web
TRANSCRIPT
EL MÉTODO ESTADÍSTICO PARA EL DISEÑO DE EXPERIMENTOS
Contenido
• El análisis de varianza.• Modelos clásicos de diseño experimental.• La homogeneidad estadística de las
comparaciones: diseños factoriales.• Diseños por bloques aleatorios.
El Análisis de Varianza
• Introducción:– Cuando definimos el diseño de experimentos,
diferenciamos dos aspectos:• La planeación del experimento.• El método estadístico.
El Análisis de Varianza
– El análisis de varianza fue creado por R.A. Fisher (1925).
– Consideraremos el problema de definir si las diferencias observadas entre más de dos medias de una muestra pueden atribuirse al azar.
La Metodología
1. Representar gráficamente los datos: Diagramas de caja si se disponen de 10 datos o mas.
2. Formulación de las hipótesis.3. Comprobación de requisitos
1. Representar gráficamente los datos: Diagramas de caja si se disponen de 10 datos o mas.
2. Formulación de las hipótesis.3. Comprobación de requisitos
Análisis de Varianza en un Solo Sentido• Ejemplo: Supóngase que se desea comparar la acción de
limpieza de tres detergentes sobre la base de los siguientes registros de blancura tomados en 15 muestras de tela blanca manchada con una tinta común y después lavada con los detergentes respectivos en una máquina con agitador.
Registros de Blancura
Detergente A Detergente B Detergente C
77 72 76
81 58 85
71 74 82
76 66 80
80 70 77
Registro de blancura
Detergente: niveles del factor fijos! Se analizar
los existentes sin necesidad de tomar una
muestra.
Análisis de Varianza en un Solo Sentido
kj
ikijii
kj
kj
kj
yyyy
yyyy
yyyy
yyyy
kj
......
......
..................
......
......
......
......21
21
21
333231
222221
111211
Tratamientos
Medias
Suposiciones sobre las variables yij:
1)Son independientes.2)Tienen distribuciones
normales con las medias respectivas μi
3)Tienen varianza común σ2
Suposiciones sobre las variables yij:
1)Son independientes.2)Tienen distribuciones
normales con las medias respectivas μi
3)Tienen varianza común σ2
El modelo de las observaciones esta
dado por:
Yij = μ+τj+εij; donde:
μ es la media globalτj son los efectos del tratamiento (τj= μj-
μ)εij : variables
aleatorias independientes con con medias cero y
varianza común σ2. (εij : Yij – μj)
El modelo de las observaciones esta
dado por:
Yij = μ+τj+εij; donde:
μ es la media globalτj son los efectos del tratamiento (τj= μj-
μ)εij : variables
aleatorias independientes con con medias cero y
varianza común σ2. (εij : Yij – μj)
Análisis de Varianza en un Solo Sentido
kj
ikijii
kj
kj
kj
TTTT
yyyy
yyyy
yyyy
yyyy
kj
..........
......
..................
......
......
......
......21
21
21
333231
222221
111211
Tratamientos
Totales/columnaNúmeroMedias
n1 n2 … nj … nk NY.1 Y.2 … Y.j … Y.k Y..
Análisis de Varianza en un Solo Sentido
kjH
vs
H
j
k
,...2,1,0:
.
0...:
1
10
Si la hipótesis nula es verdadera, toda la variabilidad se debe al azar.
Ecuación Fundamental del Análisis de Varianza (Niveles del Factor Fijo)
k
j
n
i jij
k
j
n
i j
k
j
n
i ijjjj YYYYYY
1 1
2.1 1
2...1 1
2.. )()()(
Suma de cuadrados de las desviaciones de la gran media
Suma de cuadrados de las desviaciones de la gran media
Suma de cuadrados de las desviaciones entre los tratamientos
Suma de cuadrados de las desviaciones entre los tratamientos
Suma de cuadrados de las desviaciones dentro de tratamientos
Suma de cuadrados de las desviaciones dentro de tratamientos
Tabla ANOVA (Niveles del Factor Fijo)Fuente df SS MS F Valor p
Tratamiento k-1 SS tratamientos
SS tratamientos/(k-1)
P(F(ν1, ν2)≥f)
Error N-k SS error SS error/(N-k)
TOTAL N-1 SS total
error
ostratamient
MS
MSf
Análisis de Varianza en un Solo Sentido• Ejemplo: Supóngase que se desea comparar la acción de limpieza de tres
detergentes sobre la base de los siguientes registros de blancura tomados en 15 muestras de tela blanca manchada con una tinta común y después lavada con los detergentes respectivos en una máquina con agitador.
Pruebe en el nivel de significancia 0.01 si las diferencias entre las medias son significativas.
Registros de Blancura
Detergente A Detergente B Detergente C
77 72 76
81 58 85
71 74 82
76 66 80
80 70 77
Análisis de Varianza en un Solo SentidoAnova: Single Factor
SUMMARYGroups Count Sum Average Variance
Detergente A 5 385 77 15,5Detergente B 5 340 68 40Detergente C 5 400 80 13,5
ANOVASource of Variation SS df MS F P-value F crit
Between Groups 390 2 195 8,48 0,01 6,93Within Groups 276 12 23
Total 666 14
Estadística DescriptivaEstadística Descriptiva
Debe rechazarse la hipótesis nula, concluimos que los tres detergentes no son igualmente efectivos
Después de ANOVA… qué?
• Si el analista decide seleccionar las comparaciones para luego del resultado del ANOVA, las comparaciones se pueden realizar.
• Sin embargo, el valor α se altera, debido a que la decisión de comparaciones no es aleatoria.
• Métodos:– Student - Newman – Keuls (SNK)– Scheffé test
• Si el analista decide seleccionar las comparaciones para luego del resultado del ANOVA, las comparaciones se pueden realizar.
• Sin embargo, el valor α se altera, debido a que la decisión de comparaciones no es aleatoria.
• Métodos:– Student - Newman – Keuls (SNK)– Scheffé test
Pasos para la prueba: Student - Newman – Keuls (SNK)
Pasos para la prueba: Student - Newman – Keuls (SNK)
1. Ordene las k medias muestrales de menor a mayor.2. Tome la media cuadrada del error y los grados de libertad del
error.3. Obtenga el error estándar de la media para cada tratamiento,
dicho valor será el denominador de la prueba F.
4. Tome los valores de la tabla: “Studentized Range”, con el valor de α deseado. Usando n2 como los grados de libertad del error y p = 2,3,..k.
5. Multiplique los rangos por el error estándar de la media para cada tratamiento, para encontrar los LSR (least significant ranges)
6. Analice los rangos entre las medias por pares comenzando con el valor mas alto y mas bajo.
j
errorY yennesobservaciodecantidad
MSS
j
.____.
Método de Scheffé• Usa el método de contrastes, sin embargo esos contrastes no
necesitan ser ortogonales.• Pasos:1. Establezca los contrastes de interés y calcule sus valores numéricos.2. Determine el valor de f para el que3. Calcule usando el valor de f del paso 2. 4. Calcule el error estándar de cada contraste. Para el contraste:
, el error estándar esta dado por:
5. Sea cm el valor que denote a Cm. Rechace la hipótesis de que el contraste de medias es cero si
fFP kNk ,1(fkA )1(
kkmmm TcTcC .1.1 ...
)...)(( 212
1 kmkmerrorm cncnMSSC
mm Ascc
Ejemplo
• La tabla adjunta muestra la vida de un tipo específico de bacteria (en minutos) expuesta a 4 temperaturas distintas.
• Encuentre la tabla ANOVA y defina si la temperatura tiene efecto en la vida de la bacteria.
• Establezca un contraste para comparar el promedio de vida de la bacteria entre la temperatura 1 y 2.
• Establezca un contraste para comparar la vida de la bacteria bajo la temperatura 1 y las tres restantes.
T1 T2 T3 T4
1,93 2,55 2,4 2,33
2,38 2,72 2,68 2,40
2,20 2,75 2,31 2,28
2,25 2,70 2,28 2,25
COMPONENTES DE VARIANZA
Componentes de la Varianza
Tabla ANOVA (Niveles del Factor Aleatorios)
Fuente df SS MS EMS (Valor esperado)
Tratamiento k-1 SS tratamientos SS tratamientos/(k-1)
Error N-k SS error SS error/(N-k)
TOTAL N-1 SS total
22 nerror
2error
Tabla ANOVA (Niveles del Factor Aleatorios)
• Ejemplo:Una empresa provee a un cliente con varios cientos de lotes de materia prima cada año. El cliente esta interesado en un mayor rendimiento del porcentaje de químico usable del producto.
Usualmente se toman tres muestras del rendimiento de cada lote para verificar la calidad de la materia prima. Ocurre variación dentro del lote, pero el cliente sospecha que existe variación significativa entre los lotes.
Para revisar esto, se han tomado cinco lotes aleatoriamente de varios lotes disponibles y tres rendimientos por lote. Los rendimientos se muestran en la tabla adjunta.
Cuánta varianza del experimento puede ser atribuida a las diferencias entre lotes?Cuánta varianza del experimento puede ser atribuida al error aleatorio?
Tabla ANOVA (Niveles del Factor Aleatorios)
1 2 3 4 5
74 68 75 72 79
76 71 77 74 81
75 72 77 73 79
Lotes
Rendimiento del químico por lotes
Tabla ANOVA (Niveles del Factor Aleatorios)
Factor Type Levels ValuesLote random 5 1. 2. 3. 4. 5
Analysis of Variance for Yield
Source DF SS MS F PLote 4 147,733 36,933 20,52 0,000Error 10 18,000 1,800Total 14 165,733
Expected Mean Square for Each Term (using Variance Error unrestricted Source component term model)1 Lote 11,711 2 (2) + 3 (1)2 Error 1,800 (2)
)(22otratamienterror MSEn
errorerror MSE2
Diferencia significativa
entre los lotes
Diferencia significativa
entre los lotes
511,138,1711,112222 SSStotaltotal
REVISIÓN DEL MODELO
Revisión del Modelo
• Las técnicas que se presentaron en este capítulo están basadas en:– Independencia– Muestras aleatorias– Distribuciones normales– Varianzas iguales
• En la práctica no se espera que las suposiciones del modelo sean satisfechas exactamente.
• Sin embargo, para que el procedimiento de resultados confiables las suposiciones deben ser satisfechas de forma razonable.
Revisión del Modelo
• Los residuos deben ser normales.– Los residuos de un experimento son los restos,
luego de que los efectos estimados en el modelo se han sustraído de los valores de la variable de respuesta.
– es el valor de que se predice utilizando el modelo.
ijijij YYE ˆ
ijY ijY
jijij YYE .
Revisión del Modelo
• Las varianzas deben ser homogéneas.– Analizar el rango de las observaciones en cada
tratamiento.– Utilizar criterio de control estadístico.
RD4
Revisión del Modelo
• Los errores deben ser independientes.– Los datos del experimento deben ser obtenidos de
una forma completamente aleatoria.– La falta de independencia afecta seriamente las
inferencias.– Se deben hacer esfuerzos para evitar errores
correlacionados.
Revisión del Modelo
• Procedimientos para revisar independencia:– Cálculo de auto-correlaciones.• La independencia de los errores se debe cuestionar si el
valor absoluto de la auto-correlación es mayor a:
– Durbin-Watson (DW)• Si el valores de DW mayores a 1.7 soportan la
suposición de independencia.
n96,1
n
i i
n
i ii
e
eeDW
1
22
21)(
Qué ocurre si el modelo no es adecuado?
• Qué ocurre si no se cumplen las suposiciones del modelo?– Considere un modelo distinto.– Transforme los datos a fin de lograr normalidad.
DISEÑO POR BLOQUES ALEATORIOS
Diseños por bloques aleatorios
• Son aquellos en los que se introduce una variable “bloque”.
• Se denomina variable bloque a aquella variable o factor que se introduce en el experimento para obtener comparaciones homogéneas. La variable bloque es un factor que:– Suponemos (a priori) que influye en la variable de
respuesta. – No tiene interacción con el resto de factores
incluidos en el experimento.
Diseños por bloques aleatorios
• El diseño aleatorizado por bloques permiten remover el efecto del bloque y concentrarse en los efectos de la variable de interés.– De ahí, que se reduce el estimado de la varianza del
error.• Ejemplos:– Probar el efecto de métodos de enseñanza en
diferentes estudiantes.– Probar el efecto de los de materiales en varias
máquinas.– Probar el efecto de los fertilizantes en distintos tipos
de suelos.• Bloques: estudiantes, máquinas y suelos
Diseño por Bloques Aleatorios
• El modelo:
• Donde representa el efecto del bloque.
ijjiijY
i
Tabla ANOVA (Diseño por bloques aleatorios)
Fuente df SS MS F
Entre los bloques
n-1 SS bloques SS bloques/(n-1) MS bloques/MS error
Entre los tratamientos
k-1 SS tratamientos
SS tratamientos/(k-1) MS tratamientos/MS error
Error (n-1)(k-1) SS error SS error/(n-1)(k-1)
TOTAL nk-1 SS total
Ejemplo• El jefe de transporte de una firma, desea determinar si
el desgaste de 4 marcas de llantas es el mismo luego de haber utilizado las mismas por 20,000 Km.
• Las marcas a considerar son A, B, C y D. El jefe de transporte desea probar el desempeño de las llantas en las condiciones actuales de las vías que utilizan los cuatro camiones de la empresa.
• La tabla adjunta muestra la pérdida del labrado de las llantas por vehículo y por tipo de llanta.– Se puede confirmar la variación entre los vehículos de la
flota?– El desgaste de las llantas es el mismo para todas las
marcas?
EjemploVehículo 1 Vehículo 2 Vehículo 3 Vehículo 4
Distribución de marcas y desgaste del labrado
B(14) D(11) A(13) C(9)
C(12) C(12) B(13) D(9)
A(17) B(14) D(11) B(8)
D(13) A(14) C(10) A(13)
Anova: Ejemplo de Desgaste de Neumáticos
Analysis of Variance for Desgaste
Source DF SS MS F PVehículo 3 38,688 12,896 10,04 0,003Marc 3 30,688 10,229 7,96 0,007Error 9 11,563 1,285Total 15 80,938
Se rechaza la hipótesis de igualdad entre las
medias de desgaste por vehículo y por marca.
Ejemplo• Se desea determinar la efectividad
de un fertilizante orgánico en suelos de cultivo de un producto a lo largo del año. En la tabla adjunta se registra la efectividad del fertilizante en las cuatro estaciones del año: invierno, verano, otoño y primavera.
• Formule un modelo para este diseño• Describa sus hipótesis.• Analice los datos utilizando un
modelo aleatorizado por bloques y describa sus conclusiones.
• Revise la validez del modelo.
resp fert estación4,0 1 14,8 1 25,0 1 34,6 1 44,8 2 15,0 2 25,2 2 34,6 2 44,0 3 14,8 3 25,6 3 35,0 3 4
Anexos
Sofía A. López MSc.
Cartas de Control para la Media y el Rango
Tabla 1. Factores para límites de control en gráficos de medias y rangos
Gráfico de medias
Gráfico de Rangos
Tamaño de muestra n
Factor A2 Factor D3
Factor D4
2 1.88 0 3.27
3 1.02 0 2.57
4 0.73 0 2.28
5 0.58 0 2.11
6 0.48 0 2.00
7 0.42 0.08 1.92
8 0.37 0.14 1.86
9 0.34 0.18 1.82
10 0.31 0.22 1.78