tema 9. diseños factoriales · modelo asociado a un experimento factorial hipótesis de interés...
TRANSCRIPT
Diseño de Experimentos
Tema 9.
Diseños Factoriales
JAIME MOSQUERA RESTREPO
EXPERIMENTOS CON ESTRUCTURA FACTORIAL
Generalidades
� El objetivo de experimento factorial consiste en valorar el efecto demas de un factor sobre la variable respuesta
� Se realizan todas las combinaciones posibles entre los niveles de� Se realizan todas las combinaciones posibles entre los niveles delos factores
� En cada ensayo o réplica completa del experimento se investigantodas las combinaciones posibles de los niveles de los factores.
� Se plantea la posibilidad de que los factores presenten un efecto deinteracción. Es decir la diferencia en la respuesta entre niveles deun factor no es la misma en todos los niveles de los otros factores
EXPERIMENTOS CON ESTRUCTURA FACTORIAL
Efecto interacción
� Cuando la conclusión de un factor depende de otro factor, se diceque hay interacción, la presencia de interacción indica que no seque hay interacción, la presencia de interacción indica que no sepuede estudiar el efecto de un factor sobre la respuestaindependiente del otro factor.
� Uno de los objetivos más importantes de un experimentofactorial es detectar si existe interacción de los factores.
Experimento Factorial (Ejemplo)
Se sabe que existen dos características que afectan la resistencia a la rupturade un espécimen de asfalto:
1) Tipo de mezcla.2) Método de Compactación.
Para medir el efecto de estas dos características se ha diseñado un experimentoPara medir el efecto de estas dos características se ha diseñado un experimentocuyos resultados se resumen a continuación
De forma empírica
que sugieren los
resultados?
EXPERIMENTOS CON ESTRUCTURA FACTORIAL
Gráficamente se puede ilustrar el efecto interacción:
EXPERIMENTOS CON ESTRUCTURA FACTORIAL
Arreglo general de un diseño factorial de dos factores
“Cada combinación de los niveles de los factores representa un tratamiento
diferente, en total a*b tratamientos y a*b*n unidades muestrales”
EJEMPLO
Un ingeniero está diseñando una batería que se usará en undispositivo que se someterá a variaciones de temperaturaextremas. El único parámetro del diseño que puedeseleccionar en este punto es el material de la placa o ánodode la batería y tiene tres elecciones posibles. El ingenierodecide probar los tres materiales de la placa con tres nivelesde temperatura – 15, 70 y 125ºF – ya que estos niveles detemperatura son consistentes con el medio ambiente dondese usará finalmente el producto. Se prueban cuatro bateríascon cada combinación del material de la placa y latemperatura (36 baterias), y a cada batería se le asigna deforma aleatoria la temperatura de prueba.
EJEMPLOSe obtuvieron los siguientes resultados:
Datos de la vida (en horas) para el ejemplo del diseño de la batería
Especificaciones del ModeloTipo de Diseño: Factorial Completamente al Azar
Factores de Diseño: Material Base, Temperatura de Operación
Niveles de los factores: Material TemperaturaI 15II 70II 70III 125
Tratamientos (Material, Temperatura): (I,15) (I,70) (I,125)(II,15) (II,70) (II,125)(III,15) (III,70) (III,125)
Numero de Replicas: 4
“A este tipo de diseños suele llamársele como diseño 3 x 3 con 4 replicas”
Análisis Descriptivo
200
150
100
50
tiempo
Individual Value Plot of tiempo
Grafico de Observaciones Individuales
Material
Temp
321
125701512570151257015
0
321
150
140
130
120
110
100
90
80
70
60
1257015
Material
Mean
Temp
Main Effects Plot for tiempoData Means
Grafico de efectos Principales.
Se grafican los promedios por
nivel de factor
Análisis Descriptivo
150
125
100
75
Mean
1
2
3
Material
Interaction Plot for tiempoData Means
Grafico de Interacción
Se grafican los promedios por
tratamiento
321
150
125
100
75
50
Material
Mean
15
70
125
Temp
Interaction Plot for tiempoData Means
1257015
50
Temp
MODELO ASOCIADO A UN EXPERIMENTO FACTORIAL
( )
=
=
=
++++=
nk
bj
ai
y ijkijjiijk
,...,2,1
,...,2,1
,...,2,1
ετββτµ
Donde:
= Valor aleatorio que toma la variable respuesta en la k - ésima replica que hasido expuesta al j - ésimo nivel del factor B y al i - ésimo nivel del factor A.
= Parámetro de centralidad o efecto medio general.
= Efecto del i - ésimo nivel del factor A.
= Efecto del j - ésimo nivel del factor B.
= Efecto debido a la interacción de primer orden entre los factores A y B.
= Efecto debido al error experimental.
ijky
µ
iτ
jβ
( )ijτβ
ijkε
MODELO ASOCIADO A UN EXPERIMENTO FACTORIAL
Hipótesis de interés en el modelo
1. Hipótesis de interacción
( ) ( ) 0 una menos al : vs. 0: 10 ≠∀= ijijij HH τβτβ
2. Hipótesis de Efectos Principales
Existe Interacción entre
los factores A y B
El efecto de los factores A y B
se da de forma independiente
DESCOMPOSICIÓN DE LA VARIANZA PARA EL EXPERIMENTO FACTORIAL
EABBAT SSSSSSSSSC +++=
Tabla Análisis de la Varianza Modelo Factorial
Fórmulas para el cálculo
a
i
iA
a
i
b
j
n
k
ijkT
abn
yy
bnSS
abn
yySS
−=
−=
∑
∑∑∑
=
= = =
1
2
...2
..
1 1 1
2
...2
1
SubtotalesTEBAABTE
BASubtotalesAB
a
i
b
j
ijSubtotales
b
j
jB
i
SSSSSSSSSSSSSSSS
SSSSSSSSabn
yy
nSS
abn
yy
anSS
abnbn
−=→−−−=
−−=⇒−=
−=
∑∑
∑
= =
=
=
2
...
1 1
2
.
1
2
...2
..
1
1
1
ANÁLISIS DE VARIANZA PARA EL EXPERIMENTO FACTORIAL
478547
ANOVA FACTORIAL
Two-way ANOVA: tiempo versus Material. Temp Source DF SS MS F P
Material 2 10683,7 5341,9 7,91 0,002
Temp 2 39118,7 19559,4 28,97 0,000 Temp 2 39118,7 19559,4 28,97 0,000
Interaction 4 9613,8 2403,4 3,56 0,019
Error 27 18230,8 675,2
Total 35 77647,0
S = 25,98 R-Sq = 76,52% R-Sq(adj) = 69,56%
PRUEBAS POSTANOVA
El procedimiento Postanova variara dependiendo de la aceptación de lahipótesis de interacción:
Caso I: Existe Interacción entre las factores
Se realiza un procedimiento postanova para cada uno de los niveles deun factor, analizando diferencias entre los niveles del otro factorun factor, analizando diferencias entre los niveles del otro factor
“una prueba por cada nivel de factor de referencia”
Caso II: No existe Interacción entre factores
Se efectúan pruebas postanova para comparar los niveles de losfactores cuyos efectos principales sean significativos (valor p <α)
“Una prueba por cada factor significativo”
COMPARACIONES MÚLTIPLES
Ejemplo (Prueba de Tukey):
“la prueba ANOVA identifico la existencia de interacción, por tanto laspostanova deben hacerse condicionales”.
Temperatura 15º Temperatura 70º Temperatura 125º
75.145
75.119
25.57
32
22
12
=
=
=
y
y
yMaterial 1
Material 2
Material 3 144
75,155
75,134
31
21
11
=
=
=
y
y
y
5.85
5.49
5.57
33
23
13
=
=
=
y
y
y
47.454
2.67550.305.0)27;3(05.005.0))1(;( ==⇒=⇒= − T
n
MSqT
n
MSqT EE
nabaαα
Numero de niveles a comparar
Grados de libertad error
Temperatura 15º
Temperatura 70º*47.4550.8825.5775.145 :1M vs.3 =>=− TM
47.452175.13475.155 :M1 vs.2
47.4575.1114475.155 :M3 vs.2
47.4525.975.134441 :1M vs.3
05.0
05.0
05.0
=<=−
=<=−
=<=−
TM
TM
TMM3 M2 M1
Temperatura 145º
*47.4550.6225.5775.119 :M1 vs.2
47.4500.2675.11975.145 :M2 vs.3
*47.4550.8825.5775.145 :1M vs.3
05.0
05.0
05.0
=>=−
=<=−
=>=−
TM
TM
TMM1 M2 M3
M2 M1 M3
47.4585.497.55 :M2 vs.1
47.45365.495.58 :M2 vs.3
47.45285.575.58 :1M vs.3
05.0
05.0
05.0
=<=−
=<=−
=<=−
TM
TM
TM
Validación de SupuestosEstimadores del Modelo
1, 2, ...,
( ) 1, 2, ...,
1, 2, ...,
ijk i j ij ijk
i a
y j b
k n
µ τ β τβ ε
=
= + + + + = =
.............
........
)ˆ( ˆ
ˆ ˆ
yyyyyy
yyy
jiijijjj
ii
+−−=−=
−==
βτβ
τµ
.
..................... ) (
ˆ
ijijkijk
jiijjiijkijk
ijkijkijk
yye
yyyyyyyyyye
yye
−=
+−−+−+−+−=
−=
“Valor Observado menos promedio por tratamiento”
VALIDACIÓN DE SUPUESTOS
Los Errores Tienen Distribución Normal?
99
95
90
80
Mean 0
StDev 22,82
N 36
AD 0,340
P-Value 0,478
Probability Plot of RESI1Normal
50250-25-50-75
80
70
60
50
40
30
20
10
5
1
RESI1
Percent
VALIDACIÓN DE SUPUESTOS
Los Errores Tienen Promedio = 0?
50
25
0
dual
Versus Fits(response is tiempo)
1501251007550
-25
-50
-75
Fitted Value
Resid
VALIDACIÓN DE SUPUESTOS
Los Errores Tienen Varianza Constante?
4000
3000
Scatterplot of res2 vs FITS1
1501251007550
2000
1000
0
FITS1
res2
VALIDACIÓN DE SUPUESTOS
Los Errores Tienen Varianza Constante?
Temp Material
15
3
2
1Test Statistic 5,24
P-Value 0,732
Test Statistic 0,80
P-Value 0,608
Bartlett's Test
Levene's Test
Test for Equal Variances for RESI1
125
70
3
2
1
3
2
1
4003002001000
95% Bonferroni Confidence Intervals for StDevs
P-Value 0,608
VALIDACIÓN DE SUPUESTOS
Los Errores son Independientes?
50
25
0al
Versus Order(response is tiempo)
50
25
0
0
0
e(i) vs e(i-1)
35302520151051
0
-25
-50
-75
Observation Order
Residua
50250-25-50-75
-25
-50
-75
e(i-1)
e(i)
Runs test for RESI1
Runs above and below K = 0
The observed number of runs = 21The expected number of runs = 18,944419 observations above K. 17 belowP-value = 0,486
Diseño de Experimentos
Caso Ejemplo Anova Factorial
JAIME MOSQUERA RESTREPO
EJEMPLO5-1 The yield of a chemical process is being studied. The two most important variables are thought to be
the pressure and the temperature. Three levels of each factor are selected, and a factorial experiment with
two replicates is performed. The yield data follow:
Pressure
Temperature 200 215 230 Temperature 200 215 230
150 90.4 90.7 90.2
90.2 90.6 90.4
160 90.1 90.5 89.9
90.3 90.6 90.1
170 90.5 90.8 90.4
90.7 90.9 90.1
Diseño Factorial 3 x 3 con 2 repeticiones
Analisis Descriptivo
91,0
90,8
90,6
Individual Value Plot of Resp
Temperatura
Presion
170160150
230215200230215200230215200
90,4
90,2
90,0
Resp
Analisis Descriptivo
90,9
90,8
90,7
90,6
90,5n
200
215
230
Presion
Interaction Plot for RespData Means
170160150
90,5
90,4
90,3
90,2
90,1
90,0
Temperatura
Mean
ANOVA
Analysis of Variance for Resp, using Adjusted SS for Tests
1, 2, ...,
( ) 1, 2, ...,
1, 2, ...,
ijk i j ij ijk
i a
y j b
k n
µ τ β τβ ε
=
= + + + + = =
Source DF Seq SS Adj SS Adj MS F P
Temperatura 2 0,30111 0,30111 0,15056 8,47 0,009
Presion 2 0,76778 0,76778 0,38389 21,59 0,000
Temperatura*Presion 4 0,06889 0,06889 0,01722 0,97 0,470
Error 9 0,16000 0,16000 0,01778
Total 17 1,29778
S = 0,133333 R-Sq = 87,67% R-Sq(adj) = 76,71%
ANOVA
=
=
=
+++=
nk
bj
ai
y ijkjiijk
,...,2,1
,...,2,1
,...,2,1
εβτµ
Analysis of Variance for Resp, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
Temperatura 2 0,30111 0,30111 0,15056 8,55 0,004
Presion 2 0,76778 0,76778 0,38389 21,80 0,000
Error 13 0,22889 0,22889 0,01761
Total 17 1,29778
S = 0,132691 R-Sq = 82,36% R-Sq(adj) = 76,94%
POSTANOVATukey Simultaneous Tests
Response Variable Resp
All Pairwise Comparisons among Levels of Temperatura
Temperatura = 150 subtracted from:
Difference SE of Adjusted
Temperatura of Means Difference T-Value P-Value
160 -0,1667 0,07661 -2,176 0,1131
170 0,1500 0,07661 1,958 0,1621
Temperatura = 160 subtracted from:
Difference SE of Adjusted
Tukey Simultaneous Tests
Response Variable Resp
All Pairwise Comparisons among Levels of Temperatura
Temperatura = 150 subtracted from:
Difference SE of Adjusted
Temperatura of Means Difference T-Value P-Value
160 -0,1667 0,07661 -2,176 0,1131
170 0,1500 0,07661 1,958 0,1621
Temperatura = 160 subtracted from:
Difference SE of Adjusted Difference SE of Adjusted
Temperatura of Means Difference T-Value P-Value
170 0,3167 0,07661 4,134 0,0031
Difference SE of Adjusted
Temperatura of Means Difference T-Value P-Value
170 0,3167 0,07661 4,134 0,0031
Tukey Simultaneous Tests
Response Variable Resp
All Pairwise Comparisons among Levels of Presion
Presion = 200 subtracted from:
Difference SE of Adjusted
Presion of Means Difference T-Value P-Value
215 0,3167 0,07661 4,134 0,0031
230 -0,1833 0,07661 -2,393 0,0777
Presion = 215 subtracted from:
Difference SE of Adjusted
Presion of Means Difference T-Value P-Value
230 -0,5000 0,07661 -6,527 0,0001
Tukey Simultaneous Tests
Response Variable Resp
All Pairwise Comparisons among Levels of Presion
Presion = 200 subtracted from:
Difference SE of Adjusted
Presion of Means Difference T-Value P-Value
215 0,3167 0,07661 4,134 0,0031
230 -0,1833 0,07661 -2,393 0,0777
Presion = 215 subtracted from:
Difference SE of Adjusted
Presion of Means Difference T-Value P-Value
230 -0,5000 0,07661 -6,527 0,0001
VALIDACIÓN DE SUPUESTOS
VALIDACIÓN DE SUPUESTOS
Runs test for RESI2
Runs above and below K = -1,73472E-18
The observed number of runs = 12The expected number of runs = 9,8888910 observations above K. 8 below* N is small, so the following approximation may be invalid.P-value = 0,299
VALIDACIÓN DE SUPUESTOS
One-Sample T: RESI2
Test of mu = 0 vs not = 0
Variable N Mean StDev SE Mean 95% CI T PRESI2 18 -0,0000 0,1160 0,0273 (-0,0577. 0,0577) -0,00 1,000
VALIDACIÓN DE SUPUESTOS
CASOS ESPECIALES
Diseños Factoriales sin replicas
“Para solucionar el problema algunos autores renuncian al termino interacción
alimentando con ello la suma de cuadrados del error”
Diseños Factoriales con mas de tres factores
“Lo revisamos en la sala de computo”
Diseño de Experimentos
Caso Ejemplo Factorial 3 Factores
JAIME MOSQUERA RESTREPO
EJEMPLO
DATOS
Solución en Minitab