tema 2 diseño de experimentos: modelos con varios...

50
TEMA 2 Dise˜ no de experimentos: modelos con varios factores Jos´ e R. Berrendero Departamento de Matem´ aticas Universidad Aut´ onoma de Madrid An´ alisis de Datos - Grado en Biolog´ ıa

Upload: others

Post on 12-Oct-2019

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

TEMA 2Diseno de experimentos: modelos con varios factores

Jose R. BerrenderoDepartamento de Matematicas

Universidad Autonoma de Madrid

Analisis de Datos - Grado en Biologıa

Page 2: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Esquema del tema

Modelo bifactorial aditivo.

Modelo bifactorial con interacciones.

Otros modelos y extensiones.

Page 3: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Ejemplo

El abeto posee una regeneracion natural escasa por lo que puede resultarconveniente incrementar su produccion de semillas mediante untratamiento hormonal. Se desean comparar cuatro tipos de hormonas A,B, C y D. Las condiciones naturales de reproduccion en arboles diferentesno son las mismas. Para controlar este efecto, se han seleccionado 10arboles y en cada arbol 4 ramas similares. Cada rama recibe exactamenteuno de los 4 tratamientos. Tras aplicar los tratamientos se mide el numerode semillas producidas en cada rama.

Page 4: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Ejemplo

Arbol A B C D Media

1 89 59 20 51 54.752 87 56 15 47 51.253 84 52 14 45 48.754 92 67 26 56 60.255 95 70 28 60 63.256 90 62 22 53 56.757 89 60 19 51 54.758 88 56 17 50 52.759 82 50 14 45 47.75

10 94 63 24 53 58.50

Media 89.0 59.5 19.9 51.1 54.875

Page 5: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Parte de la variabilidad en la respuesta hay que asignarla a lasdiferencias entre los arboles.

El arbol utilizado es un factor a incluir en el modelo.

¿Como habrıa que haber hecho el experimento para que sı fueseapropiado el modelo unifactorial?

A veces las diferencias entre los niveles de cierto factor no son deinteres directo, pero se disena el experimento teniendo en cuenta estefactor para reducir la variabilidad no explicada.

En este caso al factor se le suele llamar bloque.

Page 6: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

En el ejemplo:

El tratamiento hormonal es un factor con cuatro niveles: A, B, Cy D.

El arbol es otro factor (o bloque) con 10 niveles: los 10 arbolesutilizados.

El numero de semillas es la variable respuesta.

Cada combinacion lineal de niveles de los factores es un tratamiento.En el ejemplo hay 40 tratamientos (10 arboles × 4 tipos dehormonas).

Page 7: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Estructura de los datos

Yij es la respuesta correspondiente a la combinacion del nivel i del factorα con el nivel j del factor β.

Factor β1 2 · · · J Medias por filas

1 Y11 Y12 . . . Y1J Y1·Factor α 2 Y21 Y22 . . . Y2J Y2·

......

......

I YI1 YI2 . . . YIJ YI ·Medias por columnas Y·1 Y·2 Y·J Y··

Page 8: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Modelo general

Supongamos que µij es la respuesta esperada para los niveles i (factor α)y j (factor β)

El modelo bifactorial general es:

Yij = µij + uij ,

donde los errores aleatorios uij verifican las hipotesis habituales, es decir,distribucion normal de media 0 y varianza σ2 e independencia.

Con los datos de los abetos no es posible ajustar el modelo general porqueel numero de parametros (41) es mayor que el numero de datos (40).

Esto siempre sucede en un experimento con dos factores en el que hayauna unica respuesta para cada combinacion de niveles: IJ datos y IJ + 1parametros.

Page 9: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Modelo bifactorial aditivo

Una solucion es especificar con mas detalle el valor de µij .

µ: Respuesta media global.

αi : Efecto adicional debido al nivel i del factor α.

βj : Efecto adicional debido al nivel j del factor β

Para i = 1, . . . , I y j = 1, . . . , J,

Yij = µ+ αi + βj + uij ,

donde los errores uij tienen distribucion normal de media 0 y varianza σ2

(la misma para cualquier valor de i y j) y son independientes. Ademas,∑i

αi =∑j

βj = 0,

ya que podemos interpretar αi y βj como desviaciones a la media debidasa los niveles de los factores.

Page 10: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Modelo bifactorial aditivo

El modelo se puede escribir:

Yij ≡ N(µ+ αi + βj ;σ),

donde∑

i αi =∑

j βj = 0 y las variables son independientes.

El modelo aditivo tiene (I − 1) + (J − 1) + 1 + 1 = I + J parametros.Salvo en el caso I = J = 2, siempre IJ > I + J.

El modelo aditivo implica que el efecto en la respuesta del nivel de uno delos factores no depende del nivel fijado para el otro factor.

Se dice que no hay interacciones entre los dos factores.

Page 11: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

¿Es razonable un modelo aditivo para los datos de abetos?

Representamos las respuestas como funcion del arbol (una curva de colordiferente para cada tipo de hormona)

2 4 6 8 10

2040

6080

Árbol

Resp

uesta

Si las curvas son aproximadamente paralelas, el modelo aditivo esrazonable.

Page 12: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Estimadores de los parametros

Parametro Estimador

µ µ = Y..αi αi = Yi . − Y..βj βj = Y.j − Y..

Calcula los estimadores de los parametros µ y βj para j = 1, 2, 3, 4 en elejemplo de los abetos.

Los estimadores verifican las mismas restricciones que los parametros, esdecir, ∑

i

αi =∑j

βj = 0

Page 13: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Residuos y valores ajustados

Valores ajustados o pronosticados: Es la parte de la respuesta quelos factores incluidos en el modelo pueden explicar:

Yij = µ+ αi + βj = Yi . + Y.j − Y..

Residuos: Es la parte de la respuesta que los factores incluidos en elmodelo no pueden explicar:

eij = Yij − Yij = Yij − Yi . − Y.j + Y..

Calcula la descomposicion Yij = Yij + eij para la primera fila de datos delejemplo (es decir, cuando i = 1).

¿Cuanto vale la suma de los residuos de cada fila? ¿Y la suma de losresiduos de cada columna?

Page 14: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Variabilidad no explicada y estimacion de la varianza

La suma de los residuos al cuadrado mide la variabilidad no explicada oresidual:

SCR =∑i

∑j

e2ij =

∑i

∑j

(Yij − Yi . − Y.j + Y..)2

Esta suma tiene (I − 1)(J − 1) gl

Normalizando la suma de cuadrados por sus gl se obtiene un estimadorinsesgado de la varianza de los errores (la varianza residual en estemodelo):

S2R =

SCR

(I − 1)(J − 1)=

∑i

∑j(Yij − Yi . − Y.j + Y..)

2

(I − 1)(J − 1)

Puede demostrarse que SCR/σ2 ≡ χ2(I−1)(J−1).

Page 15: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Descomposicion de la variabilidadSe verifica:

Yij − Y.. = αi + βj + eij

Si elevamos al cuadrado y sumamos todos estos terminos:∑i

∑j

(Yij − Y..)2 = J

∑i

α2i + I

∑j

β2j +

∑i

∑j

e2ij

Suma de cuadrados total:

SCT =∑i

∑j

(Yij − Y..)2

Suma de cuadrados debida al factor α:

SCE(α) = J∑i

α2i = J

∑i

(Yi . − Y..)2

Suma de cuadrados debida al factor β:

SCE(β) = I∑j

β2j = I

∑j

(Y.j − Y..)2

Page 16: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Tabla ANOVA

De acuerdo con las definiciones anteriores, se cumple

SCT = SCE(α) + SCE(β) + SCR

¿Cuantos gl tiene cada suma de cuadrados?

Tabla ANOVA para el modelo bifactorial aditivo

Fuente SC gl cuadrados medios FFactor α SCE(α) F (α)Factor β SCE(β) F (β)Residual SCR (I − 1)(J − 1) SCR/[(I − 1)(J − 1)]

Total SCT

Page 17: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Ejemplo

Completa la siguiente tabla ANOVA correspondiente a un modelobifactorial aditivo ajustado a los datos de los abetos:

Fuente Suma de cuadrados gl cuadrados medios estadıstico F

Arbol 886.6Hormona 8078.0Residual 49.7

Total

¿Cual es el estimador de la varianza σ2 en este caso?

Calcula un IC de nivel 95 % para σ2.

Page 18: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Tabla ANOVA con SPSS

Sig.FMedia

cuadráticagl

Suma de cuadrados

tipo III

Modelo corregido

Intersección

arbol

hormona

Error

Total

Total corregida 3925170,375

40145621,000

1,8402749,675

,0004390,6738078,025324234,075

,00053,54698,5149886,625

,00065468,885120450,6251120450,625

,0001137,8272093,3921225120,700 aOrigenOrigen

Pruebas de los efectos inter-sujetos

Variable dependiente:semillas

a. R cuadrado = ,998 (R cuadrado corregida = ,997)

Página 1

Page 19: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Tabla ANOVA con SPSS (interpretacion)

Modelo corregido SCE(α) + SCE(β) = 25120,700Interseccion nY 2

.. = 120450, 625arbol SCE(α) = 886,625hormona SCE(β) = 24234,075Error SCR = 49,675Total

∑i

∑j Y

2ij = 145621

Total corregida SCT = 25170, 375

Coeficiente de determinacion:

R2 =SCE(α) + SCE(β)

SCT=

886,625 + 24234,075

25170,375= 0,998

Page 20: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Contrastes sobre el efecto de los factores en la respuesta

¿Tiene el factor α un efecto significativo sobre la variable respuesta Y ?Para responder planteamos el siguiente contraste de hipotesis:

H0 : α1 = · · · = αI = 0 frente a H1 : αi 6= αj para algun par i , j

Parece razonable afirmar que el efecto del factor es significativo si la partede la variabilidad que el factor explica,

SCE(α) = J(α21 + · · ·+ α2

I ),

es “suficientemente grande”.

Cuando H0 es cierta se verifica

SCE(α)

σ2≡ χ2

I−1.

Page 21: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Contrastes sobre el efecto de los factores en la respuesta

Como no conocemos σ2, lo reemplazamos por su estimador.Cuando H0 es cierta,

F (α) =SCE(α)/(I − 1)

SCR/[(I − 1)(J − 1)]≡ FI−1,(I−1)(J−1)

Un contraste de nivel α para contrastar H0 : α1 = · · · = αI = 0 vienedado por la region crıtica:

R = {F (α) > FI−1,(I−1)(J−1);α}

Escribe la region crıtica para contrastar si el factor β tiene un efectosignificativo sobre la respuesta.

Contrasta, para los datos de abetos, si el tipo de hormona tiene unefecto significativo sobre la respuesta.

Contrasta, para los datos de abetos, si el arbol tiene un efectosignificativo sobre la respuesta.

Page 22: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Comparaciones entre dos niveles de un factor

Un IC de nivel 1− α para la diferencia αi − αj es:[(Yi . − Yj .)∓ t(I−1)(J−1),α/2SR

√1

J+

1

J

]

Para contrastar H0 : αi = αj frente a H1 : αi 6= αj a nivel α, unaposibilidad es rechazar H0 cuando el intervalo anterior no contiene al 0.

¿Cual es la region crıtica que debemos usar para contrastar H0 : αi ≤ αj

frente a H1 : αi > αj?

Page 23: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Comparaciones multiples

Para llevar a cabo m comparaciones con un nivel global αT usamos elmetodo de Bonferroni:

Calcular α = αT/m.

Llevar a cabo cada contraste individual a nivel α (para que el nivel designificacion global sea αT ).

Calcular cada IC individual a nivel 1− α (para que el nivel deconfianza global sea 1− αT .

Page 24: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Comparaciones multiples

Sig.Error típ.Diferencia de medias (I-J)

Límite superiorLímite inferior

Intervalo de confianza 95%

2

3

4

1

3

4

1

2

4

1

2

3

1

2

3

4

32,9329,47,000,60731,20*

-6,67-10,13,000,607-8,40*

-36,17-39,63,000,607-37,90*

-29,47-32,93,000,607-31,20*

-37,87-41,33,000,607-39,60*

-67,37-70,83,000,607-69,10*

10,136,67,000,6078,40*

41,3337,87,000,60739,60*

-27,77-31,23,000,607-29,50*

39,6336,17,000,60737,90*

70,8367,37,000,60769,10*

31,2327,77,000,60729,50*(I)hormona (J)hormona(I)hormona (J)hormona

Comparaciones múltiples

El término de error es la media cuadrática(Error) = 1,840.

*. La diferencia de medias es significativa al nivel 0,05.

Bonferroni

Página 1

Page 25: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Modelo bifactorial con interacciones

Introducimos un nuevo modelo que presenta dos diferencias respecto alanterior:

Permitimos que haya interacciones entre los dos factores: el efectoen la respuesta de cada nivel de un factor puede depender del nivelque fijamos para el otro factor.

El experimento se replica un numero K de veces: para cadacombinacion de niveles i , j se repite el experimento K veces. Sedispone de n = IJK respuestas.

Para cada respuesta Yijk , donde i = 1, . . . , I , j = 1, . . . , J y k = 1, . . . ,Ktenemos:

Yijk = µij + uijk ,

donde las medias µij no estan restringidas y los errores verifican lashipotesis habituales.

Page 26: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Ejemplo

Se asignaron aleatoriamente 20 in-dividuos con sobrepeso (10 hom-bres y 10 mujeres) a dos posiblesdietas con el fin de estudiar su efi-cacia. Despues de 10 semanas deseguimiento de la dieta, se midio laperdida de peso (en libras) en cadaindividuo.

¿Cuanto valen I , J y K en esteejemplo?

Dieta 1 Dieta 2

Mujeres 7.6 19.58.8 17.6

12.5 16.816.1 13.718.6 21.5

Hombres 22.2 30.123.4 24.224.2 9.532.2 14.6

9.4 11.2

Page 27: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Ejemplo

Medias para cada combinacion deniveles (Yij .):

Dieta 1 Dieta 2

Mujeres 12.72 17.82Hombres 22.28 17.92

1 2

1416

1820

22

Dieta

Pér

dida

de

peso

Page 28: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Modelo bifactorial con interacciones

Vamos a escribir el modelo de manera que los parametros reflejen losefectos principales de cada factor y las interacciones.

Respuesta media global: µ = µ..

Efecto adicional debido al nivel i del factor α:

αi = µi . − µ..

Efecto adicional debido al nivel j del factor β:

βj = µj . − µ..

Efecto adicional debido a la interaccion entre los niveles i de α yj de β:

(αβ)ij = µij − µ− αi − βj

Descomposicion de la media: µij = µ+ αi + βj + (αβ)ij .

Page 29: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Modelo bifactorial con interacciones

Para i = 1, . . . , I , j = 1, . . . , J y k = 1, . . . ,K

Yijk = µ+ αi + βj + (αβ)ij + uijk ,

dondeI∑

i=1

αi =J∑

j=1

βj =I∑

i=1

(αβ)ij =J∑

j=1

(αβ)ij = 0

y las variables uijk tienen distribucion normal de media 0 y varianza σ2, yson independientes.

¿Cuantos parametros hay que estimar en este modelo?

¿Que ocurre si no se replica el experimento (K = 1)?

Page 30: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Estimadores de los parametros

Parametro Estimador

µ µ = Y...αi αi = Yi .. − Y...βj βj = Y.j . − Y...

(αβ)ij (αβ)ij = Yij . − Yi .. − Y.j . + Y...

Calcula todos los estimadores de los parametros en el ejemplo de las dietas.

Los estimadores verifican las mismas restricciones que los parametros.

Page 31: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Residuos y valores ajustados

Valores ajustados o pronosticados: Es la parte de la respuesta quelos factores incluidos en el modelo pueden explicar:

Yijk = µ+ αi + βj + (αβ)ij = Yij .

Residuos: Es la parte de la respuesta que los factores incluidos en elmodelo no pueden explicar:

eijk = Yijk − Yijk = Yijk − Yij .

Calcula la descomposicion Yijk = Yijk + eijk para las 5 mujeres que siguenla dieta 1 en el ejemplo.

¿Que restricciones verifican los residuos?

Page 32: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Variabilidad no explicada y estimacion de la varianza

La suma de los residuos al cuadrado mide la variabilidad no explicada oresidual:

SCR =∑i

∑j

∑k

e2ijk =

∑i

∑j

∑k

(Yijk − Yij .)2

Esta suma tiene IJ(K − 1) gl

Normalizando la suma de cuadrados por sus gl se obtiene un estimadorinsesgado de la varianza de los errores (la varianza residual en estemodelo):

S2R =

SCR

IJ(K − 1)=

∑i

∑i

∑k(Yijk − Yij .)

2

IJ(K − 1)

Puede demostrarse que SCR/σ2 ≡ χ2IJ(K−1).

Page 33: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Descomposicion de la variabilidadSe verifica:

Yijk − Y... = αi + βj + (αβ)ij + eijk

Si elevamos al cuadrado y sumamos todos estos terminos resulta

SCT = SCE(α) + SCE(β) + SCE(αβ) + SCR,

donde:

Suma de cuadrados total:

SCT =∑i

∑j

∑k

(Yijk − Y...)2

Suma de cuadrados debida al factor α:

SCE(α) = JK∑i

α2i = JK

∑i

(Yi .. − Y...)2

Suma de cuadrados debida al factor β:

SCE(β) = IK∑j

β2j = IK

∑j

(Y.j . − Y...)2

Page 34: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Descomposicion de la variabilidad

Suma de cuadrados debida a las interacciones:

SCE(αβ) = K∑i

∑j

(αβ)2ij = K

∑i

∑j

(Yij . − Yi .. − Y.j . + Y...)2

Suma de cuadrados residual:

SCR =∑i

∑j

∑k

e2ijk =

∑i

∑j

∑k

(Yijk − Yij .)2

¿Cuantos gl tiene cada una de estas sumas de cuadrados?

Page 35: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Tabla ANOVA para el modelo bifactorial con interacciones

Fuente SC gl cuadrados medios FFactor α SCE(α) I − 1 SCE(α)/(I − 1) F (α)Factor β SCE(β) J − 1 SCE(β)/(J − 1) F (β)

Interacciones SCE(αβ) (I − 1)(J − 1) SCE(αβ)/[(I − 1)(J − 1)] F (αβ)Residual SCR IJ(K − 1) SCR/[IJ(K − 1)]

Total SCT IJK − 1

Coeficiente de determinacion en este modelo:

R2 =SCE(α) + SCE(β) + SCE(αβ)

SCT

Page 36: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Tabla ANOVA con SPSS

Sig.FMedia

cuadráticagl

Suma de cuadrados

tipo III

Modelo corregido

Intersección

Sexo

Dieta

Sexo * Dieta

Error

Total

Total corregida 19935,366

207190,550

44,13616706,172

,1312,535111,8651111,865

,902,016,6851,685

,1242,643116,6451116,645

,000141,7266255,18516255,185

,2011,73176,3983229,194aOrigenOrigen

Pruebas de los efectos inter-sujetos

Variable dependiente:Peso

a. R cuadrado = ,245 (R cuadrado corregida = ,103)

Página 1

Page 37: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Tabla ANOVA con SPSS (interpretacion)

Modelo corregido SCE(α) + SCE(β) + SCE(αβ) = 229,194Interseccion nY 2

... = 6255,185sexo SCE(α) = 116,645dieta SCE(β) = 0,685sexo * dieta SCE(αβ) = 111,865Error SCR = 706,172Total

∑i

∑j

∑k Y

2ijk = 7190,550

Total corregida SCT = 935,366

Coeficiente de determinacion:

R2 =SCE(α) + SCE(β) + SCE(αβ)

SCT=

229,194

7190,550= 0,245

Page 38: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Contrastes sobre los efectos de los factores en la respuesta

¿Tiene la dieta (factor β) un efecto significativo sobre la respuesta?

Contraste: H0 : β1 = · · · = βJ = 0

La variabilidad debida al factor β es:

SCE(β) = IK∑j

β2j = IK

∑j

(Y.j . − Y...)2

Parece razonable rechazar H0 cuando SCE(β) sea suficientemente grande.

Bajo H0,SCE(β)

σ2≡ χ2

J−1.

Page 39: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Contrastes sobre los efectos de los factores en la respuesta

Como no conocemos σ2 lo reemplazamos por su estimador insesgado.

Bajo H0,

F (β) =SCE(β)/(J − 1)

SCR/[IJ(K − 1)]≡ FJ−1,IJ(K−1)

Una region crıtica de nivel α es:

R ={F (β) > FJ−1,IJ(K−1),α

}El contraste para el otro factor, H0 : α1 = · · · = αI = 0, es totalmenteanalogo.

Page 40: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Contrastes sobre las interacciones

En este modelo, podemos tambien preguntarnos si hay interaccionessignificativas entre los dos factores:

H0 : (αβ)ij = 0, para todo i = 1, . . . , I , j = 1, . . . , J

El razonamiento es totalmente analogo al de lo contrastes de los efectosprincipales. La region crıtica de nivel α es:

R ={F (αβ) > F(I−1)(J−1),IJ(K−1),α

},

donde

F (αβ) =SCE(αβ)/[(I − 1)(J − 1)]

SCR/[IJ(K − 1)]

tiene distribucion F(I−1)(J−1),IJ(K−1) bajo H0.

¿Cuales son las conclusiones en el ejemplo de las dietas?

Page 41: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Comparaciones multiples

Para responder a las cuestiones siguientes se razona de manera analoga alos modelos anteriores:

Escribe la formula de un intervalo de confianza de nivel 1− α para ladiferencia βi − βj en este modelo.

Escribe una region crıtica para contrastar a nivel α la hipotesisH0 : αi = αj .

¿Como habrıa que modificar los intervalos si llevamos a cabo mcomparaciones y queremos que el nivel de confianza global sea1− αT ?

Page 42: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Reactivos y catalizadores

Se desea investigar el efecto de cuatro tipos de reactivo y de trescatalizadores en la cantidad de producto resultante en una reaccion. Serepite la reaccion dos veces para cada tipo de reactivo y cada tipo decatalizador y se obtienen las cantidades de producto que aparecen en latabla siguiente:

Cat 1 Cat 2 Cat 3

Reactivo A 4-6 11-7 5-9Reactivo B 6-4 13-15 9-7Reactivo C 13-15 15-9 13-13Reactivo D 12-12 12-14 7-9

Page 43: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Tabla ANOVA del modelo bifactorial con interacciones:

Pruebas de los efectos inter-sujetos

Variable dependiente: producto

252,000a 11 22,909 5,727 ,0032400,000 1 2400,000 600,000 ,000

48,000 2 24,000 6,000 ,016120,000 3 40,000 10,000 ,001

84,000 6 14,000 3,500 ,03148,000 12 4,000

2700,000 24300,000 23

FuenteModelo corregidoInterseccióncatalizareactivocataliza * reactivoErrorTotalTotal corregida

Suma decuadrados

tipo III glMedia

cuadrática F Significación

R cuadrado = ,840 (R cuadrado corregida = ,693)a.

Page 44: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Modelo bifactorial con interacciones: algunas cuestiones

Calcula un estimador del efecto principal del reactivo A.

Calcula un estimador del efecto principal del catalizador 1.

Calcula un estimador del parametro que mide la interaccion entre el reactivo A y elcatalizador 1.

Calcula el valor pronosticado para la cantidad de producto obtenida cuando se utiliza elreactivo A y el catalizador 1.

Calcula los residuos para las observaciones correspondientes al tratamiento del apartadoanterior.

¿Cual es la tabla ANOVA correspondiente a un modelo bifactorial aditivo que no incluyeinteracciones? Escribe este modelo.

¿Hay alguna diferencia entre las conclusiones obtenidas usando el modelo aditivo y usandoel modelo con interacciones?

Page 45: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Tabla ANOVA para el modelo aditivo

Pruebas de los efectos inter-sujetos

Variable dependiente: producto

168,000a 5 33,600 4,582 ,0072400,000 1 2400,000 327,273 ,000

48,000 2 24,000 3,273 ,061120,000 3 40,000 5,455 ,008132,000 18 7,333

2700,000 24300,000 23

FuenteModelo corregidoInterseccióncatalizareactivoErrorTotalTotal corregida

Suma decuadrados

tipo III glMedia

cuadrática F Significación

R cuadrado = ,560 (R cuadrado corregida = ,438)a.

&[PageTitle]

Página 1

Page 46: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Modelos con tres o mas factores

Un modelo general con tres factores, α, β y γ incluye:

Media global: µ

Efectos principales: αi , βj , γk

Interacciones de segundo orden: (αβ)ij , (αγ)ik , (βγ)jk

Interacciones de tercer orden: (αβγ)ijk

SPSS permite seleccionar cuales de estos parametros queremos incluir enel modelo y nos da la correspondiente tabla ANOVA, cuyo analisis esanalogo al de los modelos que ya hemos visto.

El numero de observaciones requeridas para ajustar estos modelos crecemuy rapido.

¿Cuantas observaciones son necesarias para ajustar un modelo completocon 3 factores y 4 niveles cada uno?

Page 47: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Diseno por cuadrados latinos

Es un diseno alternativo que requiere menos observaciones.

Se puede aplicar cuando:

Hay tres factores.

Todos los factores se presentan con el mismo numero de niveles K .

No hay interacciones entre los factores.

El diseno por cuadrados latinos requiere unicamente K 2 observaciones.

En este diseno cada nivel de un factor aparece una unica vez con cada unode los niveles de los otros factores.

Page 48: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Diseno por cuadrados latinos

Page 49: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Diseno por cuadrados latinos: ejemplo

En un estudio se mide la velocidad de lectura (numero de palabras leıdaspor minuto) bajo distintas circunstancias:

Tipo de papel: Satinado, Blanco o Color.

Tamano de letra: Grande, Normal o Pequena.

Iluminacion: Natural (A), Muy fuerte (B), Escasa (C).

Diseno del experimento y respuestas obtenidas:

¿Cuántos factores se consideran en el experimento? Construir con SPSS la tabla de análisis de la varianza y contrastar, con un nivel de significación α=0,05, si los factores afectan a la velocidad de lectura.

8.- Se realiza un seguimiento para estudiar la posible influencia de dos factores sobre el número de visitantes a los parques nacionales. Los factores considerados son: el clima (seco o húmedo) y el departamento encargado de la conservación (A, B ó C). Los datos que se obtienen son:

A B CSeco 60 73 85Húmedo 63 69 88

(a) Plantear el modelo y las hipótesis asumidas para hacer el estudio con los datos disponibles, razonando la elección del modelo. Estimar la influencia adicional del clima húmedo sobre el número medio global de visitantes.

(b) ¿Influye el clima sobre el número de visitantes? ¿Influye el departamento encargado de la conservación? Dar respuestas razonadas con un nivel de significación del 5%.

9.- Un laboratorio de medición atmosférica ha adquirido un nuevo equipo para medir ozono. Para evaluar si el nuevo equipo está calibrado, se realiza un pequeño experimento en 5 observatorios diferentes. En cada observatorio se toma una medida con el nuevo equipo (que llamaremos B) y otra con el equipo antiguo (que llamaremos A), obteniéndose los siguientes resultados:

Obs. 1 Obs. 2 Obs. 3 Obs. 4 Obs. 5Equipo A 215 305 247 221 286Equipo B 224 312 251 232 295

Teniendo en cuenta que la suma de cuadrados totales (SCT) es 12491,6, proponer un modelo adecuado para explicar los niveles de ozono que se han observado en el experimento y contrastar si existen diferencias significativas entre los dos equipos, con nivel de confianza 0,95.

10.- En una investigación de laboratorio se emplean cámaras de crecimiento para estudiar el desarrollo de ciertos microorganismos cuando se varían las concentraciones de CO_2 (baja y alta), y la temperatura (baja, media y alta). En distintas cámaras se

Page 50: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios

Diseno por cuadrados latinos: ejemplo

Sig.FMedia

cuadráticagl

Suma de cuadrados

tipo III

Modelo corregido

Intersección

Iluminacion

Tamaño

Papel

Error

Total

Total corregida 82338,000

9529414,000

4,33328,667

,06614,07761,0002122,000

,03131,000134,3332268,667

,004223,692969,33321938,667

,000121632,923527076,0001527076,000

,01189,590388,22262329,333 aOrigenOrigen

Pruebas de los efectos inter-sujetos

Variable dependiente:Velocidad

a. R cuadrado = ,996 (R cuadrado corregida = ,985)

Página 1