tema 5: modelos probabilísticos · ahora introduciremos los , donde se evalúan -o más- aplicados...

23
Bioestadística II

Upload: ngodieu

Post on 04-Nov-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Bioestadística II

Page 2: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Bioestadística II

Page 3: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

En clases anteriores hemos estudiado diseños aleatorizados a un factor (con

y sin bloqueo), introduciendo el modelo de Análisis de la Varianza

Bioestadística II

Page 4: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Modelo lineal de Anova a un factor

ɛij es un término que representa al error aleatorio asociado a la observación Yij

Yij es la j-ésima observación del i-ésimo tratamiento, realizada sobre cada unidad experimental

μ es la media general de las observaciones

τi es el efecto del i-ésimo tratamiento

Variable respuesta: conjunto de observaciones que se obtienen de las unidades experimentales Tratamiento: conjunto de acciones que se aplican a las unidades experimentales con el fin de observar cómo responden

Bioestadística II

Page 5: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

ɛij es un término que representa al error aleatorio asociado a la observación Yij

Yij es la observación en

el i-ésimo tratamiento del

j-ésimo bloque

μ es la media general de las observaciones

τi es el efecto del i-ésimo tratamiento, con i=1,…,a

Modelo lineal de Anova a un factor con bloques

βj es el efecto del j-ésimo bloque, con j=1,…,b

Bioestadística II

Page 6: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Ahora introduciremos los

, donde se evalúan

-o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad entre los factores estudiados

Bioestadística II

Page 7: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

El modelo para un diseño a dos factores es el siguiente

ɛij es un término

que representa al error aleatorio asociado a la observación Yij

Yij es la

respuesta al i-ésimo nivel del factor A y j-ésimo nivel de factor B

μ es la media

general de las observaciones

αi es el efecto del

i-ésimo nivel del factor A, con i=1,…,a

βj es el efecto del

j-ésimo nivel del factor B, con j=1,…,b

Bioestadística II

Page 8: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

H0: α1 = α2 = … = αa

H1: al menos un αi es diferente a los demás

H0: β1 = β2 = … = βb

H1: al menos un βj es diferente a los demás

Hipótesis Estadísticas

Bioestadística II

Page 9: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Fuente de Variación

Suma de Cuadrados Grados de Libertad

Cuadrado Medio

F

Factor A SCA=

𝑎

𝑖=1

(y𝑖·)2

𝑎 -

(y··)2

𝑎𝑏 gla= a-1 CMA=

SCA

gla 𝐂𝐌𝐀

𝐂𝐌𝐄

Factor B SCB=

𝑏

𝑗=1

(y·𝑗)

2

𝑏 -

(y··)2

𝑎𝑏 glb= b-1 CMB=

SCB

glb 𝐂𝐌𝐁

𝐂𝐌𝐄

Error SCE= SCT-SCA-SCB gle= (gla)-

(glb) CME=

SCE

gld

Total SCT=

𝑎

𝑖=1

y𝑖𝑗2

𝑏

𝑘=1

- (y··)2

𝑎𝑏 glt= ab - 1

Bioestadística II

Page 10: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Todos los análisis de la varianza presentan los mismos supuestos para

el término correspondiente al error aleatorio:

• La varianza de los errores es constante (homogeneidad de varianzas)

• Los errores son variables aleatorias normales con esperanza cero

• Los errores (y por ende los datos) son independientes unos de otros

Supuestos del modelo

) ,0 ( I N~ 2

ij

Mediante interpretaciones gráficas y test estadísticos

pueden evaluarse los supuestos de normalidad y

homogeneidad de varianzas. Bioestadística II

Page 11: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Verificar la distribución normal de los errores:

• gráficamente: Q-Q plot

• Test de Shapiro-Wilk

Las hipótesis que se someten a prueba son:

H0: los residuos tienen distribución normal

H1: los residuos no tienen distribución normal

Verificar la homogeneidad de varianzas

• gráficamente: residuos vs. predichos

• Test de Levene

Las hipótesis que se someten a prueba son:

H0: σ12 = σ2

2 = … = σa2

H1: al menos dos varianzas son distintas

Supuestos del modelo

Bioestadística II

Page 12: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Bioestadística II

Page 13: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

En este caso, si el investigador supone que la respuesta a dos factores no se puede explicar como la suma de sus efectos individuales, el modelo debe incluir términos que incorporen estas hipótesis

Bioestadística II

Page 14: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Se incorpora entonces un al modelo. Permite la partición de la variabilidad considerando los efectos de cada factor y la interacción entre ellos. El modelo correspondiente es el siguiente:

αi es el efecto del

i-ésimo nivel del factor A, con i=1,…,a

βj es el efecto del

j-ésimo nivel del factor B, con j=1,…,b

δij representa los efectos

para cada combinación de

los niveles de los factores, es

decir, la interacción entre factores

ɛijk es un término que

representa al error

aleatorio asociado a la

observación Yijk

Yijk es la respuesta de

la k-ésima repetición

de cada uno de los

tratamientos

(definidos como

todas las posibles

combinaciones de los

a niveles del factor A

con los b niveles del

factor B)

μ es la media

general de las

observaciones

Bioestadística II

Page 15: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

H0: α1 = α2 = … = αa

H1: al menos un αi es diferente a los demás

H0: β1 = β2 = … = βb

H1: al menos un βj es diferente a los demás

Hipótesis Estadísticas

Bioestadística II

H0: δ11 = … = δa1 = δ12 =… = δ1b = … = δab

H1: al menos un δij es diferente a los demás

Page 16: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Bioestadística II

Page 17: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Todos los análisis de la varianza presentan los mismos supuestos para

el término correspondiente al error aleatorio:

• La varianza de los errores es constante (homogeneidad de varianzas)

• Los errores son variables aleatorias normales con esperanza cero

• Los errores (y por ende los datos) son independientes unos de otros

Supuestos del modelo

) ,0 ( I N~ 2

ij

Mediante interpretaciones gráficas y test estadísticos

pueden evaluarse los supuestos de normalidad y

homogeneidad de varianzas. Bioestadística II

Page 18: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Ejemplo de aplicación

En un estudio sobre la potencialidad forrajera de Atriplex cordobensis, un

arbusto que crece en depresiones del chaco árido argentino, se evaluó la

concentración de proteínas en hojas cosechadas en invierno y verano sobre

plantas masculinas y femeninas. Para cada combinación de sexo y estación, se

obtuvieron tres determinaciones del contenido proteico medido como

porcentaje del peso seco. Los resultados se presentan en la siguiente tabla.

Estación

Invierno Verano

Sexo

Femenino

24 17

28 18

26 16

Masculino

17 24

18 25

16 23

Page 19: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Análisis de la varianza

Variable N R² R² Aj CV

Conc.Prot. 12 0,93 0,91 6,30

Cuadro de Análisis de la Varianza (SC tipo III)

F.V. SC gl CM F p-valor

Modelo 198,00 3 66,00 37,71 <0,0001

Factor A 3,00 1 3,00 1,71 0,2268

Factor B 3,00 1 3,00 1,71 0,2268

Factor A*Factor B 192,00 1 192,00 109,71 <0,0001

Error 14,00 8 1,75

Total 212,00 11

Ejemplo de aplicación

A continuación se presenta la tabla correspondiente

al Análisis de la Varianza (salida de Infostat).

Page 20: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Ejemplo de aplicación

Se grafica aquí la media ± el

error estándar asociado de la

concentración de proteínas en

hojas de Atriplex cordobensis,

por efecto del sexo y la época

de cosecha. Se observa que los

perfiles de respuesta se cruzan

en este caso donde la

interacción resultó

significativa.

Page 21: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Para poner a prueba los supuestos del modelo, se solicitó al programa que guarde

los residuos. En primer lugar, esta información fue utilizada para evaluar los

supuestos mediante interpretaciones gráficas. Finalmente, se llevaron a cabo los

test estadísticos correspondientes.

Shapiro-Wilks (modificado)

Variable n Media D.E. W* p (una cola)

RDUO_Conc.Prot. 12 0,00 1,13 0,94 0,6672

Ejemplo de aplicación

A continuación se detallan las

pruebas referidas a la

normalidad de los residuos

• Q-Q plot (normal)

• Test de Shapiro-Wilks

Page 22: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Ejemplo de aplicación

Se incluyen aquí las pruebas para

evaluar la homogeneidad de varianzas

• Gráfico de dispersión de Residuos

(RDUO_Conc.Prot.) vs. Predichos

(PRED_Conc.Prot.)

Análisis de la varianza

Variable N R² R² Aj CV

RABS_Conc.Prot. 12 0,06 0,00 87,64

Cuadro de Análisis de la Varianza (SC tipo III)

F.V. SC gl CM F p-valor

Modelo 0,33 1 0,33 0,62 0,4475

Factor A 0,33 1 0,33 0,62 0,4475

Error 5,33 10 0,53

Total 5,67 11

• Test de Levene (Anova

tomando como

variable respuesta el

valor absoluto de los

residuos,

RABS_Conc.Prot.)

Page 23: Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad

Ejercicio integrador: Se desea estudiar cómo afecta la aplicación de distintas dosis de

droga sobre la concentración de cierta hormona en ratas. Dado que se trata de hormonas

esteroides, en el diseño del experimento se consideró también el sexo de las ratas

tratadas. Los resultados se encuentran en la siguiente tabla, expresados como

concentración plasmática de hormona en pg/ml . A continuación explique:

1. Cuál es la variable respuesta y cuál la unidad de observación,

cuáles son los factores y tratamientos resultantes, y cuántas

repeticiones hay por tratamiento.

2.El modelo estadístico correspondiente al diseño utilizado,

explicitando, en términos estadísticos y prácticos, cada uno

de los componentes.

3.Dócimas de hipótesis en términos estadísticos y prácticos.

4.Finalmente, ¿qué conclusiones pueden obtenerse

a partir de esta experiencia?

Actividad de cierre

Sexo

Femenino Masculino

Droga

Control

2,3 1,8

2,1 2

1,9 2,1

Dosis

mínima

2,5 2,1

3 2,6

2,3 1,9

Dosis

máxima

3,2 2,5

2,9 2,9

3,3 2,7