bioestadísticay usode software científico · anova de dos vías(factorial) 8. calcularf...

29
TEMA 8 ANOVA FACTORIAL Bioestadística y uso de software científico ANOVA FACTORIAL ANOVA DE MEDIDAS REPETIDAS

Upload: phungnhu

Post on 30-Sep-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

TEMA 8

ANOVA FACTORIAL

Bioestadística y uso de software científico

ANOVA FACTORIAL

ANOVA DE MEDIDAS REPETIDAS

Page 2: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

Hasta ahora...

Tema Variable dependiente

Variable independiente

Test

Tema 4 Categórica Categórica χ2, McNemar

Tema 5 Continua Dicotómica t de StudentU de Mann-Whitney

Tema 7 Continua Categórica (>2 categorías)

ANOVA de una víaKruskal-Wallis

Tema 8 Continua Categóricas (dos variables)

ANOVA de dos vías

Page 3: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

Algunos ejemplos

� Se comparan tres tratamientos (A, B y C) para el control de la tensión arterial. Se quiere saber sialguno de ellos es más eficaz.

� Sólo una variable (tratamiento)

ANOVA de una vía�ANOVA de una vía

0 : A B CH µ µ µ= =

Page 4: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

Algunos ejemplos

� Se comparan tres tratamientos (A, B y C) para el control de la tensión arterial. Se quiere saber sialguno de ellos es más eficaz y si el sexo del pacienteinfluye en la eficacia

�Dos variables (tratamiento y sexo)�Dos variables (tratamiento y sexo)

�ANOVA de dos vías

0 : A B CH µ µ µ= =

0 varones: mujeresH µ µ=

( ) ( )0 varones mujeres: A B C A B CH µ µ µ µ µ µ= = = = =

Page 5: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

Anova de 2 vías

� Tres hipótesis nulas: influencia en la tensión arterial de:

�El tratamiento:

�El sexo:0 : A B CH µ µ µ= =

�La interacción tratamiento-sexo0 varones: mujeresH µ µ=

( ) ( )0 varones mujeres: A B C A B CH µ µ µ µ µ µ= = = = =

Page 6: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

Tabla del ANOVA de una vía

Fuente de variación

Suma de cuadrados

g.l. Varianza F

Tratamiento SCE=SCT-SCR k-1 Ve=SCE/(k-1) Ve/VrTratamiento SCE=SCT-SCR k-1 Ve=SCE/(k-1) Ve/Vr

Residual SCR=Σ(ni-1)si2 n-k Vr=SCR/(n-k)

Total SCT=(n-1)s2 n-1

Page 7: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

Tabla del ANOVA de dos vías

Fuente de variación

Suma de cuadrados

g.l. Varianza F

Tratamiento SCTratamiento t-1 Vtratamiento Vt/Vr

Sexo SCSexo s-1 Vsexo Vs/Vr

Interacción SCInteracción (t-1)(s-1) Vinteracción Vi/Vr

Residual SCResidual Vresidual

Total SCTotal n-1

Page 8: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

� Datos necesarios:

Tratamiento Varones Mujeres Total

A n=20 m=140 n=25 m=135 n=45 m=137

B n=25 m=135 n=20 m=130 n=45 m=133B n=25 m=135 n=20 m=130 n=45 m=133

C n=23 m=155 n=25 m=140 n=48 m=147

Total n=68 m=143 n=70 m=135 n=138 m=139

2 160totals =

Page 9: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

1. Calcular la suma de cuadrados debida al tratamiento (SCtratamiento)

2( )tratamiento i i totalSC n m m= −∑2 2 2( ) ( ) ( )tratamiento A A total B B total C C totalSC n m m n m m n m m= − + − + −

2 2 245(137 139) 45(133 139) 48(147 139) 4872tratamientoSC = − + − + − =

Page 10: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

2. Calcular la suma de cuadrados debida al sexo(SCsexo)

2( )sexo j j totalSC n m m= −∑2 2

varones varones( ) ( )sexo total mujeres mujeres totalSC n m m n m m= − + −

2 268(143 139) 70(135 139) 2208sexoSC = − + − =

Page 11: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

3. Calcular la suma de cuadrados debida a la interacción (SCinteracción)

2

interacción ( )ij ij total i jSC n m m m m= + − −∑2 2

interacción

2 2

2 2

20(140 139 143 137) 25(135 139 135 137)

25(135 139 143 133) 20(130 139 135 133)

23(155 139 143 147) 25(140 139 135 147) 833

SC = + − − + + − − +

+ + − − + + − − +

+ − − + + − − =

Page 12: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

4. Calcular la suma de cuadrados totales (SCtotal)

2

total ( 1) totalSC n s= −

total (138 1) 160 21920SC = − × =

Page 13: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

5. Calcular la suma de cuadrados residual (SCresidual)

residual interaccióntotal tratamientos sexoSC SC SC SC SC= − − −

residual 21920 4872 2208 833 14007SC = − − − =

Page 14: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

6. Calcular los grados de libertad

Fuente de variación

Categorías Grados de libertad

Tratamiento 3-1 2Tratamiento 3-1 2

Sexo 2-1 1

Interacción (3-1)(2-1) 2

Residual Total-t-s-inter 132

Total n-1 137

Page 15: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

7. Calcular las varianzas (SC/gl) y construir la tablade ANOVA

Fuente de variación

Suma de cuadrados

Grados de libertad

Varianza

Tratamiento 4872 2 2436

Sexo 2208 1 2208

Interacción 833 2 416,5

Residual 14007 132 106,1

Total 21920 137

Page 16: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

8. Calcular F (Varianza del factor / Varianza residual)

Fuente de variación

Suma de cuadrados

Grados de libertad

Varianza F

Tratamiento 4872 2 2436 23

Sexo 2208 1 2208 20,8

Interacción 833 2 416,5 3,9

Residual 14007 132 106,1

Total 21920 137

Page 17: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA de dos vías (factorial)

9. Buscar los valores p en la tabla F

2,132 23 0,001tratamientoF F p= = → <

1,132 20,8 0,001sexoF F p= = → <

interacción 2,132 3,9 0,02F F p= = → =

Page 18: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

Page 19: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

� Se quiere conocer la evolución de la tensión arterial en 30 sujetos. Para ello, se les toma la tensión al iniciar el tratamiento (medida 1), a los 6 meses(medida 2) y al año (medida 3).

0 1 2 3:H µ µ µ= =

1 1 2 3:H µ µ µ≠ ≠

Page 20: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

� Se quiere conocer la evolución de la tensión arterial en 30 sujetos. Para ello, se les toma la tensión al iniciar el tratamiento (medida 1), a los 6 meses(medida 2) y al año (medida 3).

� Es similar a la t de Student con datos emparejados. Pero la t vale sólo para dos medidas y el ANOVA vale para >2

Page 21: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

� Datos necesarios:

: totalMedia total m

2: totalVarianza total s: totalVarianza total s

1 2 3: , ,Media de cada medición m m m

_1 _ 2 _ 30

3 :

, ,...,

Media de las mediciones en cada sujeto

m m m

Page 22: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

1. Calcular la suma de cuadrados entre las medidas(SCmedidas):

2( )medidas i totalSC n m m= −∑

2 2 2

1 2 330 ( ) ( ) ( )medidas total total totalSC m m m m m m = × − + − + −

Page 23: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

2. Calcular la suma de cuadrados entre los sujetos(SCsujetos):

2

_( )sujetos i totalSC k m m= −∑

2 2 2

_1 _ 2 _ 303 ( ) ( ) ··· ( )sujetos total total totalSC m m m m m m = × − + − + + −

Page 24: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

3. Calcular la suma de cuadrados total (SCtotal):

2( 1)total totalSC kn s= −

Page 25: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

4. Calcular la suma de cuadrados residual (SCresidual):

residual total mediciones sujetosSC SC SC SC= − −

Page 26: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

5. Calcular los grados de libertad:

. . 1 3 30 1 89

. . 1 3 1 2

totalg l kn

g l k

= − = × − =

= − = − =

( )

. . 1 3 1 2

. . 1 30 1 29

. . 1 ( 1) ( 1) 58

mediciones

sujetos

residual

g l k

g l n

g l kn k n

= − = − =

= − = − =

= − − − − − =

Page 27: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

6. Calcular las varianzas (suma de cuadrados/g.l.) y construir la tabla ANOVA:

Fuente de variación

Suma de cuadrados

Grados de libertad

Varianza

Mediciones SCmediciones k-1 Varmediciones

Sujetos SCsujetos n-1

Residual SCresidual (kn-1)-(k-1)-(n-1)

Varresidual

Total SCtotal kn-1

Page 28: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

ANOVA con medidas repetidas

7. Calcular F dividiendo las varianzas, y buscar el valor p en la tabla F con k-1,(kn-1)-(k-1)-(n-1) grados de libertad:

Varianza1,( 1) ( 1) ( 1)

medidask kn k n

residual

VarianzaF

Varianza− − − − − − =

Page 29: Bioestadísticay usode software científico · ANOVA de dos vías(factorial) 8. CalcularF (Varianzadel factor / Varianzaresidual) Fuente de variación Suma de cuadrados Gradosde libertad

Test de Friedman

� Cuando no se cumplen las condiciones del ANOVA

�Variable dependiente con distribución normal

�Homocedasticidad (varianzas homogéneas)

� Es necesario utilizar un método no paramétrico:

�Test de Friedman=método no paramétrico en lugardel ANOVA de medidas repetidas

�Test de Kruskal-Wallis=método no paramétrico en lugar del ANOVA de una vía