anÁlisis varianza un factor anova i - … · test anova la idea del test anova es comparar la...

58
Estadística Ciencias Ambientales Facultad de Ciencias Departamento de Matemáticas Profesor: Santiago de la Fuente Fernández ANÁLISIS VARIANZA UN FACTOR ANOVA I

Upload: danghuong

Post on 28-Sep-2018

222 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Estadística Ciencias AmbientalesFacultad de CienciasDepartamento de MatemáticasProfesor: Santiago de la Fuente Fernández

ANÁLISIS VARIANZA UN FACTOR ANOVA I

Page 8: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

ANÁLISIS DE LA VARIANZA

Es conocido que una variable aleatoria Y se puede considerar como suma de una constante μ y de una variable aleatoria ε, querepresenta el error aleatorio: iiy ε+μ=Este modelo se adapta bien a datos de distintas ciencias (astronomía, geodesia, etc.), pero en problemas ambientales, biológicos,industriales es demasiado simple.Una generalización natural que se adapta bien a muchos fenómenos ambientales es el modelo lineal.Supongamos una variable Y en donde presumimos saber que influyen una serie de factores o causas asignables (a, b, c, d, ..., k).En esta línea, si Y es el rendimiento de una variable de trigo, las causas asignables pueden ser el grado de la humedad del suelo, latemperatura, los fertilizantes, etc. En una primera aproximación podemos admitir que todos estos factores (a, b, c, ..., k ) sonaditivos, y podemos escribir: Y = a + b + c + ... + εsiendo ε el efecto llamado causas no asignables o de azar.Si los factores (a, b, c, d, ... , k) se mantienen constantes las medidas de Y representarán variaciones que podrán atribuirse a un grannúmero de pequeñas causas no distinguibles entre sí, que es lo que conocemos como variación aleatoria o el azar.En definitiva, si disponemos de un experimento en que medimos Y a niveles diferentes de uno o más factores, el conjunto de medidasobtenidas no será homogéneo, sino que estará formado por dos o más grupos.Ronald Fisher (1923) introdujo una técnica, conocida como Análisis de la Varianza, para contrastar esta heterogeneidad, para ver sitales factores provocan la variación que se trata de estudiar, o bien, se debe atribuir dicha variación al efecto del azar.En otras palabras, la técnica del Análisis de la Varianza trata de separar las componentes de la variación que aparecen en un conjuntode datos estadísticos

VARIANZA DE UNA MUESTRA HETEROGÉNA

Supongamos dos muestras de dos poblaciones distintas con distintas medias, pero con la misma varianza. Parece fácilmentecomprensible que si se mezclan las muestras la varianza aumenta considerablemente - << Sean dos muestras de extensión 2, laprimera formada por (9, 11) y la segunda por (19, 21), cuyas medias respectivas son 10 y 20, siendo las varianzas 1 y 1.Si tomamos una muestra con todos los valores (9, 11, 19, 21), la media es 15 y la varianza 26 (muy superior a 1) >> - .Esta simple observación es el punto de partida del método conocido como Análisis de la Varianza, utilizado para contrastar lahipótesis: "varias poblaciones normales de la misma varianza tienen distintas medias".

Page 9: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro
Page 10: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro
Page 11: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

μ1 la respuesta media del tratamiento T1

------------------------------------------------------------------------

------------------------------------------------------------------------

μk la respuesta media del tratamiento Tk

La hipótesis nula H0: μ1 = μ2 = .... = μK(La respuesta media es la misma en los k tratamientos).La hipótesis alternativa Ha: μi ≠ μj para algún i ≠ j

Page 12: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

PRINCIPIOS DEL DISEÑO EXPERIMENTAL

Realizar un experimento es variar las condiciones que afectan a las unidades experimentales y obtener una variable de respuesta.Cada medición de la variable de respuesta será una observación experimental, y su número total es el tamaño del experimento.

Llamamos tratamientos o factores a aquellas condiciones experimentales que aplicamos a distintos niveles, y que producen valores dela variable de respuesta, a priori, distintos. El experimento se efectúa para comprobar si los tratamientos tienen efectos.Llamaremos unidades experimentales a la cantidad mínima de material experimental susceptible de recibir un tratamiento a un nivelcualquiera.

En definitiva, en un experimento se aplican uno o varios tratamientos o factores a distintos niveles a ciertas unidadesexperimentales. El resultado de cada observación elemental es un valor de la variable de respuesta.

ELECCIÓN DE LOS 'I' NIVELES DE LA VARIABLE EXPLICATIVA

• Niveles Fijos, cuando los distintos tratamiento o poblaciones son seleccionados por el experimentador.Por ejemplo, se trata de estudiar el efecto sobre la prolongación de la vida de distintos medicamentos. Los medicamentos sonelegidos por el experimentador.

• Niveles Aleatorios, cuando los distintos tratamiento o poblaciones son seleccionados al azar entre todos los posibles.Por ejemplo, cuando se trata de estudiar el efecto de un contaminante sobre distintas razas de perros. Podemos seleccionar alazar los perros de toda la población y clasificar luego por las razas que, al azar, han aparecido.

En las propiedades estadísticas del Análisis de la Varianza unifactorial no hay diferencia entre la selección fija o aleatoria de losniveles.

Page 13: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

DISEÑO DE EXPERIMENTOS - Las variables explicativas son cualitativas -

• ANÁLISIS DE LA VARIANZA UNIFACTORIAL.- Analiza y compara el comportamiento de una variable continua Y en distintosniveles (poblaciones o grupos o tratamientos) de un factor (variable explicativa).Ejemplo: La producción de un cultivo en parcelas iguales con distintos fertilizantes.

• ANÁLISIS DE LA VARIANZA CON DOS FACTORES.- Analiza y compara el comportamiento de una variable continua Y endistintos niveles de varios factores (variables explicativas) y las posibles interacciones entre ellos.Ejemplo: Altura de una especie de árboles en distintas regiones y distintos climas.

MUESTRA ALEATORIA

Sea Yij el resultado que obtendremos en la j-ésima observación dentro del i-ésimo nivel del factor explicativo:

ésimo-i nivel elen muestra la de tamañoel n siendo ,n , ... 2, 1, j

k , ... 2, 1, i

ii==

Cuando todas las muestras tienen el mismo tamaño el diseño se llama EQUILIBRADO o BALANCEADO.las observaciones se realizarán al azar e independientemente unas de otras.

ESTIMACIÓN DE PARÁMETROS

( ) ( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛±=μ α−

i

r

2;In.ii nStyC.I donde ( )∑ ∑

= =−

−=

k

1i

n

1j

2.iijr

i

yyIn

1S

( ) ( )( )

( )( ) ( )[ ] ⎟

⎜⎜

χ−

χ−

=σα−−α−

221;In

2r

22;In

2r2 SIn;SInC.I donde ( )∑ ∑

= =−

−=

k

1i

n

1j

2.iijr

i

yyIn

1S

Page 14: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

ANÁLISIS DE LA VARIANZA: CLASIFICACIÓN SIMPLE DE OBSERVACIONES

Sean 'k' grupos de observaciones ijy , donde ⎩⎨⎧

≡≡

grupoldedentroordenelrepresentajgrupoalrepresentai

El modelo es ijiijy ε+μ= , en donde ( )σε ,0Nesij , o, lo que es lo mismo, se supone que las observaciones de la clase Ei proceden de

una población ( )σμ,N en que σ no depende de i, tratándose de contrastar la hipótesis nula Ho:

Ho: Las medias iμ son iguales, es decir, que no hay diferencia significativa entre los distintos grupos o clases.

Sería el caso, por ejemplo, de ver si hay diferencia entre las piezas producidas por 'k' máquinas distintas, o por una máquina endistintas épocas, o los rendimientos de distintas variedades de trigo, o los de una misma variedad sometida a tratamientos distintos,etc.

Clases muéstrales T1 T2 .. Ti .. Tk

1 y11 y21 .. yi1 .. yk1

2 y12 y22 .. yi2 .. yk2

. .. .. .. .. .. ..

. .. .. .. .. .. ..j y1j y2j .. yij .. ykj

. .. .. .. .. .. ..

. .. .. .. .. .. ..

.11ny

22ny ..iiny ..

kknyMedias

muéstrales 1y 2y .. iy .. ky

Mediaspoblacionales 1μ 2μ .. iμ .. kμ

Page 15: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

El origen del nombre Análisis de la Varianza está en que se puede considerar la varianza total descompuesta de la siguiente forma:

( ) ( ) ( ) ( ) ( ) ( )[ ]

( ) ( ) ( )444 3444 21444 3444 21444 3444 21

a

aa4342143421

SCE

2i

k

1i

n

1j

SCR

2iij

k

1i

n

1j

SCT

2ij

k

1i

n

1j

2iiij

k

1i

n

1j

2ij

k

1i

n

1jgruposentre

esdesviacioni

gruposraintesdesviacion

iijij

yyyyyy

yyyyyyyyyyyy

iii

ii

•••= =

•= =

••= =

••••= =

••= =

•••

•••

−+−=−

−+−=−−+−=−

∑∑∑∑∑∑

∑∑∑∑

SUMA DE CUADRADOS TOTAL (Variabilidad de todos los datos): ( )2ij

k

1i

n

1jyySCT

i

••= =

−= ∑∑

SUMA DE CUADRADOS EXPLICADOS (Entre-Grupos): ( )2i

k

1i

n

1jyySCE

i

•••= =

−= ∑∑ variabilidad debida a que hay distintos niveles del factor

SUMA DE CUADRADOS RESIDUAL (Intra-Grupos): ( )2iij

k

1i

n

1jyySCR

i

•= =

−= ∑∑ Variabilidad interna dentro de cada nivel

TEST ANOVA

La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento(variabilidad dentro de cada grupo)

Ho: Las respuestas medias son iguales en todos los grupos ↔ koH μ==μ=μ ....: 21Ha: Las respuestas medias son distintas en al menos dos grupos ↔ jiaH μ≠μ: para algún i,j

Page 16: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Fuente de variación Suma cuadradosdesviaciones

grados delibertad Varianza Test F de

Fisher- SnedecorR2 ≡ Coeficientede Determinación

Explicada(entre grupos) SCE (k - 1) 1

ˆ2−

=kSCESe

Residual(dentro de los grupos) SCR (n - k)

knSCRS2

r −=

Total SCT (n - 1) 1ˆ2

−=

nSCTSy

2

2

ˆˆ

r

e

SSF =

SCTSCER 2 =

Para realizar el contraste de hipótesis bastará tener en cuenta que el cociente ⎟⎟⎠

⎞⎜⎜⎝

⎛2

2

ˆˆ

r

e

SS

sigue una ( ) ( )knkF −−α ,1, de (k - 1) y (n - k)

grados de libertad para un nivel de significación fijado α. De esta forma, podremos concluir:

• Se acepta Ho cuando ( ) ( )knkr

e FSSF −−α≤⎟

⎟⎠

⎞⎜⎜⎝

⎛= ,1,2

2

ˆˆ

• Se rechaza Ho cuando ( ) ( )knkr

e FSSF −−α>⎟

⎟⎠

⎞⎜⎜⎝

⎛= ,1,2

2

ˆˆ

El p-valor asociado al contraste se define como el mínimo nivel de significación con el que la hipótesis nula sería rechazada en favorde la alternativa.

COEFICIENTE DE DETERMINACIÓN

2rS no sirve (porque depende de las unidades de medida) para explicar la variabilidad en la respuesta. Para ello se utiliza el coeficiente

de determinación ( )SCTSCER 2 = , proporción de la variabilidad observada en los datos que queda explicada por el modelo

Page 17: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

COMPARACIONES MÚLTIPLES

Cuando al aplicar el test ANOVA se rechaza que las medias son iguales, se trata de encontrar qué grupos son distintos entre síhaciendo COMPARACIONES MÚLTIPLES ( Pruebas Post hoc) dos a dos.Para ello, existen varias opciones, siendo la CORRECCIÓN DE BONFERRONI la que más se utiliza.

• Cuando existe evidencia para rechazar la hipótesis nula, cabe preguntarse si son iguales los niveles medios de los grupos (i, j).

jiaji0 :H:H μ≠μμ=μ con un nivel de significación α

Se rechaza la hipótesis nula cuando ( ) ( )kn,2

ji

2R

ji t

n1

n1S

yy−α

•−•>

+

( ) ( ) ( ) ( ) ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+±=μ−μ−α•−•

jirkn,2

jiji n1

n1StyyCI

La varianza se estima con los datos de los DOS grupos y de los otros grupos, se utiliza la varianza residual.

• Si hay evidencia para rechazar la hipótesis nula y deseamos encontrar qué grupos se diferencian entre sí, habrá que realizar ⎟⎟⎠

⎞⎜⎜⎝

⎛2k

tests para comprobar todos los pares de medias.

Page 18: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

PRUEBAS Post hoc: TEST DE BONFERRONI

Para comparar los grupos dos a dos, aplicamos el test de Bonferroni, utilizando los intervalos de confianza

( ) ( )( )

( ) ( )( ) ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+±εμ−μ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+±=μ−μ−⎟

⎠⎞⎜

⎝⎛ α•−•−⎟

⎠⎞⎜

⎝⎛ α•−•

jirkn,c2

jijiji

rkn,c2jiji n

1n1Styy

n1

n1StyyCI a

El test múltiple de Bonferroni fijando un nivel de significación total ⎟⎠⎞⎜

⎝⎛ α

c2 , donde c = número de contrastes, est decir, el número de

tests ⎟⎟⎠

⎞⎜⎜⎝

⎛2k

que hay que realizar para comparar todos los pares de medias: ⎟⎟⎠

⎞⎜⎜⎝

⎛=

2k

c

Señalar que puede ocurrir que se rechace la hipótesis nula H0 en ANOVA y no se encuentren diferencias entre ningún par de mediasaplicando el test de Bonferroni.El test de Bonferroni es muy conservador, especialmente cuando 'c' es grande. Pueden aplicarse otros contrastes múltiples: Test deTukey (cuando el diseño es equilibrado), test de Scheffé (cuando los tamaños muestrales son diferentes, coincide siempre conANOVA), test de Dunnett (cuando hay un grupo control), test de Duncan, ..., etc.

Al aplicar el Test de Bonferroni, ( ) ( )( ) ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+±=μ−μ−⎟

⎠⎞⎜

⎝⎛ α•−•

jirkn,c2

jiji n1

n1StyyCI , cuando el CERO no se encuentra en

el intervalo, rechazamos la hipótesis de que las medias son iguales.

Page 19: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

DISPOSICIÓN DE LOS CÁLCULOS:

Familianúmero Observaciones in ∑

=

in

jijy

1∑=

in

iijy

1

2

i

n

jij

n

yi

2

1 ⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

i

n

1jij

.i n

yy

i

∑=

• =

1 111211 ,...,, nyyy 1n ∑=

1

11

n

jjy ∑

=

1

1

21

n

ijy

1

2

11

1

n

yn

jj ⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

1

n

1jj1

1 n

yy

i

∑=

• =

2 222221 ,...,, nyyy 2n ∑=

2

12

n

jjy ∑

=

2

1

22

n

ijy

2

2

12

2

n

yn

jj ⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

2

n

1jj2

2 n

yy

2

∑=

• =

............ .............................. ...... ............... ................ ......................... ...........................

............ .............................. ...... ............... ................ ......................... ...........................

k knkkk yyy ,...,, 21 kn ∑=

kn

jjky

1∑=

kn

ijky

1

2

k

n

jjk

n

yk

2

1 ⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

k

n

1jjk

.k n

yy

k

∑=

• =

∑=

=k

iinn

1 ∑∑

∑∑

= =••

==

=k

1i

n

1jij

n

1jij

k

1i

i

i

yn1y

y

∑∑==

in

iij

k

iy

1

2

1i

n

jijk

i n

yi

2

1

1

⎟⎟⎠

⎞⎜⎜⎝

⎛∑

∑ =

= ⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=∑

∑ =

=••

i

n

1jijk

1i n

y

k1y

i

El cálculo de las desviaciones cuadráticas se abrevia con el artificio conocido: [ SCT = SCE + SCR ]

Page 20: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

• SUMA DE CUADRADOS TOTAL (Variabilidad de todos los datos):

( ) ( )

( ) 22ij

k

1i

n

1j

22ij

k

1i

n

1j

n

yy

ij

k

1i

n

1j

22ij

k

1i

n

1j

ij

k

1i

n

1j

2k

1i

n

1j

2ij

k

1i

n

1jij

22ij

k

1i

n

1j

2ij

k

1i

n

1j

ynyyny2ynyyy2yny

yy2yyyy2yyyySCT

ii

ijk

1i

in

1j

ii

iiiii

••= =

••••••= =

∑ ∑=

= =••••

= =

••= =

••= == =

••••= =

••= =

−=−+=−+=

=−+=−+=−=

∑∑∑∑∑∑∑∑

∑∑∑∑∑∑∑∑∑∑

= =••

44 344 21

Por tanto, ( )n

yyyySCT

2

ijk

1i

n

1j2ij

k

1i

n

1j

2ij

k

1i

n

1j

i

ii ⎟⎟⎠

⎞⎜⎜⎝

⎛∑ ∑

−=−= = =

= =••

= =∑ ∑∑∑ suma de cuadrados total

• SUMA DE CUADRADOS EXPLICADOS (Entre-Grupos):

( ) ( ) ( )

22i

k

1iii

k

1ii

22i

k

1iii

k

1i

n

1j

22i

k

1i

n

1j

i22

i

k

1i

n

1j

2i

k

1ii

2i

k

1i

n

1j

ynynyny2ynynyy2yny

yy2yyyynyySCE

ii

ii

•••=

•=

•••••=

•= =

•••••= =

••••••= =

•••=

•••= =

−=−+=−+=

=−+→−=−=

∑∑∑∑∑∑∑

∑∑∑∑∑

Por tanto, ( )n

y

n

y

yynSCE

2

ijk

1i

n

1j

i

2n

1jijk

1i

2i

k

1ii

ii

⎟⎟⎠

⎞⎜⎜⎝

⎛∑ ∑

−⎟⎟⎠

⎞⎜⎜⎝

=−== ==

=•••

=

∑∑∑ suma de cuadrados explicados (Entre-Grupos)

Page 21: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

ANÁLISIS ESTADÍSTICO: ANOVA (Contraste de igualdad de medias)

El objetivo es averiguar si los tratamientos empleados son significativamente diferentes, esto es, si hay una diferencia significativaentre los efectos producidos por los tratamientos.Para la aplicación del Análisis de la Varianza con un solo factor (ANOVA I) se tienen que verificar las siguientes hipótesis:• Que las poblaciones donde proceden las muestras sean normales.

Es decir, la variable yi sigue una distribución normal N(μi, σ) para cada i.

• Que las citadas poblaciones tengan la misma varianza (hipótesis de homocedasticidad)

• Linealidad. esto es, que la diferencia de los datos a su media, en cada nivel del factor, se distribuyen alrededor del cero (Gráficode los Residuos)

• Que las muestras hayan sido elegidas al azar

Se tendrán k poblaciones normales: N(μ1, σ), N(μ2, σ), ...., N(μk, σ)

y se pretende contrastar la hipótesis nula Ho frente a la alternativa H1:

Ho: Las medias poblaciones de donde proceden las muestras son iguales. ↔ koH μ==μ=μ ....: 21

Ha: Las medias poblaciones de donde proceden las muestras NO son iguales. ↔ jiaH μ≠μ: para algún i,j

NOTACIÓN:

K = número de tratamientosni = número de elementos que tiene la muestra a la que se aplicó el tratamiento j.n = número total de elementos observadosyij = valor que toma la variable de respuesta en el elemento i-ésimo de los que se aplicó el tratamiento j

Page 22: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

1º. Se someten 24 muestras de agua a 4 tratamientos de descontaminación diferentes y asignados al azar. Para cada muestra se mideun indicador de la calidad del agua (cuanto más alto está el indicador, mayor es la calidad del agua).En el experimento, el más efectivo es el tratamiento 3, pero ¿estamos seguros de que los tratamientos no son iguales?.

T1 T2 T3 T462606359

636771646566

686671676868

5662606163646359

Solución.- En un principio, parece ser que el tratamiento más efectivo es el 3. Para asegurarnos que los indicadores medios seanrealmente distintos hacemos un test ANOVA.

T1 T2 T3 T462606359

636771646566

686671676868

5662606163646359

•iy 61 66 68 612is 3,33 8 2,8 6,85

i

n

1jij

ii n,...,2,1iy

n1y

i== ∑

=• ( )∑

=•−

−=

in

1j

2iij

i

2i yy

1n1s

ESTIMACIÓN POBLACIONAL DE LOS PARÁMETROS:

•=

==μ ∑ i

n

1jij

ii yy

n1 i

( ) ( ) 2i

k

1ii

k

1i

n

1j

2iij

2r s1n

kn1yy

kn1S

i

∑∑∑== =

• −−

=−−

=

Page 23: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

64y41yy

k1y

4

1ii

k

1ii === ∑∑

=•••

=••• a

( )( ) ( ) ( ) ( ) ( ) ( )( )[ ] ( ) 112yySCR6,585,6188,21681633,314424

1S 2ij

k

1i

n

1j

2r

i

=−==−+−+−+−−

= ••= =∑ ∑a

( )( ) ( ) ( ) 3401247826087,14yySCT7826087,14

1n

yyS 2

ij

4

1i

n

1j

2ij

4

1i

n

1j2y

i

i

=−=−==−

= ••= =

••= = ∑ ∑∑∑

a

Adviértase que( ) ( ) ( )

444 3444 21

444 8444 76

444 3444 21

444 8444 76

444 3444 21

444 8444 76

1kSCES

SCE

2i

k

1i

n

1j

knSCRS

SCR

2iij

k

1i

n

1j

1nSCTS

SCT

2ij

k

1i

n

1j

2e

i

2r

i

2y

i

yyyyyy

−=

•••= =

−=

•= =

−=

••= =

−+−=− ∑∑∑∑∑∑

( ) 763

2281k

SCES228112340SCRSCTyySCE 2e

2i

4

1i

n

1j

i

==−

==−=−=−= •••= =∑ ∑ a

57,136,5

76SSF 2

r

2e === 67,0

340228

SCTSCER 2 ===

Page 24: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Cálculos:

∑=

in

1jijy ∑

=

in

1j

2ijy

i

2n

1jij

n

yi

⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

i

n

1jij

i n

yy

i

∑=

• =

T1 62 - 60 - 63 - 59 244 14894 14884 61T2 63 - 67 - 71 - 64 - 65 - 66 396 26176 26136 66T3 68 - 66 - 71 - 67 - 68 - 68 408 27758 27744 68T4 56 - 62 - 60 - 61 - 63 - 64 - 63 - 59 488 29816 29768 61

1536y4

1i

n

1jij

i

=∑∑= =

98644y4

1i

n

1j

2ij

i

=∑∑= = 98532

n

y4

1i i

2n

1jij

i

=⎟⎟⎠

⎞⎜⎜⎝

∑∑

=

=64y =••

( ) 9830424

153624

y2

24

1i

n

1jij

i

==⎥⎥⎦

⎢⎢⎣

⎡∑∑= =

340983049864424

y

ySCT

24

1i

n

1jij4

1i

n

1j

2ij

i

i

=−=⎟⎟⎠

⎞⎜⎜⎝

−=∑∑

∑∑ = =

= = / 2289830498532

24

y

n

y

SCE

24

1i

n

1jijk

1i i

2n

1jij

ii

=−=⎟⎟⎠

⎞⎜⎜⎝

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎟⎟⎠

⎞⎜⎜⎝

=∑∑

∑∑

= =

=

=

112228340SCRSCESCRSCT =−=⇒+=

Page 25: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Fuente de variación Suma cuadradosdesviaciones

grados delibertad Varianza Test F - R2

Explicada(entre grupos) SCE = 228 (k - 1) = 3 76

3228

1kSCES2

e ==−

=

Residual(dentro de los grupos) SCR = 112 (n - k) = 20 6,5

20112

knSCRS2

r ==−

=

Total SCT = 340 (n - 1) = 23 78,1423

3401n

SCTS2y ==

−=

57,136,5

76SSF 2

r

2e ===

67,0340228

SCTSCER 2 ===

Se establece la hipótesis nula Ho: no existe diferencia significativa entre los tratamientos.

Se rechaza Ho cuando ( ) ( ) 0984,3F57,13FFSSF 20;3;05,0kn,1k,2

r

2e =≥=⇒≥⎟⎟⎠

⎞⎜⎜⎝

⎛= −−α . Por tanto, se rechaza la hipótesis nula,

afirmando que no todos los tratamientos son iguales, con una fiabilidad del 95% (nivel de confianza).

El porcentaje de variabilidad explicada es del 67%.

• Al rechazar la hipótesis nula H0 existe evidencia estadística de que al menos una de las μi es diferente de las otras medias. Cabepreguntarse entre que medias hay diferencia significativa.

Para comparar los grupos dos a dos, aplicamos el test de Bonferroni, utilizando el intervalo de confianza

( ) ( )( ) ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+±=μ−μ−⎟

⎠⎞⎜

⎝⎛ α•−•

jirkn,c2

jiji n1

n1StyyCI

El test múltiple de Bonferroni fija un nivel de significación total ⎟⎠⎞⎜

⎝⎛ α

c2 , donde c = número de contrastes, es decir, el número de

contrastes que hay que realizar para comparar todos los pares de medias: 624

c =⎟⎟⎠

⎞⎜⎜⎝

⎛=

Page 26: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Los tratamientos más efectivos son el 2 y el 3

Page 29: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

2º. De un cierto producto se tomaron 12 muestras lo más parecidas posibles y se dividieron en 5 familias de 4, 2, 2, 3, 1 muestras,que se almacenaron bajo diferentes condiciones. Se trata de ver con los datos de hidratación de la tabla adjunta si hay diferenciassignificativas entre los métodos de almacenaje.

Método 1 2 3 4 58,37,68,48,3

7,47,1

8,16,4

7,99,510,0

7,1

Solución.-

Método Contenido de agua %tamaño muestra

in ∑=

in

1jijy ∑

=

in

jijy

1

2

i

2n

1jij

n

yi

⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

i

n

1jij

.i n

yy

i

∑==

1 8, 3 - 7.6 - 8.4 - 8.3 4 32,6 266.1 265,69 8,22 7.4 - 7.1 2 14,5 105,17 105,13 7,33 8.1 - 6.4 2 14,5 106,57 105,13 7,34 7.9 - 9.5 - 10.0 3 27.4 252,66 250,25 9,15 7.1 1 7,1 50,41 50,41 7.1

12nn5

1ii ==∑

=1,96y

5

1i

n

1jij

i

=∑∑= =

91,780yin

1j

2ij

5

1i=∑∑

== 61,776n

y

i

2n

1jij5

1i

i

=⎟⎟⎠

⎞⎜⎜⎝

⎛∑

∑ =

=

8,7y.. =

Page 30: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

6.76912

y2

5

1i

n

1jij

i

=⎥⎥⎦

⎢⎢⎣

⎡∑∑= =

31,116,76991,78012

y

ySCT

25

1i

n

1jij5

1i

n

1j

2ij

i

i

=−=⎟⎟⎠

⎞⎜⎜⎝

−=∑∑

∑∑ = =

= = / 01,76,76961,776

12

y

n

y

SCE

25

1i

n

1jijk

1i i

2n

1jij

ii

=−=⎟⎟⎠

⎞⎜⎜⎝

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎟⎟⎠

⎞⎜⎜⎝

=∑∑

∑∑

= =

=

=

30,401,731,11SCRSCESCRSCT =−=⇒+=

Fuente de variación Suma cuadradosdesviaciones

grados delibertad Varianza Test F

de SnedecorExplicada(entre grupos) SCE = 7, 01 (k - 1) = 4 75,1

401,7

1kSCES2

e ==−

=

Residual(dentro de los grupos) SCR = 4,30 (n - k) = 7 61,0

730,4

knSCRS2

r ==−

=

Total SCT = 11,31 (n - 1) = 11 03,111

31,111n

SCTS2y ==

−=

86,261,075,1

SSF 2

r

2e ===

Se establece la hipótesis nula Ho: no existe diferencia significativa en los métodos de almacenaje.

Se acepta Ho cuando ( ) ( ) 1203,4F86,2FFSSF 7;4;05,0kn,1k,2

r

2e =≤=⇒≤⎟⎟⎠

⎞⎜⎜⎝

⎛= −−α . Por tanto, se acepta que no hay diferencia

significativa entre los métodos de almacenaje con una fiabilidad del 95% (nivel de confianza).

Page 31: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

3º. Quince personas que se instruyen en un programa técnico son asignadas en forma aleatoria a tres tipos diferentes de instrucción,todos los cuales se relacionan con el desarrollo de un nivel específico de habilidad en la lectura de copias heliográficas.La puntuación de las pruebas de rendimiento, al concluir la especialización, se presentan en la tabla adjunta, junto con la puntuaciónmedia de desempeño asociado a cada enfoque de instrucción. ¿Existe diferencia significativa entre los métodos de instrucciónempleados?.

Métodoinstrucción Puntuación de la prueba Puntuación todas

las pruebasPuntuación mediade las pruebas

A 86 79 81 70 84 400 80B 90 76 88 82 89 425 85C 82 68 73 71 81 375 75

Solución:

Método Puntuación pruebatamaño muestra

in ∑=

in

1jijy ∑

=

in

jijy

1

2

i

2n

1jij

n

yi

⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

i

n

1jij

.i n

yy

i

∑==

A 86 - 79 - 81 - 70 - 84 5 400 32154 32000 80B 90 - 76 - 88 - 82 - 89 5 425 36265 36125 85C 82 - 68 - 73 - 71 - 81 5 375 28279 28125 75

15nn3

1ii ==∑

=1200y

3

1i

n

1jij

i

=∑∑= =

96698yin

1j

2ij

3

1i=∑∑

== 96250n

y

i

2n

1jij3

1i

i

=⎟⎟⎠

⎞⎜⎜⎝

⎛∑

∑ =

=

80y.. =

Page 32: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

9600015

y2

3

1i

n

1jij

i

=⎥⎥⎦

⎢⎢⎣

⎡∑∑= =

698960009669815

y

ySCT

23

1i

n

1jij3

1i

n

1j

2ij

i

i

=−=⎟⎟⎠

⎞⎜⎜⎝

−=∑∑

∑∑ = =

= = / 2509600096250

15

y

n

y

SCE

23

1i

n

1jijk

1i i

2n

1jij

ii

=−=⎟⎟⎠

⎞⎜⎜⎝

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎟⎟⎠

⎞⎜⎜⎝

=∑∑

∑∑

= =

=

=

448250698SCRSCESCRSCT =−=⇒+=

Fuente de variación Suma cuadradosdesviaciones

grados delibertad Varianza Test F

de SnedecorExplicada(entre grupos) SCE = 250 (k - 1) = 2 125

2250

1kSCES2

e ==−

=

Residual(dentro de los grupos) SCR = 448 (n - k) = 12 3,37

12448

knSCRS2

r ==−

=

Total SCT = 698 (n - 1) = 14 6,4914698

1nSCTS2

y ==−

=

35,33,37

125SSF 2

r

2e ===

Se establece la hipótesis nula Ho: no existe diferencia significativa en el método de instrucción, es decir, no existe diferenciasignificativa en las medias muéstrales.

Se acepta Ho cuando ( ) ( ) 8853,3F35,3FFSSF 12;2;05,0kn,1k,2

r

2e =≤=⇒≤⎟⎟⎠

⎞⎜⎜⎝

⎛= −−α . Por tanto, se acepta que no hay diferencia

significativa entre las medias muéstrales, con una fiabilidad del 95% (nivel de confianza).

Page 33: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

4º. La tabla adjunta representa el promedio de palabras mecanografiadas por minuto en diferentes máquinas, por individuosasignados aleatoriamente sin experiencia previa en estas máquinas, después del mismo período de instrucción. ¿Es significativa lamedia de palabras por minuto lograda por las tres máquinas, con un nivel de significación del 5%?.

Máquinas Promedio palabras por minuto1 79 83 62 51 772 74 85 723 81 65 79 55

Solución:

Máquinas Promediopalabras/minuto

tamaño muestrain ∑

=

in

1jijy ∑

=

in

jijy

1

2

i

2n

1jij

n

yi

⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

i

n

1jij

.i n

yy

i

∑==

1 79 - 83 - 62 - 51 - 77 5 352 25504 24780,8 70,42 74 - 85 - 72 3 231 17885 17787 77,03 81 - 65 - 79 - 55 4 280 20052 19600 70,0

12nn3

1ii ==∑

=863y

3

1i

n

1jij

i

=∑∑= =

63441yin

1j

2ij

3

1i=∑∑

== 8,62167n

y

i

2n

1jij3

1i

i

=⎟⎟⎠

⎞⎜⎜⎝

⎛∑

∑ =

=

47,72y.. =

1,6206412

y2

3

1i

n

1jij

i

=⎥⎥⎦

⎢⎢⎣

⎡∑∑= =

/ 9,13761,620646344112

y

ySCT

23

1i

n

1jij3

1i

n

1j

2ij

i

i

=−=⎟⎟⎠

⎞⎜⎜⎝

−=∑∑

∑∑ = =

= =

Page 34: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

7,1031,620648,6216712

y

n

y

SCE

23

1i

n

1jijk

1i i

2n

1jij

ii

=−=⎟⎟⎠

⎞⎜⎜⎝

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎟⎟⎠

⎞⎜⎜⎝

=∑∑

∑∑

= =

=

=

2,12737,1039,1376SCRSCESCRSCT =−=⇒+=

Fuente de variación Suma cuadradosdesviaciones

grados delibertad Varianza Test F

de SnedecorExplicada(entre grupos) SCE = 103,7 (k - 1) = 2 85,51

27,103

1kSCES2

e ==−

=

Residual(dentro de los grupos) SCR = 1273,2 (n - k) = 9 47,141

92,1273

knSCRS2

r ==−

=

Total SCT = 1376,9 (n - 1) = 11 17,12511

9.13761n

SCTS2y ==

−=

37.047,14185,51

SSF 2

r

2e ===

Se establece la hipótesis nula Ho: no existe diferencia significativa entre las tres máquinas.

Se acepta Ho cuando ( ) ( ) 2565,4F37,0FFSSF 9;2;05,0kn,1k,2

r

2e =≤=⇒≤⎟⎟⎠

⎞⎜⎜⎝

⎛= −−α . Por tanto, se acepta que no hay diferencia

significativa entre las tres máquinas en términos de velocidad de mecanografía, con una fiabilidad del 95% (nivel de significación del5%).En realidad, debido a que la varianza explicada (entre grupos, marca de la máquina) es menor que la varianza residual (dentro de losgrupos, error de muestreo), podemos observar que la variabilidad entre las tres máquinas es menor que la variabilidad esperada, dadoque no existen diferencias entre las marcas de las máquinas.

Page 35: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

COMPARACIÓN DE POBLACIONES

El Test ANOVA trata de comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidaddentro de cada grupo).

G1 G2 G3 F1 F2 F35º.20192021

22222222

24242325

4501025

8303812

15442

35

Medias 20 22 24 20 22 24

Grupo

muestrain ∑

=

in

1jijy ∑

=

i

ij

n

1j

2y

i

n

1jij

i n

yy

i

∑=

• =( )∑

=••• −

3

1i

2ii yyn

G1 20 - 19 - 20 - 21 4 80 1602 20 ( )222204 −

G2 22 - 22 - 22 - 22 4 88 1936 22 ( )222224 −

G3 24 - 24 - 23 - 25 4 96 2306 24 ( )222244 −

2212

3

1i

in

1jijy

y

2643

1i

in

1jijy

=

∑=

∑==••

=∑=

∑=

5844y3

1i

n

1j

2i

ij=∑∑

= =22

3

yy

3

1ii

==∑=

••( )∑

=••• =−=

3

1i

2ii 32yynSCE

Page 36: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Grupomuestra

in ∑=

in

1jijy ∑

=

i

ij

n

1j

2y2n

1j

2i

ijy ⎟

⎟⎠

⎞⎜⎜⎝

⎛∑=

i

2n

1j

2

n

yi

ij ⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

G1 20 - 19 - 20 - 21 4 80 1602 6400 1600G2 22 - 22 - 22 - 22 4 88 1936 7744 1936G3 24 - 24 - 23 - 25 4 96 2304 9216 2304

2212

3

1i

in

1jijy

y

2643

1i

in

1jijy

=

∑=

∑==••

=∑=

∑=

5844y3

1i

n

1j

2i

ij=∑∑

= = 5840n

y

i

2n

1j

23

1i

i

ij

=⎟⎟⎠

⎞⎜⎜⎝

⎛∑

∑ =

=

( ) ( ) ( ) a

444 3444 21444 3444 21444 3444 21SCE

2i

k

1i

n

1j

SCR

2iij

k

1i

n

1j

SCT

2ij

k

1i

n

1jyyyyyy

iii

•••= =

•= =

••= =

−+−=− ∑∑∑∑∑∑ ( ) ( ) ( )444 3444 2144 344 21444 3444 21

SCE

2i

k

1ii

SCR

2iij

k

1i

n

1j

SCT

2ij

k

1i

n

1jyynyyyy

ii

•••=

•= =

••= =

−+−=− ∑∑∑∑∑

( ) ( ) ( ) 3212

2645840n

y

n

y

yynyySCE2

2

ijk

1i

n

1j

i

2n

1jij3

1i

2i

3

1ii

2i

3

1i

n

1j

ii

i

=−=⎟⎟⎠

⎞⎜⎜⎝

⎛∑ ∑

−⎟⎟⎠

⎞⎜⎜⎝

=−=−= = ==

=•••

=•••

= =

∑∑∑∑∑

( ) 3658085844n

yyyySCT

2

ij3

1i

n

1j2ij

3

1i

n

1j

2ij

k

1i

n

1j

i

ii

=−=⎟⎟⎠

⎞⎜⎜⎝

⎛∑ ∑

−=−= = =

= =••

= =∑ ∑∑∑ / 43236SCESCTSCR =−=−=

Page 37: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

( ) ( ) ( )4444 34444 21444 3444 21444 3444 21

SCE

2i

k

1i

n

1j

SCR

2iij

k

1i

n

1j

SCT

2ij

k

1i

n

1jyyyyyy

iii

•••= =

•= =

••= =

−+−=− ∑ ∑∑ ∑∑ ∑

( )

36)2225()2223()2224()2224(

)2222()2222()2222()2222(

)2221()2220()2219()2220(yySCT

2222

2222

22222ij

k

1i

n

1j

i

=−+−+−+−+

+−+−+−+−+

+−+−+−+−=−= ••= =∑ ∑

( )

4)2425()2423()2424()2424(

)2222()2222()2222()2222(

)2021()2020()2019()2020(yySCR

2222

2222

22222iij

k

1i

n

1j

i

=−+−+−+−+

+−+−+−+−+

+−+−+−+−=−= •= =∑ ∑

( ) ( ) 32)2224(.4)2222(.4)2220(.4yynyySCE 2222i

3

1ii

2i

k

1i

n

1j

i

=−+−+−=−=−= •••=

•••= =

∑∑∑

Page 38: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Test ANOVA

Fuente de variación Suma cuadradosdesviaciones

grados delibertad Varianza Test F de

Fisher- SnedecorR2 ≡ Coeficiente de

DeterminaciónExplicada(entre grupos) SCE = 32 3 - 1 = 2 16

232

1kSCES2

e ==−

=

Residual(dentro de los grupos) SCR = 4 12 - 3 = 9 444,0

94

knSCRS2

r ==−

=

Total SCT = 36 12 - 1 = 11 27,31136

1nSCTS2

y ==−

=

36444,016

SSF 2

r

2e

9;2 === 89,03632

SCTSCER 2 ===

Sea la hipótesis nula H0: Las respuestas medias son iguales en los tres grupos.

Con una fiabilidad del α = 0,95 (95%) se acepta Ho cuando ( ) ( ) ( ) ( )kn,1k,2r

2e

kn,1k FSSF −−α−− ≤⎟

⎟⎠

⎞⎜⎜⎝

⎛= , entonces:

2565,4F36444,016

SSF 9;2;05,02

r

2e

9;2 =>===

Se rechaza la hipótesis nula, afirmando con una fiabilidad del 95% que las respuestas medias son distintas en al menos dos grupos.El porcentaje de variabilidad explicada por el modelo es del 89%.

Análogamente, el análisis en el otro grupo:

Page 39: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Grupo

muestrain ∑

=

in

1jijy ∑

=

i

ij

n

1j

2y

i

n

1jij

i n

yy

i

∑=

• =( )∑

=••• −

3

1i

2ii yyn

F1 45 - 0 - 10 - 25 4 80 2750 20 ( )222204 −

F2 8 - 30 - 38 - 12 4 88 2552 22 ( )222224 −

F3 15 - 44 - 2 - 35 4 96 3390 24 ( )222244 −

2212

3

1i

in

1jijy

y

2643

1i

in

1jijy

=

∑=

∑==••

=∑=

∑=

8692y3

1i

n

1j

2i

ij=∑∑

= =22

3

yy

3

1ii

==∑=

••( )∑

=••• =−=

3

1i

2ii 32yynSCE

Grupomuestra

in ∑=

in

1jijy

2n

1j

2i

ijy ⎟

⎟⎠

⎞⎜⎜⎝

⎛∑=

i

2n

1j

2

n

yi

ij ⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

F1 45 - 0 - 10 - 25 4 80 6400 1600F2 8 - 30 - 38 - 12 4 88 7744 1936F3 15 - 44 - 2 - 35 4 96 9216 2304

696963

1i

in

1jijy

2643

1i

in

1jijy

2

=⎟⎟⎟

⎜⎜⎜

⎛∑=

∑=

=∑=

∑=

a

a

5840n

y

i

2n

1j

23

1i

i

ij

=⎟⎟⎠

⎞⎜⎜⎝

⎛∑

∑ =

=

Page 40: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

( ) ( ) ( ) a

444 3444 21444 3444 21444 3444 21SCE

2i

k

1i

n

1j

SCR

2iij

k

1i

n

1j

SCT

2ij

k

1i

n

1jyyyyyy

iii

•••= =

•= =

••= =

−+−=− ∑∑∑∑∑∑ ( ) ( ) ( )444 3444 2144 344 21444 3444 21

SCE

2i

k

1ii

SCR

2iij

k

1i

n

1j

SCT

2ij

k

1i

n

1jyynyyyy

ii

•••=

•= =

••= =

−+−=− ∑∑∑∑∑

( ) ( ) 3212

696965840n

y

n

y

yynyySCE

2

ijk

1i

n

1j

i

2n

1jij3

1i

2i

3

1ii

2i

3

1i

n

1j

ii

i

=−=⎟⎟⎠

⎞⎜⎜⎝

⎛∑ ∑

−⎟⎟⎠

⎞⎜⎜⎝

=−=−= = ==

=•••

=•••

= =

∑∑∑∑∑

( ) 288458088692n

yyyySCT

2

ij3

1i

n

1j2ij

3

1i

n

1j

2ij

k

1i

n

1j

i

ii

=−=⎟⎟⎠

⎞⎜⎜⎝

⎛∑ ∑

−=−= = =

= =••

= =∑ ∑∑∑

2852322884SCESCTSCR =−=−=

Test ANOVA

Fuente de variación Suma cuadradosdesviaciones

grados delibertad Varianza Test F de

Fisher- SnedecorR2 ≡ Coeficiente de

DeterminaciónExplicada(entre grupos) SCE = 32 3 - 1 = 2 16

232

1kSCES2

e ==−

=

Residual(dentro de los grupos) SCR = 2852 12 - 3 = 9 9,316

92852

knSCRS2

r ==−

=

Total SCT = 2884 12 - 1 = 11 27,31136

1nSCTS2

y ==−

=

05,09,316

16SSF 2

r

2e

9;2 === 01,0288432

SCTSCER 2 ===

Page 41: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Sea la hipótesis nula H0: Las respuestas medias son iguales en los tres grupos.

Con una fiabilidad del α = 0,95 (95%) se acepta Ho cuando ( ) ( ) ( ) ( )kn,1k,2r

2e

kn,1k FSSF −−α−− ≤⎟

⎟⎠

⎞⎜⎜⎝

⎛= , entonces:

2565,4F05,09,316

16SSF 9;2;05,02

r

2e

9;2 =≤===

Se acepta la hipótesis nula, afirmando con una fiabilidad del 95% que las respuestas medias son distintas en al menos dos grupos.

El porcentaje de variabilidad explicada por el modelo es del 1%.

Page 42: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

ESTADÍSTICATercer Curso de CC. Ambientales (Universidad Autónoma de Madrid)

MODELOS DE DISEÑO DE EXPERIMENTOS (ANOVA DE UN FACTOR)

1. En un experimento realizado para comparar la capacidad pulmonar en niños, adultos y ancianos, se han obtenido los siguientesresultados:

Niños 8,4 7,6 7,9 8,0 8,1Adultos 8,7 8,1 8,5 8,2 8,0Ancianos 7,4 7,8 7,3 7,6 8,0

Hacer un estudio completo.

2. Las precipitaciones caídas en un país han disminuido de manera preocupante durante el último año. Antes de tomar ninguna medidase decide hacer un estudio previo para saber el descenso de las lluvias se produjo de forma homogénea en todo el país. Para ello seseleccionan aleatoriamente cinco estaciones meteorológicas en cada una de las cuatro regiones del país, obteniéndose los siguientesporcentajes de disminución de las precipitaciones en cada una de ellas:

Región Este Región Norte Región Oeste Región Sur10,4 12,8 11,2 13,912,8 14,2 9,8 14,215,6 16,3 10,7 12,89,2 10,1 6,3 15,08,7 12,0 12,4 13,7

(a) Proponer un modelo para comparar los porcentajes de disminución de las precipitaciones en las 4 regiones.(b) Representar los datos gráficamente mediante diagramas de puntos y cajas. ¿Se verifican las hipótesis?.(c) ¿En qué zona parecen haber disminuido más las precipitaciones?.(d) Obtener la tabla ANOVA.

Page 43: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

(e) Contrastar la hipótesis nula de que las medias de disminución del porcentaje de lluvias en el país fueron las mismas en las cuatroregiones (tomar α = 0,10).(f) Efectuar comparaciones entre las medias de las diferentes regiones con un nivel de confianza global del 90%.

3. En un estudio sobre la efectividad de los métodos para dejar de fumar se quiere saber cuándo la reducción media en el número decigarrillos diarios difiere de un método a otro entre hombres fumadores. Para ello se hace un experimento con 12 fumadores queconsumían 60 cigarrillos diarios. Se aplica cada uno de los métodos a 4 de ellos seleccionados aleatoriamente. El número de cigarrillosque deja de fumar cada individuo es:

Método I Método II Método III50 41 4951 40 4751 39 4552 40 47

(a) Contrastar mediante el análisis de la varianza que la reducción media en el número de cigarrillos es igual para los tres niveles conun nivel de significación α = 0,05(b) Construir los intervalos de confianza para la diferencia entre las medias con un nivel de confianza conjunto de 0,95. ¿Quéconclusiones se pueden obtener?.

4. A continuación se muestran los datos recogidos por las inspecciones en cuatro gasolineras elegidas aleatoriamente. Los valores dela tabla reflejan los milímetros que faltan para completar un litro en distintas mediciones sobre el mismo surtidor de cada gasolinera.

Gasol. C 17,80 18,00 17,98 18,20 18,00 17,99 18,10 17,90Gasol. R 18,01 17,75 18,00 17,77 18,01 18,01 18,12 18,20Gasol. S 18,10 17,92 18,01 17,88 18,30 18,22 18,56 18,10Gasol. V 18,05 18,01 17,94 18,23 18,20 18,00 17,84 18,11

Contrastar la hipótesis nula de que la cantidad de gasolina que se sirve por litro no depende de la gasolinera.

Page 44: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

5. Completar la siguiente tabla ANOVA correspondiente a la comparación de 4 grupos con 4 observaciones por grupo:

Fuente de variación Suma cuadrados Grados libertad Varianzas Test F p-valorEntre Grupos 5,91Residual 54Total

6. En un bosque próximo a una incineradora los árboles no crecen con normalidad. Se piensa que unos nuevos abonos americanos yaustralianos pueden ser la solución. Para ver si es efectiva esta medida se utiliza el abono americano en un tercio de los árboles, elabono australiano en otro tercio y para el tercio restante no se utiliza ningún abono. Después de 3 meses se han obtenido lossiguientes resultados sobre el crecimiento en centímetros de 60 árboles en total:

Abono americano 57,6y1 =• 70,0s21 =

Abono australiano 30,5y2 =• 65,0s22 =

Sin abono 20,3y3 =• 50,0s23 =

A un nivel de significación α = 0,01 ¿Se puede afirmar que se obtienen diferencias en los resultados?. En caso necesario, efectuar unacomparación de los crecimientos medios, con un nivel de significación conjunto de 0,15.

7. En un estudio sobre la incidencia del cáncer en la garganta se van a analizar los resultados obtenidos en 10 ciudades de más de100.000 habitantes, en otras 10 ciudades de menos de 100.000 habitantes, y en 20 pueblos. En cada población se registra la variableY = 'Número de casos detectados por cada 100.000 habitantes'. Los resultados obtenidos se resumen a continuación:

y 2sCiudades grandes 120 105,2Ciudades pequeñas 110 95,3Pueblos 70 101.8

Page 45: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

(a) ¿Aportan estos datos evidencia estadística de que el hábitat influye en la incidencia del cáncer de garganta?. Dar una respuestarazonada, con una confianza del 90%, indicando el modelo y la metodología estadística empleada?.(b) Suponiendo que la varianza es la misma en cada uno de los tipos de población, dar una estimación insesgada de dicha varianza?.(c) Hallar intervalos de confianza para estimar simultáneamente las diferencias entre incidencias medias de la enfermedad en lostres tipos de población, con una confianza conjunta del 70%. ¿Qué soluciones estadísticas se pueden obtener sobre la incidenciamedia en los tres tipos de población?.

8. Se estudia ña influencia de los ingresos familiares en la tasa de mortalidad en 60 ciudades distintas. Para esto, consideramos tresniveles de ingresos (bajo, medio y alto) y obtenemos los siguientes resultados:

NivelBajo 4n1 = 243,866y1 =• 596,3394s2

1 =Medio 40n2 = 785,935y2 =• 844,3024s2

2 =Alto 16n3 = 321,970y3 =• 795,4198s2

3 =

(a) Describir el modelo a usar en el análisis de los datos y las hipótesis asumidas.(b) Construir la tabla ANOVA y decidir, a un nivel 0,01, si el factor influye en la tasa de mortalidad.(c) A nivel de conjunto α = 0,05, ¿entre qué niveles del factor se detectan diferencias significativas?.

Page 47: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro
Page 48: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

CALCULADORA: Total En cada Grupo

Niños 8.4 7.6 7.9 8.0 8.1 8y1 =• 085,0s21 =

Adultos 8.7 8.1 8.5 8.2 8.0 3,8y2 =• 085,0s22 =

Ancianos 7.4 7.8 7.3 7.6 8.015495,0S

15y2y =

=••

62,7y3 =• 082,0s23 =

Page 50: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

Test ANOVA

Fuente de variación Suma cuadradosdesviaciones

grados delibertad Varianza Test F de

Fisher- SnedecorR2 ≡ Coeficiente de

DeterminaciónExplicada(entre grupos) SCE = 1,16133 3 - 1 = 2 580665,0

1kSCES2

e =−

=

Residual(dentro de los grupos) SCR = 1,008 15 - 3 = 12 084,0S2

r =

Total SCT = 2,16933 15 - 1 = 14 154952,01n

SCTS2y =

−=

913,6084,0

5806,0SSF 2

r

2e

12;2 === 5353,0SCTSCER 2 ==

La proporción de la variabilidad observada que se explica en el modelo es del 53,53%. (R2 = 0,5353)

Habiendo rechazado la hipótesis nula, realizamos comparaciones múltiples (Pruebas Post hoc) para analizar si existe diferenciaentre algún par de medias. Para ello, se realiza el Test de Bonferroni, fijando un nivel de significación total c2T

α=α

Page 52: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro

( ) ( )( )

⎪⎪⎭

⎪⎪⎬

⎪⎪⎩

⎪⎪⎨

+±=μ−μ−⎟

⎠⎞⎜

⎝⎛ α•−•

4484476 típicoError

jirkn,c2

jiji n1

n1StyyCI ( ) ( ) ( ) ( )

⎪⎪⎭

⎪⎪⎬

⎪⎪⎩

⎪⎪⎨

⎥⎦

⎤+±=μ−μ⇒ •−•

44 344 21típicoError

jiji 51

512898,0055,3yyCI

Test de BonferroniVariable Dependiente: Indicador de Salud

Edad (i) Edad (j)Diferencia de medias

( )•−• ji yy

Error típico

jir n

1n1S + signatura Intervalo Confianza

Limite InferiorIntervalo Confianza

Limite Superior

Niños NiñosAdultos - 0,30 0,1832 0,383 - 0.8596 0,2596Ancianos 0,38 0,1832 0,181 - 0,1796 0,9396

Adultos Niños 0,30 0,1832 0,383 - 0,2596 0,8596AdultosAncianos 0,68 0,1832 0,09 0,1204 1,2396

Ancianos Niños - 0,38 0,1832 0,181 - 0.9396 0,1796Adultos - 0,68 0,1832 -1,1895 - 1,2396 - 0,1204Ancianos

Page 54: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro
Page 56: ANÁLISIS VARIANZA UN FACTOR ANOVA I - … · TEST ANOVA La Idea del Test ANOVA es comparar la variabilidad entre las medias con la variabilidad en el experimento (variabilidad dentro