one way anova

Post on 26-May-2015

636 Views

Category:

Economy & Finance

1 Downloads

Preview:

Click to see full reader

DESCRIPTION

Carlos Gabriel Contreras SerranoFundamentos básicos del análisis de varianza en una vía.

TRANSCRIPT

Carlos Gabriel Contreras Serrano MscEstadistico.

Universidad de California Los Angeles.Duke University

One Way ANOVA.

Generalidades.

Su objetivo consiste en comprobar Sí uno o mas tratamientos experimentales producen un efecto determinado sobre la variable dependiente.

Establecimiento de relaciones causales entre la variable dependiente y la variable independiente.

Modelo estructura matemático de ANOVA.

Valor observa

do.

Suma de efectos

explicados por factores de efectos

fijos.

Suma de efectos

explicados por factores de efectos aleatorios

Suma de efectos explicados por otros factores distintos de los tratamientos.

Influencia de los tratamientos,

EfectosConstantes.

Efectos aleatorios.

ij

Estructura del análisis de varianza en un experimento

simple.

Puntuación de la variable independiente para la muestra i del tratamiento j.

Puntuación media de la población de la cual se ha extraído la

observación, es constante en todos los términos del experimento.

Efecto del j-esimo tratamiento experimental.

Error correspondiente a la i-esima observación bajo el j-

esimo tratamiento.

Yij = + j + ij

Mínimos cuadrados ordinarios (MCO)

EL procedimiento matemático diseñado para la estimación de los parámetros del modelo se denomina Mínimos Cuadrados Ordinarios MCO.

Consiste en minimizar la suma de cuadrados componente de error del modelo.

La finalidad del análisis de varianza radica en comprobar Sí alguno de los parámetros del modelo se desvía suficiente de cero y, por ende, Sí alguno de los tratamientos experimentales ejerce una influencia significativa sobre el fenómeno de estudio.

La razón F (Introducción)

Para realizar la comprobación de hipótesis, se sigue una serie de pasos hasta llegar a la razón F. estadístico en el que se fundamenta la prueba de hipótesis.

Un ejemplo clásico de ANOVA se puede observar en un diseño unifactorial multigrupo.

VARIABLE INDEPENDIENTE.

A

A1 A2 A3 Aj _Yi

SUJETOS

S1 Y1-1 Y1-2 Y1-3 Y1-k __Y1

S2 Y2.1 Y2.2 Y2.3 Y2.k __Y2

S3 Y3.1 Y3.2 Y3.3 Y3.k __Y3

S4 Y4.1 Y4.2 Y4.3 Y4.k __Y4

Sí Yi-1 Yi-2 Yi-3 Yij __Yn

Yj Y1 Y2 Y3 Yk

y..

Diseño unifactorial multigrupo al azar.

Yij = + j + ij

_ _ _ _ _ _

Supuestos para el uso de mínimos cuadrados ordinarios.

Los ij deben distribuirse normalmente.

Los ij han de ser independientes entre Sí.

La media de los ij deben ser igual a cero.

La varianza de los ij ha de coincidir con la varianza de la población.

V(ij) = 2

Cumplidos los supuestos…Los parámetros se pueden estimar de la

siguiente forma.

y.. ........

y j - y.. = j - j

Yij = + j + ij

_ _

_

ij = yij - y.j _

yij = y..+ (y. j – y..) + ij.

_ _ _

Colocando y.. En el miembro izquierdo de la igualdad, la desviación de una observación en torno a la media de la población se expresa como:

La ecuación anterior expresa el principio central de ANOVA. La distancia (o tamaño de variación) de un valor observado concreto, yij, con respecto a la media de todos los valores observados, y.. Se puede dividir en dos componentes: variación explicada y variación no explicada.

yij-y = (y. j – y..) +_ _ __

(yij - y.j)

Propósito matemático de ANOVA.

El propósito básico del ANOVA radica en calcular estos dos componentes de variación y en convertirlos en valores comparables. Para ello, se han de estimar en primer lugar las denominadas sumas de cuadrados o variaciones que se producen en un experimentos.

Componentes.

_ _

_

Suma de cuadrados.Las cumas de cuadrados reflejan las diferentes

variaciones que tienen lugar en un experimento y constituyen un elemento fundamental para el calculo de las varianzas.

Partiendo de una sola observación, yij, y aplicando la descomposición de la desviación total (puntuaciones diferentes con respecto a la media) en los componentes que acabamos de describir como desviación explicada y desviación no explicada, se tiene que:

yij-y = (y. j – y..) +_ _ __

(yij - y.j)

Elevando al cuadrado ambos miembros de la igualdad.

Desarrollando el binomio al cuadrado del segundo miembro de la igualdad

(yij-y )2= (y. j – y..) +_ _ __

(yij - y.j) 2

(yij-y )2= (y j – y..)2 + (yij - y.j)2 +2 (y.j – y..)(yij - y.j)

_ _ __ __ _

Generalizando la ecuación para cada i y j del experimento.

(yij-y )2= ny j – y..)2 + (yij - y.j)2 +2 (y.j – y..)(yij - y.j)

_ _ _ _ _ _ _

ji j ji ji

Dado que la suma de las variaciones de los yij en torno a su media es igual a cero.

2 (y.j – y..)(yij - y.j) = 0_ _ _

ji

(yij-y )2= ny j – y..)2 + (yij - y.j)2

_ _ _ _

ji j ji

En consecuencia, se obtiene la siguiente igualdad.

Suma cuadrática total.

Suma cuadrática intergrupo.

Suma cuadrática intragrupo.

Las sumas de cuadrados se calculan de manera diferente para cada tipo de diseño, de igual forma, la descomposición de la

variación total se calcula de manera diferente según el diseño.

Una vez obtenidas la suma cuadrática total, intergrupos e intragrupos, han de compararse tales variaciones entre Sí, para lo cual resulta necesario obtener sus correspondientes varianzas. La varianza es una variación promedio y, mas concretamente, se define como la cantidad de variación por grado de libertad. En consecuencia, para proceder al calculo de las varianzas se deben extraer, en primer lugar, los grados de libertad correspondientes a cada suma de cuadrados.

Grados de libertad. (concepto)

Son la cantidad de observaciones básicas independientes de las que se dispone en la estimación de una fuente de variación.

Siempre que se aplique una restricción a las observaciones basicas se pierde un grado de libertad.

Grados de libertad (calculo)

Varianzas o medias cuadraticas

Se obtienen dividiendo las variaciones o suma de cuadrados entre sus correspondientes grados de libertad.

Se esta forma se estima la proporción de varianza que corresponde a cada una de las fuentes de variación del modelo.

En el análisis de varianza de una vía hay que calcular dos medias cuadráticas. Una correspondiente a la fuente de variación intergrupos y otra correspondiente a la fuente de variación del error.

Medias cuadráticas.

MC intergrupo = SC intergrupo

gl intergrupo.

MC error = SC error

gl error

F= MC intergrupo

MC error

Razón FLa razón F es el cociente entre la media

cuadrática intergrupo o varianza explicada por el tratamiento y la media cuadrática del error o varianza residual:

Bajo el supuesto de la hipotesis nula o de la ausencia de diferencia entre los diversos grupos de tratamiento. La distribución muestra del estadístico se aproxima a la distribución F con k-1 grados de libertad el numerador y k(n-1) grados de libertad en el denominador.

Razón F

Este estadístico puede utilizarse para contrastar la hipótesis de igualdad entre las diferentes medias de la población, es decir, para saber Sí las medias de los grupos han sido extraídas de la misma población o de idénticas poblaciones. Sí las medias de los grupos no difieren entre Sí, la razón se acerca a la unidad, variando únicamente en función de las fluctuaciones del muestreo. Sí, por el contrario, las medias de los grupos difieren entre Sí, la razón excede la unidad en mayor medida de lo que podría atribuirse al mero azar.

Razón F

La hipótesis nula se rechaza cuando el valor F obtenido por el investigador (F empírica o F observada( supera el valor critico o tabular de F (F teórica) asumiendo un determinado valor alpha o error de tipo I

Ejemplo.

Un investigador quiere saber cual de los siguientes tratamientos tiene mejor efecto sobre la atención de niños diagnosticados con Déficit de Atención e Hiperactividad:

1.Biofedback.2.Terapia conductual.3.Terapia familiar.

Para ello, 90 niños fueron asignados aleatoriamente a tres grupo: 1. grupo Biofedback, 2. grupo terapia conductual y 3. niños sin tratamiento. Para asegurar éticamente al grupo 3 se suministro el mejor tratamiento una vez finalizado el experimento.

Datos.

Para medir los niveles de atención se aplico el test TOVA, (Test of Variables of Attention)

En términos generales se utilizó el programa StatGraphic para el análisis de los resultados.

Procedimiento en StarGraphics.Datos en el editor, es importante colocar

todos los datos en fila, uno detrás del otro.

Procedimiento en StarGraphicsIr a Comparaciones, análisis de varianza,

ANOVA simple.

Procedimiento en StarGraphicsSeleccione atención como variable

dependiente y tratamiento como factor, posteriormente de aceptar.

Procedimiento en StarGraphicsComo resultado se extraerá lo siguiente.

Interpretación.

En investigación social, es común utilizar un margen de error del 5% por lo que alpha será de 0.05.

El valor de P en este caso es menor de 0.05 lo que quiere decir que se rechaza la hipótesis nula, por lo que efectivamente existen diferencias estadísticamente significativas en por lo menos dos tratamientos.

Hay que recordar que la hipótesis nula en ANOVA indica que no hay diferencias significativas entre las medias de los grupos.

Grafico de medias.

Interpretación.Como se puede observar, la media de atención

en el grupo de pacientes que recibieron bioretroalimentación es superior a los pacientes que recibieron terapia de comportamiento, y los que recibieron terapia de comportamiento puntuaron superior que aquellos que recibieron terapia familiar.

Es posible que la terapia de comportamiento sea el mejor tratamiento para el déficit de atención e hiperactividad, aun asi hay que hacer análisis de COMPARACIONES MULTIPLES para tener elementos de análisis mas sólidos.

top related