anova

35
1 Capítulo 12 Análisis de varianza Objetivos: Al terminar este capítulo podrá: 1. Comprender la noción general del análisis de varianza. 2. Enunciar las características de la distribución F. 3. Realizar una prueba de hipótesis para determinar si dos varianzas de dos poblaciones son iguales. 4. Organizar datos en una tabla de ANOVA de una y dos direcciones.

Upload: coral-bruno

Post on 02-Oct-2015

215 views

Category:

Documents


0 download

DESCRIPTION

estadistica para administradores

TRANSCRIPT

  • Captulo 12Anlisis de varianzaObjetivos: Al terminar este captulo podr:

    Comprender la nocin general del anlisis de varianza.

    Enunciar las caractersticas de la distribucin F.

    Realizar una prueba de hiptesis para determinar si dos varianzas de dos poblaciones son iguales.

    Organizar datos en una tabla de ANOVA de una y dos direcciones.

  • Captulo 12 (Continuacin)Definir y entender el significado de los trminos tratamientos y bloques.

    Realizar una prueba de hiptesis entre tres o ms medias de tratamiento.

    Desarrollar intervalos de confianza para la diferencia entre medias de tratamiento.

    Realizar una prueba de hiptesis para determinar si existe alguna diferencia entre medias de bloques.

  • Caractersticas de la distribucin F.Hay una "familia" de distribuciones F.Dos parmetros determinan a cada miembro de la familia: los grados de libertad del numerador y los grados de libertad del denominador.F no puede ser negativa, y es una distribucin continua.La distribucin F es positivamente sesgada.Su rango de valores va de cero a infinito. Como F tiende a infinito, la curva se acerca al eje de las equis.

  • Prueba para varianzas igualesPara la prueba de dos colas, el estadstico de prueba est dado por:

    S12 y son las varianzas muestrales para las dos muestras.

    Se rechaza la hiptesis nula si el valor calculado del estadstico de prueba es mayor que el valor crtico.

  • Ejemplo 1Coln, corredor de bolsa en Seguridades Crticas, report que la tasa media de retorno en una muestra de 10 acciones de Internet era 12.6% con una desviacin estndar de 3.9%. La tasa media de retorno en una muestra de 8 acciones de uso utilitario era 10.9% con una desviacin estndar de 3.5%. En el nivel de significancia del .05, puede Coln concluir que hay ms variacin en la accin de Internet?

  • Ejemplo 1 (Continuacin)Paso 1: Las hiptesis son:

    Paso 2: El nivel de significancia es .05. Paso 3: El estadstico de prueba es la distribucin F.

  • Ejemplo 1 (Continuacin)Paso 4: H0 es rechazada si F >3.68. Los grados de libertad son 9 en el numerador y 7 en el denominador.Paso 5: El valor de F se computa como sigue.

    H0 no es rechazada. Hay poca evidencia para mostrar ms variacin en la accin de Internet.

  • Suposiciones para el ANOVALa distribucin F tambin se utiliza para probar si dos o ms medias muestrales provienen de la misma o igual poblacin.Esta tcnica se llama anlisis de varianza o ANOVA.ANOVA requiere las condiciones siguientes:

    Las poblaciones estn distribuidas normalmente.Las poblaciones tienen desviaciones estndar iguales.Las muestras se seleccionan independientemente.

  • Procedimiento del anlisis de varianzaLa hiptesis nula es que las medias de la poblacin son iguales.La hiptesis alternativa es que por lo menos una de las medias es diferente.El estadstico de prueba es la distribucin F.La regla de decisin es rechazar la hiptesis nula si F (calculada) es mayor que F (tabla) con grados de libertad en el numerador y el denominador.

  • Procedimiento del anlisis de varianzaSi hay k poblaciones muestreadas, los grados de libertad del numerador son k - 1.Si hay un total de n observaciones, los grados de libertad del denominador es n - k .El estadstico de prueba se calcula con:

  • Procedimiento del anlisis de varianzaEl total de los SS es la suma total de cuadrados.

  • Procedimiento del anlisis de varianzaSST es la suma de cuadrados del tratamiento.

    El TC es el total de columna, nc es el nmero de observaciones en cada columna, X la suma de todas las observaciones, y n el nmero total de observaciones.

  • Procedimiento del anlisis de varianzaSSE es la suma de cuadrados del error.

  • Ejemplo 2Los restaurantes de Rosenbaum se especializan en comidas para jubilados. Katy Polsby, presidenta, desarroll recientemente un nuevo platillo para la cena. Antes de hacerlo como un men regular, decide probarlo en varios de sus restaurantes. Ella quisiera saber si hay una diferencia en el nmero de cenas vendidas por da en los restaurantes de Anyor, de Loris, y de Lander. Utilice el nivel de significancia del .05.

  • Ejemplo 2 (Continuacin)Aynor LorisLander13101812121614131712111717 Tc514685 nc 4 4 5

  • Ejemplo 2 (Continuacin)El total SS es:

  • Ejemplo 2 (Continuacin)El SST es:

  • Ejemplo 2 (Continuacin)El SSE es:

    SSE = SS total SST = 86 76.25 = 9.75

  • Ejemplo 2 (Continuacin)Paso 1: H0: 1 = 2 = 3 H1: Las medias del tratamiento no son iguales

    Paso 2: H0: es rechazada si F >4.10. Hay 2 df en el numerador y 10 df en el denominador.

  • Ejemplo 2 (Continuacin)Para encontrar el valor de F:

  • Ejemplo 2 (Continuacin)La decisin es rechazar la hiptesis nula.Los medios del tratamiento no son iguales.El nmero de comidas que se vendi en las tres localizaciones no es igual.

    La tabla de ANOVA en la diapositiva siguiente es del sistema de Minitab.

  • Ejemplo 2 (Continuacin)Analysis of VarianceSource DF SS MS F PFactor 2 76.250 38.125 39.10 0.000Error 10 9.750 0.975Total 12 86.000 Individual 95% CIs For Mean Based on Pooled StDevLevel N Mean StDev ---------+---------+---------+-------Aynor 4 12.750 0.957 (---*---) Loris 4 11.500 1.291 (---*---) Lander 5 17.000 0.707 (---*---) ---------+---------+---------+-------Pooled StDev = 0.987 12.5 15.0 17.5

  • Inferencias acerca de pares de valores medios de tratamientoCuando rechazamos la hiptesis nula de que las medias son iguales, podemos desear saber qu medias de tratamiento son diferentes.

    Uno de los procedimientos ms simples est en el uso de los intervalos de confianza.

  • Intervalo de confianza para la diferencia entre medias de tratamiento

    donde t se obtiene de la tabla t con (n - k) grados de libertad.

    MSE = [SSE/(n - k)]

  • Ejemplo 3 Del Ejemplo 2 desarrolle un intervalo de confianza del 95% para la diferencia en el nmero de cenas vendidas en Lander y Aynor. Puede Katy concluir que hay una diferencia entre los dos restaurantes?

  • Ejemplo 3 (Continuacin)Dado que el cero no est en el intervalo, concluimos que este par de medias es diferente.

    El nmero medio de comidas vendidas en Aynor es diferente de Lander.

  • ANOVA en dos direccionesPara el ANOVA en dos direcciones, probamos si hay una diferencia significativa entre el efecto del tratamiento y si hay una diferencia en el efecto de bloqueo.

    Sea Br el total del bloque (r para las filas)SSB representa la suma de los cuadrados para los bloques donde:

  • Ejemplo 4 La fbrica Bieber funciona 24 horas al da, cinco das a la semana. Los trabajadores rotan turnos cada semana. Todd Bieber, el dueo, est interesado en ver si hay una diferencia en el nmero de unidades producidas cuando los empleados trabajan en varios turnos. Una muestra de cinco trabajadores se selecciona y su salida se registra en cada cambio. En el nivel de significancia del .05, podemos concluir que hay una diferencia en la produccin media de los turnos y en la produccin media de cada empleado?

  • Ejemplo 4 (Continuacin)

    EMPLEADOTURNO DIURNOTURNO VESPERTINOTURNO NOCTURNOBAEZA312535CERVERA332633DELGADO282430GUTIRREZ302928LPEZ282627

  • Ejemplo 4 (Continuacin)EFECTO DEL TRATAMIENTO

    Paso 1: H1: No todos los medios son iguales. Paso 2: H0 es rechazado si F >4.46, los grados de libertad son 2 y 8.

  • Ejemplo 4 (Continuacin)Calcule las diferentes sumas de cuadrados:SS(total) = 139.73SST = 62.53SSB = 33.73SSE = 43.47. df(bloque) = 4, df(tratamiento) = 2, df(error)=8.

  • Ejemplo 4 (Continuacin)Paso 3:

    Paso 4: H0 es rechazada. Hay una diferencia en el nmero medio de unidades producidas para los diversos perodos.

  • Ejemplo 4 (Continuacin)EFECTO DEL BLOQUE

    Paso 1: H1: No todas los medias son iguales.

    Paso 2: H0 es rechazada si F >3.84, df =(4,8)

  • Ejemplo 4 (Continuacin)Paso 3: F = [33.73/4]/[43.47/8] = 1.55

    Paso 4: H0 no se rechaza puesto que no hay diferencia significativa en el nmero medio de unidades producidas para los diversos empleados.

  • Ejemplo 4 (Continuacin)Debajo est la salida de Minitab.

    ANOVA de dos vas: Unidades contra trabajador, turno

    Analysis of Variance for Units Source DF SS MS F PWorker 4 33.73 8.43 1.55 0.276Shift 2 62.53 31.27 5.75 0.028Error 8 43.47 5.43Total 14 139.73