Transcript

Anlisis de VarianzaZultner Quintanilla MontoyaCaractersticas de la distribucin F Existe una familia de distribuciones F. Cada miembro de la familia est determinado por dos parmetros: los grados de libertad (gl) en el numerador y los grados de libertad en el denominador. El valor de F no puede ser negativo y es una distribucin continua. La distribucin F tiene sesgo postivo. Sus valores varan de 0 a . Con forme F la curva se aproxima al eje X. 11-3Prueba para variancias iguales Para prueba de dos colas, el estadstico de prueba estdado por: son las variancias muestrales para las dos muestras. La hiptesis nula se rechaza si el clculo del estadstico de prueba es ms grande que el valor crtico (de tablas) con nivel de confianzay grados de libertad para el numerador y el denominador.2122SFS=2 21 2y S S/ 211-4EJEMPLO 1 Colin, agente de bolsa del Critical Securities, reportque la tasa media de retorno en una muestra de 10 acciones desoftware fue 12.6% con una desviacin estndar de 3.9%. La tasa media de retorno en una muestra de 8 acciones de compaas de servicios fue 10.9% con desviacin estndar de 3.5%. Para 0.05 de nivel de significancia, Puede Colin concluir que hay mayor variacin en las acciones de software? 11-6EJEMPLO 1continuacin Paso 1: Paso 2:H0se rechaza si F > 3.68,gl = (9, 7),= .05 Paso 3: Paso 4: H0no se rechaza. No hay evidencia suficiente para asegurar que hay mayor variacin en las acciones de software.0:s uH 11-71:s uH >22(3.9)1.2416(3.5)F = =Suposiciones de ANOVA La distribucin F tambin se usa para probar la igualdad de ms de dos medias con una tcnica llamada anlisis de variancia (ANOVA).ANOVA requiere las siguientes condiciones: la poblacin que se muestrea tiene una distribucin normal las poblaciones tienen desviaciones estndar iguales las muestras se seleccionan al azar y son independientes11-8Procedimiento de anlisis de variancia Hiptesis nula: las medias de las poblaciones son iguales. Hiptesis alterna: al menos una de las medias es diferente. Estadstico de prueba: F = (varianza entre muestras)/(varianza dentro de muestras). Regla de decisin: para un nivel de significancia , la hiptesis nula se rechaza si F (calculada) es mayor que F (en tablas) con grados de libertad en el numerador y en el denominador. 11-9NOTA Sise muestrean k poblaciones, entonces losgl (numerador) = k - 1 Si hay un total de N puntos en la muestra, entonces los gl (denominador) = N - k El estadstico de prueba se calcula con: SST es la suma de cuadrados de los tratamientos. SSE es la suma de cuadrados del error.11-101SSTkFSSEN k=Frmulas Sea TCel total de la columna, ncel nmero de observaciones en cada columna, y X la suma de todas las observaciones. 22( )( ) ( )XSStotal Xn= 11-1122( )ccXTSSTn n = ( ) SSE SStotal SST = EJEMPLO 2 Los restaurantes Rosenbaum se especializan en comidas para retirados y familias. Su presidenta Katy Polsby acaba de desarrollar un nuevo platillo de pastel de carne. Antes de hacerlo parte del men normal decidi probarlo en varios de sus restaurantes. Quiere saber si hay diferencia en el nmero medio de comidas vendidas por da en los restaurantes Sylvania, Perrysburg y PointPlace para una muestra de cinco das. Con .05 de nivel de significancia, puede Katy concluir que hay una diferencia en el nmero medio de comidas de carne vendidas por da en los tres restaurantes? 11-12EJEMPLO 2continuacinSylvania Perrysburg Point Place13 10 1812 12 1612 11 1714 13 171711-13TotalTc51 46 85 182nc4 4 5 13(X2) 653 534 1447 2634EJEMPLO 2continuacin De la tabla, Katy determina SST = 76.25, SSE = 9.75, y el estadstico de prueba: F = [76.25 /2] /[9.75 /10] = 39.1026 Paso 1: H0: 1= 2= 3H1: no todas las medias son iguales Paso 2: H0se rechaza si F> 4.10 Paso 3: F = 39.10 Paso 4: H0se rechaza. Existe una diferencia en el nmero medio de comidas vendidas.11-14Inferencias acerca de las medias de tratamiento Cuando se rechaza la hiptesis nula de que las medias son iguales, quiz sea bueno saber qu medias de tratamiento difieren. Uno de los procedimientos ms sencillo es el uso de los intervalos de confianza.11-15Intervalos de confianza para ladiferencia entre dos medias donde t se obtiene de la tabla con (N - k) grados de libertad. MSE = [SSE /(N - k)]11-161 21 21 1( ) X X t MSEn n + EJEMPLO 3 Del EJEMPLO 2 desarrolle un intervalo de confianza de 95% para la diferencia en el nmero medio de comidas de pastel de carne vendidas en Point Place (pob # 1) y Sylvania (pob # 2). Puede Katy concluir que existe diferencia entre los dos restaurantes?1 1(17 12.75) 2.228 0.9754 5 + 11-174.25 1.48 (2.77,5.73) 1 21 21 1( ) X X t MSEn n + Dos factores ANOVA Para ANOVA de dos factores se prueba si existe una diferencia significativa entre el efecto de tratamiento y si existe una diferencia en la variable de bloqueo. Sea Br el total de bloque (r segn las filas) SSB representa la suma de los cuadrados de los bloques, donde:11-1822( )rXBSSBk n = EJEMPLO 4 La Bieber Manufacturing Co. opera 24 horas al da, cinco das a la semana. Los trabajadores rotan su turno cada semana. Todd Bieber, el propietario, se interesa en saber si hay una diferencia en el nmero de unidades producidas cuando los empleados trabajan diferentes turnos. Se seleccion una muestra de cinco trabajadores y se registr su produccin en cada turno. Con .05 de nivel de significancia, se puede concluir que existe una diferencia en la produccin media por turno y por empleado?11-19EJEMPLO 4continuacin11-20EmpleadoProduccin en el daProduccin en la tardeProduccin en la nocheMcCartney 31 25 35Neary 33 26 33Schoen 28 24 30Thompson 30 29 28Wagner 28 26 27EJEMPLO 4continuacin Variable de tratamiento Paso 1:H0: 1= 2= 3H1: no todas las medias son iguales. Paso 2:H0se rechaza si F > 4.46, gl = (2, 8). Calcule la variable de suma de cuadrados:SS(total) = 139.73, SST = 62.53, SSB = 33.73, SSE = 43.47.gl(bloque) = 4, gl(tratamiento) = 2, gl(error) = 8. Paso 3:F = [62.53 /2] /[43.47 /8] = 5.7511-21EJEMPLO 4continuacin Paso 4: H0se rechaza.Existe una diferencia en el nmero promedio de unidades producidas para los distintos periodos o turnos. Variable de bloqueo: Paso 1: H0: 1= 2= 3= 4= 5H1: no todas las medias son iguales. Paso 2: H0se rechaza si F > 3.84, gl = (4,8) Paso 3: F = [33.73 / 4] / [43.47 / 8] = 1.55 Paso 4: H0no se rechaza ya que no existe una diferencia significativa en el nmero promedio de unidades producidas para los distintos trabajadores.11-22


Top Related