f:\planteamiento de hipótesis en mas de dos poblaciones
TRANSCRIPT
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 1
UNIVERSIDAD VERACRUZANA
FACULTAD DE ADMINISTRACIÓN
Estadística Inferencial
TEMA
Planteamiento de Hipótesis en más de dos Poblaciones
EQUIPO: Restaurantes 2
Aguilar Hernández Leticia Avila Ortega Gabriela
Barcelata Beltrán Ana María Domínguez Rivera Laura María
Durán Fabián Luis Selin García Velázquez Anahí
González Cabañas Lizeth Pacheco Betancourt Adriana Nohemi
PROGRAMA EDUCATIVO: Lic. Admón. Turística
Veracruz, Ver., a 10 de mayo del 2010
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 2
PLANTEAMIENTO DE HIPÓTESIS EN MÁS DE DOS POBLACIONES
Algunas veces se consideran problemas en que debemos decidir si las diferencias
observadas entre más de dos medias se pueden atribuir al azar o si existen
diferencias reales entre las medias de las poblaciones de las que se obtuvieron las
muestras.
Y esto se estudia cuando por ejemplo lo que queremos conocer sobre la base de
datos muestrales, si en realidad existe alguna diferencia:
en la efectividad de 3 métodos de enseñanza de una lengua extranjera, o quizás
queremos comparar la producción promedio por caballería de distintas variedades de arroz.
Un investigador agrícola pudiera estar interesado en saber que tipo de fertilizante da mejores rendimientos,
ó sí en determinado laboratorio médico se desea evaluar el efecto de diferentes medicamentos en la presión sanguínea.
El método que utilizamos para este propósito es un instrumento estadístico
poderoso conocido como ANALISIS DE VARIANZA.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 3
GLOSARIO
ANOVA.- análisis de varianza (instrumento estadístico)
HIPOTESIS ESTADISTICA.- es una asunción relativa a una o varias poblaciones,
que puede ser cierta o no.
IDENTIDAD FUNDAMENTAL.- descomposición de la varianza total
GAUSSIANA.- En estadística y probabilidad se llama distribución normal,
distribución de Gauss o distribución gaussiana, a una de las distribuciones de
probabilidad de variable continua que con más frecuencia aparece en fenómenos
reales.
INSESGADO.- Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual al parámetro que se desea estimar.
GRADOS DE LIBERTAD.- es un estimador del número de categorías
independientes en una prueba particular o experimento estadístico.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 4
1:2
2
0
D
E
SE
SEH 1:
2
2
1
D
E
SE
SEH
k
i
k
i
iji
k
i
i
k
i
ni
j
ij nindondeyyTTTdonden
Ty
111
2
1 1
2
FORMULARIO
2
122
n
N i
k
i
i
T
22
T
22
T
insesgadoestimadorunesSEdondeyykn
S D
ni
j
iijD
22
2
1
2 1
22
2
2
1221
2
2
0
11
E
i
k
i
ii
E
k
i
ii
E
SElaentonces
yquecasoesteenesqueyaciertanulahipótesislabajoinsesgadoserásóloy
desesgadoestimadorunesquelopork
n
SEsudondek
yyn
S
2
11 1
2
1 1
2k
i
ii
k
i
ni
j
iij
k
i
ni
j
ij yynyyyy
1
22
k
SCCMS
kn
SCCMS E
EED
DD
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO
MEDIO
ESTADÍSTICO
ENTRE
GRUPO
2
1
K
I
ii yyn k – 1 1n
SCE F0 = 2
2
D
E
S
S
k
i
ni
j
iij yy1
2
1
n – k kn
SCD
DENTRO DE
GRUPO
TOTAL K
i
ni
j
ij yy1 1
2
N - 1
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 5
INTRODUCCION
Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que
puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la
información extraída de las muestras y tanto si se aceptan como si se rechazan se
puede cometer un error.
La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se
representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).
Fisher realizó muchos avances en la estadística, siendo una de sus más
importantes contribuciones, la inferencia estadística creada por él en 1920.
Student y Ronald Fisher iniciaron una nueva era en el estudio de las distribuciones
muestrales. Ronald Aylmer Fisher encontró en muestras procedentes de una
población normal, la distribución del coeficiente de correlación, los coeficientes de
regresión, los coeficientes de correlación múltiple y de proporción de variables
conocida por el nombre de F.
Esta distribución de probabilidad se usa como estadística prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación simultánea de varias medias poblacionales se conoce como análisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de intervalos. Características de la distribución F
Existe una "familia" de distribuciones F. Un miembro específico de la familia se determina por dos parámetros: los grados de libertad en el numerador y en el denominador . Existe una distribución F para la combinación de 29 grados de libertad en el numerador y 28 grados en el denominador. Existe otra distribución F para 19 grados en el numerador y 6 en el denominador.
La distribución F es una distribución continua.
F no puede ser negativa
La distribución F tiene un sesgo positivo
A medida que aumentan los valores, la curva se aproxima al eje x, pero nunca lo toca
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 6
En este trabajo se abordara el tema de F Fisher esperando así cumplir con las
expectativas requeridas.asi también se presentaran de manera simultánea las
formulas utilizadas, las tablas a utilizar, con el fin de hacer más fácil el
entendimiento del tema planteado.
ANÁLISIS DE VARIANZA
El análisis de varianza, como técnica de lo que trata es: si se está estudiando la
característica cuyos valores dependen de varias clases de efectos que operan
simultáneamente, poder decidir si tales efectos son debido al azar o si realmente
son diferentes.
Esta técnica de lo que trata es de expresar una medida de la variación total de un
conjunto de datos como una suma de términos, que se pueden atribuir a fuentes o
causas específicas de variación; pues bien esta descomposición de la varianza
total se denomina: Identidad fundamental. Ella junto a la formación del estadístico
de prueba, se refleja en una tabla llamada “Tabla de Análisis de Varianza”, que
resume los principales aspectos teóricos prácticos de la técnica.
Hay un corolario que plantea que:
Si “k” poblaciones se unen y las varianzas de las “k” poblaciones son iguales a 2
se tiene que:
2
122
n
N i
k
i
i
T Por lo tanto si todas las medias son iguales entonces:
22
T , mientras que si alguna es diferente, se puede concluir que 22
T
De modo que una comparación de varianza puede conducir a una conclusión
sobre la igualdad de medias poblacionales.
El método que se utiliza es a través de los estimadores de 2.
Hay un Teorema que plantea que:
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 7
Si dos o más muestras proceden de una misma población o de diferentes
poblaciones, pero con igual varianza, entonces un estimador insesgado de 2
podrá obtenerse a través de la siguiente expresión:
insesgadoestimadorunesSEdondeyykn
S D
ni
j
iijD
22
2
1
2 1
A esta varianza se le da el nombre de Varianza dentro del grupo.
Sería bueno comentar que esta varianza como es insesgada proporciona una
estimación válida de la varianza desconocida de la población sin importarle si se
acepta o rechaza H0.
Hay otro Teorema, bajo las mismas condiciones que el anterior que plantea que
otro estimador de 2 es:
22
2
2
1221
2
2
0
11
E
i
k
i
ii
E
k
i
ii
E
SElaentonces
yquecasoesteenesqueyaciertanulahipótesislabajoinsesgadoserásóloy
desesgadoestimadorunesquelopork
n
SEsudondek
yyn
S
Este estimador es conocido como varianza entre grupos.
Esta situación que expresan estos estimadores se pudiera representar
gráficamente de la siguiente forma:
Para H0 cierta: Para H0 falsa:
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 8
x 1 ________ x 1
x x
x3 x 2 x3
x 2
1 2 3 1 2 3
En este caso las xi no son iguales pero los elementos de las 3 poblaciones si casi
iguales sus valores están cercanos son muy diferentes y originan medias
muestrales muy diferentes.
Si estamos en caso de H0 falsa, y se nos presenta esta situación se diferencia en
la suma de cuadrado entre grupo esta diferencia, mientras que si estamos en el
caso de H0 cierta la diferencia entre los grupos es mínima.
En el caso de la SC, dentro de los grupos lo que hace es comparar cada elemento
de la muestra con la media de su propio grupo, para una u otra conclusión de la
hipótesis nula, su cálculo no se refleja, el valor es el mismo.
Como ya dijimos, el análisis de varianza consiste en dividir la suma de cuadrado
total en dos fuentes de variación y proceder al análisis de las mismas, estas son la
variación dentro del grupo y la variación entre grupos. Como son variaciones la
vamos a expresar como sumas de cuadrados, es decir:
SCT = SCD + SCE
__ __ __ __
(Yij - Y) = (Yij - Yi) + (Yi – Y)
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 9
Representando estas la variación total que es igual a la variación dentro del grupo
más la variación entre grupos, gráficamente se representa de la siguiente forma:
_ .
yij - yi .
. _
_ . yij -y
y1 .
_ _ .
yi - y . _
Y
.
_ .
y2 .
Si elevamos al cuadrado ambos miembros, y sumamos por “j” e “i”, llegamos a la
Identidad Fundamental, planteada anteriormente.
2
11 1
2
1 1
2k
i
ii
k
i
ni
j
iij
k
i
ni
j
ij yynyyyy donde se considera:
Suma de Suma de Suma de
Cuadrado Cuadrado Cuadrado
Total Dentro del Grupo Entre Grupo
De la misma forma resulta de gran importancia en el Análisis de varianza, la
relación entre los grados de libertad (que ya se habló de ellos en el Tema
anterior).
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 10
Si se aplica el valor esperado en ambos miembros se obtienen, bajo el supuesto
de H0 cierto de que, los grados de libertad asociados a estas sumas de cuadrados
serán:
(n – 1) = (n – k) + (k – 1) Esto es,
Para la SCT, = para la SCD y para la SCE
Si dividimos las Sumas de Cuadrados entre los grados de libertad, se obtendrán
los estimadores de 2 planteados, es decir la varianza total 2
TS la varianza dentro
del grupo 2
DS , y la varianza entre grupo 2
ES . También estos cocientes se
denominan Cuadrados Medios.
1
22
k
SCCMS
kn
SCCMS E
EED
DD
Debido a que el cálculo de varianzas entre y dentro de grupos hay varios pasos,
se acostumbra a dar al grupo completo de resultados en una tabla conocida como
tabla de análisis de varianza (ANOVA). Esta tabla incluye las fuentes de variación,
las sumas de los cuadrados(es decir las variaciones), los grados de libertad, las
varianzas(es decir los cuadrados medios) y el valor del estadístico de prueba que
veremos más adelante.
ANOVA
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO
MEDIO
ESTADÍSTICO
ENTRE
GRUPO
2
1
K
I
ii yyn k – 1 1n
SCE F0 = 2
2
D
E
S
S
k
i
ni
j
iij yy1
2
1
n – k kn
SCD
DENTRO DE
GRUPO
TOTAL K
i
ni
j
ij yy1 1
2
N - 1
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 11
Aquí en este caso se utiliza como estadístico de prueba F0, ¿Por qué la
Distribución F? . La distribución a utilizar es la F de Fisher, que se basa en la
razón de 2 varianzas.
Con el fin de determinar si las medias de los diversos grupos son todas iguales, se
pueden examinar dos estimadores diferentes de la varianza de la población. Uno
de los estimadores se basa en la suma de los cuadrados dentro de los grupos
(SCD); el otro se basa en la suma de los cuadrados entre los grupos (SCE). Si la
hipótesis nula es cierta, estos estimadores deben ser aproximadamente iguales; si
es falsa el estimador basado en la suma de los cuadrados entre grupos debe ser
mayor.
El estimado de la varianza entre los grupos no solo toma en cuenta las
fluctuaciones aleatorias de una observación a otra, sino también mide las
diferencias de un grupo con otro. Si no hay diferencia de un grupo a otro, cualquier
diferencia en la media muestral se explicará por la variación aleatoria, y la
varianza entre grupos, debe estar cerca de la varianza dentro de los grupos. Sin
embargo si en realidad hay una diferencia entre los grupos, la varianza entre
grupos será significativamente mayor que la varianza dentro de los grupos.
Por todo lo anterior, la prueba estadística se basa en la razón de estas dos
varianzas: CME/CMD. Si la hipótesis nula es cierta, esta razón debe estar cercana
a uno; si la hipótesis nula es falsa entonces el numerador debe ser mayor que el
denominador y la razón debe ser mayor que uno
Como se aprecia el problema se reduce a buscar un valor a partir del cuál el
estadístico de prueba resulte significativamente mayor que 1, y así se rechazará la
hipótesis de que no hay diferencias entre las medias de los grupos cuando la
razón entre las varianzas CME/CMD F k – 1;n – k)
De aquí se infiere que las hipótesis nula y alternativa que se plantearán serán las
siguientes:
H0: 1 = 2 = . . . = k
H1: alguna i diferente
Es bueno señalar que estas hipótesis son equivalentes a decir:
1:2
2
0
D
E
SE
SEH 1:
2
2
1
D
E
SE
SEH
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 12
Ya que como se vio anteriormente 2
ES es un estimador sesgado de la VARIANZA y
sólo será insesgado si se cumple que H0 es cierta, mientras que 2
DS es un
estimador insesgado.
Además es la razón por la cuál la distribución a utilizar es la F de Fisher, que no es
más que la relación entre 2 varianzas y siempre considerando, la región crítica
hacia la derecha, ya que nuestro problema se reduce a buscar un valor a partir del
cuál es estadístico de prueba resulte significativamente mayor que 1 y así
Rechazaremos H0 a un nivel de significación , si knk
D
E FS
S ;1
12
2
Antes de continuar queremos plantear que las fórmulas de cálculo de los
estimadores de las varianzas poblacionales conceptuales o por definición son muy
tediosas, sin embargo hay para estos estimadores unas fórmulas de cálculos
abreviadas que son más fáciles.
SCT =k
i
k
i
iji
k
i
i
k
i
ni
j
ij nindondeyyTTTdonden
Ty
111
2
1 1
2
SCE = n
T
n
Tk
i i
i
2
1
2
SCD = k
i i
ik
i
ni
j
ijn
Ty
1
2
1 1
2
Aunque se debe señalar que dado el carácter aditivo de estas varianzas, se
acostumbra a obtener la SCD por diferencia, es decir como:
SCT = SCE + SCD se obtendría despejando: SCD = SCT - SCE
Para aplicar esta técnica es necesario que se cumplan ciertas suposiciones sobre
los datos investigados.
1.- Las características medibles se distribuyen normalmente en cada población.
Esto es kidondeNY iii ,2,1; 2
2.- Las varianzas de las k poblaciones son iguales: 22
2
2
1 k
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 13
3.- Las características medibles son estadísticamente independientes, de una
población a otra: Y1, Y2, ... , Yk.
4.- Las muestras n1, n2, ... ,nk de los k grupos poblacionales deben seleccionarse a
través del M.A.S.
Vamos a ver un Ejemplo:
Los datos siguientes corresponden al Costo de Producción de un producto
fabricado bajo tecnologías diferentes. Realice una prueba estadística a un = 0.05
para decidir si existen diferencias entre las tecnologías, que puedan afectar los
Costos.
Tecnología Yi j ni Ti Ti2 Ti
2/ni Y2i j
A 7 4 6 4 9 5 30 900 180 49 16 36 16 81 198
B 2 4 5 6 3 5 20 400 80 4 16 25 36 9 90
C 7 8 7 11 7 5 40 1600 320 49 64 49 121 49 332
15 90 580 620
Hay que tener en cuenta que el subíndice i, representa las filas, y el j las
columnas.
Se prepara la tabla atendiendo a lo que se necesita a partir de las formulas
abreviadas planteadas, únicamente hay que tener en cuenta que los niveles se
deben planteara en el sentido de fila.
Resumiendo: n = 15; T = 90; k = 3; n1 = n2 = n3 = 5
Luego:
n
TYSC
k
i
ni
j
ijT
2
1 1
2 = 620 – 902/15 = 620 – 8100/15 = 620 – 540 = 80
SCE = n
T
n
Tk
i i
i
2
1
2
= 580 – 540 = 40
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 14
SCD = k
i i
ik
i
ni
j
ijn
Ty
1
2
1 1
2 = 620 – 580 = 40 o también utilizando la identidad
fundamental y en ella se despeja SCD, esto es:
SCT = SCD + SCE SCD = SCT – SCE = 80 – 40 = 40
Y ya estamos en condiciones de plantear la tabla de análisis de varianza, para el
cálculo del estadístico de Prueba.
ANOVA
Fuente de
Variación
Suma de
Cuadrado
Grados de
Libertad
Cuadrado
medio
Estadístico de
Prueba
Entre grupo
Dentro grupo
40
40
2
12
20
3.33
06.63.3
200F
Total 80 14
H0: 321
H1: alguna i diferente
= 0.05
2
2
D
E
S
S = 6.06
W: 2
2
D
E
S
S F1-
(k – 1; n – k) = 2
2
D
E
S
S Fo.95
(2, 12) = 2
2
D
E
S
S 3.89
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 15
RR
3.89
R:D:/ Rechazo H0 F0 3.89
No Rechazo H0 F0 3.89
D/ F0 = 6.06 3.89 Rechazo H0 que aceptamos H1 lo que nos indica que
existen diferencias significativas entre los costos de producción para por lo menos
una tecnología a un = 0.05
Si quisiéramos saber cual o cuales tecnologías son diferentes se pudiera
completar el análisis con una prueba T’Student de diferencia de media, probando
dos a dos dichas tecnologías.
Esta prueba de la homogeneidad de las varianzas fue desarrollada por Barttlet, y
se basa en el cálculo de un cociente, el cuál se denota por M/C.
se utiliza para comprobar uno de los supuestos del análisis de varianza, si se
quiere, el más importante, que es el de varianza constante(conocido por
Homocedasticidad)
Así las hipótesis a plantear serían:
H0: 22
2
2
1 k
H1: alguna 2
i diferente
Y el estadístico de prueba será el cociente M/C que es un estadístico que mide la
variabilidad entre las varianzas muestrales ya que:
2
1
2 ln1ln i
k
i
iD SnSknM Donde
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 16
kn
Sn
S
k
i
ii
D1
2
2
1
y
2
12
1i
k
i
iji
in
YY
S
Se puede observar que si las 2
iS difieren poco entre sí el valor de M, será pequeño
y si suponemos que la 2
iS son iguales, entonces M tomará el valor cero.
Demostración:
2
1
2 ln1ln i
k
i
iD SnSknM si 2
iS son iguales, entonces se trata como una
constante y se saca fuera de la sumatoria.
k
i
ii
k
i
ii
nSkn
nS
knM1
21
2
1ln
1
ln
Como knnk
i
i
01
1
M=(n – k) knSkn
knSi
i 22
lnln
M= (n- k) ln 2
iS - (ln 2
iS ) n- k
M = 0
Veamos el cálculo del estadístico de Prueba: M/C
M = 1 + k
i i knnk 1
1
1
1
13
1
Barttlet demostró que el estadístico M sigue aproximadamente una distribución 2,
con k-1 grados de libertad para (ni – 1) 4, y se divide entre una cantidad C, como
la planteada anteriormente; el cociente mejora la aproximación, y es más preciso
que si utilizáramos solamente M.
La expresión de M, puede transformarse para trabajar con logaritmos comunes.
M = 2.3026 2
10
1
2
10 log1log i
k
i
iD SnSkn se debe aclarar que se puede
aplicar tanto logaritmo comunes como naturales.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 17
La región crítica estará dada por: 12
1/: kCMW que gráficamente quedará representada de la siguiente
forma:
R no R. RR
)1(2
1k
A continuación vamos a comprobar este supuesto de varianza constantes o
iguales en el ejemplo que se desarrollo en la conferencia anterior.
Comencemos calculando las varianzas: 2
iS , para ello es necesario primeramente
hallar las medias de cada grupo:
615
908
5
404
5
206
5
30
3
33
2
22
1
11
n
TY
n
TY
n
TY
n
TY
Ya que 1
2
12
i
k
ii
n
YijYi
S
5.44
18
4
94041
4
)69()64()66()64()67( 222222
1S
5.24
10
4
14104
4
)43()46()45()44()42( 222222
2S
34
12
4
19101
4
)87()811()87()88()87( 222222
3S
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 18
33.312
)10(4
12
)35.25.4(4)1(
1
2
2
kn
Sni
S
k
i
i
D
Ya estamos en condiciones de plantear los elementos que hacen falta para
determinar M
Población ni 2
iS ln 2
iS (ni – 1) ln 2
iS
1 5 4.5 1.50408 6.01632
2 5 2.5 0.91629 3.66516
3 5 3 1.09861 4.39444
14.07592
ln 2
DS = ln 3.33 = 1.20297
M = (n – k) ln 2
DS -k
i
iSni1
2ln)1(
M = 12(1.20297) – 14.07592
= 14.43564 – 14.07592
= 0.35972
C=
11.172
81
2
1
4
3
6
11
2
1
4
1
4
1
4
1
6
11
1
1
1
13
11
1 1
k
i knnk
M/C = 0.35972/1.11 = 0.323
Ya estamos en condiciones de plantear la prueba, ya que calculamos el
estadístico de prueba.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 19
H0: 2
3
2
2
2
1
H1: alguna 2
i diferente
= 0.05
M/C 2(1- )
k-1
W: M/C 2(1- )
k-1 = M/C 5.99
R:D:/ Rechazo H0 M/C 5.99
No Rechazo H0 M/C 5.99
D/ . M/C = 0.323 5.99 No Rechazo H0 : 2
3
2
2
2
1 a un = 0.05
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 20
UTILIDAD
Esta distribución de probabilidad se usa en estadística como prueba en varias
situaciones. Se emplea para probar si dos muestras provienen de poblaciones que
poseen varianzas iguales. Esta prueba es útil para determinar si una población
normal tiene una mayor variación que la otra y también se aplica cuando se trata
de comparar simultáneamente varias medias poblacionales. La comparación
simultánea de varias medias poblacionales se conoce como análisis de varianza
(ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos
tener al menos la escala de intervalos.