18-10-2015
1
PRUEBA DE HIPÓTESIS
Diferencia de medias o proporciones
Métodos Cuantitativos Avanzados
Nincen Figueroa
Carrera de Ciencia Política
Universidad Diego Portales
2015
PRUEBA DE HIPÓTESIS:MUESTRA PAREADAS O MUESTRAS INDEPENDIENTES
El cálculo de intervalo de confianza y el procedimiento de prueba de hipótesis
visto en los capítulos anteriores refieren a cálculos que implican una sola
muestra, que permiten hacer inferencia acerca de un parámetro poblacional.
Sin embargo, cuando realizamos inferencia estadística existen muchas situaciones
en que necesitamos comparar dos conjuntos de datos muestrales. En ese
sentido, podemos considerar dos casos:
1. Muestras pareadas (emparejados) o dependientes. Los datos se obtienes de la
misma fuente, es decir, las muestras están relacionadas entre ellas.
2. Muestras Independientes. Los datos provienen de distintas fuentes o diferentes
grupos, en otras palabras, las muestras NO están relacionadas entre sí.
18-10-2015
2
PRUEBA DE HIPÓTESISDIFERENCIA DE MEDIAS PARA MUESTRAS PAREADAS
Bibliografía para esta sesión:
• Weiss, N.A. (2011). Elementary Statistics (8th ed.). Pearson.
• Blalock, H. M. (1978). Estadística social. México: Fondo de Cultura Económica.
• Johnson, R., & Romo Muñoz, J. H. (2008). Estadística elemental: lo esencial. México: Cengage Learning.
• Triola, M., Pineda Ayala, L. E., & Hernández Ramírez, R. (2009). Estadística. Naucalpán de Juárez: Pearson
Educación.
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
Cuando nos referimos a muestras pareadas es porque entre ellas existe alguna
relación para que cada valor en una muestra se aparee con un valor
correspondiente en la otra muestra.
Por ejemplo:
Promedio de notas de evaluación a Sebastián Piñera y Michelle Bachelet
Evaluación sobre la confianza en diferentes instituciones
Notas de un curso inicial y luego notas después de haber aplicado un programa especial de
enseñanza.
Al momento de trabajar con muestras pareadas deberemos utilizar estadístiscos
de prueba (puntaje z o t) que consideren la diferencia entre ambas mediciones
(por ej. Medición de Piñera y Bachelet)
18-10-2015
3
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
La diferencia entre ambas mediciones estará dada por:
En este caso, el promedio de las diferencias entre ambas mediciones está dada
por:
Y la desviación estándar se encuentra determinada por la fórmula:
21 ii xxd
n
xxd
ii
21
1
1
)(
2
2
n
n
dd
s
n
dds
d
i
d
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
Considerando el promedio y la desviación estándar de la diferencia
entre ambas mediciones, es posible calcular los estadísticos de prueba
dependiendo del tamaño muestral:
Si nuestra muestra es mayor que 30 casos Si nuestra muestra es menor que 30 casos
n
dz
d
d
n
s
dt
d
d
18-10-2015
4
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
Pudiendo calcular un estadístico de pruebas basado en el promedio de
las diferencias de las medias, la prueba de hipótesis sigue los mismos
pasos que una prueba de hipótesis para una muestra:
1. Planteamiento de hipótesis
2. Calcular el valor de tabla en base al nivel de significación α3. Dibujar regiones de aceptación y rechazo
4. Cálculo de estadístico de prueba
5. Decidir y concluir respecto de la prueba de hipótesis
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
Para el caso de diferencia de media para muestras pareadas, las hipótesispueden formularse igualmente de manera bilateral o unilateral,siguiendo la forma:
H0: µd = 0 valor de la hipótesis nula o valor “teórico”
H1: µd ≠ 0 Bilateralµd >0 Unilateral (derecha)µd < 0 Unilateral (izquierda)
Recuerde que H0: µd = 0, por lo tanto este será el valor que se utilice alcalcular el estadístico.
Se prueba si las diferencias son aleatorias u obedecen a un cambio realen la población.
18-10-2015
5
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS. EJEMPLO.
Un balneario de aguas curativas anuncia un programa de reducción de peso y
afirma que el participante promedio pierde más de 6 kilos. En la siguiente tabla
se muestra elresultado en 10 personas, cuál sería su decisión con nivel de
significación del 1%
Sujeto Nº Antes Después
1 85,9 77,2
2 91,8 86,4
3 100 96,8
4 94,1 87,3
5 88,2 81,8
6 80,4 73,2
7 87,7 79,0
8 91,8 85
9 94,5 84,5
10 105,9 92,7
H0: µd = 6
H1: µd >6
1. Planteamiento de hipótesis
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS. EJEMPLO.
2. Calcular el valor de tabla en base al nivel de significación α
3. Dibujar regiones de aceptación y rechazo
821,2)9()110()1( 99.001.011 ttnt
2,821
18-10-2015
6
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS. EJEMPLO.
4. Cálculo de estadístico de prueba
Antes Después d d2
1 85,9 77,2 8,7 75,69
2 91,8 86,4 5,4 29,16
3 100 96,8 3,2 10,24
4 94,1 87,3 6,8 46,24
5 88,2 81,8 6,4 40,96
6 80,4 73,2 7,2 51,84
7 87,7 79 8,7 75,69
8 91,8 85 6,8 46,24
9 94,5 84,5 10 100
10 105,9 92,7 13,2 174,24
Suma 76,4 650,3
64,710
4,76d
72,24,7Sd
9,186,0
64,1
10
72,2
664,70
n
S
dt
d
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS. EJEMPLO.
5. Decisión y conclusión acerca de la hipótesis nula
Como el valor calculado t=1.9 no pertenece al área de rechazo, entonces con un nivel de
confianza del 90% no es posible rechazar la hipótesis nula, por lo que no es posible
concluir que la pérdida de peso después del programa es superior a 6 kg.
Caso contrario, si el t calculado (o el valor del estadístico de prueba) hubiera caído en el
área de rechazo, rechazo la hipótesis nula en favor de la alternativa.
2,8211,9
18-10-2015
7
PRUEBA DE HIPÓTESISDIFERENCIA DE MEDIAS PARA MUESTRAS INDEPENDIENTES
Bibliografía para esta sesión:
• Weiss, N.A. (2011). Elementary Statistics (8th ed.). Pearson.
• Blalock, H. M. (1978). Estadística social. México: Fondo de Cultura Económica.
• Johnson, R., & Romo Muñoz, J. H. (2008). Estadística elemental: lo esencial. México: Cengage Learning.
• Triola, M., Pineda Ayala, L. E., & Hernández Ramírez, R. (2009). Estadística. Naucalpán de Juárez: Pearson
Educación.
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Dos muestras son independientes cuando los valores muestrales seleccionados de una
población no están relacionados, emparejados o asociados con los valores muestrales de la
otra población.
Promedio de notas de evaluación a Sebastián Piñera según sexo de la persona encuestada
Evaluación sobre la confianza en diferentes instituciones según pertenencia o no la región Metropolitana.
Notas de un curso inicial y luego notas después de haber aplicado un programa especial de enseñanza, según si
asistió o no más del 80% a las clases.
Cuando hacemos esto, por lo general pensamos que un grupo tiene un comportamiento diferente que el otro. Lo que nos interesará es la diferencia en el promedio entre ambos grupos respecto de una determinada característica.
Por lo tanto, la hipótesis nula que usaremos es que los dos grupos tiene en el mismo comportamiento, es decir, la diferencia entre ellos es cero:
0:: 210210 HHH
2121 xx
18-10-2015
8
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Las hipótesis alternativas en el caso de la diferencia de medias para muestrasindependientes pueden tener tres formas, las cuales son:
Al igual que en casos anteriores, la prueba de hipótesis para diferencia demedias en muestras independientes será distinto dependiendo siconocemos o no la varianza.
2121
2121
2121
210
0
0
0:
0:
aH
H
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Si las muestras son independientes, elegidas aleatoriamente y con
varianzas conocidas, podemos suponer que la diferencia de medias tiene una
distribución normal. La fórmula de desviación estándar para esta distribución
está determinada por:
En este caso, el estadístico de prueba (puntaje z) estará determinado por:
Calculando el estadístico de prueba, el procedimiento para la prueba de hipótesis
se realiza siguiendo las etapas ya señaladas anteriormente.
2
2
2
1
2
1
21 nnxx
2
2
2
1
2
1
2111 )()(
nn
xxz
18-10-2015
9
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Si no conocemos la varianza, al igual que en casos anteriores, el estadístico
de prueba a utilizar será el asociado a la distribución t-de Student.
En este caso, nos encontraremos frente a dos posibles situaciones respecto de
las varianzas de los grupos:
Ambas poblaciones tienen varianzas iguales
Ambas poblaciones tienen varianzas distintas
Para determinar en cual de los dos escenarios nos encontramos, deberemos
realizar una prueba de inferencia respecto a la varianza utilizando el
estadístico F de Snedecor/Fisher antes de realizar nuestra prueba de
hipótesis de las diferencia de medias.
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
La inferencia respecto a la varianza para dos muestras independientes se
basa en la utilización de la distribución F de Snedecor, cuyas
características son:
No tiene valores negativos, por lo que F es igual a 0 o positiva
Es asimétrica y se encuentra sesgada hacia la derecha
Existen muchas distribuciones F diferentes, la que será diferente para cada par de
grados de libertad
11 21 nglngl dn
BilateralgltUnilateralglt )2
,(),(
18-10-2015
10
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Las hipótesis a plantear respecto a las varianzas buscarán dar cuenta si estas son
iguales o distintas, por lo que tendrán la forma:
El estadístico de prueba se encuentra representado por la fórmula:
2
2
2
1
2
1
2
2
2
12
2
2
10
1:
1:
aH
H
2
2
2
1
S
SF
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Dependiendo si rechazamos o no nuestra hipótesis nula debemos calcular el
estadístico de prueba de distintas formas:
2 iguales 2 distintas
gl: Valor más pequeño entre n1 – 1
y n2 - 1221 nngl
2
)1()1(
11
)(
21
2
22
2
11
21
21
nn
snsns
nns
xxt
p
p
2
2
2
1
2
1
21 )(
n
s
n
s
xxt
18-10-2015
11
PRUEBA DE HIPÓTESISDIFERENCIA DE PROPORCIONES PARA MUESTRAS INDEPENDIENTES
Bibliografía para esta sesión:
• Weiss, N.A. (2011). Elementary Statistics (8th ed.). Pearson.
• Blalock, H. M. (1978). Estadística social. México: Fondo de Cultura Económica.
• Johnson, R., & Romo Muñoz, J. H. (2008). Estadística elemental: lo esencial. México: Cengage Learning.
• Triola, M., Pineda Ayala, L. E., & Hernández Ramírez, R. (2009). Estadística. Naucalpán de Juárez: Pearson
Educación.
PRUEBA DE HIPÓTESIS:
DIFERENCIA DE PROPORCIONES PARA MUESTRA INDEPENDIENTES
En el caso de diferencia de proporciones para muestras independientes,
debemos utilizar el estadístico de prueba z determinado por:
Las hipótesis a plantear, adquirirán la forma:
2
22
1
11
21
ˆˆˆˆ
ˆˆ
n
qp
n
qp
ppz
2121
2121
2121
21210
0
0
0:
0:
pppp
pppp
ppppH
ppppH
a
18-10-2015
12