Download - Inferencia Estadística. Prueba de Hipótesis Diferencia de Medias o Proporciones (1)

18-10-2015

1

PRUEBA DE HIPÓTESIS

Diferencia de medias o proporciones

Métodos Cuantitativos Avanzados

Nincen Figueroa

Carrera de Ciencia Política

Universidad Diego Portales

[email protected]

2015

PRUEBA DE HIPÓTESIS:MUESTRA PAREADAS O MUESTRAS INDEPENDIENTES

El cálculo de intervalo de confianza y el procedimiento de prueba de hipótesis

visto en los capítulos anteriores refieren a cálculos que implican una sola

muestra, que permiten hacer inferencia acerca de un parámetro poblacional.

Sin embargo, cuando realizamos inferencia estadística existen muchas situaciones

en que necesitamos comparar dos conjuntos de datos muestrales. En ese

sentido, podemos considerar dos casos:

1. Muestras pareadas (emparejados) o dependientes. Los datos se obtienes de la

misma fuente, es decir, las muestras están relacionadas entre ellas.

2. Muestras Independientes. Los datos provienen de distintas fuentes o diferentes

grupos, en otras palabras, las muestras NO están relacionadas entre sí.

18-10-2015

2

PRUEBA DE HIPÓTESISDIFERENCIA DE MEDIAS PARA MUESTRAS PAREADAS

Bibliografía para esta sesión:

• Weiss, N.A. (2011). Elementary Statistics (8th ed.). Pearson.

• Blalock, H. M. (1978). Estadística social. México: Fondo de Cultura Económica.

• Johnson, R., & Romo Muñoz, J. H. (2008). Estadística elemental: lo esencial. México: Cengage Learning.

• Triola, M., Pineda Ayala, L. E., & Hernández Ramírez, R. (2009). Estadística. Naucalpán de Juárez: Pearson

Educación.

PRUEBA DE HIPÓTESIS:

DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS

Cuando nos referimos a muestras pareadas es porque entre ellas existe alguna

relación para que cada valor en una muestra se aparee con un valor

correspondiente en la otra muestra.

Por ejemplo:

Promedio de notas de evaluación a Sebastián Piñera y Michelle Bachelet

Evaluación sobre la confianza en diferentes instituciones

Notas de un curso inicial y luego notas después de haber aplicado un programa especial de

enseñanza.

Al momento de trabajar con muestras pareadas deberemos utilizar estadístiscos

de prueba (puntaje z o t) que consideren la diferencia entre ambas mediciones

(por ej. Medición de Piñera y Bachelet)

18-10-2015

3



La diferencia entre ambas mediciones estará dada por:

En este caso, el promedio de las diferencias entre ambas mediciones está dada

por:

Y la desviación estándar se encuentra determinada por la fórmula:

21 ii xxd

n

xxd

ii

21

1

1

)(

2

2

n

n

dd

s

n

dds

d

i

d



Considerando el promedio y la desviación estándar de la diferencia

entre ambas mediciones, es posible calcular los estadísticos de prueba

dependiendo del tamaño muestral:

Si nuestra muestra es mayor que 30 casos Si nuestra muestra es menor que 30 casos

n

dz

d

d

n

s

dt

d

d

18-10-2015

4



Pudiendo calcular un estadístico de pruebas basado en el promedio de

las diferencias de las medias, la prueba de hipótesis sigue los mismos

pasos que una prueba de hipótesis para una muestra:

1. Planteamiento de hipótesis

2. Calcular el valor de tabla en base al nivel de significación α3. Dibujar regiones de aceptación y rechazo

4. Cálculo de estadístico de prueba

5. Decidir y concluir respecto de la prueba de hipótesis



Para el caso de diferencia de media para muestras pareadas, las hipótesispueden formularse igualmente de manera bilateral o unilateral,siguiendo la forma:

H0: µd = 0 valor de la hipótesis nula o valor “teórico”

H1: µd ≠ 0 Bilateralµd >0 Unilateral (derecha)µd < 0 Unilateral (izquierda)

Recuerde que H0: µd = 0, por lo tanto este será el valor que se utilice alcalcular el estadístico.

Se prueba si las diferencias son aleatorias u obedecen a un cambio realen la población.

18-10-2015

5


DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS. EJEMPLO.

Un balneario de aguas curativas anuncia un programa de reducción de peso y

afirma que el participante promedio pierde más de 6 kilos. En la siguiente tabla

se muestra elresultado en 10 personas, cuál sería su decisión con nivel de

significación del 1%

Sujeto Nº Antes Después

1 85,9 77,2

2 91,8 86,4

3 100 96,8

4 94,1 87,3

5 88,2 81,8

6 80,4 73,2

7 87,7 79,0

8 91,8 85

9 94,5 84,5

10 105,9 92,7

H0: µd = 6

H1: µd >6

1. Planteamiento de hipótesis



2. Calcular el valor de tabla en base al nivel de significación α

3. Dibujar regiones de aceptación y rechazo

821,2)9()110()1( 99.001.011 ttnt

2,821

18-10-2015

6



4. Cálculo de estadístico de prueba

Antes Después d d2

1 85,9 77,2 8,7 75,69

2 91,8 86,4 5,4 29,16

3 100 96,8 3,2 10,24

4 94,1 87,3 6,8 46,24

5 88,2 81,8 6,4 40,96

6 80,4 73,2 7,2 51,84

7 87,7 79 8,7 75,69

8 91,8 85 6,8 46,24

9 94,5 84,5 10 100

10 105,9 92,7 13,2 174,24

Suma 76,4 650,3

64,710

4,76d

72,24,7Sd

9,186,0

64,1

10

72,2

664,70

n

S

dt

d



5. Decisión y conclusión acerca de la hipótesis nula

Como el valor calculado t=1.9 no pertenece al área de rechazo, entonces con un nivel de

confianza del 90% no es posible rechazar la hipótesis nula, por lo que no es posible

concluir que la pérdida de peso después del programa es superior a 6 kg.

Caso contrario, si el t calculado (o el valor del estadístico de prueba) hubiera caído en el

área de rechazo, rechazo la hipótesis nula en favor de la alternativa.

2,8211,9

18-10-2015

7

PRUEBA DE HIPÓTESISDIFERENCIA DE MEDIAS PARA MUESTRAS INDEPENDIENTES






Educación.


DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES

Dos muestras son independientes cuando los valores muestrales seleccionados de una

población no están relacionados, emparejados o asociados con los valores muestrales de la

otra población.

Promedio de notas de evaluación a Sebastián Piñera según sexo de la persona encuestada

Evaluación sobre la confianza en diferentes instituciones según pertenencia o no la región Metropolitana.

Notas de un curso inicial y luego notas después de haber aplicado un programa especial de enseñanza, según si

asistió o no más del 80% a las clases.

Cuando hacemos esto, por lo general pensamos que un grupo tiene un comportamiento diferente que el otro. Lo que nos interesará es la diferencia en el promedio entre ambos grupos respecto de una determinada característica.

Por lo tanto, la hipótesis nula que usaremos es que los dos grupos tiene en el mismo comportamiento, es decir, la diferencia entre ellos es cero:

0:: 210210 HHH

2121 xx

18-10-2015

8



Las hipótesis alternativas en el caso de la diferencia de medias para muestrasindependientes pueden tener tres formas, las cuales son:

Al igual que en casos anteriores, la prueba de hipótesis para diferencia demedias en muestras independientes será distinto dependiendo siconocemos o no la varianza.

2121

2121

2121

210

0

0

0:

0:

aH

H



Si las muestras son independientes, elegidas aleatoriamente y con

varianzas conocidas, podemos suponer que la diferencia de medias tiene una

distribución normal. La fórmula de desviación estándar para esta distribución

está determinada por:

En este caso, el estadístico de prueba (puntaje z) estará determinado por:

Calculando el estadístico de prueba, el procedimiento para la prueba de hipótesis

se realiza siguiendo las etapas ya señaladas anteriormente.

2

2

2

1

2

1

21 nnxx

2

2

2

1

2

1

2111 )()(

nn

xxz

18-10-2015

9



Si no conocemos la varianza, al igual que en casos anteriores, el estadístico

de prueba a utilizar será el asociado a la distribución t-de Student.

En este caso, nos encontraremos frente a dos posibles situaciones respecto de

las varianzas de los grupos:

Ambas poblaciones tienen varianzas iguales

Ambas poblaciones tienen varianzas distintas

Para determinar en cual de los dos escenarios nos encontramos, deberemos

realizar una prueba de inferencia respecto a la varianza utilizando el

estadístico F de Snedecor/Fisher antes de realizar nuestra prueba de

hipótesis de las diferencia de medias.



La inferencia respecto a la varianza para dos muestras independientes se

basa en la utilización de la distribución F de Snedecor, cuyas

características son:

No tiene valores negativos, por lo que F es igual a 0 o positiva

Es asimétrica y se encuentra sesgada hacia la derecha

Existen muchas distribuciones F diferentes, la que será diferente para cada par de

grados de libertad

11 21 nglngl dn

BilateralgltUnilateralglt )2

,(),(

18-10-2015

10



Las hipótesis a plantear respecto a las varianzas buscarán dar cuenta si estas son

iguales o distintas, por lo que tendrán la forma:

El estadístico de prueba se encuentra representado por la fórmula:

2

2

2

1

2

1

2

2

2

12

2

2

10

1:

1:

aH

H

2

2

2

1

S

SF



Dependiendo si rechazamos o no nuestra hipótesis nula debemos calcular el

estadístico de prueba de distintas formas:

2 iguales 2 distintas

gl: Valor más pequeño entre n1 – 1

y n2 - 1221 nngl

2

)1()1(

11

)(

21

2

22

2

11

21

21

nn

snsns

nns

xxt

p

p

2

2

2

1

2

1

21 )(

n

s

n

s

xxt

18-10-2015

11

PRUEBA DE HIPÓTESISDIFERENCIA DE PROPORCIONES PARA MUESTRAS INDEPENDIENTES






Educación.


DIFERENCIA DE PROPORCIONES PARA MUESTRA INDEPENDIENTES

En el caso de diferencia de proporciones para muestras independientes,

debemos utilizar el estadístico de prueba z determinado por:

Las hipótesis a plantear, adquirirán la forma:

2

22

1

11

21

ˆˆˆˆ

ˆˆ

n

qp

n

qp

ppz

2121

2121

2121

21210

0

0

0:

0:

pppp

pppp

ppppH

ppppH

a

18-10-2015

12

Download - Inferencia Estadística. Prueba de Hipótesis Diferencia de Medias o Proporciones (1)

Top Related