test de hipótesis i

42
INFERENCIA ESTADÍSTICA INFERENCIA ESTADÍSTICA La Inferencia Estadística comprende los métodos que son usados para obtener conclusiones acerca de la población en base a una muestra tomada de ella. Incluye los métodos de estimación de parámetros y las pruebas de hipótesis. M P obtención de la muestra conclusion es

Upload: hector-funes

Post on 17-Jun-2015

50.843 views

Category:

Education


1 download

TRANSCRIPT

Page 1: Test de Hipótesis I

INFERENCIA ESTADÍSTICAINFERENCIA ESTADÍSTICALa Inferencia Estadística comprende los métodos que son usados para obtener conclusiones acerca de la población en base a una muestra tomada de ella. Incluye los métodos de estimación de parámetros y las pruebas de hipótesis.

MMP obtención de

la muestra

conclusiones

Page 2: Test de Hipótesis I

Inferencia para ProporcionesInferencia para Proporciones

n

xp ˆ

)1,0(~ˆ

N

n

pq

pPZ

es la proporción muestral.

p representa la proporción poblacional que se desea estimar

Cuando estamos interesados en estimar la proporción p (o el porcentaje) de ocurrencia de un evento. Se necesita definir una variable aleatoria X que indique el número de veces que ocurre el evento en una muestra de tamaño n y con probabilidad de éxito, p. Se puede mostrar que cuando el tamaño de muestra es grande, tal que np > 5, entonces el estadístico

Page 3: Test de Hipótesis I

Intervalo de confianza para la Intervalo de confianza para la ProporciónProporción

Intervalo de confianza (aproximado) del 100 (1-) % para la proporción poblacional p es:

nqp

Zpnqp

Zp ˆˆˆ,ˆˆ

ˆ 2/2/

Page 4: Test de Hipótesis I

Problema de test de hipótesis:Una empresa constructora acaba de comprar una gran cantidad de cables con garantía de resistencia promedio de al menos de 7000 psi. Con la finalidad de verificar esto, ha decidido tomar una muestra de 10 cables para verificar su resistencia. Después usará los resultados del experimento para decidir si acepta o no la hipótesis del fabricante de cables, de que la media poblacional es por lo menos de 7000 libras por pulgadas cuadradas.

Page 5: Test de Hipótesis I

Problema de test de hipótesisProblema de test de hipótesis

Se busca comprobar alguna información o afirmación (conjetura) sobre la población a partir de los datos obtenidos de una muestra.

Menos del 3% de las bombillas de un lote de 5000 duran menos de 1000 horas.

Las bombillas duran más de 1000 horas en promedio.

La resistencia media poblacional es por lo menos de 7000 psi.

Page 6: Test de Hipótesis I

Es una aseveración o conjetura con respecto a una o más poblaciones.

Es una afirmación que se hace acerca de un parámetro o varios parámetros poblacional.

La verdad o falsedad de una hipótesis estadística nunca llega a ser conocida con certeza.No se considera la población, sino una muestra aleatoria.

Hipótesis EstadísticaHipótesis Estadística

Page 7: Test de Hipótesis I

Test de hipótesisTest de hipótesisSe busca evidencia en los datos de la muestra para apoyar la hipótesis o para rechazar la hipótesis.

La aceptación o no rechazo de una hipótesis implica que los datos no dan suficiente evidencia para rechazarla.

El rechazo implica que la evidencia muestral es suficiente para rechazarla.

Page 8: Test de Hipótesis I

Hipótesis Nula y AlternativaHipótesis Nula y Alternativa

H0: Cualquier aseveración que deseamos probar.

H1: Hipótesis alternativa.

Se espera que sea rechazada después de aplicar una prueba estadística

La afirmación que se espera sea aceptada después de aplicar una prueba estadística.

Page 9: Test de Hipótesis I

Hipótesis Nula y AlternativaHipótesis Nula y Alternativa

7000:0 H 7000:0 H

7000:1 H

La resistencia media poblacional es por lo menos de 7000 libras por pulgadas cuadradas.

La resistencia media poblacional es menos de 7000 libras por pulgadas cuadradas.

Page 10: Test de Hipótesis I

Tipos de ErroresTipos de Errores

Page 11: Test de Hipótesis I

Tipos de ErroresTipos de Errores

Error de tipo II :

Aceptar la hipótesis nula cuando ésta en la realidad es Falsa.

Error de tipo I:

Rechazar la hipótesis nula cuando ésta en la realidad es verdadera.

Page 12: Test de Hipótesis I

Nivel de significanciaNivel de significancia

VesHHchazarP 00 /Re

FesHHrechazarNoP 00 /Probabilidad del error tipo II

Una disminución de provoca un crecimiento en

Page 13: Test de Hipótesis I

1- se le llama la potencia de la prueba.

Potencia de la pruebaPotencia de la prueba

Una buena prueba estadística es aquella que tiene una potencia de prueba alta.

Page 14: Test de Hipótesis I

¿Mejor balance entre los ¿Mejor balance entre los errores tipo I y tipo II?errores tipo I y tipo II?

Regla general

Nivel de error tipo II = 4 veces Nivel de error tipo I

Si el nivel de error tipo I = 5% un adecuado nivel de error tipo II es 20% (potencia = 80%)

Page 15: Test de Hipótesis I

Ho : =68

68:1 H

EjemploEjemplo

6868 o

Una media muestral que cae cercana a 68 se consideraría como evidencia a favor de H0

Una media muestral considerablemente menor o mayor que 68 se consideraría como evidencia a favor de H1

Page 16: Test de Hipótesis I

Estadístico de prueba: XRegión crítica: 67x 69x

Región de aceptación o no rechazo de H0 :

6967 x

67 68 69

Aceptar H0 Rechazar H0Rechazar H0

X

Page 17: Test de Hipótesis I

nNX

,~

68/6968/67 XPXP

6.336n

Page 18: Test de Hipótesis I

0950.067.167.1 ZPZP9.5% de todas las muestras de tamaño 36 nos llevarán a rechazar que la media es 68.

El nivel de significancia puede reducirse ampliando la región de aceptación o aumentando el tamaño de la muestra.

La reducción del nivel de significancia no es suficiente para garantizar un buen procedimiento de prueba. Debemos ver el error tipo II.

Page 19: Test de Hipótesis I

70/6967 XP

64 66 68 70 72 74

0.1

0.2

0.3

0.4

0.5

0.6 H1H0

0485.070/66.15 ZP

Page 20: Test de Hipótesis I

Procedimiento de test HipótesisProcedimiento de test Hipótesis Establecer la H0

Elegir una hipótesis alternativa adecuada.

Elegir un nivel de significancia .

Seleccionar el estadístico de prueba apropiada y establecer la región crítica.

Calcular el valor del estadístico de prueba a partir de la muestra.

Rechazar H0 si la estadística de prueba tiene un valor en la región crítica.

Page 21: Test de Hipótesis I

Establecer la H0

Elegir una hipótesis alternativa adecuada.

Elegir un nivel de significancia .

.Seleccionar el estadístico de prueba apropiada y establecer la región crítica.

Calcular el valor del estadístico de prueba a partir de la muestra.

Rechazar H0 si la estadística de prueba tiene un valor en la región crítica.

Procedimiento de test HipótesisProcedimiento de test Hipótesis

Page 22: Test de Hipótesis I

De una población normal con media desconocida y varianza conocida 2

Prueba de Hipótesis Prueba de Hipótesis relacionadas con la media de relacionadas con la media de

una Población Normaluna Población NormalVarianza conocida

00 : H

Se desea probar la hipótesis:

Page 23: Test de Hipótesis I

Establecer la H0

Elegir una hipótesis alternativa adecuada.

Elegir un nivel de significancia .

.Seleccionar el estadístico de prueba apropiada y establecer la región crítica.

Calcular el valor del estadístico de prueba a partir de la muestra.

Rechazar H0 si la estadística de prueba tiene un valor en la región crítica.

Procedimiento de test HipótesisProcedimiento de test Hipótesis

Page 24: Test de Hipótesis I

Contra la alternativa:

01 : H

Elegir una hipótesis alternativa Elegir una hipótesis alternativa adecuadaadecuada

01 : H

01 : H

Page 25: Test de Hipótesis I

Establecer la H0

Elegir una hipótesis alternativa adecuada.

Elegir un nivel de significancia .

.Seleccionar el estadístico de prueba apropiada y establecer la región crítica.

Calcular el valor del estadístico de prueba a partir de la muestra.

Rechazar H0 si la estadística de prueba tiene un valor en la región crítica.

Procedimiento de test HipótesisProcedimiento de test Hipótesis

Page 26: Test de Hipótesis I

Establecer la H0

Elegir una hipótesis alternativa adecuada.

Elegir un nivel de significancia .

.Seleccionar el estadístico de prueba apropiado y establecer la región crítica.

Calcular el valor del estadístico de prueba a partir de la muestra.

Rechazar H0 si la estadística de prueba tiene un valor en la región crítica.

Procedimiento de test HipótesisProcedimiento de test Hipótesis

Page 27: Test de Hipótesis I

.Seleccionar el estadístico de prueba apropiado

Page 28: Test de Hipótesis I

n

XZ

0

Se distribuye como una normal estándar.

Una muestra aleatoria de tamaño n.

1)( 2/2/ aa ZZZP

|Z |>Z/2 La Región crítica:

Page 29: Test de Hipótesis I

Establecer la H0

Elegir una hipótesis alternativa adecuada.

Elegir un nivel de significancia .

.Seleccionar el estadístico de prueba apropiada y establecer la región crítica.

Calcular el valor del estadístico de prueba a partir de la muestra.

Rechazar H0 si la estadística de prueba tiene un valor en la región crítica.

Procedimiento de test HipótesisProcedimiento de test Hipótesis

Page 30: Test de Hipótesis I

Calcular el valor del Calcular el valor del estadístico de prueba a estadístico de prueba a partir de la muestra.partir de la muestra.

n

xzcal

0

Page 31: Test de Hipótesis I

Establecer la H0

Elegir una hipótesis alternativa adecuada.

Elegir un nivel de significancia .

.Seleccionar el estadístico de prueba apropiada y establecer la región crítica.

Calcular el valor del estadístico de prueba a partir de la muestra.

Rechazar H0 si la estadística de prueba tiene un valor en la región crítica.

Procedimiento de test HipótesisProcedimiento de test Hipótesis

Page 32: Test de Hipótesis I

Rechazar HRechazar H00 si la estadística si la estadística

de prueba tiene un valor en la de prueba tiene un valor en la región crítica.región crítica.

Si |zcal |>Z/2 entonces se rechaza Ho

Page 33: Test de Hipótesis I

Fórmulas para prueba de Fórmulas para prueba de hipotesis de mediashipotesis de medias

Caso IHo : =0

Ha : <0

Estadística de Prueba:

n

XZ o

Caso IIIHo : =0

Ha : >0

Caso IIHo : =0

Ha : 0

Si Zcal < -Z

entoncesse rechaza Ho

Decisión:

Si |Zcal |>Z/2 entonces

se rechaza Ho

Si Zcal > Z

entoncesse rechaza Ho

Page 34: Test de Hipótesis I

Prueba de hipotesis Prueba de hipotesis (varianza desconocida)(varianza desconocida)

Caso IHo : =0

Ha : <0

Estadística de Prueba:

n

SX

t o

Caso IIIHo : =0

Ha : >0

Caso IIHo : =0

Ha : 0

Decisión:

Si tcal < -t

entoncesse rechaza Ho

Si |tcal |>t/2 entonces

se rechaza Ho

Si tcal > t

entoncesse rechaza Ho

con n-1 grados de libertad

Page 35: Test de Hipótesis I

Comparación entre dos medias Comparación entre dos medias poblacionales usando muestras poblacionales usando muestras independientesindependientes

222

21

221 ~

11

)()(

mn

p

t

nms

yxt

Supongamos que se tienen dos poblaciones distribuidas normalmente con medias desconocidas 1 y 2, respectivamente. Se puede aplicar una prueba t de Student para comparar las medias de dichas poblaciones basándonos en dos muestras independientes tomadas de ellas.

Si las varianzas de las poblaciones son iguales pero desconocidas

Page 36: Test de Hipótesis I

La varianza poblacional es estimada por una varianza combinada de las varianzas de las dos muestras tomadas.

Un intervalo de confianza del 100(1-) % para la diferencia 1-2 de las medias poblacionales será de la forma:

2

)1()1( 22

212

nm

snsms p

nmstyx pmn

11)2,2/(

Page 37: Test de Hipótesis I

Las pruebas de hipótesis son:

Caso I Caso II Caso III

Ho : Ho : Ho :

Ha : Ha : Ha : 21 21

21 21

21 21

Prueba Estadística:

nms

yxt

p

11

Decisión: Si < Si < o > Si > se rechaza Ho se rechaza Ho se rechaza Ho

calt t calt 2/t calt 2/1 t calt 1t

con m+n-2 grados de libertad

Page 38: Test de Hipótesis I

Si las varianzas de las poblaciones no son iguales, entonces se usa una prueba aproximada de t, donde el número de grados de libertad es calculado aproximadamente.La prueba de t aproximada está dada por:

n

s

m

s

yxt

22

21

donde los grados de libertad gl son aproximados por la siguiente fórmula:

11

)(22

21

221

n

c

m

c

ccgl

m

sc

21

1 n

sc

22

2

Page 39: Test de Hipótesis I

Comparando media de dos Comparando media de dos poblaciones usando muestras poblaciones usando muestras pareadaspareadas

En este caso se trata de comparar dos métodos o tratamientos, pero se quiere que las unidades experimentales donde se aplican los tratamientos sean las mismas, ó lo más parecidas posibles, para evitar influencia de otros factores en la comparación

Page 40: Test de Hipótesis I

n

d

d

n

ii

1 1

2

n

dds i

i

d

)(

Las inferencias que se hacen son acerca del promedio poblacional d de las di . Si d = 0, entonces significa que no hay diferencia entre los dos tratamientos.

Consideremos di = Xi - Yi la diferencia de los tratamientos en el i-ésimo sujeto.

Sea Xi el valor del tratamiento I y Yi el valor del tratamiento II en el i-ésimo sujeto.

Page 41: Test de Hipótesis I

Pruebas de HipótesisPruebas de Hipótesis

Caso I Caso II Caso III Ho : d = 0 Ho : d = 0 Ho : d =0Ha : d < 0 Ha : d 0 Ha : d >0

1~ nd

t

n

s

dtPrueba Estadística:

Decisión:Si tcalc<-t Si | tcal |>t/2 Si tcal >t

Se rechaza H0

Page 42: Test de Hipótesis I

Test de hipótesis para Test de hipótesis para ProporcionesProporciones

Prueba Estadística (Aproximada):

n

qp

ppZ

00

0 )(

DecisiónSi Zcal <-Z Si |Zcal |>Z / 2 Si Zcal >Z entonces entonces entonces se rechaza Ho se rechaza Ho se rechaza Ho

Caso I Caso II Caso IIIHo : p=p0 Ho : p=p0 Ho : p=p0

Ha : p<p0 Ha : p p0 Ha : p>p0