test de hipótesis i

INFERENCIA ESTADÍSTICAINFERENCIA ESTADÍSTICALa Inferencia Estadística comprende los métodos que son usados para obtener conclusiones acerca de la población en base a una muestra tomada de ella. Incluye los métodos de estimación de parámetros y las pruebas de hipótesis.

MMP obtención de

la muestra

conclusiones

Inferencia para ProporcionesInferencia para Proporciones

n

xp ˆ

)1,0(~ˆ

N

n

pq

pPZ

es la proporción muestral.

p representa la proporción poblacional que se desea estimar

Cuando estamos interesados en estimar la proporción p (o el porcentaje) de ocurrencia de un evento. Se necesita definir una variable aleatoria X que indique el número de veces que ocurre el evento en una muestra de tamaño n y con probabilidad de éxito, p. Se puede mostrar que cuando el tamaño de muestra es grande, tal que np > 5, entonces el estadístico

Intervalo de confianza para la Intervalo de confianza para la ProporciónProporción

Intervalo de confianza (aproximado) del 100 (1-) % para la proporción poblacional p es:

nqp

Zpnqp

Zp ˆˆˆ,ˆˆ

ˆ 2/2/

Problema de test de hipótesis:Una empresa constructora acaba de comprar una gran cantidad de cables con garantía de resistencia promedio de al menos de 7000 psi. Con la finalidad de verificar esto, ha decidido tomar una muestra de 10 cables para verificar su resistencia. Después usará los resultados del experimento para decidir si acepta o no la hipótesis del fabricante de cables, de que la media poblacional es por lo menos de 7000 libras por pulgadas cuadradas.

Problema de test de hipótesisProblema de test de hipótesis

Se busca comprobar alguna información o afirmación (conjetura) sobre la población a partir de los datos obtenidos de una muestra.

Menos del 3% de las bombillas de un lote de 5000 duran menos de 1000 horas.

Las bombillas duran más de 1000 horas en promedio.

La resistencia media poblacional es por lo menos de 7000 psi.

Es una aseveración o conjetura con respecto a una o más poblaciones.

Es una afirmación que se hace acerca de un parámetro o varios parámetros poblacional.

La verdad o falsedad de una hipótesis estadística nunca llega a ser conocida con certeza.No se considera la población, sino una muestra aleatoria.

Hipótesis EstadísticaHipótesis Estadística

Test de hipótesisTest de hipótesisSe busca evidencia en los datos de la muestra para apoyar la hipótesis o para rechazar la hipótesis.

La aceptación o no rechazo de una hipótesis implica que los datos no dan suficiente evidencia para rechazarla.

El rechazo implica que la evidencia muestral es suficiente para rechazarla.

Hipótesis Nula y AlternativaHipótesis Nula y Alternativa

H0: Cualquier aseveración que deseamos probar.

H1: Hipótesis alternativa.

Se espera que sea rechazada después de aplicar una prueba estadística

La afirmación que se espera sea aceptada después de aplicar una prueba estadística.

Hipótesis Nula y AlternativaHipótesis Nula y Alternativa

7000:0 H 7000:0 H

7000:1 H

La resistencia media poblacional es por lo menos de 7000 libras por pulgadas cuadradas.

La resistencia media poblacional es menos de 7000 libras por pulgadas cuadradas.

Tipos de ErroresTipos de Errores

Tipos de ErroresTipos de Errores

Error de tipo II :

Aceptar la hipótesis nula cuando ésta en la realidad es Falsa.

Error de tipo I:

Rechazar la hipótesis nula cuando ésta en la realidad es verdadera.

Nivel de significanciaNivel de significancia

VesHHchazarP 00 /Re

FesHHrechazarNoP 00 /Probabilidad del error tipo II

Una disminución de provoca un crecimiento en

1- se le llama la potencia de la prueba.

Potencia de la pruebaPotencia de la prueba

Una buena prueba estadística es aquella que tiene una potencia de prueba alta.

¿Mejor balance entre los ¿Mejor balance entre los errores tipo I y tipo II?errores tipo I y tipo II?

Regla general

Nivel de error tipo II = 4 veces Nivel de error tipo I

Si el nivel de error tipo I = 5% un adecuado nivel de error tipo II es 20% (potencia = 80%)

Ho : =68

68:1 H

EjemploEjemplo

6868 o

Una media muestral que cae cercana a 68 se consideraría como evidencia a favor de H0

Una media muestral considerablemente menor o mayor que 68 se consideraría como evidencia a favor de H1

Estadístico de prueba: XRegión crítica: 67x 69x

Región de aceptación o no rechazo de H0 :

6967 x

67 68 69

Aceptar H0 Rechazar H0Rechazar H0

X

nNX

,~

68/6968/67 XPXP

6.336n

0950.067.167.1 ZPZP9.5% de todas las muestras de tamaño 36 nos llevarán a rechazar que la media es 68.

El nivel de significancia puede reducirse ampliando la región de aceptación o aumentando el tamaño de la muestra.

La reducción del nivel de significancia no es suficiente para garantizar un buen procedimiento de prueba. Debemos ver el error tipo II.

70/6967 XP

64 66 68 70 72 74

0.1

0.2

0.3

0.4

0.5

0.6 H1H0

0485.070/66.15 ZP

Procedimiento de test HipótesisProcedimiento de test Hipótesis Establecer la H0

Elegir una hipótesis alternativa adecuada.

Elegir un nivel de significancia .

Seleccionar el estadístico de prueba apropiada y establecer la región crítica.

Calcular el valor del estadístico de prueba a partir de la muestra.

Rechazar H0 si la estadística de prueba tiene un valor en la región crítica.

Establecer la H0



.Seleccionar el estadístico de prueba apropiada y establecer la región crítica.



Procedimiento de test HipótesisProcedimiento de test Hipótesis

De una población normal con media desconocida y varianza conocida 2

Prueba de Hipótesis Prueba de Hipótesis relacionadas con la media de relacionadas con la media de

una Población Normaluna Población NormalVarianza conocida

00 : H

Se desea probar la hipótesis:

Establecer la H0







Contra la alternativa:

01 : H

Elegir una hipótesis alternativa Elegir una hipótesis alternativa adecuadaadecuada

01 : H

01 : H

Establecer la H0







Establecer la H0



.Seleccionar el estadístico de prueba apropiado y establecer la región crítica.




.Seleccionar el estadístico de prueba apropiado

n

XZ

0

Se distribuye como una normal estándar.

Una muestra aleatoria de tamaño n.

1)( 2/2/ aa ZZZP

|Z |>Z/2 La Región crítica:

Establecer la H0







Calcular el valor del Calcular el valor del estadístico de prueba a estadístico de prueba a partir de la muestra.partir de la muestra.

n

xzcal

0

Establecer la H0







Rechazar HRechazar H00 si la estadística si la estadística

de prueba tiene un valor en la de prueba tiene un valor en la región crítica.región crítica.

Si |zcal |>Z/2 entonces se rechaza Ho

Fórmulas para prueba de Fórmulas para prueba de hipotesis de mediashipotesis de medias

Caso IHo : =0

Ha : <0

Estadística de Prueba:

n

XZ o

Caso IIIHo : =0

Ha : >0

Caso IIHo : =0

Ha : 0

Si Zcal < -Z

entoncesse rechaza Ho

Decisión:

Si |Zcal |>Z/2 entonces

se rechaza Ho

Si Zcal > Z


Prueba de hipotesis Prueba de hipotesis (varianza desconocida)(varianza desconocida)

Caso IHo : =0

Ha : <0

Estadística de Prueba:

n

SX

t o

Caso IIIHo : =0

Ha : >0

Caso IIHo : =0

Ha : 0

Decisión:

Si tcal < -t


Si |tcal |>t/2 entonces

se rechaza Ho

Si tcal > t


con n-1 grados de libertad

Comparación entre dos medias Comparación entre dos medias poblacionales usando muestras poblacionales usando muestras independientesindependientes

222

21

221 ~

11

)()(

mn

p

t

nms

yxt

Supongamos que se tienen dos poblaciones distribuidas normalmente con medias desconocidas 1 y 2, respectivamente. Se puede aplicar una prueba t de Student para comparar las medias de dichas poblaciones basándonos en dos muestras independientes tomadas de ellas.

Si las varianzas de las poblaciones son iguales pero desconocidas

La varianza poblacional es estimada por una varianza combinada de las varianzas de las dos muestras tomadas.

Un intervalo de confianza del 100(1-) % para la diferencia 1-2 de las medias poblacionales será de la forma:

2

)1()1( 22

212

nm

snsms p

nmstyx pmn

11)2,2/(

Las pruebas de hipótesis son:

Caso I Caso II Caso III

Ho : Ho : Ho :

Ha : Ha : Ha : 21 21

21 21

21 21

Prueba Estadística:

nms

yxt

p

11

Decisión: Si < Si < o > Si > se rechaza Ho se rechaza Ho se rechaza Ho

calt t calt 2/t calt 2/1 t calt 1t

con m+n-2 grados de libertad

Si las varianzas de las poblaciones no son iguales, entonces se usa una prueba aproximada de t, donde el número de grados de libertad es calculado aproximadamente.La prueba de t aproximada está dada por:

n

s

m

s

yxt

22

21

donde los grados de libertad gl son aproximados por la siguiente fórmula:

11

)(22

21

221

n

c

m

c

ccgl

m

sc

21

1 n

sc

22

2

Comparando media de dos Comparando media de dos poblaciones usando muestras poblaciones usando muestras pareadaspareadas

En este caso se trata de comparar dos métodos o tratamientos, pero se quiere que las unidades experimentales donde se aplican los tratamientos sean las mismas, ó lo más parecidas posibles, para evitar influencia de otros factores en la comparación

n

d

d

n

ii

1 1

2

n

dds i

i

d

)(

Las inferencias que se hacen son acerca del promedio poblacional d de las di . Si d = 0, entonces significa que no hay diferencia entre los dos tratamientos.

Consideremos di = Xi - Yi la diferencia de los tratamientos en el i-ésimo sujeto.

Sea Xi el valor del tratamiento I y Yi el valor del tratamiento II en el i-ésimo sujeto.

Pruebas de HipótesisPruebas de Hipótesis

Caso I Caso II Caso III Ho : d = 0 Ho : d = 0 Ho : d =0Ha : d < 0 Ha : d 0 Ha : d >0

1~ nd

t

n

s

dtPrueba Estadística:

Decisión:Si tcalc<-t Si | tcal |>t/2 Si tcal >t

Se rechaza H0

Test de hipótesis para Test de hipótesis para ProporcionesProporciones

Prueba Estadística (Aproximada):

n

qp

ppZ

00

0 )(

DecisiónSi Zcal <-Z Si |Zcal |>Z / 2 Si Zcal >Z entonces entonces entonces se rechaza Ho se rechaza Ho se rechaza Ho

Caso I Caso II Caso IIIHo : p=p0 Ho : p=p0 Ho : p=p0

Ha : p<p0 Ha : p p0 Ha : p>p0

test de hipótesis i

Education