prueba de hipótesis - listado de páginas web...

37
INFERENCIA ESTADISTICA

Upload: phungdien

Post on 28-Sep-2018

227 views

Category:

Documents


0 download

TRANSCRIPT

INFERENCIA ESTADISTICA

ESTIMACION

2 maneras de estimar:

• Estimaciones puntuales

• Estimaciones por intervalo

22 s

x

ESTIMACION

• Estimaciones por intervalo• Limites de Confianza

LCI<= valor<=LCS

P(LCI<= valor<=LCS)=(1-α)

α Nivel de Significación (riesgo)

(1-α) Nivel de Confianza (Seguridad)

α = 5% (0.05)

IC para una media (I)

1) Varianza poblacional conocida (σ²). Limites del IC:

Donde Z (Variable normal tipificada), cuyos valoresse encuentran tabulados. Y además:

)(

)(

2

2

xVarZxL

xVarZxL

s

i

n)x(Var

2

IC para una media (II)

Por lo tanto el intervalo de confianza (IC) para

estimar una media poblacional queda de la

manera siguiente:

nZx:IC 2

IC para una media - ejemplo

Deseamos estimar el promedio de edad de cierta población.Tomamos una muestra de tamaño 100 en la cual se obtuvo unamedia muestral de 35. La variable considerada tienedistribución normal con una varianza igual a 3. Calcular elintervalo de confianza al 95 % .

aplicando simplemente la fórmula para calcular los límites delintervalo de confianza (IC), tenemos:

100

396.135

IC para una media (III)

2) Varianza poblacional no conocida, variable Xnormal.

(reemplazando σ² por su estimación s²)

Limites del IC:

En donde tα corresponde a los valores del 1-α central de

la distribución T, con n-1 grados de libertad.

n

stx n 1,2/

IC para una media - ejemplo

Deseamos estimar la presión sistólica promedio de cierta población.

Tomamos una muestra de tamaño 20 en la cual se obtuvo una media

muestral de 150 mmHg con una varianza muestral igual a 9. La variable

considerada tiene distribución normal. Calcular el intervalo de confianza al

95 % para la media poblacional.

Solución: Dado que se desea un nivel de confianza del 95%, el error =0.05

y utilizando:

Reemplazando t0.05 = 2.09 (buscado en la tabla de la distr. T para dosextremos, valor-p ó =0.05 y 19 gl):

n

stx 025.0

20

909.2150

IC para una media (IV)

3) Varianza poblacional no conocida, variable X .

Pero si el tamaño muestral (n) es lo suficientemente

grande (>30), entonces la distribución de las medias es

normal (Teorema Central del Límite).

n

sZx:IC 2

CALCULO DEL TAMAÑO MUESTRAL

Es necesario:

• Precisión deseada en la estimación

• Nivel de confianza (o el alfa)

• Algún otro parámetro poblacional previo

• Depende de la estrategia del muestreo

CALCULO DEL TAMAÑO MUESTRAL

Para estimar una media

Supongamos que deseamos tener una imprecisión I en la

estimación de la media con un nivel de confianza 1-α y

deseamos encontrar n . En este caso la imprecisión

corresponde a:

Despejando n:

nZI 2

2

22

2

I

)Z(n

Prueba de Hipótesis

Tipos de hipótesis

• En la prueba de hipótesis se comienzaproponiendo una hipótesis tentativa acercade un parámetro poblacional

• A la hipótesis tentativa se le denominahipótesis nula (H0)

• La hipótesis alternativa es la opuesta de loque se afirma en H0 y se representa por Ha

• El procedimiento de prueba de hipótesiscomprende el uso de datos de una muestrapara probar las 2 aseveraciones propuestas

• Es necesario practicar para poder formularhipótesis en forma correcta

• Las formas de H0 y Ha van a depender de laaplicación en la cual deseamos realizar laprueba

• La prueba de hipótesis es una demostraciónde contradicción

• Se presentan generalmente 3 tipos desituaciones en los cuales debemos establecerhipótesis:

– Prueba de hipótesis en Investigación

– Prueba de validez de una afirmación

– Prueba en casos de toma de decisiones

• Resumen de formas para hipótesis nula yalterna ( valor de interés)

– La igualdad siempre aparece vinculada al lahipótesis nula

– Una forma de facilitar la selección de la formaadecuada de las hipótesis es asignando lo que sequiere demostrar a la Ha

0 0:H

0:aH

0 0:H

0:aH

0 0:H

0:aH

Una operación en una línea de producción debe llenar

cajas con detergente hasta un peso promedio de 300

gr. Periódicamente se selecciona una muestra de cajas

llenas. Si los datos de la muestra llevan a la conclusión

de que les falta o sobra detergente, se debe parar la

línea de producción, y hacer los ajustes necesarios

1.Formule la hipótesis nula y alterna

2.Comente la conclusión y la decisión cuando no se

puede rechazar H0

Error tipo I y II

• Las hipótesis nula y alterna son

aseveraciones sobre la población que

compiten entre sí

• No siempre es posible que las conclusiones

sean verdaderas o correctas

H0 verdadera Ha verdadera

Aceptar H0

Conclusión

CorrectaError tipo II

Rechazar H0 Error tipo IConclusión

Correcta

• No se puede eliminar la posibilidad de errores en la

prueba de hipótesis, pero si es posible considerar su

probabilidad

• Se define como:

=probabilidad de cometer un error tipo I

b=probabilidad de cometer error tipo II

• La máxima probabilidad permisible se le llama nivel

de significancia para la prueba. Los valores

acostumbrados son de 0.05 y 0.01

• En la mayoría de las aplicaciones se controla la

probabilidad de cometer error tipo I, luego existe la

incertidumbre con respecto al error tipo II

• Si los datos muestrales son consistentes con

H0 se adopta en la práctica la conclusión de

“no rechazar H0”, ya que de esta forma

evitamos el riesgo de cometer error tipo II

• La conclusión de “aceptar H0” se toma sólo

cuando se haya determinado el error tipo II

Suponga que se va a implantar un nuevo

método de producción si una prueba de

hipótesis respalda la conclusión de que con ese

método se reduce la media del costo de

operación por hora

1.Enuncie las hipótesis nula y alterna si la media del

costo para el método actual de producción es de $220

por hora

2.¿Cuál es el error de tipo I en este caso y sus

consecuencias?

3.¿Cuál es el error tipo II en este caso y sus

consecuencias?

Pruebas unilaterales para la media

Muestra Grande

• En este caso (n>30) se asume distribución normal

• Para pruebas de hipótesis acerca de la media de una

población se emplea el estadígrafo z

• Se determina si la desviación del valor numérico en

estudio es lo suficiente para justificar el rechazo de la

hipótesis nula

/

Xz

n

• La probabilidades 0.05 y 0.01 de cometer

error tipo I están relacionadas con un valor

de z de –1.645 y –2.33 respectivamente

• Luego se debe rechazar H0 si el valor de z es

menor a –1.645 o –2.33 dependiendo del

nivel de significancia

• El valor z establece el límite de la región de

rechazo denominada valor crítico

0-1.645 2.33

=0.05 =0.01

Xn

z

Rechazar H0 Rechazar H0

• Resumen de pruebas unilaterales sobre

media de una población. Si n30

0 0

0

0 0

0

:

:

; / /

Rechazar H si

a

H

H

X Xz z

n s n

z z

0 0

0

0 0

0

:

:

; / /

Rechazar H si

a

H

H

X Xz z

n s n

z z

• Valor p

– Es el valor de probabilidad de obtener un

resultado de la muestra que sea al menos

tan improbable como lo que se observa

– Este valor corresponde al valor de la

probabilidad asignada al z calculado a

partir del valor numérico sometido a la

prueba de hipótesis

– Si p es menor al nivel de significancia

predefinido se debe rechazar H0

Muestra Pequeña

• En este caso (n < 30) se asume que la poblacióntiene una distribución normal

• Con distribución t se pueden hacer inferenciasacerca de la media de la población

• Para este estadígrafo se debe considerar los gradosde libertad asociados al tamaño de la muestra (n-1)para definir el valor crítico que llevará al rechazo deH0. Por las características de la tabla resultacomplicado calcular el valor de p por lo que seexpresa en intervalos

0

/

Xt

s n

Pruebas bilaterales para la media

Muestra grande

• La diferencia de esta prueba con respecto a las

unilaterales está en que la región de rechazo está

ubicada simultáneamente en ambas colas

• En las pruebas bilaterales de hipótesis siempre se

determina la región de rechazo colocando un área de

probabilidad igual a /2 en cada cola de distribución

• Para este caso el valor de z para un nivel de

significancia de 0.05 corresponderá a 1.96

z-z

/2=0.025

0-1.96 1.96

/2=0.025

• Resumen de pruebas bilaterales sobre media

de una población. Si n30

0 0

0

0 0

0 / 2 / 2

:

:

; / /

Rechazar H si

a

H

H

X Xz z

n s n

z z z z

• Valor p

– En una prueba bilateral se determina el p

duplicando el área en la cola

– Esta multiplicación busca comparar el

valor de p directamente con y poder

mantener la misma regla de rechazo

Muestra pequeña

• Con una prueba bilateral y un nivel de

significancia definido se debe considerar al

estadígrafo t /2 para determinar el área de

probabilidad asociado a los grados de

libertad de la muestra

Relación entre estimación por intervalo yprueba de hipótesis

• En la determinación del intervalo de confianza paramedias se empleo un coeficiente definido por 1- ,como una forma de definir si nuestros promediosmuestrales contenían al parámetro poblacional

• Ahora para una prueba bilateral de hipótesis sepuede rechazar H0 si el intervalo de confianza para lamedia de la población no abarca el promediopoblacional

/ 2X zn

Prueba de hipótesis y toma de decisiones

• Siempre que se emplee una prueba dehipótesis en la toma de decisiones estaráinvolucrada una acción

• El no emprender acciones cuando “no serechaza H0” está dado por el riesgo decometer error tipo II

• Para disminuir esta incertidumbre se debecalcular este error. Otra forma descrita tienerelación con el tamaño de la muestra aestudiar

• Error tipo II (Aceptar H0 cuando es falsa)

– Formular las hipótesis nula y alterna

– Usar el nivel de significancia a para establecer unaregla de rechazo basado en el estadístico de prueba(z)

– De acuerdo con la regla de rechazo, despejar elvalor de la media de la muestra que identifique laregión de rechazo de la prueba

– Usar el resultado del paso anterior para establecerlos valores de la media de muestra que conduzcan ala aceptación de H0 ( darse medias más bajas yestimar la probabilidad de que le punto mediomuestral real sea mayor)

– La probabilidad de rechazar correctamente H0

cuando es falsa se llama potencia de la prueba (1-b)

0Rechazar H si 1.645z

Darse un promedio menor

Recalcular z

Despejar media muestral

x2 x

Calcular b

0

/

Xz

n

0

H0 falsa

Pro

bab

ilid

ad d

e re

chaz

ar

corr

ecta

men

te H

0

Curva de Potencia

• Tamaño de la muestra

• Controlando el tamaño de la muestra es posible

manejar la probabilidad de cometer error tipo I y II

b

Rechazar H0

0

a

C

H0:0

Ha:<0

H0 verdadero =0

H0 falsa a<0

0

0

22

2

0

a

a

a

c z c zn n

z zn n

z zn

b

b

b

Pasos de la prueba de hipótesis:

1. Definir la hipótesis nula y alterna para el caso

2. Seleccionar el estadístico de prueba que seusará para decidir rechazar o no H0

3. Especificar el nivel de significancia, , para laprueba

4. Usar el nivel de significancia para establecer laregla de rechazo que indique los valores quellevarán al rechazo de H0

5. Reunir los datos de la muestra y calcular el valordel estadístico de prueba

6. Comparar el valor estadístico con los valorescríticos o calcular el valor de p