pruebas de hipótesis inferencia estadística inferencia estadística- ing. ricardo fernando otero -...

18
Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Upload: dominga-castaneda

Post on 02-Apr-2015

165 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Pruebas de Hipótesis

Inferencia Estadística

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 2: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Pruebas de Hipótesis Son un proceso de decisión que se basa en los datos, el cual ofrece una conclusión acerca

de algún sistema específico.

El objetivo de las pruebas de hipótesis consiste en intentar responder la pregunta ¿Cuál se

cree que es el valor del parámetro de una población?

Debido a que para conocer el valor del parámetro es necesario analizar toda la población,

las pruebas de hipótesis utilizan valores muestrales y estimadores.

Parten de una hipótesis estadística, la cual es una aseveración o conjetura respecto a una o

más poblaciones.

La falsedad o verdad de una hipótesis estadística nunca se sabe con absoluta certeza, a

menos que se examine toda la población.

El rechazo de una hipótesis simplemente implica que la evidencia de la muestra la refuta.

Es decir, es poco probable encontrar la información muestral observada si la hipótesis es

en verdad correcta.

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 3: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Definición de Hipótesis Hipótesis Nula

Se refiere a la hipótesis que se desea probar y se denota como Ho. Este tipo de hipótesis se opone a Ha, y a menudo es el complemento lógico para ella. Frecuentemente, representa el status quo del experimento.

Hipótesis Alternativa El rechazo de Ho conduce al no rechazo de una hipótesis alternativa, determinada como Ha, o H1.

Este tipo de hipótesis representa por lo general la pregunta que debe responderse, la teoría que desea probarse.

La conclusión obtenida a través de la aplicación de la prueba de hipótesis puede llegar a la siguientes dos conclusiones.

En cualquier caso, se debe evidenciar que las conclusiones no implican una aceptación formal y literal de Ho.

Rechazar Ho : A favor de Ha, debido a evidencia de los datos de la muestra.No rechazar Ho : Debido a insuficiente evidencia en los datos.

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 4: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Errores tipo 1 y 2 Error 1

Rechazar la hipótesis nula dado que en realidad es verdadera. Frecuentemente llamado Falso Positivo. Se representa a través de la letra griega .

Error 2 No rechazar la hipótesis nula dado que en realidad es falsa. Frecuentemente llamado Falso Negativo. Se representa a través de la letra griega β

Si la hipótesis nula no es rechazada y ésta es verdadera. Se ha llegado a una conclusión correcta.

Si la hipótesis nula es rechazada y ésta es verdadera. Se ha producido un error tipo 1.

Si la hipótesis nula es rechazada y ésta es falsa. Se ha llegado a una conclusión correcta.

Si la hipótesis nula no es rechazada y ésta es falsa. Se ha producido un error tipo 2.

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 5: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Suponga que un juez está decidiendo sobre algún caso que podría ocasionar que la persona acusada vaya a la cárcel.

En este caso se plantea las siguientes hipótesis: Ho = El acusado es Culpable Ha = El acusado es Inocente

Errores tipo 1 y 2

Culpable | Culpable Culpable | Inocente

Inocente | Culpable Inocente | Inocente

Correcto

CorrectoError tipo 1

Error tipo 2

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 6: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Ejemplo ¿Cuáles serían las respectivas hipótesis? ¿Cómo se interpretarían los errores

tipo 1 y tipo 2? ¿Cuál error se podría considerar más grave?

Una compañía produce televisores LCD. Ellos aseguran que la proporción de pantallas defectuosas es del 3%. Recientemente se ha incrementado de manera importante la cantidad de personas que han solicitado devoluciones por defectos de calidad.

Una mujer cree que está embarazada y por ello se realiza una prueba de embarazo. Un paciente ha tenido ciertos síntomas por lo que su médico cree que tiene cierta

enfermedad terminal. Para determinarlo, el médico decide aplicar una prueba para poder verificar su estado.

Unos días antes de una campaña presidencial, se cree que las intenciones de voto de cierto candidato son del 51%. Se decide realizar una muestra estratificada para probar dicha hipótesis.

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 7: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Conceptos P.H. Estadístico de Prueba

Valor obtenido a través de la muestra que se va a comprar con los valores asociados al error tipo 1 y a la curva de probabilidad asociada.

Valor de distribución crítico Valor de la variable aleatoria según su distribución de

probabilidad y el error tipo 1. Valor sensible

Valor límite que está asociado al error tipo 2. P-value

Mínimo valor de error tipo 1 para rechazar la hipótesis nula.

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 8: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Tipos de prueba de hipótesis Pruebas de Cola Derecha

Sirven para comprar si un estadístico de una población es mayor que un valor determinado. Se debe escoger un valor hacia la derecha de la distribución del estadístico asociado al error tipo

1. Ha > , Ho = .

Pruebas de Cola Izquierda Sirven para comprar si un estadístico de una población es mayor que un valor determinado. Se debe escoger un valor hacia la izquierda de la distribución del estadístico asociado al error tipo

1. Ha < , Ho = .

Pruebas Bilaterales Sirven para comprar si un estadístico de una población es diferente que un valor determinado. Se debe escoger un valor hacia la derecha y hacia la izquierda de la distribución del estadístico

asociado a la MITAD del error tipo 1. Ha , Ho = .

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 9: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Ejemplo Una empresa de material eléctrico afirma que fabrica

bombillas de luz que tienen una duración promedio de 800 horas. Según los análisis de calidad de la empresa, se conoce que el tiempo de vida de cada bombilla se distribuye normal, y que además tiene desviación estándar de 40 horas. Para probar la afirmación de la empresa, se procede a obtener una muestra aleatoria de 50 unidades, de la cual se obtiene un promedio muestral de 790 horas. ¿Qué se puede decir acerca de la afirmación inicial de la empresa?

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 10: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Pasos para implementar una prueba de hipótesis1. Defina los objetivos de la investigación.

2. Establezca las hipótesis nula y alternativa.

3. Elija un nivel de significancia fijo.

4. Seleccione el estimador de parámetro a probar.

5. Obtener el valor del estadístico de prueba.

6. Establezca el área de la región crítica.

7. Rechace la hipótesis nula si el estadístico cae en el área

crítica. De otra manera, no rechace Ho.

8. Calcule el valor p.

9. Obtenga conclusiones científicas y de ingeniería.

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 11: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Descripción Gráfica

ZcZp

Pvalue

Prueba de Cola Derecha

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

No RechazoRechazo

Page 12: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Fórmulas Cola Derecha

Cola Izquierda

Dos colas

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 13: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Cálculo de error tipo 2 Para poder obtener un valor numérico del error tipo 2, es necesario

determinar un valor sensible. Este valor sensible representa un valor “verdadero” del parámetro con el

cual sería inadmisible aceptar la hipótesis nula. El valor del complemento del error tipo 2 se denomina Potencia de la

Prueba. Procedimiento de Cálculo

Definir valor sensible. Crear la gráficas del promedio muestral con el valor de la hipótesis nula y con el

valor sensible. Determinar el valor des-estandarizado del inverso de la distribución en alfa ó 1 –

alfa, según la hipótesis nula. Estandarizar el valor bajo la curva del valor sensible. Obtener la probabilidad asociada al valor sensible.

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 14: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Error tipo 2

Page 15: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Cálculo del tamaño de muestra El valor asociado al tamaño de muestra depende de:

El valor sensible Valor hipótesis nula Varianza poblacional Error tipo 1 Potencia de la prueba

Page 16: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Ejemplo En determinado proceso se desea saber si el nivel máximo de

contaminaste es, en promedio, mayor de 12mg/l. Supóngase además que se ha definido un error tipo 1 del 5%. Para probar esta hipótesis se toma una muestra aleatoria simple de tamaño n=50 mediciones, en la cual se obtiene un promedio muestral de 12.8mg/l. Por estudios previos, se sabe que la desviación estándar del nivel de contaminantes es de 3g/l.

Plantear las hipótesis respondientes. Probar la hipótesis. Establecer gráficamente las áreas de rechazo. Determinar el valor P. Obtener el valor del error tipo 2 con un valor sensible de 13.5 Obtener el tamaño de muestra para lograr un error tipo 2 del 5%

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 17: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Relación entre I.C. y P.H. Los intervalos de confianza pueden ser utilizados para probar

cierto tipo de hipótesis. Los I.C. unilaterales son equivalentes a las pruebas de

hipótesis de cola derecha o izquierda. Los I.C. bilaterales son equivalentes a las pruebas de

hipótesis de dos colas. Para estos casos, si el valor de la hipótesis se encuentra por

dentro de los límites del intervalo, entonces con seguridad dicha hipótesis nula no será rechazada.

Para estas herramientas estadísticas, un incremento en el tamaño de la muestra disminuye el error asociado al intervalo de confianza y los errores tipo 1 y 2 de la prueba de hipótesis.

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá

Page 18: Pruebas de Hipótesis Inferencia Estadística Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad

Estadísticos de prueba para la proporción Aplica para cuando se quieren hacer inferencias sobre la

proporción de ocurrencias de un evento.

Inferencia Estadística- Ing. Ricardo Fernando Otero - Pregrado Ingeniería Industrial – Pontificia Universidad Javeriana Sede Bogotá