hipotesis

12
Diseño Estadístico y Herramientas para la Calidad Expositor: Dr. Juan José Flores Romero [email protected] http://lsc.fie.umich.mx/~juan M. en Calidad Total y Competitividad Pruebas de Hipótesis Pruebas de Hipótesis Analizar datos de una muestra y verificar si confirman una especulación (hiótesis) acerca de parámetros. Hipótesis de la población Media Proporción Varianza Diferencia de medias Diferencia de proporciones Razón de varianzas Media de diferencias Hipótesis Afirmación acerca de una o más poblaciones. Ejemplos: Un periódico atrae más lectores que otro Empleados con cierta capacitación son más eficientes que con otra capacitación La varianza de un proceso tiene un valor dado El ingreso promedio familiar en cierta área tiene cierto valor I 60% de los empleados han terminado la preparatoria

Upload: manuel-alejandro-campusano-rojas

Post on 10-Dec-2015

212 views

Category:

Documents


0 download

DESCRIPTION

calculo de hipotesis

TRANSCRIPT

Page 1: Hipotesis

Diseño Estadístico yHerramientas para

la CalidadExpositor:

Dr. Juan José Flores [email protected]

http://lsc.fie.umich.mx/~juan

M. en Calidad Total y Competitividad

Pruebas de Hipótesis

Pruebas de Hipótesis

Analizar datos de una muestra y verificar si confirman una especulación (hiótesis) acerca de parámetros.

Hipótesis de la poblaciónMediaProporciónVarianzaDiferencia de mediasDiferencia de proporcionesRazón de varianzasMedia de diferencias

Hipótesis

Afirmación acerca de una o más poblaciones.Ejemplos:

Un periódico atrae más lectores que otroEmpleados con cierta capacitación son más eficientes que con otra capacitaciónLa varianza de un proceso tiene un valor dadoEl ingreso promedio familiar en cierta área tiene cierto valor I60% de los empleados han terminado la preparatoria

Page 2: Hipotesis

Pruebas de Hipótesis

1. Formulación de la Hipótesis2. Identificación del estadístico de prueba y su

distribución3. Nivel de significancia4. Formulación de la regla de decisión5. Colección de datos y cálculos6. Decisión estadística7. Decisión administrativa

Formulación de la Hipótesis

Hipótesis Nula H0Hipótesis a probarNula = no hay diferenciaEj. 60% de los empleados tienen prepa

Hipótesis Alternativa H1Alternativa disponible cuando la hipótesis nula se rechazaEj. No es el 60%, es mayor del 60%, es menor del 60%

Identificación del Estadístico de Prueba y su Distribución

La decisión de rechazar o no rechazar la hipótesis nula depende de la magnitud del estadístico de pruebaEstadísticos de prueba:

z para mediast para medias varianza desconocidaz para proporcionesetc.

Nivel de Significancia

Acciones posibles:Rechazar H0

No rechazar H0 (noten que no dice aceptar)Resultados posibles:

1. Rechazar H0 cuando es falsa2. Rechazar H0 cuando es verdadera3. No rechazar H0 cuando es falsa4. No rechazar H0 cuando es verdadera

Page 3: Hipotesis

Nivel de Significancia

4 OK3 Error Tipo I

αRechazar H0

2 Error tipo IIβ

1 OKNo rechazar H0

H0 FalsaH0 Verdadera

Nivel de Significancia

Se desea minimizar la probabilidad de cometer ambos erroresPara un tamaño de muestra dado:

⇓α ⇒ ⇑β⇓β ⇒ ⇑α

La única forma de decrementar ambos es incrementar el tamaño de la muestraα es el nivel de significancia

Nivel de SignificanciaCuando se ha calculado el estadístico de prueba, se determina la probabilidad de obtener un valor tan o más extremo que el nuestro cuando H0 es ciertaSi la probabilidad es menor o igual que α, rechazamos H0, a favor de H1 (el valor del estadístico es significativo)Si la probabilidad es mayor que α, no podemos rechazar H0 (el valor del estadístico no es significativo)Valores comunes de α: 0.05 y 0.01Seleccionamos el valor de α de acuerdo a las consecuencias de un error tipo I

Formulación de la Regla de Decisión

Si, cuando H0 se cumple, la probabilidad de obtener un valor del estadístico tan o más extremo que el obtenido es menor o igual que α, se rechaza la hipótesis. Si no, no se rechaza.

Si el valor calculado del estadístico cae en la región de rechazo, se rechaza H0. Si cae en la región de aceptación, no se rechaza H0. Si el valor calculado es igual al valor crítico, se rechaza H0.

Page 4: Hipotesis

Colección de Datos y Cómputo

La calidad de una decisión final depende de la calidad de los datos en los que se basa.La muestra debe ser aleatoria y representativa.Los cálculos del estadístico de prueba se llevan a cabo como se estudió en la parte de Estadística Desciptiva.

Evaluar el estadístico de pruebaLa decisión estadística consiste en rechazar o no rechazar H0, basados en esta evaluación.

Si rechazamos H0, la decisión administrativa deberá ser compatible con H1, o bien, puede ser algo como colectar más datos.

Decisiones Estadística y Administativa

Ej. Una compañía carga una tarifa constante por envíos, basados en un estudio (viejo) que dice que la media de los paquetes es de 17.5 onzas y la d.e. es de 3.6 (considera que todos los paquetes pesaran 17.5). El gerente cree que la media ya no es la misma. El tamaño de la compañía hace que un estudio de la población completa sea imposible. Se decide tomar una muestra de 100 paquetes.

PH de la Media, Distribución Normal, Varianza Conocida Formulación de la Hipótesis

La media de los pesos de los paquetes es la misma.

H0: μ = 17.5 H1: μ ≠ 17.5

Page 5: Hipotesis

Estadístico de Prueba

El estadístico de prueba

tiene la distribución normal estándar

z =x −μ0

σn

Nivel de Significanciaα = 0.05

α establece los límites entre la región de aceptación y la de rechazoLos valores de z que tienen α/2 del área bajola curva normal estándar la izquierda y derecha.α/2 = 0.05/2 = 0.025z1 = -1.96, z2 = 1.96

Regla de Decisión

a) Si los datos arrojan un valor de la media tan grande que su probabilidad de ocurrenciacuando H0 es verdadera es menor o igual a α/2, se rechaza H0

b) Si los datos arrojan un valor del estadísticotan pequeño que su probabilidad de ocurrencia cuando H0 es verdadera esmenor o igual a α/2, se rechaza H0

Colección de Datos y Cómputo

100 paquetes fueron pesadosSuponga que la media fue de 18.4 oz.z = (18.4-17.5)/(3.6/√100) = 2.5

Page 6: Hipotesis

Decisiones Estadística y Administrativa

Como 2.5>1.96, rechazamos la hipótesis

El peso promedio de los paquetes ha cambiado. La compañía debe considerar un incremento en los cargos de envío.

Relación entre PH y Estimación

Al construir el intervalo de confianza de 100(1-α)% para μ,

si μ0 se encuentra en ese intervalo, no podemos rechazarla hipótesissi μ0 no se encuentra en ese intervalo, se rechaza la hipótesis.

Como el intervalo no contiene μ0=17.5, se rechazala hipótesis

x ±1.96σn=18.4 ±1.96

3.6

100=18.4 ± 0.7 = [17.7,19.1]

Valores p

Un valor p es la probabilidad de obtener un valor del estadístico de prueba tan grande o mayor (pequeño-menor) que el obtenido, dado que H0 es verdadera.Es el valor mínimo de significancia al cual H0sea rechazada.Es la magnitud de la sorpresa que le causaría el rechazo a un creyente de H0.

El departamento de control de calidad de una compañía procesadora de alimentos especifica que la media del peso neto por paquete de cereal no debe ser menor que 20 oz. La experiencia indica que los pesos están distribuidos normalmente con una desviación estándar de 19.5 oz. ¿Existe evidencia suficiente para indicar que el peso medio real de los paquetes ha decrementado?

Segundo Ejemplo

Page 7: Hipotesis

Formulación de la Hipótesis

La media de los pesos de los paquetes es la mayor que 20.

H0: μ ≥ 20 H1: μ < 20

Estadístico de Prueba

El estadístico de prueba

tiene la distribución normal estándar

z =x −μ0

σn

Nivel de Significanciaα = 0.05

α establece los límites entre la región de aceptación y la de rechazoEsta es una prueba asimétrica, llamadaprueba de na cola. El valor de z que tiene αdel área bajo la curva normal estándar a la izquierda es:z = -1.645

Regla de Decisión

a) Si los datos arrojan un valor de la media tan grande que su probabilidad de ocurrenciacuando H0 es verdadera es mayor o igual a α, se rechaza H0.

Page 8: Hipotesis

Colección de Datos y Cómputo

15 paquetes fueron pesadosSuponga que la media fue de 19.5 oz.z = (19.5-20)/(31.5/√15) = -1.29

Decisiones Estadística y Administrativa

Como -1.29>-1.645, no podemos rechazar la hipótesis.

No existe evidencia estadística que indiqueque el peso promedio de los paquetes ha disminuido.

Cálculo de Valores pp el es menor valor de significancia α, para el cual H0 puede ser rechazada.Para el ejemplo anterior, z=-1.29.¿Cuál es el área bajo la curva normal estándar en la región (-∞, -1.29)?Usando la hoja de XL que desarrollamos en el tema de probabilidad, tenemos quep=0.0985.Si p>α, rechazamos H0

Una compañía manufacturera de llantas dice que la vida promedio de cierto tipo de llanta es mayor que 25,000 millas. Una muestra aleatoria de 15 llantas es probada. La media y d.e. Son de 27,000 y 5,000 milla, respectivamente. ¿Podemos concluir que el producto es tan bueno como se presume?

PH de la Media, Distribución Normal, Varianza Desconocida

Page 9: Hipotesis

Formulación de la Hipótesis

La media de la vida de las llantas no llega a 25,000 millas.

H0: μ ≤ 25,000 H1: μ > 25,000

Estadístico de Prueba

Como la d.e. de la población es desconocida, el estadístico de prueba utilizado es:

el cual tiene la distribución t

t =x −μ0

sn

Nivel de Significancia

α = 0.05

α establece los límites entre la región de aceptación y la de rechazoPrueba de una cola. El valor de t que tiene αdel área bajo la curva t a la derecha, considerando 14 grados de libertad es: t = 1.7613

Regla de Decisión

a) Si los datos arrojan un valor de la media tan grande que su probabilidad de ocurrenciacuando H0 es verdadera es menor o igual a α, se rechaza H0

Page 10: Hipotesis

Colección de Datos y Cómputo

15 llantas fueron probadasμ = 27,000, s = 5,000t = (27,000-25,000)/(5,000/√15) = 1.55

Decisiones Estadística y Administrativa

Como 1.55<1.7613, no podemos rechazar la hipótesis.

Como no pudimos rechazar la hipótesis nula, los datos no aportan evidencia que indiqueque la vida de las llantas sea mayor. Cualquier decisión administrativa quecontraponga H0, no podrá garantizarse, en base a los datos.

Una compañía decide probar que método de capacitación es mejor, el A o el B. Para ello, decide aplicar ambos métodos a parejas de empleados y, al final del curso, medir su desempeño. La siguiente tabla muestra los resultados:

Pares de Observaciones

1280929167288815708571282946882905-186854087873788952585901DiferenciaMétodo BMétodo APareja

Formulación de la Hipótesis

El método B es mejor que el A.

H0: μd ≤ 0 H1: μd > 0

Page 11: Hipotesis

Estadístico de Prueba

Como la d.e. de la población es desconocida, el estadístico de prueba utilizado es:

el cual tiene la distribución tμd0 se considera 0.

t =d −μd 0

sd

Nivel de Significancia

α = 0.05

α establece los límites entre la región de aceptación y la de rechazoPrueba de una cola. El valor de t que tiene αdel área bajo la curva t a la derecha, considerando 8 grados de libertad es: t = 1.8595

Regla de Decisión

a) Si los datos arrojan un valor de la media tan grande que su probabilidad de ocurrenciacuando H0 es verdadera es menor o igual a α, se rechaza H0

Colección de Datos y Cómputo

De los datos colectados se tiene:⎯d = 8.2sd = 6.12s⎯d = 6.12/√9 = 2.04t=(8.2 - 0) / 2.04 = 4.02

Page 12: Hipotesis

Decisiones Estadística y Administrativa

Como 4.02>1.85, rechazamos la hipótesis.

Como rechazamos la hipótesis nula, concluimos, en base a la evidencia que losdatos aportan, que el método A es superior al método B.Como 4.02>3.3554, p<0.005