hipotesis
Post on 10-Dec-2015
212 Views
Preview:
DESCRIPTION
TRANSCRIPT
Diseño Estadístico yHerramientas para
la CalidadExpositor:
Dr. Juan José Flores Romerojuanf@umich.mx
http://lsc.fie.umich.mx/~juan
M. en Calidad Total y Competitividad
Pruebas de Hipótesis
Pruebas de Hipótesis
Analizar datos de una muestra y verificar si confirman una especulación (hiótesis) acerca de parámetros.
Hipótesis de la poblaciónMediaProporciónVarianzaDiferencia de mediasDiferencia de proporcionesRazón de varianzasMedia de diferencias
Hipótesis
Afirmación acerca de una o más poblaciones.Ejemplos:
Un periódico atrae más lectores que otroEmpleados con cierta capacitación son más eficientes que con otra capacitaciónLa varianza de un proceso tiene un valor dadoEl ingreso promedio familiar en cierta área tiene cierto valor I60% de los empleados han terminado la preparatoria
Pruebas de Hipótesis
1. Formulación de la Hipótesis2. Identificación del estadístico de prueba y su
distribución3. Nivel de significancia4. Formulación de la regla de decisión5. Colección de datos y cálculos6. Decisión estadística7. Decisión administrativa
Formulación de la Hipótesis
Hipótesis Nula H0Hipótesis a probarNula = no hay diferenciaEj. 60% de los empleados tienen prepa
Hipótesis Alternativa H1Alternativa disponible cuando la hipótesis nula se rechazaEj. No es el 60%, es mayor del 60%, es menor del 60%
Identificación del Estadístico de Prueba y su Distribución
La decisión de rechazar o no rechazar la hipótesis nula depende de la magnitud del estadístico de pruebaEstadísticos de prueba:
z para mediast para medias varianza desconocidaz para proporcionesetc.
Nivel de Significancia
Acciones posibles:Rechazar H0
No rechazar H0 (noten que no dice aceptar)Resultados posibles:
1. Rechazar H0 cuando es falsa2. Rechazar H0 cuando es verdadera3. No rechazar H0 cuando es falsa4. No rechazar H0 cuando es verdadera
Nivel de Significancia
4 OK3 Error Tipo I
αRechazar H0
2 Error tipo IIβ
1 OKNo rechazar H0
H0 FalsaH0 Verdadera
Nivel de Significancia
Se desea minimizar la probabilidad de cometer ambos erroresPara un tamaño de muestra dado:
⇓α ⇒ ⇑β⇓β ⇒ ⇑α
La única forma de decrementar ambos es incrementar el tamaño de la muestraα es el nivel de significancia
Nivel de SignificanciaCuando se ha calculado el estadístico de prueba, se determina la probabilidad de obtener un valor tan o más extremo que el nuestro cuando H0 es ciertaSi la probabilidad es menor o igual que α, rechazamos H0, a favor de H1 (el valor del estadístico es significativo)Si la probabilidad es mayor que α, no podemos rechazar H0 (el valor del estadístico no es significativo)Valores comunes de α: 0.05 y 0.01Seleccionamos el valor de α de acuerdo a las consecuencias de un error tipo I
Formulación de la Regla de Decisión
Si, cuando H0 se cumple, la probabilidad de obtener un valor del estadístico tan o más extremo que el obtenido es menor o igual que α, se rechaza la hipótesis. Si no, no se rechaza.
Si el valor calculado del estadístico cae en la región de rechazo, se rechaza H0. Si cae en la región de aceptación, no se rechaza H0. Si el valor calculado es igual al valor crítico, se rechaza H0.
Colección de Datos y Cómputo
La calidad de una decisión final depende de la calidad de los datos en los que se basa.La muestra debe ser aleatoria y representativa.Los cálculos del estadístico de prueba se llevan a cabo como se estudió en la parte de Estadística Desciptiva.
Evaluar el estadístico de pruebaLa decisión estadística consiste en rechazar o no rechazar H0, basados en esta evaluación.
Si rechazamos H0, la decisión administrativa deberá ser compatible con H1, o bien, puede ser algo como colectar más datos.
Decisiones Estadística y Administativa
Ej. Una compañía carga una tarifa constante por envíos, basados en un estudio (viejo) que dice que la media de los paquetes es de 17.5 onzas y la d.e. es de 3.6 (considera que todos los paquetes pesaran 17.5). El gerente cree que la media ya no es la misma. El tamaño de la compañía hace que un estudio de la población completa sea imposible. Se decide tomar una muestra de 100 paquetes.
PH de la Media, Distribución Normal, Varianza Conocida Formulación de la Hipótesis
La media de los pesos de los paquetes es la misma.
H0: μ = 17.5 H1: μ ≠ 17.5
Estadístico de Prueba
El estadístico de prueba
tiene la distribución normal estándar
z =x −μ0
σn
Nivel de Significanciaα = 0.05
α establece los límites entre la región de aceptación y la de rechazoLos valores de z que tienen α/2 del área bajola curva normal estándar la izquierda y derecha.α/2 = 0.05/2 = 0.025z1 = -1.96, z2 = 1.96
Regla de Decisión
a) Si los datos arrojan un valor de la media tan grande que su probabilidad de ocurrenciacuando H0 es verdadera es menor o igual a α/2, se rechaza H0
b) Si los datos arrojan un valor del estadísticotan pequeño que su probabilidad de ocurrencia cuando H0 es verdadera esmenor o igual a α/2, se rechaza H0
Colección de Datos y Cómputo
100 paquetes fueron pesadosSuponga que la media fue de 18.4 oz.z = (18.4-17.5)/(3.6/√100) = 2.5
Decisiones Estadística y Administrativa
Como 2.5>1.96, rechazamos la hipótesis
El peso promedio de los paquetes ha cambiado. La compañía debe considerar un incremento en los cargos de envío.
Relación entre PH y Estimación
Al construir el intervalo de confianza de 100(1-α)% para μ,
si μ0 se encuentra en ese intervalo, no podemos rechazarla hipótesissi μ0 no se encuentra en ese intervalo, se rechaza la hipótesis.
Como el intervalo no contiene μ0=17.5, se rechazala hipótesis
x ±1.96σn=18.4 ±1.96
3.6
100=18.4 ± 0.7 = [17.7,19.1]
Valores p
Un valor p es la probabilidad de obtener un valor del estadístico de prueba tan grande o mayor (pequeño-menor) que el obtenido, dado que H0 es verdadera.Es el valor mínimo de significancia al cual H0sea rechazada.Es la magnitud de la sorpresa que le causaría el rechazo a un creyente de H0.
El departamento de control de calidad de una compañía procesadora de alimentos especifica que la media del peso neto por paquete de cereal no debe ser menor que 20 oz. La experiencia indica que los pesos están distribuidos normalmente con una desviación estándar de 19.5 oz. ¿Existe evidencia suficiente para indicar que el peso medio real de los paquetes ha decrementado?
Segundo Ejemplo
Formulación de la Hipótesis
La media de los pesos de los paquetes es la mayor que 20.
H0: μ ≥ 20 H1: μ < 20
Estadístico de Prueba
El estadístico de prueba
tiene la distribución normal estándar
z =x −μ0
σn
Nivel de Significanciaα = 0.05
α establece los límites entre la región de aceptación y la de rechazoEsta es una prueba asimétrica, llamadaprueba de na cola. El valor de z que tiene αdel área bajo la curva normal estándar a la izquierda es:z = -1.645
Regla de Decisión
a) Si los datos arrojan un valor de la media tan grande que su probabilidad de ocurrenciacuando H0 es verdadera es mayor o igual a α, se rechaza H0.
Colección de Datos y Cómputo
15 paquetes fueron pesadosSuponga que la media fue de 19.5 oz.z = (19.5-20)/(31.5/√15) = -1.29
Decisiones Estadística y Administrativa
Como -1.29>-1.645, no podemos rechazar la hipótesis.
No existe evidencia estadística que indiqueque el peso promedio de los paquetes ha disminuido.
Cálculo de Valores pp el es menor valor de significancia α, para el cual H0 puede ser rechazada.Para el ejemplo anterior, z=-1.29.¿Cuál es el área bajo la curva normal estándar en la región (-∞, -1.29)?Usando la hoja de XL que desarrollamos en el tema de probabilidad, tenemos quep=0.0985.Si p>α, rechazamos H0
Una compañía manufacturera de llantas dice que la vida promedio de cierto tipo de llanta es mayor que 25,000 millas. Una muestra aleatoria de 15 llantas es probada. La media y d.e. Son de 27,000 y 5,000 milla, respectivamente. ¿Podemos concluir que el producto es tan bueno como se presume?
PH de la Media, Distribución Normal, Varianza Desconocida
Formulación de la Hipótesis
La media de la vida de las llantas no llega a 25,000 millas.
H0: μ ≤ 25,000 H1: μ > 25,000
Estadístico de Prueba
Como la d.e. de la población es desconocida, el estadístico de prueba utilizado es:
el cual tiene la distribución t
t =x −μ0
sn
Nivel de Significancia
α = 0.05
α establece los límites entre la región de aceptación y la de rechazoPrueba de una cola. El valor de t que tiene αdel área bajo la curva t a la derecha, considerando 14 grados de libertad es: t = 1.7613
Regla de Decisión
a) Si los datos arrojan un valor de la media tan grande que su probabilidad de ocurrenciacuando H0 es verdadera es menor o igual a α, se rechaza H0
Colección de Datos y Cómputo
15 llantas fueron probadasμ = 27,000, s = 5,000t = (27,000-25,000)/(5,000/√15) = 1.55
Decisiones Estadística y Administrativa
Como 1.55<1.7613, no podemos rechazar la hipótesis.
Como no pudimos rechazar la hipótesis nula, los datos no aportan evidencia que indiqueque la vida de las llantas sea mayor. Cualquier decisión administrativa quecontraponga H0, no podrá garantizarse, en base a los datos.
Una compañía decide probar que método de capacitación es mejor, el A o el B. Para ello, decide aplicar ambos métodos a parejas de empleados y, al final del curso, medir su desempeño. La siguiente tabla muestra los resultados:
Pares de Observaciones
1280929167288815708571282946882905-186854087873788952585901DiferenciaMétodo BMétodo APareja
Formulación de la Hipótesis
El método B es mejor que el A.
H0: μd ≤ 0 H1: μd > 0
Estadístico de Prueba
Como la d.e. de la población es desconocida, el estadístico de prueba utilizado es:
el cual tiene la distribución tμd0 se considera 0.
t =d −μd 0
sd
Nivel de Significancia
α = 0.05
α establece los límites entre la región de aceptación y la de rechazoPrueba de una cola. El valor de t que tiene αdel área bajo la curva t a la derecha, considerando 8 grados de libertad es: t = 1.8595
Regla de Decisión
a) Si los datos arrojan un valor de la media tan grande que su probabilidad de ocurrenciacuando H0 es verdadera es menor o igual a α, se rechaza H0
Colección de Datos y Cómputo
De los datos colectados se tiene:⎯d = 8.2sd = 6.12s⎯d = 6.12/√9 = 2.04t=(8.2 - 0) / 2.04 = 4.02
Decisiones Estadística y Administrativa
Como 4.02>1.85, rechazamos la hipótesis.
Como rechazamos la hipótesis nula, concluimos, en base a la evidencia que losdatos aportan, que el método A es superior al método B.Como 4.02>3.3554, p<0.005
top related