unidad 3 estimación puntual pruebas de hipotesis

Upload: antonio-castillo-galindo

Post on 07-Jan-2016

64 views

Category:

Documents


1 download

DESCRIPTION

Estimacion de pruebas de hipotesos

TRANSCRIPT

Title Layout

Estimacin PuntualUnidad 3Parmetro. Es una constante correspondiente a una distribucin de probabilidad o a una poblacin.

Ejemplo. Para la distribucin binomial; n, p. Para la distribucin geomtrica; p. Para la distribucin poisson . Para la distribucin exponencial; . Para la distribucin normal; y . Los parmetros tpicos que se desean conocer de una poblacin son; la media, la varianza o una proporcin.

Estadstico. Es una funcin de una muestra. Por ejemplo; , , S2, S, Rango, etc.

Estimador Puntual. Es un estadstico utilizado para estimar el valor de un parmetro desconocido a partir de una muestra aleatoria. Por ejemplo, el mejor estimador puntual de la media de una poblacin es , el mejor estimador puntual de la varianza es S2, El mejor estimador puntual de una proporcin es , donde X es el nmero de xitos en una muestra aleatoria de tamao n.

Una estimacin por intervalo de un parmetro , consiste en construir un intervalo de la forma , donde los extremos del intervalo se obtienen de acuerdo a la distribucin del estimador del parmetro, donde 1 - es la probabilidad de que el intervalo contenga al valor del parmetro (0 < < 1) y se le llama nivel de confianza. A un intervalo obtenido de esta manera se le llama intervalo de confianza (IC) de , con un nivel de confianza de 1 - .IC para la media con varianza conocida. Suponer una muestra aleatoria de una v.a. X con distribucin normal y varianza conocida. El IC para la media con un nivel de confianza de 1- est dado por:

donde es el valor de z tal que

Estimacin por intervalo

NOTA: Si es una muestra grande (n 30), se puede sustituir por S sin importar la distribucin de probabilidad que tenga X.

Ejemplo. Se tom un muestra aleatoria de 40 focos anotando el tiempo en horas que funcion cada foco. Construir un IC para el tiempo promedio de vida del foco con un nivel de confianza del 95%.

328, 17, 176, 165, 137, 940, 133, 413, 587, 767, 763, 212, 302, 1072, 66, 192, 128, 825, 383, 392, 1012, 715, 1691, 267, 441, 757, 116, 9, 185, 779, 63, 1524, 529, 127, 1089, 128, 304, 441, 764, 182.

El p-valor. Es el mnimo valor de para rechazar H0. Se obtiene calculando la probabilidad de la regin de rechazo considerando como valor crtico el valor del estadstico de prueba.Ejemplo. Obtener el p-valor del ejercicio anterior.

IC para la media con varianza desconocida. Suponer una muestra aleatoria de una v.a. X con distribucin normal y varianza desconocida. El IC para la media con un nivel de confianza de 1- est dado por:

Donde es el valor de la variable alteatoria con distribucin t de student con n-1 grados de libertad tal que,

NOTA: Si es una muestra grande (n 30), se puede aplicar el procedimiento anterior.Ejemplo. Se tom un muestra aleatoria de 15 focos anotando el tiempo en horas que funcion cada foco. Construir un IC para el tiempo promedio de vida del foco con un nivel de confianza del 95%.17, 165, 940, 413, 767, 763, 66, 128, 825, 1012, 715, 757, 9, 185, 182.IC para la varianza. Suponer una muestra aleatoria de una poblacin normal de tamao n. Luego, el IC para la varianza de la poblacin con nivel de confianza 1- est dado por:

con n-1 grados de libertad tal que P( > ) = 1 - /2.

NOTA: Para valores grandes de n, el valor de se puede aproximar mediante la frmula;

Ejemplo. Construir un IC para la varianza de las hora de vida de un foco utilizando las 40 observaciones anteriores.IC para una proporcin para muestras grandes. Suponer una muestra aleatoria de tamao n donde se observaron X xitos. El IC para la proporcin de xitos en la poblacin con un nivel de confianza de 1- est dado por;

Donde .

Ejemplo.Construir un IC para la proporcin de focos que duran ms de 500 horas funcionando, utilizando las 40 observaciones anteriores.Determinar el tamao de la muestra. Para ; .

Para p; Donde error = (longitud total)/2

PRUEBAS DE HIPTESISHiptesis estadstica. Es una afirmacin hecha acerca de un parmetro de una poblacin.Una prueba de hiptesis es un procedimiento estadstico donde se pone en competencia dos hiptesis para decidir cual es la verdadera, de acuerdo a la evidencia estadstica contenida en una muestra aleatoria de la poblacin.Hiptesis nula (H0). Es la hiptesis que afirma una verdad ya establecida.Hiptesis alternativa (H1). Es la hiptesis que se desea sustituya a la hiptesis nula.Error tipo I y error tipo II. Son los tipos de errores que se pueden cometer en una prueba de hiptesis.Estado de la naturalezaSe acepta H0Se rechaza H0H0 es verdaderaNo hay errorError tipo IH0 es falsaError tipo IINo hay errorNivel de significancia. Es la probabilidad de cometer un error tipo I, y se denota por . A la probabilidad de cometer un error tipo II se le denota por .La realizacin de una prueba de hiptesis se puede dividir en 4 pasos que se indican a continuacin.Establecer la hiptesis nula.Establecer la hiptesis alternativa.Calcular un estadstico de prueba.Aplicar una regla de decisin.

Tipos de pruebas de hiptesis. Pruebe bilateral y prueba unilateral.Hiptesis nula; H0: = 0 vs

Hiptesis alternativa

Prueba de hiptesis para la media de una poblacin (varianza conocida).Suponer una muestra aleatoria de tamao n que proviene de una poblacin normal con varianza

Conocida , y sea la media muestral.

Prueba bilateral. Sea H0: = 0 vs H1: 0. Estadstico de prueba;

Regla de decisin; se rechaza H0 con un nivel de significancia si ,Donde es el valor de la variable con distribucin normal estndar z tal que

Prueba unilateral. A) Sea H0: = 0 vs H1: > 0. Se rechaza H0 con un nivel de significancia si , donde es el valor de la variable con distribucin normal estndar z tal que .

B) Sea H0: = 0 vs H1: < 0. Se rechaza H0 con un nivel de significancia si donde es el valor de la variable con distribucin normal estndar z tal que .

NOTA: Si es una muestra grande (n 30), se puede sustituir por S sin importar la distribucin de probabilidad que tenga X.

Ejemplo.

El dueo de un negocio de comidas rpidas afirma que en promedio, el nmero de rdenes por hora que se piden por telfono es 35 rdenes por hora. Aplicar una prueba de hiptesis para verificar lo que afirma el dueo, usar un nivel de significancia del 5%. A continuacin aparece el nmero de rdenes que se pidieron en una hora durante 35 das.27, 27, 32, 30, 29, 28, 22, 26, 25, 27, 31, 26, 29, 35, 30, 31, 31, 32, 33, 30, 31, 40, 29, 29, 19, 32, 37, 31, 41, 22, 30, 26, 33, 27, 23.Prueba de hiptesis para la media de una poblacin (varianza desconocida).Suponer una muestra aleatoria de tamao n que proviene de una poblacin normal. Sea la media muestral y la varianza muestral.

Prueba bilateral. Sea H0: = 0 vs H1: 0. Estadstico de prueba; Regla de decisin; se rechaza H0 con un nivel de significancia si donde es el valor de la variable t con distribucin t de student con n-1 grados de libertad, tal que .

Prueba unilateral. A) Sea H0: = 0 vs H1: > 0. Se rechaza H0 con un nivel de significancia si , donde es el valor de la variable t con distribucin t de student tal que .

B) Sea H0: = 0 vs H1: < 0. Se rechaza H0 con un nivel de significancia si donde, es el valor de la variable t con distribucin t de student tal que .

NOTA: Si es una muestra grande (n 30), se puede aplicar el procedimiento anterior.Ejemplo.

El vendedor de una franquicia afirma que su negocio tiene un promedio de ventas diarias de $ 150,000.00. Se registraron las ventas diarias durante 15 das, aplicar una prueba de hiptesis para verificar lo dicho por el vendedor de la franquicia. Usar un 10% de nivel de significancia.229315, 320742, 73590, 306161, 10768, 71334, 26286, 115407, 338578, 37356, 29562, 199865, 360205, 344462, 51308.Prueba de hiptesis para la varianza de una poblacin normal.Suponer una muestra aleatoria de tamao n que proviene de una poblacin normal con varianza muestral

Prueba bilateral. Sea H0: vs H1: . Estadstico de prueba;

Regla de decisin; se rechazar H0 si , o si . Donde es el valor de la distribucin 2 con n-1 g.l. tal que P[ ] = /2 y es el valor de la distribucin 2 con n-1 g.l. tal que P[ ] ] = 1-(/2).

Prueba unilateral. A) Sea H0: vs H1: . Se rechaza H0 con un nivel de significancia si , donde , donde es el valor de la distribucin 2 con n-1 g.l. tal que P[ ] = . B) Sea H0: vs H1: . Se rechaza H0 con un nivel de significancia si ,donde es el valor de la distribucin 2 con n-1 g.l. tal que

P[ ] = 1 - .

Ejemplo.

Para el ejemplo anterior, el vendedor de la franquicia afirma que las ventas diarias tienen una desviacin estndar de $150,000.00. Aplicar una prueba de hiptesis para verificar esta afirmacin, usar un nivel de significancia del 10%.Prueba de hiptesis para una proporcin (muestra grande).Suponer una muestra aleatoria de tamao n, donde se observaron X xitos.

Prueba bilateral. Sea H0: p = p0 vs H1: p p0. Estadstico de prueba;

Regla de decisin; se rechaza H0 con un nivel de significancia si , donde es el valor de la variable con distribucin normal estndar z tal que

Prueba unilateral. Sea H0: p = p0 vs H1: p > p0. Se rechaza H0 con un nivel de significancia si donde es el valor de la variable con distribucin normal estndar z tal que .

B) Sea H0: p = p0 vs H1: p < p0. Se rechaza H0 con un nivel de significancia si , donde es el valor de la variable con distribucin normal estndar z tal que .

Ejemplo. Se desea probar la hiptesis de que el 60% de los clientes que entran a un negocio hacen una compra. Para ello se observaron 300 clientes al azar y se observ que 170 hicieron una compra. Probar la hiptesis anterior con un 5% de nivel de significancia.

Pruebas de bondad de ajuste Ji-cuadrada

Esta prueba trata de verificar que una muestra aleatoria proviene de una distribucin en particular, es decir que sigue una distribucin de probabilidad especfica. Luego,H0: La muestra aleatoria proviene de una poblacin f(x). vsH1: La muestra aleatoria NO proviene de una poblacin f(x).Esta prueba se aplica de la siguiente manera. Suponer una muestra aleatoria de tamao n.Organizar los valores de la muestra aleatoria en la siguiente tabla de frecuencias.

Donde FEi = n Prob(x intervalo i ), y n es el tamao de la muestra aleatoria. Adems, FEi 5 para todo i.

Intervalo de claseFrecuencia observadaFrecuencia esperada1FO1FE12FO2FE23FO3FE34FO4FE4kFOkFEk2. Calcular

3. Rechazar H0 con un nivel de significancia si ,donde k es el nmero de sumandos en , r es el nmero de parmetros independientes estimados.Ejemplo. La siguiente tabla de frecuencias son ventas diarias en miles de pesos de un vendedor. Se desea probar la hiptesis de que sigue una distribucin normal. Se registraron las ventas diarias de 35 das, adems = 36.67 y S = 11.76. Usar un nivel de significancia del 5%.

VENTASFOFEMenos de 25625-351235-45945-55455-653Ms de 651Q-Q plotsLas grficas llamadas Q-Q plots (grficas Q-Q) se utilizan para verificar que los datos de una muestra aleatoria proviene de una distribucin determinada. Se construyen de la siguiente manera.1.- Suponer que se tiene una muestra aleatoria de tamao n. Primero se ordenan los valores de la muestra en forma creciente;

2.- A cada observacin se le estima su probabilidad acumulada mediante la frmula

3.- A cada observacin se le asocia con el percentil terico (de acuerdo a la distribucin de probabilidad determinada) correspondiente a denotado por . Formndose n pares ordenados ( , ).

4.- Se grafican en el plano los puntos ( , ). Si los puntos estn alineados en el plano, entonces se puede afirmar que la muestra proviene de una poblacin con la distribucin determinada.

Ejemplo. Construir la grfica Q-Q de los siguientes datos para verificar si provienen de una distribucin normal. (observe que 44.096 y S = 37.703)

kxProb. acumuladaPercentil terico (y)(x, y)11.10.02-33.3(1.1, -33.3)23.50.06-14.5(3.5, -14.5)33.80.10-4.2(3.8, -4.2)49.80.143.4(9.8, 3.4)513.70.189.6(13.7, 9.6)614.70.2215.0(14.7, 15.0)716.50.2619.8(16.5, 19.8)816.80.3024.3(16.8, 24.3)917.10.3428.5(17.1, 28.5)1021.50.3832.6(21.5, 32.6)1122.40.4236.5(22.4, 36.5)1228.60.4640.3(28.6, 40.3)1329.30.5044.1(29.3, 44.1)1431.00.5447.9(31.0, 47.9)1535.60.5851.7(35.6, 51.7)1636.60.6255.6(36.6, 55.6)1753.90.6659.6(53.9, 59.6)1868.00.7063.9(68.0, 63.9)1972.10.7468.4(72.1, 68.4)2083.90.7873.2(83.9, 73.2)2191.20.8278.6(91.2, 78.6)2292.20.8684.8(92.2, 84.8)23105.40.9092.4(105.4, 92.4)24108.40.94102.7(108.4, 102.7)25125.30.98121.5(125.3, 121.5)

Ejemplo. Hacer una grfica Q-Q para los datos del ejemplo anterior ajustndolos a una distribucin exponencial.kxProb. acumuladaPercentil terico (y)(x, y)11.10.020.9(1.1, 0.9)23.50.062.7(3.5, 2.7)33.80.104.6(3.8, 4.6)49.80.146.7(9.8, 6.7)513.70.188.8(13.7, 8.8)614.70.2211.0(14.7, 11.0)716.50.2613.3(16.5, 13.3)816.80.3015.7(16.8, 15.7)917.10.3418.3(17.1, 18.3)1021.50.3821.1(21.5, 21.1)1122.40.4224.0(22.4, 24.0)1228.60.4627.2(28.6, 27.2)1329.30.5030.6(29.3, 30.6)1431.00.5434.2(31.0, 34.2)1535.60.5838.3(35.6, 38.3)1636.60.6242.7(36.6, 42.7)1753.90.6647.6(53.9, 47.6)1868.00.7053.1(68.0, 53.1)1972.10.7459.4(72.1, 59.4)2083.90.7866.8(83.9, 66.8)2191.20.8275.6(91.2, 75.6)2292.20.8686.7(92.2, 86.7)23105.40.90101.5(105.4, 101.5)24108.40.94124.1(108.4, 124.1)25125.30.98172.5(125.3, 172.5)

Chart2-33.31.1-14.53.5-4.23.83.49.89.613.71514.719.816.524.316.828.517.132.621.536.522.440.328.644.129.347.93151.735.655.636.659.653.963.96868.472.173.283.978.691.284.892.292.4105.4102.7108.4121.5125.3

yrecta a 45x (valores de la muestra)y (percentiles tericos)

Sheet10.1698964525

Sheet2xyrecta a 451.1-33.31.13.5-14.53.53.8-4.23.89.83.49.813.79.613.714.71514.716.519.816.516.824.316.817.128.517.121.532.621.522.436.522.428.640.328.629.344.129.33147.93135.651.735.636.655.636.653.959.653.96863.96872.168.472.183.973.283.991.278.691.292.284.892.2105.492.4105.4108.4102.7108.4125.3121.5125.3

Sheet200000000000000000000000000000000000000000000000000

yrecta a 45x (valores de la muestra)y (percentiles tericos)

Sheet3

Chart30.91.12.73.54.63.86.79.88.813.71114.713.316.515.716.818.317.121.121.52422.427.228.630.629.334.23138.335.642.736.647.653.953.16859.472.166.883.975.691.286.792.2101.5105.4124.1108.4172.5125.3

yrecta a 45x (valores de la muestra)y (percentiles tericos)

Sheet10.1698964525

Sheet2xyrecta a 451.10.91.13.52.73.53.84.63.89.86.79.813.78.813.714.71114.716.513.316.516.815.716.817.118.317.121.521.121.522.42422.428.627.228.629.330.629.33134.23135.638.335.636.642.736.653.947.653.96853.16872.159.472.183.966.883.991.275.691.292.286.792.2105.4101.5105.4108.4124.1108.4125.3172.5125.3

Sheet200000000000000000000000000000000000000000000000000

yrecta a 45x (valores de la muestra)y (percentiles tericos)

Sheet3