prueba de hipotesis basada en una sola muestra

26
PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA Pruebas de hipótesis es una parte de la ESTADISTICA INFERENCIAL y tiene su analogía con los pasos que se realizan en un JUICIO. Objetivo : Aquí no se busca Estimar el parámetro sino determinar cuál de las hipótesis contrapuestas propuestas por el investigador es la correcta para cierto nivel. Esquema del procedimiento de Prueba de Hipótesis El investigador establecerá las hipótesis en base a la teoría que quiere verificar . Tomar una muestra aleatoria de la población en estudio. Comparar lo observado con su teoría, si lo observado se contrapone a su teoría se rechaza su hipótesis en caso contrario se dice que no se observó cambio.

Upload: doankien

Post on 11-Feb-2017

309 views

Category:

Documents


25 download

TRANSCRIPT

Page 1: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Pruebas de hipótesis es una parte de la ESTADISTICA INFERENCIAL y

tiene su analogía con los pasos que se realizan en un JUICIO.

Objetivo:

Aquí no se busca Estimar el parámetro 𝜃 sino determinar cuál de

las hipótesis contrapuestas propuestas por el investigador es la

correcta para cierto nivel.

Esquema del procedimiento de Prueba de Hipótesis

El investigador establecerá las hipótesis en base a la teoría

que quiere verificar.

Tomar una muestra aleatoria de la población en estudio.

Comparar lo observado con su teoría, si lo observado se

contrapone a su teoría se rechaza su hipótesis en caso

contrario se dice que no se observó cambio.

Page 2: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Primero definiremos los elementos necesarios para lleva

adelante una Prueba de hipótesis.

a) El investigador debe establecer las hipótesis

contrapuestas de interés para 𝜃, llamadas Hipótesis

Nula (𝑯𝟎) e Hipótesis Alternativa (𝑯𝒂).

𝑯𝟎 hipótesis de no cambio, no diferencia, no mejoría, etc.

𝑯𝒂 hipótesis que el investigador pretende validar.

Si 𝜃 es el parámetro de interés y 𝜃0 un valor fijado por el

investigador entonces en nuestro tratamiento de Prueba de

hipótesis consideraremos estas posibles hipótesis

alternativas

𝑯𝒂 ∶

𝜽 ≠ 𝜽𝟎 𝑷𝒓𝒖𝒆𝒃𝒂 𝒃𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍𝜽 > 𝜽𝟎 𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓𝜽 < 𝜽𝟎 𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓

b) Estadístico de Prueba: estadístico con distribución

conocida bajo hipótesis nula, sobre el cual se basará

la decisión a tomar.

c) Región de Rechazo (RR): conjunto de valores del

estadístico de prueba para los cuales 𝑯𝟎 será

rechazada.

d) Luego 𝑯𝟎 será rechazada si el valor observado o

alcanzado del estadístico pertenece a la RR, en cuyo

caso diremos que la 𝑯𝒂 es la correcta. En caso

Page 3: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

contario diremos que no se encontró evidencia

suficiente para rechazar 𝑯𝟎.

Al tomar una decisión se pueden cometer dos tipos de

errores.

Error tipo I: Rechazar 𝑯𝟎 cuando 𝑯𝟎 es verdadera.

Error tipo II: Aceptar 𝑯𝟎 cuando 𝑯𝟎 es falsa.

Denotaremos con 𝛼 𝑦 𝛽 a las probabilidades de cometer los

Errores tipo I y tipo II respectivamente.

Llamaremos nivel de significación de una prueba al valor

𝜶 = 𝐦𝐚𝐱𝜽𝝐𝜴𝟎𝜶 𝜽 , 𝒅𝒐𝒏𝒅𝒆 𝑯𝟎: 𝜽𝝐𝜴𝟎.

La Región de Rechazo determina las probabilidades de

cometer cada uno de los errores.

Page 4: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

PROBLEMA 1: Supongamos que el 10% de las tarjetas de circuito

producidas por cierto fabricante son defectuosas.

Con el fin de reducir la proporción de tarjetas defectuosas se ha

sugerido un nuevo proceso de producción.

En este caso 𝜃 = 𝑝 es la verdadera proporción de tarjetas

defectuosas con este nuevo método de producción. Se desea

estudiar la eficacia del nuevo método de producción.

a) Establecer las hipótesis de interés.

b) Se tomó una muestra aleatoria de n=200 tarjetas producidas

con este nuevo método. Determinar el Estadístico de Prueba

y su distribución.

c) Dada la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 15 , calcular el nivel de significancia

aproximado y hallar una expresión para la probabilidad

aproximada de cometer el Error de tipo II.

d) Si ahora la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 12 , calcular el nivel de

significancia aproximado.

e) Si en la muestra aleatoria se obtuvo x=13 ¿cuál sería su

conclusión? Usando la región de rechazo dada en el ítem c).

Observaciones:

i) 𝛽 𝑝 crece cuando 𝑝 se aproxima a 0,10 por la izquierda.

ii) 𝛼 = max𝑝≥0,10 𝛼 𝑝 = 𝛼 0,10 . Luego esta prueba sigue

teniendo el mismo nivel de significancia para la hipótesis

simplificada 𝐻0: 𝑝 = 0,10.

Por lo tanto de ahora en más nuestra hipótesis nula será:

𝑯𝟎 ∶ 𝜽 = 𝜽𝟎

Page 5: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

En resumen los pasos a seguir para realizar una

Prueba de Hipótesis son:

a) Identificar el parámetro de interés.

b) Determinar las Hipótesis nula y alternativa

para el problema.

c) Determinar el Estadístico de Prueba adecuado,

con distribución conocida bajo 𝑯𝟎 .

d) Fijado un nivel de significancia 𝜶 determinar la

Región de Rechazo.

e) Calcular el valor observado o alcanzado del

estadístico de prueba con la muestra obtenida.

f) Determinar si 𝑯𝟎 debe ser rechazada o no

para el nivel de significación dado,

estableciendo una conclusión en el contexto

del problema.

Page 6: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Pruebas de Hipótesis para la media poblacional

Así como hicimos en IC consideraremos diferentes situaciones para

plantear Prueba de Hipótesis.

Hipótesis Nula:

𝑯𝟎 ∶ 𝝁 = 𝝁𝟎

Caso A:

Sea 𝑋1,𝑋2,… ,𝑋𝑛 una m.a. de 𝑁(𝜇, 𝜎2) con 𝜎2 conocido.

Bajo estos supuestos sabemos que

𝑿 ~ 𝑵 𝝁,𝝈𝟐

𝒏 ⇔

𝑿 − 𝝁

𝝈 𝒏 ~ 𝑵(𝟎,𝟏)

Estadístico de Prueba

𝑿 −𝝁𝟎

𝝈 𝒏 ~ 𝑵(𝟎,𝟏) , bajo 𝑯𝟎

Si la Hipótesis alternativa fuese:

𝑯𝒂 ∶ 𝝁 < 𝜇𝟎

Fijado un nivel de significancia 𝛼 entonces veamos cómo

definir la Región de Rechazo (𝑅𝑅𝛼 ) y estudiemos el

comportamiento de la función 𝛽.

Page 7: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

𝑹𝑹𝜶 = 𝒙 ≤ 𝒌𝜶 = −𝒛𝜶

𝝈

𝒏 + 𝝁𝟎 = 𝒛 ≤ −𝒛𝜶

La probabilidad de cometer el error tipo II es:

𝜷 𝝁′ = 𝟏 − 𝜱 −𝒛𝜶 + ( 𝝁𝟎−𝝁′)

𝝈 𝒏 , ∀ 𝝁′ < 𝝁𝟎.

Observaciones sobre esta función:

i) lim𝜇→𝜇0− 𝛽 𝜇 = 1 − 𝛼 y lim𝜇→−∞ 𝛽 𝜇 = 0.

ii) 𝛽 es una función creciente con punto de inflexión en

𝑘𝛼 = −𝑧𝛼 𝜎

𝑛 + 𝜇0 .

iii) Ahora si queremos determinar el tamaño de

muestra necesario para que una prueba de nivel 𝛼

sea tal que

𝜷 𝝁′ ≤ 𝜷𝟎

Entonces:

𝒏 ≥ 𝒛𝜷𝟎 + 𝒛𝜶

( 𝝁𝟎−𝝁′) 𝝈

𝟐

.

Page 8: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Problema 2 (Ejercicio 8.18) Se sabe que el tiempo de secado

de cierto tipo de pintura, bajo ciertas condiciones de

prueba, está normalmente distribuido con valor medio de

75 minutos y una desviación estándar de 9 minutos.

Un equipo de químicos ha diseñado un nuevo aditivo para

reducir el tiempo medio de secado de la pintura. Se supone

que el tiempo de secado para la pintura con el nuevo

aditivo seguirá teniendo distribución normal con desviación

estándar de 9 minutos. Debido al gasto asociado con el

aditivo, la evidencia debe sugerir de forma contundente una

disminución en el tiempo medio de secado (𝜇) para su

aceptación.

a) Plantear las hipótesis pertinentes.

b) Dar el estadístico de prueba y su distribución bajo hipótesis

nula.

c) Se tomó una muestra aleatoria de tamaño 25

obteniéndose un promedio muestral de 72,3 minutos.

¿Cuál sería su conclusión usando un nivel de significancia

de 0,01? Justifique su respuesta.

d) ¿Cuál es el nivel de significación para la 𝑅𝑅= 𝑧 ≤ −2,88 ?

e) Para la RR dada en el ítem d), dar el valor de la

probabilidad de cometer el error tipo II cuando 𝜇 =70.

f) Para la RR dada en el ítem d), ¿cuál es el menor tamaño de

muestra que debería tomar para asegurar que

𝛽 70 ≤ 0,01?

Page 9: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Nivel de significación y P(error tipo II cuando μ=70)

68 69 70 71 72 73 74 75 76 77 78 79 80 81 820,00

0,02

0,04

0,07

0,09

0,11

0,13

0,16

0,18

0,20

0,22

De

nsid

ad

P(errortipo I)=0,0020

68 69 70 71 72 73 74 75 76 77 78 79 80 81 820,00

0,02

0,04

0,07

0,09

0,11

0,13

0,16

0,18

0,20

0,22

De

nsid

ad

P(error tipo II en 70)=0,5398

Page 10: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Problema 3 (Ejercicio 8.10)

Una mezcla de ceniza pulverizada de combustible y

cemento Portland para techar debe tener una resistencia a

la compresión de más de 1300 𝐾𝑁/𝑚2.La mezcla no se

utilizará a menos que una evidencia experimental indique

de manera concluyente que se ha cumplido la

especificación de resistencia. Supongamos que la resistencia

a la compresión para especímenes de esta mezcla está

distribuida normalmente con 𝜎 = 60. Sea 𝜇 la resistencia

media de compresión de la mezcla.

a) ¿Cuáles son las hipótesis nula y alternativa

pertinentes?

b) Considere el procedimiento de prueba basado en el

estadístico 𝑋 para n=20 muestras, ¿cuál es su

distribución cuando 𝐻0 es verdadera?

c) Dada la siguiente 𝑅𝑅 = 𝑥 ∶ 𝑥 ≥ 1331,26 determine

el nivel de significación de la prueba de hipótesis.

d) ¿Cuál es la distribución del estadístico de prueba

cuando 𝜇 = 1350? Usando la RR dada en el ítem c),

¿cuál es la probabilidad de que la mezcla se considere

no satisfactoria cuando 𝜇 = 1350?

e) ¿Cómo debería cambiar la RR para que la prueba tenga

un nivel de significancia de 0,05? ¿Qué impacto tendría

este cambio en la probabilidad del ítem d)?

Page 11: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Problema 4 (Ejercicio 8.11)

La calibración de una báscula debe ser revisada al pesar 25

veces un espécimen de prueba de 10 kg. Suponga que los

resultados de diferentes pesos son independientes entre sí

y que el peso en cada intento está normalmente distribuido

con 𝜎 = 0,2 𝑘𝑔. Sea 𝜇 el valor medio de lectura de peso de

la báscula.

a) ¿Cuáles son las hipótesis pertinentes?

b) Suponga que la báscula debe ser revisada si

𝑥 ≤ 9,8968 𝑜 𝑥 ≥ 10,1032 entonces ¿cuál es la

probabilidad de que la revisión se realice cuando no

sea necesaria?

c) ¿Cuál es la probabilidad de que la revisión se considere

innecesaria cuando 𝜇 = 10,1? ¿Y cuándo 𝜇 = 9,8?

d) Sea 𝑧 = 𝑥 − 10 𝑛 / 𝜎 ¿cuál es el valor de c para que

la región de rechazo del ítem b) sea equivalente a

rechazar si 𝑧 ≥ 𝑐?

e) Si ahora el tamaño de muestra fuese de 10 en lugar de

25, ¿cómo se alteraría la RR del ítem d) para que

𝛼 = 0,05?

f) Mediante el uso de la RR definida en el ítem e) , ¿cuál

sería su conclusión usando los siguientes datos

muestrales?

9,981 10,006 9,857 10,107 9,888

9,728 10,439 10,214 10,190 9,793

Page 12: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Resumiendo:

Supuestos:

Sea 𝑿𝟏,𝑿𝟐,… ,𝑿𝒏 una m.a. de 𝑵(𝝁,𝝈𝟐) con 𝝈𝟐 conocido.

Hipótesis Nula:

𝑯𝟎 ∶ 𝝁 = 𝝁𝟎

Estadístico de Prueba:

𝒁 = 𝑿 −𝝁𝟎

𝝈 𝒏 ~ 𝑵(𝟎,𝟏) , bajo 𝑯𝟎

𝑯𝒂 𝑹𝑹𝜶 𝜷 𝝁 𝝁 < 𝜇𝟎

𝒛 ≤ −𝒛𝜶 𝟏 − 𝜱 −𝒛𝜶 +

( 𝝁𝟎 − 𝝁)

𝝈 𝒏

𝝁 > 𝜇𝟎

𝒛 ≥ 𝒛𝜶 𝜱 𝒛𝜶 + ( 𝝁𝟎 − 𝝁)

𝝈 𝒏

𝝁 ≠ 𝝁𝟎

𝒛 ≥ 𝒛𝜶𝟐

𝜱 𝒛𝜶𝟐

+ ( 𝝁𝟎 − 𝝁)

𝝈 𝒏 − 𝜱 −𝒛𝜶

𝟐 +

( 𝝁𝟎 − 𝝁)

𝝈 𝒏

El mínimo tamaño de muestra necesario para que una

prueba de nivel 𝛼 sea tal que

𝜷 𝝁′ ≤ 𝜷𝟎 tomar 𝒏 ≥ 𝒛𝜷𝟎 + 𝒛𝜶

( 𝝁𝟎−𝝁′) 𝝈

𝟐

si la hipótesis es

unilateral y poner 𝑧𝛼2

en lugar de 𝑧𝛼 si la hipótesis es

bilateral.

Page 13: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Caso B:

Sea 𝑋1,𝑋2,… ,𝑋𝑛 una muestra aleatoria con valor medio y

varianza 𝜇 𝑦 𝜎2 respectivamente. Si el tamaño de muestra

es suficientemente grande entonces por TCL:

𝑿 ~ 𝑵 𝝁,𝝈𝟐

𝒏 ⇔

𝑿 − 𝝁

𝝈 𝒏 ~ 𝑵(𝟎,𝟏)

Pedir 𝑛 ≥ 30 si la varianza es conocida y si es desconocida

reemplazar 𝜎 por S y pedir 𝑛 ≥ 40, luego todo es igual que

en el Caso A.

Hipótesis Nula:

𝑯𝟎 ∶ 𝝁 = 𝝁𝟎

Estadístico de Prueba:

𝒁 = 𝑿 −𝝁𝟎

𝝈 𝒏 ~ 𝑵(𝟎,𝟏) , bajo 𝑯𝟎

𝑯𝒂 𝑹𝑹𝜶 𝜷 𝝁 𝝁 < 𝜇𝟎

𝒛 ≤ −𝒛𝜶 𝟏 − 𝜱 −𝒛𝜶 +

( 𝝁𝟎 − 𝝁)

𝝈 𝒏

𝝁 > 𝜇𝟎

𝒛 ≥ 𝒛𝜶 𝜱 𝒛𝜶 + ( 𝝁𝟎 − 𝝁)

𝝈 𝒏

𝝁 ≠ 𝝁𝟎

𝒛 ≥ 𝒛𝜶𝟐

𝜱 𝒛𝜶𝟐 +

( 𝝁𝟎 − 𝝁)

𝝈 𝒏 − 𝜱 −𝒛𝜶

𝟐 +( 𝝁𝟎 − 𝝁)

𝝈 𝒏

Si el 𝜎 es desconocido reemplazarlo por S, siempre que

𝑛 ≥ 40.

Page 14: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

El mínimo tamaño de muestra necesario para que una

prueba de nivel aproximado 𝛼 sea tal que 𝜷 𝝁′ ≤ 𝜷𝟎

tomar 𝒏 ≥ 𝒛𝜷𝟎 + 𝒛𝜶

( 𝝁𝟎−𝝁′) 𝝈

𝟐

si la hipótesis es unilateral y

poner 𝑧𝛼2

en lugar de 𝑧𝛼 si la hipótesis es bilateral.

Problema 5 (Ejercicio 8.20)

Cierta marca de focos son anunciados que poseen un

tiempo de vida medio de 750 horas. Su precio es bastante

asequible, por lo que un cliente potencial ha estado

evaluando su compra, previo convenio de compra, y sólo

dará marcha atrás si se demuestra en forma concluyente

que el tiempo de vida medio (𝜇) es menor a lo anunciado.

Se seleccionó una muestra aleatoria de 50 focos y se

determinó el tiempo de vida para cada uno de ellos,

obteniéndose un promedio y desvío estándar muestral de

738,44 y 38,20 horas, respectivamente.

a) Determinar las hipótesis pertinentes.

b) Dar el estadístico de prueba y su distribución bajo

hipótesis nula.

c) Determinar la región de rechazo de 𝐻0 al 5% y ¿cuál

sería su recomendación?

d) ¿Cuál sería su recomendación? Considerando

𝛼 = 0,01.

Page 15: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Caso C:

Sea 𝑋1,𝑋2,… ,𝑋𝑛 una muestra aleatoria de 𝑁(𝜇,𝜎2) con 𝜎2

desconocido.

Bajo estos supuestos sabemos que

𝑿 − 𝝁

𝑺 𝒏 ~ 𝒕𝒏−𝟏

Hipótesis Nula:

𝑯𝟎 ∶ 𝝁 = 𝝁𝟎

Estadístico de Prueba:

𝑻 = 𝑿 −𝝁𝟎

𝑺 𝒏 ~ 𝒕𝒏−𝟏 , bajo 𝑯𝟎

𝑯𝒂 𝑹𝑹𝜶 𝝁 < 𝜇𝟎

𝒕 ≤ −𝒕𝜶;𝒏−𝟏

𝝁 > 𝜇𝟎

𝒕 ≥ 𝒕𝜶;𝒏−𝟏

𝝁 ≠ 𝝁𝟎

𝒕 ≥ 𝒕𝜶𝟐

,𝒏−𝟏

Page 16: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

En este caso es muy complicado dar la expresión de la

probabilidad de cometer el Error Tipo II y determinar el

valor de n.

Problema 6 (Ejercicio 8.19)

En cierta marca de aceite vegetal hidrogenado se anuncia

que el producto tiene un punto de fusión de 95. Se ha

determinado el punto de fusión en cada una de 16 muestras

de esta marca de aceite vegetal hidrogenado y los

resultados obtenidos fueron: 𝑥 = 94,32 𝑦 𝑠 = 1,20.

Si se puede suponer que el tiempo de fusión en aceite

vegetal tiene distribución normal entonces:

a) Obtener un intervalo de confianza del 95% para el

punto de fusión medio para este aceite hidrogenado.

b) Planteadas las hipótesis 𝐻0 : 𝜇 = 95 𝑦 𝐻𝑎 : 𝜇 ≠ 95

concluir al 5%.

c) Comparar los resultados obtenidos en los ítems

anteriores.

Page 17: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Prueba de hipótesis para la varianza poblacional

Supuestos:

Sea 𝑋1,𝑋2,… ,𝑋𝑛 una muestra aleatoria con

distribución 𝑁(𝜇 ; 𝜎2).

Bajo estas condiciones sabemos

𝑛 − 1 𝑆2

𝜎2 ~ 𝜒𝑛−12

Este resultado nos servirá para obtener la región de

rechazo para la prueba de hipótesis.

𝑯𝟎: 𝝈𝟐 = 𝝈𝟎𝟐

Estadístico de Prueba:

𝒏−𝟏 𝑺𝟐

𝝈𝟎𝟐 ~ 𝝌𝒏−𝟏

𝟐 ; bajo 𝑯𝟎

Fijado un nivel de significación 𝛼 y considerando la

hipótesis alternativa

𝑯𝒂: 𝝈𝟐 > 𝝈𝟎𝟐

Page 18: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Luego 𝑯𝟎 será rechazada para valores de 𝑺𝟐 que sean

mayores que una constante 𝑘𝛼 o sea una región de

rechazo razonable sería

𝑅𝑅𝛼 = 𝑠2 ≥ 𝑘𝛼

¿Cómo determinar el valor de la constante 𝑘𝛼 ?

𝛼 = 𝑃 𝑆2 ≥ 𝑘𝛼 ; 𝜎02 = 𝑃

(𝑛 − 1)𝑆2

𝜎02 ≥

(𝑛 − 1)𝑘𝛼

𝜎02

Entonces buscar en la tabla de una distribución 𝜒𝑛−12

𝜒𝛼 ; 𝑛−12 =

(𝑛 − 1)𝑘𝛼

𝜎02

Por lo tanto

𝑅𝑅𝛼 = 𝑠2 ≥ 𝑘𝛼 = 𝜒𝛼 ; 𝑛−1

2 𝜎02

𝑛 − 1

Es una región de rechazo tal que la prueba tiene un

nivel de significación 𝛼.

Page 19: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Trabajando de forma similar se puede hallar la 𝑅𝑅𝛼 para

las otras dos posibles hipótesis alternativas.

𝐻𝑎 𝑅𝑅𝛼 𝜎2 > 𝜎0

2 𝑥2 ≥ 𝜒𝛼 ; 𝑛−12

𝜎2 < 𝜎02 𝑥2 ≤ 𝜒1−𝛼 ; 𝑛−1

2

𝜎2 ≠ 𝜎02 𝑥2 ≤ 𝜒1−𝛼/2 ; 𝑛−1

2 𝑜 𝑥2 ≥ 𝜒𝛼/2 ; 𝑛−12

donde 𝑥2 =(𝑛−1)𝑠2

𝜎02 .

Problema 7:

Un investigador afirma que su equipo de medición

tiene una variabilidad dada por una desviación

estándar igual a 2. Una muestra aleatoria de n=16

observaciones, provenientes de una distribución

normal, arrojó una varianza muestral 𝑠2 = 6,1.

¿Contradicen los datos lo que afirma el investigador?

Justifique usando un 𝛼 = 0,05.

Page 20: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Pruebas de Hipótesis para la Proporción poblacional

Supuestos:

Sea 𝑋1,𝑋2,… ,𝑋𝑛 una m.a. de Bernoulli de parámetro 𝑝,

entonces la variable 𝑋 = 𝑋𝑖 ~ B(n, p) 𝑛𝑖=1 .

Aquí tendremos dos casos a considerar:

i) Si n es suficientemente grande.

ii) Si n es pequeño.

Caso i)

Por TCL sabemos que

𝑝 =𝑋

𝑛 ~ 𝑁 𝑝,

𝑝 𝑞

𝑛

Hipótesis Nula:

𝑯𝟎 ∶ 𝒑 = 𝒑𝟎

Estadístico de Prueba:

𝒁 = 𝑝 − 𝒑𝟎

𝒑𝟎 𝒒𝟎 𝒏 ~ 𝑵(𝟎,𝟏) , bajo 𝑯𝟎

Page 21: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

𝑯𝒂 𝑹𝑹𝜶 𝜷 𝒑′ 𝒑 < 𝒑𝟎

𝒛 ≤ −𝒛𝜶

𝟏 −𝜱

−𝒛𝜶 𝒑𝟎 𝒒𝟎

𝒑′𝒒′+

( 𝒑𝟎 − 𝒑′)

𝒑′𝒒′𝒏

𝒑 > 𝒑𝟎

𝒛 ≥ 𝒛𝜶 𝜱

𝒛𝜶 𝒑𝟎 𝒒𝟎

𝒑′𝒒′+

( 𝒑𝟎 −𝒑′)

𝒑′𝒒′𝒏

𝒑 ≠ 𝒑𝟎

𝒛 ≥ 𝒛𝜶𝟐

𝜱

𝒛𝜶𝟐

𝒑𝟎 𝒒𝟎

𝒑′𝒒′+

( 𝒑𝟎 −𝒑′)

𝒑′𝒒′𝒏

−𝜱

−𝒛𝜶𝟐

𝒑𝟎 𝒒𝟎

𝒑′𝒒′+

( 𝒑𝟎 − 𝒑′)

𝒑′𝒒′𝒏

Si 𝑛 𝑝0 ≥ 10 y 𝑛 𝑞0 ≥ 10.

El tamaño de muestra necesario para que una prueba de

nivel aproximado 𝛼 sea tal que 𝜷 𝒑′ ≤ 𝜷𝟎 tomar

𝒏 ≥ 𝒛𝜷𝟎 𝒑′ 𝒒′+ 𝒛𝜶 𝒑𝟎 𝒒𝟎

( 𝒑𝟎−𝒑′)

𝟐

si la hipótesis es unilateral y

poner 𝑧𝛼2

en lugar de 𝑧𝛼 si la hipótesis es bilateral.

Page 22: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Problema 8 (Ejercicio 8.35)

Los registros de la Dirección de vehículos del automotor

indican, que de todos los vehículos que fueron sometidos a

una prueba de emisión de gases, el 70% pasaron la prueba

en el año 2011. Para mejorar las condiciones del medio

ambiente se realizó, en cierta ciudad durante el año 2012,

una campaña de difusión para aumentar este porcentaje.

Se tomó una muestra aleatoria de 200 automóviles, de

esta ciudad, de los cuales 156 pasaron la prueba de emisión

de gases.

a) Determinar las hipótesis pertinentes.

b) Dar el estadístico de prueba y su distribución bajo

hipótesis nula.

c) Determinar la región de rechazo de 𝐻0 al 2% y ¿cuál

sería su conclusión respecto al éxito de la campaña de

difusión?

Page 23: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Caso ii)

Si n es pequeño la prueba estadística estará basada en una

distribución Binomial de parámetros n y p.

Hipótesis Nula:

𝑯𝟎 ∶ 𝒑 = 𝒑𝟎

Estadístico de Prueba:

𝑿 = 𝑿𝒊 ~ 𝐁(𝐧, 𝒑𝟎) 𝒏𝒊=𝟏 bajo 𝑯𝟎

Page 24: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Problema 9:

Una empresa está evaluando la posibilidad de establecerse

para prestar servicio de TV por cable, en cierto pueblo de la

provincia.

Sea X el número de familias que estarían interesadas en

solicitar este servicio en una muestra aleatoria de 25 y p la

proporción verdadera de familias interesadas en solicitar tal

servicio. Considere las siguientes hipótesis:

𝐻0: 𝑝 = 0,5 𝑦 𝐻𝑎 : 𝑝 > 0,5.

a) ¿Cuál es la distribución del estadístico de prueba X bajo

𝐻0?

b) ¿Cuáles de estas regiones de rechazo es la más

adecuada para las hipótesis planteadas? ¿y por qué? 𝑅𝑅1 = 𝑥 ∶ 𝑥 ≤ 7 𝑜 𝑥 ≥ 18

𝑅𝑅2 = 𝑥 ∶ 𝑥 ≤ 8 ; 𝑅𝑅3 = 𝑥 ∶ 𝑥 ≥ 18

c) Para la región de rechazo seleccionada en el ítem b),

calcular el nivel de significación de la prueba.

d) Calcular la probabilidad de cometer un error tipo II

para p=0,6 y para p=0,8, para la región de rechazo

seleccionada en el ítem b.

e) Usando la región de rechazo seleccionada en el ítem b,

¿cuál sería su conclusión si 20 de las 25 familias

estarían interesadas en solicitar este servicio de TV por

cable?

Page 25: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

p-valor para una prueba de Hipótesis

Definición:

Se llama p-valor o nivel de significancia alcanzado al

mínimo nivel de significancia a partir del cual rechazaría la

hipótesis nula para un conjunto dado.

Una vez calculado el p-valor la conclusión a un nivel de

significancia 𝛼 será

Si 𝐩 − 𝐯𝐚𝐥𝐨𝐫 ≤ 𝛂 entonces rechazar 𝑯𝟎 a un nivel 𝜶

Si 𝐩 − 𝐯𝐚𝐥𝐨𝐫 > 𝛂 entonces diremos que no hay evidencia

suficiente para rechazar 𝑯𝟎 a un nivel 𝜶 .

Page 26: PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

¿Cómo calcular el p-valor?

Distribución del Estadístico de

Prueba

Hipótesis alternativa

p-valor

Z

Cola superior Cola inferior Bilateral

𝟏 − 𝜱(𝒛𝒐𝒃𝒔) 𝜱(𝒛𝒐𝒃𝒔) 𝟐 𝟏 − 𝜱( 𝒛𝒐𝒃𝒔 )

T

Cola superior Cola inferior Bilateral

P( T > 𝒕𝒐𝒃𝒔) P( T < 𝒕𝒐𝒃𝒔) 2 P( T > 𝒕𝒐𝒃𝒔 )

𝝌𝟐

Cola superior Cola inferior Bilateral

P( 𝝌𝟐 > 𝝌𝒐𝒃𝒔𝟐 )

P( 𝝌𝟐 < 𝝌𝒐𝒃𝒔𝟐 )

2 P( 𝝌𝟐 > 𝝌𝒐𝒃𝒔𝟐 )

Calcular los p valores para los problemas 2, 3, 4, 5, 6. 7 y 8.