estadística ii tema 2: contraste de hipótesis en una población

36
Tema 2. Contraste de hip´ otesis en una poblaci´ on Contenidos I Introducci´ on, las hip´ otesis nula y alternativa I El procedimiento de contraste de hip´ otesis I Errores de Tipo I y Tipo II, potencia del contraste I Estad´ ısticos del contraste, nivel de significaci´ on y regiones de aceptaci´ on/rechazo en contrastes bilaterales y unilaterales I Contrastes de hip´ otesis: procedimiento I p-valor I Contrastes bilaterales e intervalos de confianza I Ejemplos para distintos par´ ametros I Potencia y tama˜ no muestral

Upload: trinhdan

Post on 31-Dec-2016

257 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Estadística II Tema 2: Contraste de hipótesis en una población

Tema 2. Contraste de hipotesis en una poblacion

Contenidos

I Introduccion, las hipotesis nula y alternativa

I El procedimiento de contraste de hipotesis

I Errores de Tipo I y Tipo II, potencia del contraste

I Estadısticos del contraste, nivel de significacion y regiones deaceptacion/rechazo en contrastes bilaterales y unilaterales

I Contrastes de hipotesis: procedimiento

I p-valor

I Contrastes bilaterales e intervalos de confianza

I Ejemplos para distintos parametros

I Potencia y tamano muestral

Page 2: Estadística II Tema 2: Contraste de hipótesis en una población

Tema 2. Contraste de hipotesis en una poblacion

Objetivos de aprendizajeAl final de este tema debieras ser capaz de:

I Llevar a cabo un contraste de hipotesis sobre una poblacion

I Formular las hipotesis nula y alternativa de un contraste

I Entender los errores de tipo I y tipo II, definir el nivel designificacion, definir la potencia del contraste

I Seleccionar un estadıstico del contraste adecuado e identificar lasregiones crıticas correspondientes a contrastes unilaterales ybilaterales

I Utilizar el p-valor para llevar a cabo un contraste

I Conocer la relacion entre un contraste bilateral y un intervalo deconfianza asociado

I Calcular la potencia de un contraste y encontrar el tamano muestralnecesario para obtener una potencia dada

Page 3: Estadística II Tema 2: Contraste de hipótesis en una población

Tema 2. Contraste de hipotesis en una poblacion

ReferenciasI Newbold, P. “Estadıstica para administracion y economıa”

I Capıtulo 9 (9.1-9.5)

I Ross, S. “Introduccion a la Estadıstica”I Capıtulo 9

Page 4: Estadística II Tema 2: Contraste de hipótesis en una población

Contrastes de hipotesis: introduccion

Un contraste de hipotesis es un procedimiento que:

I se basa en datos muestrales

I para proporcionarnos informacion cara a tomar una decision

I sobre la validez de una conjetura o hipotesis sobre una poblacion X ;tıpicamente, el valor de un parametro de la poblacion θ (θ puede seruno cualquiera de los parametros que hemos considerado hastaahora: µ, p, σ2, etc)

Esta hipotesis a confrontar se conoce como la hipothesis nula (H0):

I Podemos pensar en ella como la hipotesis considerada correcta(antes de llevar a cabo el test)

I Sera mantenida a menos que la muestra aporte suficiente evidenciacontraria

I La informacion recogida en la muestra se emplea para confrontar (ocontrastar) esta hipotesis

Page 5: Estadística II Tema 2: Contraste de hipótesis en una población

La hipotesis nula: ejemplos

1. Un fabricante de paquetes de cereales afirma que, en promedio, cadapaquete pesa al menos 400 g. Quieres contrastar esta informacion apartir de los pesos de los paquetes en una muestra aleatoria.Poblacion: X = ’peso de un paquete de cereales (en g)’

Hipotesis nula, H0 : µ ≥µ0︷︸︸︷400' MAS

¿Proporciona la muestra suficiente evidencia para dudar de(rechazar) H0?

2. Una companıa recibe envıos de componentes, que acepta si elporcentaje de componentes defectuosos es como maximo del 5%. Ladecision se basa en una muestra aleatoria de estos componentes.Poblacion: X = 1 si un componente es defectuoso y 0 en otro casoX ∼ Bernoulli(p), p = proporcion de componentes defectuosos entodo el envıo

Hipotesis nula, H0 : p ≤p0︷︸︸︷

0.05' MAS

¿Proporciona la muestra evidencia suficiente para rechazar H0?

Page 6: Estadística II Tema 2: Contraste de hipótesis en una población

La hipotesis nula, H0

I Define la hipotesis a contrastar

I Se asume inicialmente que la hipotesis nula es correcta (semejante asuponer inocencia a menos que se pruebe la culpa)

I Habitualmente corresponde al estatus quo

I Su definicion matematica siempre contiene los sımbolos ’=’, ’≤’ o ’≥’

(conjunto cerrado)

I Puede ser rechazada como resultado del contraste, o no serlo

I Hipotesis simples:

H0 : µ =

µ0z}|{5 , H0 : p =

p0z}|{0.6 , H0 : σ2 =

σ20z}|{

9 En general: H0 : θ = θ0

Espacio parametrico asociado a esta hipotesis nula: Θ0 = {θ0}I Hipotesis compuestas (especificadas mediante un rango de valores):

H0 : µ ≤

µ0z}|{5 , H0 : p ≥

p0z}|{0.6 En general: H0 : θ ≤ θ0 o H0 : θ ≥ θ0

Espacio parametrico asociado a esta hipotesis nula: Θ0 = (−∞, θ0] oΘ0 = [θ0,∞)

Page 7: Estadística II Tema 2: Contraste de hipótesis en una población

Hipotesis alternativa, H1Si la hipotesis nula no es valida, alguna alternativa debe ser correcta. Pararealizar el contraste, el investigador debe especificar una hipotesis alternativafrente a la que se contrasta la hipotesis nula.La hipotesis alternativa H1:

I Es la opuesta a la hipotesis nula

I Habitualmente confronta el estatus quo

I Su formulacion matematica no contiene los sımbolos ’=’, ’≤’ o ’≥’

I Puede ser soportada por los datos o no serlo

I Habitualmente es la hipotesis por la que se inclina el investigador

I Hipotesis unilaterales:

(cola derecha) H1 : µ > 5, (cola izquierda) H0 : p < 0.6

En general: H1 : θ > θ0 o H1 : θ < θ0

Espacio parametrico bajo esta alternativa: Θ1 = (θ0,∞) o Θ1 = (−∞, θ0)

I Hipotesis bilaterales:

H1 : σ2 6= 9 En general: H1 : θ 6= θ0

Espacio parametrico bajo esta alternativa: Θ1 = (−∞, θ0) ∪ (θ0,∞)

Page 8: Estadística II Tema 2: Contraste de hipótesis en una población

La hipotesis alternativa: ejemplos1. Un fabricante de paquetes de cereales afirma que, en promedio, cada

paquete pesa al menos 400 g. Quieres contrastar esta informacion a partirde los pesos de los paquetes en una muestra aleatoria.Poblacion: X = ’peso de un paquete de cereales (en g)’Hipotesis nula, H0 : µ ≥ 400 frente a

Hipotesis alternativa, H1 : µ < 400' MAS

¿Proporciona la informacion de la muestra suficiente evidencia en contrade H0 y a favor de H1?

2. Una companıa recibe envıos de componentes, que acepta si el porcentajede componentes defectuosos es como maximo del 5%. La decision se basaen una muestra aleatoria de estos componentes.Poblacion: X = 1 si un componente es defectuoso y 0 en otro casoX ∼ Bernoulli(p), p = proporcion de componentes defectuosos en el envıoHipotesis nula, H0 : p ≤ 0.05 frente a

Hipotesis alternativa, H1 : p > 0.05' MAS

¿Proporciona la informacion de la muestra suficiente evidencia contra H0

y a favor de H1?

Page 9: Estadística II Tema 2: Contraste de hipótesis en una población

Procedimiento de contraste de hipotesis

xyyxxxxyyPoblacion:

X = ’altura de un estudiante de laUC3M (en m)’

Afirmacion: En promedio, losestudiantes miden menos de 1.6 m ⇒

Hipotesis:

H0 : µ ≤ 1.6 frente a H1 : µ > 1.6

¿Es extrano observar unamedia muestral igual ax = 1.65si la media de la poblaciones µ ≤ 1.6?

' MAS yyxxMuestra: Supongamos que lamedia muestral es 1.65 m,x = 1.65

Si no es razonable, rechazamos lahipotesis nula en favor de laalternativa.

Page 10: Estadística II Tema 2: Contraste de hipótesis en una población

Procedimiento de contraste de hipotesis

I Una vez especificadas las hipotesis nula y alternativa y recogida lainformacion muestral, se toma una decision sobre la hipotesis nula(rechazar o no rechazar H0).

I La regla de decision se basa en el valor de una “distancia” entre losdatos muestrales de que disponemos y aquellos valores que tienenalta probilidad si se cumple la hipotesis nula.

I Esta distancia se calcula como el valor de un estadıstico delcontraste, relacionado con las cantidades pivotales mencionadas enel Tema 1. Mas adelante se mencionaran casos especıficos.

I Para cualquier decision que pueda tomarse, existe la posibilidad dellegar a una conclusion equivocada sobre el valor del parametro de lapoblacion, porque no disponemos mas que de una muestra aleatoriay con ella no podemos tener la certeza de que la hipotesis nula seacorrecta o no.

I Existen dos posibles estados en la naturaleza y por tanto se puedencometer dos errores: los errores de Tipo I y de Tipo II.

Page 11: Estadística II Tema 2: Contraste de hipótesis en una población

Errores de Tipo I y de Tipo II, potenciaI Error de Tipo I: rechazar una hipotesis nula correcta. El error de Tipo I se

considera importante. La probabilidad de un error de Tipo I es igual a α yse denomina nivel de significacion,

α = P(rechazar la nula|H0 es correcta)

I Error de Tipo II: no rechazar una hipotesis nula incorrecta. Laprobabilidad de un error de Tipo II es igual a β.

β = P(no rechazar la nula|H1 es correcta)

I potencia: probabilidad de rechazar una hipotesis nula (cuando esincorrecta).

potencia = 1− β = P(rechazar la nula|H1 es correcta)

Situacion actualDecision H0 correcta H0 incorrecta

No Sin error Error de Tipo IIRechazar H0 (1− α) (β)

Rechazar Error de Tipo I Sin errorH0 (α) (1− β = potencia)

Page 12: Estadística II Tema 2: Contraste de hipótesis en una población

Errores de Tipo I y de Tipo II, potencia

I Los errores de Tipo I y de Tipo II no se pueden cometersimultaneamente

I El error de Tipo I solo puede darse si H0 es correcta

I El error de Tipo II solo puede darse si H0 es incorrecta

I Si la probabilidad del error de Tipo I, α ⇑, entonces la probabilidaddel error de Tipo II, β ⇓

I Si todo lo demas no cambia:I β ⇑ cuando la diferencia entre el valor supuesto para el parametro y

su valor real ⇓I β ⇑ cuando α ⇓I β ⇑ cuando la variabilidad en la poblacion (σ) ⇑I β ⇑ cuando el tamano muestral (n) ⇓I Para θ ∈ Θ1

potencia(θ) = 1− β(θ)

I Para θ ∈ Θ0

potencia(θ) ≤ α

Page 13: Estadística II Tema 2: Contraste de hipótesis en una población

Estadıstico del contraste, nivel de significacion y region derechazo

Estadıstico del contraste, T

I Nos permite decidir si es “probable” o “improbable” que se observenlos datos muestrales, suponiendo que la hipotesis nula sea cierta.

I Es la cantidad pivotal vista en el Tema 1, calculada bajo la hipotesisnula.

I La decision del contraste de hipotesis se basa en el valor observadodel estadıstico del contraste, t.

I Si los datos muestrales proporcionan evidencia contraria a lahipotesis nula, el valor observado del estadıstico del contrastedebiera ser “extremo”, esto es, muy poco probable. En otro caso,este valor debiera ser “usual”.

I Distinguimos entre valores “usuales” y “extremos” sobre la base de:I la distribucion del estadıstico del contraste para la muestra,I el nivel de significacion α, que define la llamada region de rechazo o

crıtica y la region de aceptacion.

Page 14: Estadística II Tema 2: Contraste de hipótesis en una población

Estadıstico del contraste, significacion y region de rechazoRegion de rechazo (RR) y de aceptacion (RA) en contrastes de tamano α:

Contraste unilateral derecho H1 : θ > θ0 RRα = {t : t > Tα} RAα = {t : t ≤ Tα} ●

VALOR CRITICO

RA RR

α

Contraste unilateral izquierdo H1 : θ < θ0 RRα = {t : t < T1−α} RAα = {t : t ≥ T1−α} ●

VALOR CRITICO

RARR

α

Contraste bilateral H1 : θ 6= θ0 RRα = {t : t < T1−α/2 o t > Tα/2}RAα = {t : T1−α/2 ≤ t ≤ Tα/2}

● ●VALOR

CRITICOVALOR

CRITICORARR RR

α 2 α 2

Page 15: Estadística II Tema 2: Contraste de hipótesis en una población

Estadısticos del contraste

Sea X n una m.a.s. de una poblacion X con media µ y varianza σ2, α un nivel de

significacion, zα el cuantil α de N(0,1), µ0 la media de la poblacion bajo H0, etc.

Parametro Hipotesis Estadıstico contraste RRα contraste bilateral

Datos normalesVarianza conocida

X−µ0σ/√

n∼ N(0, 1)

8>>>>><>>>>>:z :

zz }| {x − µ0

σ/√

n< z1−α/2 o

x−µ0σ/√

n> zα/2

9>>>>>=>>>>>;Media Datos no normales

Muestra grande

X−µ0σ/√

n∼ap. N(0, 1)

z :

x−µ0σ/√

n< z1−α/2 o

x−µ0σ/√

n> zα/2

ffDatos BernoulliMuestra grande

p−p0pp0(1−p0)/n

∼ap. N(0, 1)

z :

p−p0pp0(1−p0)/n

< z1−α/2 op−p0p

p0(1−p0)/n> zα/2

ff

Datos normalesVarianza descono-cida

X−µ0s/√

n∼ tn−1

8>>>>><>>>>>:t :

tz }| {x − µ0

s/√

n< tn−1;1−α/2 o

x−µ0s/√

n> tn−1;α/2

9>>>>>=>>>>>;

Varianza Datos normales(n−1)s2

σ20

∼ χ2n−1

8>>>>>>>><>>>>>>>>:χ2 :

χ2z }| {(n − 1)s2

σ20

< χ2n−1;1−α/2

o(n−1)s2

σ20

> χ2n−1;α/2

9>>>>>>>>=>>>>>>>>;Desv. Tıp. Datos normales

(n−1)s2

σ20

∼ χ2n−1

(χ2 :

(n−1)s2

σ20

< χ2n−1;1−α/2

o(n−1)s2

σ20

> χ2n−1;α/2

)

Pregunta: ¿Como definirıas RRα para contrastes unilaterales?

Page 16: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste de hipotesis: procedimiento

1. Especificar las hipotesis nula y alternativa.

2. Calcular el valor observado del estadıstico del contraste (vertransparencia anterior).

3. Para un nivel de significacion α dado, definir la region de rechazo(RRα).

I Rechazar H0, la hipotesis nula, si el valor del estadıstico del contrasteesta en RRα y no rechazar H0 en otro caso.

4. Escribir las implicaciones para nuestro caso en una frase.

Page 17: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste unilateral para la media de datos normales convarianza conocida: ejemplo

Ejemplo: 9.1 (Newbold) Los pesos de los rodamientos fabricados en un procesosiguen una distribucion normal con media 250 g. y desviacion tıpica 5 g. Trasreajustar el mismo, el encargado sospecha que el peso promedio ha aumentado,pero su desviacion tıpica no ha cambiado. Se selecciona una muestra aleatoriasimple de dieciseis rodamientos, con un peso medio de 251.9 g. ¿Tiene razon elencargado? Lleva a cabo el contraste para un nivel de significacion del 5%.

Poblacion:X = ”peso de un rodamiento (en g)”X ∼ N(µ, σ2 = 52)

' MAS: n = 16

Muestra: x = 251.9

Objetivo: contrastar

H0 : µ =

µ0z}|{250 frente a H1 : µ > 250

(contraste unilateral)

Estadıstico del contraste:Z = X−µ0

σ/√

n∼ N(0, 1)

Valor observado del estadıstico:

σ = 5 µ0 = 250

n = 16 x = 251.9

z =x − µ0

σ/√

n

=251.9− 250

5/√

16= 1.52

Page 18: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste unilateral para la media de datos normales convarianza conocida: ejemplo

Ejemplo: 9.1 (cont.)Region de rechazo (o region crıtica):

RR0.05 = {z : z > z0.05}= {z : z > 1.645}

Como z = 1.52 /∈ RR0.05 no rechazamosH0 a un nivel de significacion del 5%.

Densidad N(0,1) ●

z=1.52

zα = 1.645RA RR

Conclusion: Los datos muestrales no proporcionan suficiente evidenciapara rechazar la afirmacion de que el peso promedio de los rodamientoses 250 g.

Page 19: Estadística II Tema 2: Contraste de hipótesis en una población

Definicion de p-valor

I Es la probabilidad de que se obtenga un valor del estadıstico delcontraste que sea al menos tan extremo (≤ o ≥) como el observado,suponiendo que H0 sea cierta.

I Se conoce tambien como el nivel de significacion observado

I Es el menor valor de α para el que se puede rechazar H0.

I Se puede emplear en el paso 3) del procedimiento de contraste dehipotesis con la regla siguiente:

I Si el p-valor < α, rechazamos H0

I Si el p-valor ≥ α, no rechazamos H0

I Como resumen:I p-valores “pequenos” proporcionan evidencia en contra de H0

I p-valores “grandes” proporcionan evidencia a favor de H0

Page 20: Estadística II Tema 2: Contraste de hipótesis en una población

p-valorCalculo del p-valor: t valor observado del estadıstico del contraste T :

Contraste unilateral derecho H1 : θ > θ0 p-valor = P(T ≥ t)

estad. de contr.

p−valor =area

Contraste unilateral izquierdo H1 : θ < θ0 p-valor = P(T ≤ t)

estad. de contr.

p−valor =area

Contraste bilateral H1 : θ 6= θ0 p-valor = P(T ≤ −|t|) + P(T ≥ |t|)

|estad.|−|estad.|

p−valor =areas

izq.+der.

Page 21: Estadística II Tema 2: Contraste de hipótesis en una población

p-valor: ejemploEjemplo: 9.1 (cont.)

Poblacion:X = ”peso de un rodamiento (en g)”X ∼ N(µ, σ2 = 52)

' MAS: n = 16

Muestra: x = 251.9

Objetivo: contrastar

H0 : µ =

µ0z}|{250 frente a H1 : µ > 250

(contraste unilateral)

Estadıstico del contraste:Z = X−µ0

σ/√

n∼ N(0, 1)

Valor observado del estadıstico: z = 1.52

densidad N(0,1)

p-valor = P(Z ≥ z) = P(Z ≥ 1.52)

= 0.0643 donde Z ∼ N(0, 1)

Como se cumple quep-valor = 0.0643 ≥ α = 0.05no rechazamos H0 (perorechazarıamos para cualquier αmayor que 0.0643, por ejemplo,α = 0.1).

z=1.52

p−valor =area

Page 22: Estadística II Tema 2: Contraste de hipótesis en una población

El p-valor y la probabilidad de la hipotesis nula1

I El p-valor:I no es la probabilidad de H0 ni la del error de Tipo I, α;I se puede utilizar como un estadıstico del contraste comparando su

valor con el de α (i.e. rechazar H0 si p-valor < α).

I Queremos responder la pregunta: ¿cual es la probabilidad de lahipotesis nula dadas las observaciones?

I Recordemos que definimos el p-valor como la probabilidad de obtenerlas observaciones (o valores mas extremos) dada la hipotesis nula.

I No podemos responder de manera exacta,I Pero bajo condiciones generales y asumiendo que sin los datos

Pr(H0) = Pr(H1) = 1/2, entonces para p-valores, p, tales quep < 0.36:

Pr(H0|Observaciones) ≥ −ep ln(p)

1− ep ln(p).

1Selke, Bayarri and Berger, The American Statistician, 2001

Page 23: Estadística II Tema 2: Contraste de hipótesis en una población

El p-valor y la probabilidad de la hipotesis nula

La siguiente tabla permite calibrar el p-valor como una funcion de laprobabilidad de la hipotesis nula:

p-valor Pr(H0|Observaciones) ≥0.1 0.39

0.05 0.290.01 0.11

0.001 0.020.00860 0.10.00341 0.050.00004 0.01≤ 0.00001 0.001

I Para un p-valor igual a 0.05 la hipotesis nula tiene una probabilidadde al menos el 29% de ser cierta.

I Mientras que si queremos que la probabilidad de que sea cierta nosupere el 5%, el p-valor tiene que ser mas pequeno que 0.0034.

Page 24: Estadística II Tema 2: Contraste de hipótesis en una población

Intervalos de confianza y contrastes bilaterales: dualidad

Un contraste bilateral a un nivel de significacion α puede realizarse apartir de un intervalo (simetrico) con nivel de confianza 100(1− α)% dela manera siguiente:

1. Especificar las hipotesis nula y alternativa:

H0 : θ = θ0 frente a H1 : θ 6= θ0

2. Calcular un intervalo de confianza al 100(1− α)% para θ.

3. Si θ0 no pertenece a este intervalo, rechazamos H0.Si θ0 pertenece al intervalo, no rechazamos H0.

4. Escribir las implicaciones para nuestro caso en una frase.

Page 25: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste bilateral para la media con varianza conocida:ejemplo

Ejemplo: 9.2 (Newbold) Un taladro produce agujeros cuyos diametrossiguen una distribucion normal con media 2 cm y desviacion tıpica 0.06cm. Para verificar su correcto funcionamiento se miden aleatoriamentenueve taladros, con un diametro medio de 1.95 cm. Realiza un contrastebilateral para un nivel de significacion del 5% utilizando ICs.

Poblacion:X = ”diametro de un agujero (en cm)”X ∼ N(µ, σ2 = 0.062)

' MAS: n = 9

Muestra: x = 1.95

Objetivo: contrastar

H0 : µ =

µ0︷︸︸︷2 frente a H1 : µ 6= 2

(contraste bilateral)

Intervalo de confianza al100(1− α)% = 95% para µ:

IC0.95(µ) =

(x ∓ 1.96

σ√n

)=

(1.95∓ 1.96

0.06√9

)= (1.9108, 1.9892)

Como µ0 = 2 /∈ CI0.95(µ),rechazamos H0 a un nivel designificacion del 5%.

Page 26: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste bilateral para la proporcion: ejemploEjemplo: 9.6 (Newbold) En una muestra aleatoria de 199 sociosauditores de empresas de auditorıa americanas, 104 socios se mostraronde acuerdo con la afirmacion: “Los flujos de caja operativos son unamedida valida de rentabilidad”. Contrasta al 10% frente a unaalternativa bilateral la hipotesis nula de que la mitad de los miembros dela poblacion estarıan de acuerdo con esta afirmacion.

Poblacion:X = 1 si un socio esta de acuerdo con laafirmacion y 0 en otro casoX ∼ Bernoulli(p)

' MAS: n = 199 n grande

Muestra: p = 104199 = 0.523

Objetivo: contrastar

H0 : p =

p0︷︸︸︷0.5 frente a H1 : p 6= 0.5

(contraste bilateral)

Estadıstico del contraste:Z = p−p0√

p0(1−p0)/n∼aprox. N(0, 1)

Valor observado del estadıstico:

p0 = 0.5

n = 199 p = 0.523

z =p − p0√

p0(1− p0)/n

=0.523− 0.5√

0.5(1− 0.5)/199

= 0.65

Page 27: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste bilateral para la proporcion: ejemplo

Ejemplo: 9.6 (cont.)Region de rechazo o region crıtica:

RR0.10 = {z : z > z0.05} ∪{z : z < −z0.05}

= {z : z > 1.645} ∪{z : z < −1.645}

Como z = 0.65 /∈ RR0.10 norechazamos H0 a un nivel designificacion del 10%.

Densidad N(0,1) ● ●

z=0.65

zα2

= 1.645− zα2

= − 1.645RA RRRR

Conclusion: Los datos muestrales no dan evidencia suficiente para dudarque la mitad de los socios auditores piensen que el flujo de cajaoperacional es una medida valida de rentabilidad.

Page 28: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste unilateral, media con var. desconocida: ejemploEjemplo: 9.4 (Newbold, modificado) Una cadena de centros comerciales creeque el aumento de ventas entre Noviembre y Diciembre es del 20%. Unamuestra aleatoria de seis centros tuvo incrementos de ventas de 19.2, 18.4,19.8, 20.2, 20.4, 19.0. Suponiendo la poblacion normal, contrasta que elincremento promedio es al menos del 20% frente a una alternativa unilateral,para α = 10%. Emplea el p-valor.

Poblacion:X = “incremento de ventas en un centroentre Nov. y Dic. (en %)”

X ∼ N(µ, σ2) σ2 desconocida

' MAS: n = 6 n pequeno

Muestra: x = 1176

= 19.5

s2 = 2284.44−6(19.5)2

6−1= 0.588

Objetivo: contrastar

H0 : µ ≥

µ0z}|{20 frente a H1 : µ < 20

(contraste unilateral)

Estadıstico del contraste:

T = X−µ0s/√

n∼ tn−1

Valor observado del estadıstico:

µ0 = 20 n = 6

x = 1.95 s =√

0.588 = 0.767

t =x − µ0

s/√

n

=19.5− 20

0.767/√

6= −1.597

Page 29: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste unilateral, media con var. desconocida: ejemplo

Ejemplo: 9.4 (cont.)

p-valor = P(T ≤ −1.597)

∈ (0.05, 0.1) porque

−t5;0.05z }| {−2.015 < −1.597 <

−t5;0.10z }| {−1.476

Dado que p-valor < α = 0.1,rechazamos la hipotesis nula a estenivel.

Densidad tn−1 | |

t=−1.597

p−valor =area

−2.015 −1.476

Conclusion: Los datos muestrales proporcionan suficiente evidencia pararechazar que el incremento promedio de las ventas haya sido al menos del 20%.

Interpretacion del p-valor: si la hipotesis nula fuese cierta, la probabilidad de

que hubiesemos obtenido estos datos muestrales serıa como maximo del 10%,

lo que es bastante improbable, y por tanto rechazamos la hipotesis nula.

Page 30: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste unilateral para la media con varianzadesconocida: ejemplo

Ejemplo: 9.4 (cont.) en Excel: Selecciona la opcion de menu: Datos,submenu: Analisis de datos, escoge la funcion: prueba t para dos muestrassuponiendo varianzas desiguales.Columna A (datos), Columna B (n repeticiones de µ0 = 20), en amarillo(estadıstico observado t, p-valor y tn−1;α).

Page 31: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste unilateral para la varianza: ejemploEjemplo: 9.5 (Newbold) Para cumplir con la normativa, la varianza del nivel deimpurezas en tanto por ciento en los envıos de un cierto producto quımico nopuede superar el valor 4. Una muestra aleatoria de veinte envıos haproporcionado una cuasi-varianza muestral del nivel de impurezas de 5.62.

a) Lleva a cabo un contraste de hipotesis adecuado (α = 0.1).

b) Calcula la potencia del contraste. ¿Cual es la potencia para σ21 = 7?

c) ¿Que tamano muestral garantizarıa una potencia de 0.9 para σ21 = 7?

Poblacion:X = “nivel de impurezas del producto en unenvıo (en %)”X ∼ N(µ, σ2)

' MAS: n = 20

Muestra: s2 = 5.62

Objetivo: contrastar

H0 : σ2 ≤

σ20z}|{

4 frente a H1 : σ2 > 4

(contraste unilateral)

Estadıstico del contraste:

χ2 = (n−1)s2

σ20∼ χ2

n−1

Valor observado del estadıstico:

σ20 = 4 n = 20

s2 = 5.62

χ2 =(n − 1)s2

σ20

=(20− 1)5.62

4= 26.695

Page 32: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste unilateral para la varianza: ejemplo

Ejemplo: 9.5 a) (cont.)

p-valor = P(χ2 ≥ 26.695)

∈ (0.1, 0.25) porque

χ219;0.25︷︸︸︷22.7 < 26.695 <

χ219;0.1︷︸︸︷27.2

Como el p-valor es mayor queα = 0.1, no podemos rechazar lahipotesis nula a este nivel.

Densidad χ2n−1

χ2 =

26.695

p−valor =area

● ●22.7 27.2

Conclusion: Los datos muestrales no proporcionan suficiente evidenciapara rechazar la afirmacion de que la varianza del porcentaje deimpurezas en los envıos de este producto no es mayor que 4.

Page 33: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste unilateral para la varianza: potenciaEjemplo: 9.5 b) Recuerda que: potencia = P(rechazar H0|H1 es cierta)

¿Cuando rechazamos H0?

RR0.1 =

(n − 1)s2

σ20

> χ2n−1;0.1

ff

=

8>><>>:(n − 1)s2 >

27.2 · 4 = 108.8z }| {χ2

n−1;0.1 · σ20

9>>=>>;La potencia viene dada por:

potencia(σ21) = P

“rechazar H0|σ2 = σ2

1

”= P

“(n − 1)s2 > 108.8|σ2 = σ2

1

”= P

„(n − 1)s2

σ21

>108.8

σ21

«= P

„χ2 >

108.8

σ21

«= 1− Fχ2

„108.8

σ21

«

potencia(σ2) funcion de σ2

0 2 4 6 8 100.0

0.2

0.4

0.6

0.8

1.0

potencia(σ2) =1 − β(σ2)

σ02 = 4

αΘ0 Θ1 σ2

(Fχ2 es la funcion de distribucion de χ2n−1) Por tanto,

power(7) = P`χ2 > 108.8

7

´= 0.6874.

Page 34: Estadística II Tema 2: Contraste de hipótesis en una población

Contraste unilateral para la varianza: calculo de tamanomuestral

Ejemplo: 9.5 c)De nuestros calculos anteriores, sabemos que

potencia(σ21) = P

“(n−1)s2

σ21

> χ2n−1;0.1

σ20

σ21

”, (n−1)s2

σ21∼ χ2

n−1

Nuestro objetivo es encontrar el menor n tal que:

potencia(7) = P

0BBB@ (n − 1)s2

σ21

> χ2n−1;0.1

0.571z}|{4

7

1CCCA ≥ 0.9

La ultima ecuacion implica que queremos trabajar con una distribucion χ2n−1

cuyo cuantil 0.9 debe cumplir χ2n−1;0.9 ≥ 0.571χ2

n−1;0.1.

tabla chi-cuadrado χ243;0.9/χ

243;0.1 = 0.573 > 0.571 ⇒ n − 1 = 43

Por tanto, si disponemos de 44 observaciones podremos detectar el valor

alternativo σ21 = 7 correctamente con una probabilidad superior al 90%.

Page 35: Estadística II Tema 2: Contraste de hipótesis en una población

Otro ejemplo sobre potencia: contraste unilateral para lamedia, poblacion normal y σ2 conocida

I H0 : µ ≥ µ0 frente a H1 : µ < µ0 para α = 0.05

I Supongamos µ0 = 5, n = 16, σ = 0.1I Rechazamos H0 si x−µ0

σ/√

n< −zα = −1.645, esto es, cuando

x ≥ 4.96, por tanto

potencia(µ1) = P(Z < 4.96−µ1

0.1/√

16

)

4.85 4.95 5.050.0

0.2

0.4

0.6

0.8

1.0

µ0 = 5

α

Θ0Θ1 µ

potencia(µ) =1 − β(µ)

4.85 4.95 5.050.0

0.2

0.4

0.6

0.8

1.0

n=16n=9n=4

Page 36: Estadística II Tema 2: Contraste de hipótesis en una población

Otro ejemplo sobre potencia: contraste unilateral para lamedia, poblacion normal y σ2 conocida

La funcion potencia = 1− P(error Tipo II) tiene las siguientespropiedades (si todo lo demas se mantiene constante):

I Cuanto mas alejada este la media verdadera µ1 del valor supuestoµ0, mayor es la potencia.

I Cuanto menor sea α, menor es la potencia, esto es, si se reduce laprobabilidad de un error de Tipo I, se incrementa la probabilidad deun error de Tipo II.

I Cuanto mayor es la varianza de la poblacion, menor es la potencia(cuando tenemos mas variabilidad, resulta mas difıcil detectarpequenas desviaciones del valor real respecto del valor supuesto µ0).

I Cuanto mayor sea el tamano muestral, mayor es la potencia delcontraste (cuanto mas informacion tengamos sobre la poblacion,mas sencillo resultara detectar pequenas desviaciones del valor realrespecto de la hipotesis nula).