pruebas hipotesis

22
69 DEPARTAMENTO DE ESTADÍSTICA Y MATEMÁTICAS UNIDAD 3 PRUEBAS DE HIPÓTESIS 2.2. Dos muestras: Pruebas para diferencia de medias Se dispone de una muestra aleatoria de tamaño n de una población normal X que tiene media X y varianza 2 X ; también se dispone de una muestra aleatoria de tamaño m de una población normal Y que tiene media Y y varianza 2 Y . Queremos comparar las medias poblacionales. Para ello vamos a realizar las siguientes pruebas 0 0 0 0 0 0 0 0 0 : : : 1) 2) 3) : : : X Y X Y X Y a X Y a X Y a X Y H D H D H D vs vs vs H D H D H D La estadística de prueba es X Y . Aceptamos H0 cuando la diferencia entre el valor observado de la estadística de prueba en la muestra no sea “muy diferente” del valor propuesto 0 D para X Y . Para buscar diferencias significativas entre estas cantidades utilizamos la distribución de X Y para ello es necesario saber la manera en que se tomaron las muestras; es decir, es necesario saber si las muestras son dependientes o independientes; también se requiere conocer como son las distribuciones poblacionales, saber si las varianzas son o no conocidas y los tamaños muestrales. 2.2.1. Contrastes basados en muestras independientes: Supongamos que se tienen muestra aleatorias independientes de tamaños n y m de dos poblaciones X e Y que son normales con medias X y Y y varianzas de una muestra 2 X y 2 Y conocidas. En este caso, la distribución de la estadística de prueba es: 0 2 2 ~ (0,1) X Y X Y D Z N n m Esta estadística la utilizaremos para buscar diferencias significativas entre X Y y D0. Con base en esta estadística se tiene que las regiones críticas de tamaño α y los valores p para los tres contrastes anteriores son las siguientes:

Upload: jhonathan-steven-herrera-atehortua

Post on 13-Sep-2015

294 views

Category:

Documents


18 download

DESCRIPTION

Pruebas o Contrastes Estadisticos

TRANSCRIPT

  • 69

    DEPARTAMENTO DE ESTADSTICA Y MATEMTICAS

    UNIDAD 3

    PRUEBAS DE HIPTESIS

    2.2. Dos muestras: Pruebas para diferencia de medias

    Se dispone de una muestra aleatoria de tamao n de una poblacin normal X que tiene

    media X y varianza 2

    X ; tambin se dispone de una muestra aleatoria de tamao m de

    una poblacin normal Y que tiene media Y y varianza 2

    Y . Queremos comparar las

    medias poblacionales. Para ello vamos a realizar las siguientes pruebas

    0 0 0 0 0 0

    0 0 0

    : : :

    1) 2) 3)

    : : :

    X Y X Y X Y

    a X Y a X Y a X Y

    H D H D H D

    vs vs vs

    H D H D H D

    La estadstica de prueba es X Y . Aceptamos H0 cuando la diferencia entre el valor observado de la estadstica de prueba en la muestra no sea muy diferente del valor

    propuesto 0D para X Y . Para buscar diferencias significativas entre estas cantidades

    utilizamos la distribucin de X Y para ello es necesario saber la manera en que se tomaron las muestras; es decir, es necesario saber si las muestras son dependientes o

    independientes; tambin se requiere conocer como son las distribuciones poblacionales,

    saber si las varianzas son o no conocidas y los tamaos muestrales.

    2.2.1. Contrastes basados en muestras independientes:

    Supongamos que se tienen muestra aleatorias independientes de tamaos n y m de dos

    poblaciones X e Y que son normales con medias X y Y y varianzas de una muestra 2

    X

    y 2Y conocidas. En este caso, la distribucin de la estadstica de prueba es:

    0

    2 2~ (0,1)

    X Y

    X Y DZ N

    n m

    Esta estadstica la utilizaremos para buscar diferencias significativas entre X Y y D0. Con base en esta estadstica se tiene que las regiones crticas de tamao y los valores p para los tres contrastes anteriores son las siguientes:

  • 70

    Prueba bilateral.

    0 0

    0

    :

    :

    X Y

    a X Y

    H D

    vs

    H D

    En este caso parece razonable rechazar H0 cuando el valor observado para X Y en la

    muestra sea suficientemente diferente del valor propuesto 0D para X Y . Entonces,

    valores grandes de la estadstica Z en cualquier direccin nos conducen a rechazar H0; por

    esta razn,

    2 2. . / o RC z z z z z Entonces, rechazamos H0 a favor de Ha y concluimos que 0X Y D cuando

    02 2

    ( ). .c

    X Y

    x y Dz R C

    n m

    El valor p para la prueba es:

    2 cp valor P Z z

    Prueba unilateral derecha.

    0 0

    0

    :

    :

    X Y

    a X Y

    H D

    vs

    H D

    En este caso parece razonable rechazar H0 cuando el valor observado para X Y en la

    muestra sea suficientemente mayor que el valor propuesto 0D para X Y ; por lo tanto, valores extremos en la cola derecha de la estadstica Z nos conducen a rechazar H0. Por esta

    razn, la regin crtica de tamao y el valor p son:

    . . /RC z z z

    Entonces, rechazamos H0 a favor de Ha y concluimos que 0X Y D cuando

    02 2

    ( ). .c

    X Y

    x y Dz R C

    n m

  • 71

    El valor p es:

    cp valor P Z z

    Prueba unilateral izquierda.

    0 0

    0

    :

    :

    X Y

    a X Y

    H D

    vs

    H D

    En este caso parece razonable rechazar H0 cuando el valor observado para X Y en la

    muestra sea suficientemente menor que el valor propuesto 0D para X Y ; por esta

    razn, la regin crtica y el valor p para un nivel de significancia preestablecido para esta prueba son:

    . . /RC z z z

    Entonces, rechazamos H0 a favor de Ha y concluimos que 0X Y D cuando

    02 2

    ( ). .c

    X Y

    x y Dz R C

    n m

    El valor p es:

    cp valor P Z z

    Observaciones:

    a) Los contrastes anteriores siguen siendo vlidos aun cuando las poblaciones no sean normales, siempre que los tamaos muestrales son grandes.

    b) Los contrastes anteriores siguen siendo vlidos aun cuando las varianzas poblacionales

    sean desconocidas, en este caso las reemplazamos por las varianzas muestrales 2 XS y 2

    YS , pero se requiere que los tamaos muestrales sean grandes. En este caso, la

    estadstica de prueba es

    02 2

    ~ (0,1)

    X Y

    X Y DZ N

    S S

    n m

    Adems, el valor calculado de la estadstica es:

    02 2

    ( )c

    X Y

    x y Dz

    s s

    n m

    Las regiones crticas y los valores p son los mismos que antes.

  • 72

    Ejemplo 4. Se cree que el promedio verbal para el nmero de respuestas correctas para la

    prueba SAT para los hombres es mayor que el de las mujeres por ms de 10 puntos. Las

    muestras aleatorias para ambos sexos arrojaron los siguientes resultados:

    Hombres Mujeres

    Tamao muestral = 125 100

    Media muestral = 480 460

    Desviacin estndar muestral = 60 52

    Asuma normalidad.

    a) Utilizar un nivel de significancia del 5% para determinar si se encuentra apoyada la creencia por la evidencia muestral. Cul es el p valor?

    b) Suponga que la verdadera diferencia es de 11 puntos. Cul es la potencia de la prueba anterior?

    Solucin:

    Sea X = Calificacin en la prueba verbal SAT para los hombres esta variable tiene una

    media poblacional X y una varianza 2

    X desconocida. De una muestra aleatoria de

    tamao n = 125 se obtiene 480, 60XX S

    De una muestra aleatoria de tamao m = 100 de Y que representa la calificacin en la

    prueba verbal SAT para los mujeres. Esta variable tiene una media poblacional Y y una

    varianza 2Y desconocida. De de la muestra se obtiene 460, 52YY S

    Se cree que el promedio para los hombres est por encima del de las mujeres por ms de 10

    puntos. Lo anterior lo podemos indicar como 10X Y , pues la cantidad X Y nos

    indica en qu cantidad la media poblacional de X est por encima de la de Y. Entonces

    a) Utilizar un nivel de significancia del 5% para probar la creencia; para ello, debemos realizar la siguiente prueba de hiptesis:

    0 : 10

    : 10

    X Y

    a X Y

    H

    vs

    H

    Esta es una prueba unilateral derecha para la diferencia de medias poblacionales de dos

    poblaciones independientes con varianzas poblacionales desconocidas y tamaos

    muestrales grandes, entonces la estadstica de prueba para el contraste es

    0

    2 2~ (0,1)

    X Y

    X Y DZ N

    S S

    n m

  • 73

    La regin crtica es

    0.05. . / 1.645RC z z z z

    Usando la informacin muestral se obtiene que el valor calculado de la estadstica de

    prueba es:

    2 2

    480 460 ( 10)1.34

    60 52

    125 100

    cz

    Como 1.34 . .cz R C entonces no es posible rechazar H0 y esto nos permite inferir que

    posible que los hombres superen a las mujeres en esa prueba pero no lo hacen por ms

    de 10 puntos.

    El valor p para la prueba es:

    1.34 0.0901 0.05p valor P Z Entonces rechazamos H0.

    b) Si la verdadera diferencia es 11 10X Y , entonces la hiptesis nula es falsa y para

    este valor la potencia de la prueba es:

    0 0Rechazar / es falsa

    1.645 / 11c X Y

    Potencia P H H

    P Z

    Para encontrar esta probabilidad hay que tener en cuenta

    2 2

    10c

    X Y

    X YZ

    S S

    n m

    Entonces,

    2 2

    101.645 / 11X Y

    X Y

    X YPotencia P

    S S

    n m

    Como la verdadera media no es 10 sino que es 11, entonces la estadstica anterior est

    mal estandarizada. Para corregir este problema restamos 1 en el numerador de la parte

    izquierda de la expresin anterior y esta misma cantidad se resta al lado derecho, y as se

    obtiene que

  • 74

    2 2 2 2

    2 2

    10 1 11.645

    11.645 1.51 0.0655

    60 52

    125 100

    X Y X Y

    X YPotencia P

    S S S S

    n m n m

    P Z

    Ejemplo 4.1. Un fabricante afirma que la tensin de ruptura promedio del hilo A excede a

    las hilo B en al menos 12 kilogramos. Para probar esta afirmacin se pusieron a prueba 50

    hilos de cada tipo bajo condiciones controladas. El hilo tipo A tuvo una tensin promedio

    de 86.7 kilogramos con una desviacin estndar de 6.28; mientras que el hilo tipo B tuvo

    una tensin promedio de 77.8 kilogramos con una desviacin estndar de 5.61. Utilice un

    nivel de significancia del 5% para probar la afirmacin del fabricante. Encuentre el valor p

    de la prueba.

    Solucin:

    Sea X = La tensin de ruptura del hilo tipo A y X es la tensin de ruptura promedio de

    hilo.

    Sea Y = La tensin de ruptura del hilo tipo B y Y es la tensin de ruptura promedio de

    hilo.

    En la muestra aleatoria de tamao n = 50 de X se obtiene 86.7 y 6.28Xx S y en la

    muestra de tamao m = 50 de Y se obtiene 77.8 y 5.61Yy S

    El fabricante afirma que la resistencia promedio del hilo tipo A excede a la del hilo tipo B

    en al menos 12 kilogramos y esto quiere decir que 12X Y , entonces debemos probar

    a un nivel de significancia 0.05 lo siguiente:

    0 : 12

    : 12

    X Y

    a X Y

    H

    vs

    H

    Esta es una prueba unilateral izquierda para la diferencia entre dos medias poblacionales de

    poblaciones independientes con varianzas poblaciones desconocidas y tamaos muestrales

    grandes; por lo tanto, la estadstica de prueba es:

    02 2

    ~ (0,1)

    X Y

    X Y DZ N

    S S

    n m

  • 75

    Entonces, la regin critica de para es

    0.05. . / 1.645RC z z z

    Para tomar la decisin buscamos

    2 2 2 2

    12 86.7 77.8 122.6031

    6.28 5.61

    50 50

    c

    X Y

    x yz

    S S

    n m

    Como 2.6031 . .cz R C , entonces rechazamos H0 y concluimos que la afirmacin de

    fabricante no es cierta.

    Ahora bien, el valor p para esta prueba es:

    ( 2.6031) 0.0046 0.05cp valor P Z z

    Entonces, rechazamos H0.

    El caso de varianzas poblacionales desconocidas pero iguales:

    Un caso de particular inters es en el que las varianzas poblacionales son desconocidas,

    pero podemos suponer que son iguales. En este caso, la estadstica de prueba es:

    0( 2)~

    1 1n m

    p

    X Y Dt t

    Sn m

    Donde,

    2 2( 1) ( 1)

    2x Y

    p

    n S m SS

    n m

    Entonces, las regiones crticas y los valores p para los contrastes alternativos son las

    siguientes:

    Prueba bilateral:

    ( 2, 2) ( 2, 2) 2. . / o 2n m n m n m cRC t t t t t p valor P t t

    Prueba unilateral derecha.

    ( , 2) 2. . / n m n m cRC t t t p valor P t t

    Prueba unilateral izquierda.

  • 76

    ( , 2) 2. . / n m n m cRC t t t p valor P t t

    En cualquiera de los tres casos anteriores se rechaza H0 cuando . .ct R C donde

    0

    1 1c

    p

    x y Dt

    Sn m

    Ejemplo 5. A finales de la dcada de los setenta se descubri que la sustancia

    carcionognica NDMA se formaba durante el proceso de secado de la malta verde, la cual

    se empleaba para fabricar cerveza. A principios de los ochenta se desarroll un nuevo

    proceso para el secado de la malta, el cual minimizaba la formacin de NDMA. Se tomaron

    muestras aleatorias de una cerveza domstica que se fabric empleando ambos procesos, y

    se midieron los niveles de NDMA en partes por billn. Los resultados estn en la tabla

    adjunta:

    Proceso 6 4 5 5 6 5 5 6 4 6 7 4

    Anterior

    Proceso 2 1 2 2 1 0 3 2 1 0 1 1

    propuesto

    Si se supone que se muestrearon dos poblaciones normales e independientes con varianzas

    iguales, existe alguna razn para creer, a un nivel de significancia del 5% que ha

    disminuido la cantidad de NDMA en ms de dos partes por billn con el empleo del nuevo

    proceso? Encuentre el p valor para el contraste.

    Solucin:

    Sea X = Cantidad NDMA que se forma en el secado de la malta verde en el proceso

    anterior. Entonces, se puede afirmar que 2~ ( , )XX N

    Sea Y = Cantidad NDMA que se forma en el secado de la malta verde en el proceso nuevo.

    Entonces, se puede afirmar que 2~ ( , )YY N

    En lo anterior se asume que las varianzas poblacionales son iguales. Adems, podemos

    asumir independencia entre las poblaciones X e Y.

    Ahora bien, X Y representa la reduccin promedio verdadera en partes por billn por el

    empleo del nuevo proceso. Entonces nos piden contrastar que la reduccin es superior a dos

    partes por billn; esto es hay que realizar el siguiente contraste de hiptesis:

    0 : 2

    : 2

    X Y

    a X Y

    H

    vs

    H

  • 77

    Para la realizacin de la prueba se toman dos muestras aleatorias independientes de

    tamaos 12n y 12m de las poblaciones X e Y, respectivamente. Ahora, de las muestras se obtiene que:

    Summary Statistics X Y ------------------------------------------------------------Count 12 12 Average 5.25 1.33333 Variance 0.931818 0.787879 Standard deviation 0.965307 0.887625 Sum 63.0 16.0 ------------------------------------------------------------

    Dado que las poblaciones son normales, independientes con varianzas desconocidas pero

    iguales, entonces la estadstica de prueba para el contraste es:

    0( 2) (20 20 2) (18)~

    1 1n m

    p

    X Y Dt t t t

    Sn m

    Donde

    2 211 11 11 0.931818 11 0.787879

    0.9272822 22

    x Yp

    S SS

    Entonces, la regin crtica de tamao 0.05 es:

    (0.05,22). . / 1.717RC t t t Ahora, el valor calculado de la estadstica de prueba es:

    05.25 1.33 2

    5.0718451 1 1 1

    0.9272812 12

    c

    p

    x y Dt

    Sn m

    Ahora, como

    5.071845 . .ct R C

    Entonces, rechazamos H0 y concluimos que con el empleo del nuevo proceso de secado de

    la malta verde se produce una reduccin en NDMA en ms de dos partes por billn.

    2.2.2. Contrastes basados en muestras dependiente (datos pareados):

    En este caso suponemos que se tiene una muestra aleatoria de n pares de observaciones de

    la forma 1 1 2 2( , ),( , ), , ( , )n nX Y X Y X Y de dos poblaciones normales dependientes X e Y que

    tienen medias X y Y . Queremos determinar si 0X Y D o no lo es. Para realizar

  • 78

    la prueba definimos la v.a 2~ ( , )D DD X Y N con D X Y y 2

    D es

    desconocida. Las pruebas para determinar si 0D X Y D se basan en la estadstica

    0 0( 1)~

    / /n

    D D

    D D X Y Dt t

    S n S n

    donde DD X Y S son media y desviacin estndar de las diferencia entre X e Y.

    Entonces, las regiones criticas de tamao y el p valor para las tres pruebas anteriores son las siguientes:

    Prueba bilateral:

    0 0

    0

    :

    :

    D X Y

    a D X Y

    H D

    vs

    H D

    La regin crtica y el p valor son:

    ( /2, 1) ( /2, 1) 1. . / 2n n n cRC t t t t t p valor P t t Prueba unilateral derecha:

    0 0

    0

    :

    :

    D X Y

    a D X Y

    H D

    vs

    H D

    La regin crtica y el p valor son:

    ( , 1) 1. . / n n cRC t t t p valor P t t

    Prueba unilateral izquierda:

    0 0

    0

    :

    :

    D X Y

    a D X Y

    H D

    vs

    H D

    La regin crtica y p valor son

    ( /2, 1) 1. . / n n cRC t t t p valor P t t

    En cualquiera de los tres casos anteriores se rechaza H0 cuando ct RC donde

    0

    /c

    d

    d Dt

    S n

  • 79

    Donde dd s son media y desviacin estndar muestral de las diferencias muestrales.

    Observacin: Usado la estadstica

    ( 1)( ) ( )

    ~/ /

    X Y X Yn

    D D

    D X Yt t

    S n S n

    Se obtiene que el intervalo de confianza del 100(1 )% para ( )X Y es

    ( / 2, 1) ( / 2, 1)d d

    n X Y n

    s sd t d t

    n n

    Ejemplo 6: Se llev a cabo un estudio para determinar el grado en el cual el alcohol

    entorpece la habilidad de pensamiento para llevar a cabo una tarea. Se seleccionaron al

    azar diez personas de distintas caractersticas y se les pidi que participaran en el

    experimento. Despus de proporcionarles la informacin pertinente, cada persona llev a

    cabo el experimento sin nada de alcohol en su organismo. Entonces, la tarea volvi a

    llevarse a cabo, despus de que cada persona haba consumido una cantidad suficiente de

    alcohol para tener un contenido en su organismo de 0.1%. Los tiempos antes y despus

    (en minutos) estn en la siguiente tabla.

    Participante Antes (X) Despus (Y) Despus Antes = D

    1 28 39 11

    2 22 45 23

    3 55 67 12

    4 45 61 16

    5 32 46 14

    6 35 58 23

    7 40 51 11

    8 25 34 9

    9 37 48 11

    10 20 30 10

    Media - muestral 33.9 47.9 14

    Desviacin estndar muestral 10.90 11.80 5.14

    Suponiendo que los tiempos antes y despus se pueden modelar por una distribucin

    normal, puede concluirse a un nivel de significancia del 5% que el tiempo despus es

    mayor que el tiempo promedio antes por ms de 10 minutos? Encuentre el p valor para el contraste. Construya un intervalo de confianza del 95% para la diferencia entre los

    tiempos promedio despus menos antes.

    Solucin: Sea D = Y X = Diferencia de tiempos despus antes ~ 2( , )D y X DN

    con varianza desconocida, donde 2~ ( , )y yY N es el tiempo despus y 2~ ( , )X XX N

  • 80

    es el tiempo antes. Los resultados muestrales para la variable D estn en la tabla anterior y

    nos muestran que 14d y 5.14ds .

    Observe se est suponiendo que el tiempo promedio despus es mayor que el tiempo

    promedio antes; entonces D Y X representa en cuanto el tiempo promedio despus

    supera al tiempo promedio antes y se espera que lo supere en ms de 10 minutos. Por lo

    tanto, debemos contrastar a un nivel de significancia del 5% las siguientes hiptesis:

    0

    0

    : 10

    : 10

    D Y X

    D Y X

    H

    vs

    H

    La estadstica de prueba para este contraste es

    0 (10)10

    ~/ / 10D D

    D D Dt t

    S n S

    La regin crtica de tamao = 0.05 es

    RC = (0.05,9)/ 1.833t t t El valor calculado de la estadstica a partir de la informacin muestral es

    10 14 10

    2.461/ 10 5.14/ 10

    c

    d

    dt

    S

    Como tc = 2.461 pertenece a la regin crtica, entonces se rechaza H0 y podemos concluir

    que el tiempo promedio despus es mayor que el tiempo promedio antes por ms de 10

    minutos.

    2.3. PRUEBAS PARA VARIANZAS.

    Caso 1. Una sola muestra: Pruebas para la varianza de una poblacin normal.

    Se quiere probar el valor 20 para la varianza

    2 de una poblacin normal. Para la prueba

    usaremos la estadstica muestral 2XS proveniente de una muestra aleatoria de tamao n

    tomada de la poblacin de inters. Los contrastes que vamos realizar son los siguientes:

    1)

    2 2

    0 0

    2 2

    0

    :

    :a

    H

    vs

    H

    ; 2)

    2 2

    0 0

    2 2

    0

    :

    :a

    H

    vs

    H

    y 3)

    2 2

    0 0

    2 2

    0

    :

    :a

    H

    vs

    H

    En cualquiera de los casos, la estadstica de prueba bajo H0 cierta es

  • 81

    22 2

    12

    0

    ( 1)~X n

    n S

    Con esta estadstica pretendemos buscar diferencias significativas entre la varianza

    muestral 2XS y el valor propuesto

    2

    0 para la varianza poblacional y de esta forma

    rechazaremos la hiptesis nula. Ahora, para un nivel de significancia preestablecido, las regiones crticas y los valores p para los contrastes anteriores son:

    Prueba bilateral: 2 2

    0 0

    2 2

    0

    :

    :a

    H

    vs

    H

    Rechazaremos la hiptesis nula cuando el valor observado de la varianza muestral sea

    suficientemente diferente del valor propuesto y esto ocurre cuando el valor muestral de la

    estadstica de prueba sea un valor extremo de la distribucin 21n . Por lo tanto, la regin

    crtica de tamao es:

    2 2 2 2 2( 2, 1) (1 2, 1). . / n nRC

    Si

    22

    2

    0

    ( 1).Xc

    n sR C

    rechazamos H0 en favor de la alternativa.

    El valor p para esta prueba viene dado como:

    2 2 2

    1

    2 2 2

    1

    2 ( ) si 1

    2 ( ) si 1

    n c c

    n c c

    P X Xp valor

    P X X

    Prueba unilateral derecha:

    2 2

    0 0

    2 2

    0

    :

    :a

    H

    vs

    H

    Rechazaremos la hiptesis nula cuando el valor observado de la varianza muestral sea

    suficientemente mayor que el valor propuesto para sta y esto ocurre cuando el valor muestral de la estadstica de prueba sea un valor extremo en la cola derecha de la

    distribucin 2 1n . Por lo tanto, la regin crtica de tamao es:

    2 2 2( , 1). . / nRC

  • 82

    Si

    22

    2

    0

    ( 1).Xc

    n sR C

    rechazamos H0 en favor de la alternativa.

    El p valor para esta prueba es: Valor p = 2 21( )n cP

    Prueba unilateral izquierda:

    2 2

    0 0

    2 2

    0

    :

    :a

    H

    vs

    H

    Rechazaremos la hiptesis nula cuando el valor observado de la varianza muestral sea

    suficientemente menor que el valor propuesto para sta. Por lo tanto, la regin crtica de tamao es:

    2 2 2(1 , 1). . / nRC

    Si

    22

    2

    0

    ( 1).Xc

    n sR C

    rechazamos H0 en favor de la alternativa.

    El p valor para esta prueba es: Valor p 2 21n cP

    Ejemplo 7: (Ejercicio 9.43 del texto de Canavos) En un proceso de llenado, la tolerancia

    para el peso de los recipientes es de ocho gramos. Para reunir este requisito, la desviacin

    estndar en el proceso debe ser de dos gramos. Los pesos de 25 recipientes seleccionados

    al azar dieron una desviacin estndar de 2.8 gramos.

    a) Si los pesos se encuentran normalmente distribuidos, determine si la varianza de stos es diferente del valor necesario. Emplese un nivel de significancia del 2%.

    b) Para qu valores de la varianza muestral no puede rechazarse la hiptesis nula del apartado anterior? Se encuentran estos valores equidistantes del valor necesario de la

    varianza? Cmo deberan ser? Comente.

    Ejemplo 7.1.: El gerente de una planta sospecha que el nmero de piezas que produce un

    trabajador en particular por da, flucta ms all del valor normal esperado. El gerente

    decide observar el nmero de piezas que produce este trabajador durante diez das,

    seleccionados stos al azar. Los resultados son: 15, 12, 8, 13, 12, 15, 16, 9, 8, y 14. Si se

    sabe que la desviacin estndar para todos los trabajadores es de 2 unidades y si el nmero

    de stas que se produce diariamente, se encuentra modelado en forma adecuada por una

    distribucin normal, a un nivel de significancia del 5%, tiene apoyo la sospecha del

    gerente? Obtener el p valor para el contraste.

    Solucin:

    Sea X = Nmero de piezas que produce un trabajador particular por da ~ Normal.

  • 83

    De la muestra aleatoria dada se obtiene 12.2x y 2 8.84444Xs . El gerente sospecha que

    = desviacin estndar de X > 2. Dada la informacin anterior nos piden contrastar a un

    nivel de significancia del 5% ( = 0.05) la sospecha. Esto es, hay que realizar con = 0.05 la siguiente prueba de hiptesis:

    2

    0 0

    2

    : 2 : 4

    : 2 : 4a a

    H H

    vs vs

    H H

    La estadstica de prueba para este contraste es

    2 22 2

    92

    0

    ( 1) 9~

    4

    n S S

    La regin crtica de tamao = 0.05 es

    2 2 2(0.05,9). . / 16.92RC El valor calculado de la estadstica de prueba es

    22 9 9 8.84444 19.8999

    4 4c

    s

    Ahora, como 2 19.8999 (19.8999 16.92)c RC , entonces rechazamos H0 y

    concluimos que el nmero de piezas que produce este trabajador por da flucta ms all

    del valor normal esperado.

    El p valor = 29 18.8999P . De la tabla se concluye que 0.01 < p valor < 0.02. Entonces, para un nivel de significancia del 5% se rechaza H0, pues el p valor < 0.05.

    Caso 2: Pruebas para la igualdad de varianzas de dos poblaciones normales.

    Sean 2 2 y X YS S las varianzas muestrales de dos muestras aleatorias independientes de

    tamaos n y m de dos poblaciones X e Y que tienen varianzas poblacionales 2 2 y X Y ,

    respectivamente. Queremos comparar las varianzas poblacionales; para ello utilizaremos

    las varianzas muestrales y la estadstica de prueba es:

    2 2

    ( 1, 1)2 2~Y X n m

    X Y

    SF

    S

    Usando esta estadstica vamos a realizar los siguientes contrastes:

  • 84

    1)

    2 2

    0

    2 2

    :

    :

    X Y

    a X Y

    H

    vs

    H

    2)

    2 2

    0

    2 2

    :

    :

    X Y

    a X Y

    H

    vs

    H

    Bajo H0 cierta, la estadstica de prueba se reduce a

    2

    ( 1, 1)2~X n m

    Y

    SF F

    S

    Entonces, rechazaremos H0 cuando haya mucha diferencia entre las varianzas muestrales

    y esto quiere decir que 2XS es mucho mayor o mucho menor que

    2

    YS ; entonces las regiones

    las regiones crticas de tamao y los valores p para los dos contrates anteriores son:

    Prueba bilateral:

    ( 2, 1, 1) (1 2, 1, 1)

    ( 2, 1, 1)

    1. . / o n m n m

    m n

    R C F F F F FF

    ( 1, 1)

    ( 1, 1)

    2 ( ) si 1

    2 ( ) si 1

    n m c c

    n m c c

    P F F Fp valor

    P F F F

    Prueba unilateral derecha:

    ( , 1, 1). . / n mRC F F F ( 1, 1)( )n m cp valor P F F

    En cualquiera de los dos casos rechazamos H0 a favor de la alternativa Ha cuando 2

    2

    Xc

    Y

    sF

    s caiga en la regin crtica.

    Ejemplo 8: Un inversionista desea comparar el riesgo asociado con dos diferente

    mercados, A y B. El riesgo de un mercado se mide por la variacin en los cambios diarios

    de precios. El inversionista piensa que el riesgo asociado con el mercado B es mayor que

    el del mercado A. Se obtienen muestras aleatorias independientes de 21 cambios diarios de

    precios para el mercado A y de 16 para el mercado B. Se obtienen los siguientes

    resultados:

    Mercado A Mercado B

    Tamao 21 16

    Media 0.3 0.3

    Desviacin estndar 0.25 0.45

  • 85

    a) Si se supone que las muestras provienen de dos poblaciones normales e independientes a

    un nivel de significancia del 5% encuentra apoyo la creencia del inversionista?

    Encuentre el p valor de la prueba. b) Si la varianza muestral de A es la dada, cul es el mximo valor de la varianza muestral

    de B con base en n = 16 que no llevar al rechazo de la hiptesis nula del apartado

    anterior?

    Solucin:

    Sean X = Cambios diarios de precios en el mercado A ~ Normal y 2X la variacin en los

    cambios diarios de precios en este mercado; por lo tanto, 2X representa el riesgo en el

    mercado A.

    Sea tambin Y = Cambios diarios de precios en el mercado B ~ Normal y 2Y la variacin

    en los cambios diarios de precios en este mercado; por lo tanto, 2Y representa el riesgo en

    el mercado B.

    Tambin se tiene que las poblaciones son independientes. De las muestras aleatorias se

    obtiene

    21, 0.25, 16, 0.45X yn S m S

    Nos piden usar el nivel de significancia del 0.05 y la informacin anterior, para contrastar la creencia del inversionista de que el riesgo asociado con el mercado B es

    mayor que el del mercado A. Esto es, hay que realizar el contraste siguiente:

    2 2

    0

    2 2

    :

    :

    Y X

    a Y X

    H

    vs

    H

    La estadstica de prueba para este contraste es:

    2

    ( 1, 1) (15,20)2~Y m n

    X

    SF F F

    S

    Entonces, la regin crtica de tamao 0.05 es:

    (0.05,15,20) (0.05,15,20). . / 2.20RC F F F F

    El valor calculado de la estadstica de prueba es

    2 2

    2 2

    0.45 0.20253.24

    0.25 0.0625Y

    c

    X

    sF

    s

  • 86

    Ahora, como 3.24 . .cF R C entonces rechazamos 2 2

    0 : X YH y concluimos que el

    riesgo asociado al mercado A es menor que el del mercado B.

    Finalmente, el valor p de la prueba es

    (15,20)( 3.24) 0.05p valor P F

    Ejemplo 8.1: Se conjetura que las acciones de una compaa sufriran ms variacin en una

    industria con competencia en precios que una en las que existiera un duopolio o colusin

    tcita. En un estudio sobre la industria de generadores, se hall que en cuatro aos de

    competencia en precios, la variacin en las acciones fue de 114.09. En los siguientes siete

    aos, en los cuales hubo duopolio y colusin tcita, esta variacin fue de 16.08. Asumir que

    los datos pueden considerarse como muestras aleatorias independientes de dos poblaciones

    normales. Contrastar a un nivel de significancia del 5% la conjetura. Encontrar el p valor para esta pueda.

    2.4. PRUEBAS CONCERNIENTES A PROPORCIONES.

    PRUEBAS PARA UNA PROPORCIN.

    En muchos problemas prcticos se requiere realizar contrastes sobre la proporcin

    poblacional . Estos contrastes tienen la forma:

    0 0 0 0 0 0

    0 0 0

    : : :

    1) , 2) 3)

    : : :a a a

    H H H

    vs vs vs

    H H H

    La estadstica de prueba para estos contrastes es:

    /X n = proporcin de xitos en la muestra de tamao n observada.

    La hiptesis nula ser rechazada a favor de la alternativa cuando haya diferencias

    significativas entre /X n sea suficientemente diferente del valor propuesto 0 , para

    buscar diferencias significativas entre estas dos cantidades, utilizaremos la siguiente

    estadstica

    0

    0 0

    ~ (0,1)

    (1 ) aZ N

    n

    Usando la estadstica anterior se obtiene que las regiones crticas de tamao y el p valor para las pruebas anteriores son las siguientes:

  • 87

    Prueba bilateral: En este caso rechazamos H0 cuando el valor observado para la proporcin

    muestral /X n sea suficientemente diferente del valor propuesto 0 para ; por lo

    tanto,

    2 2. . / RC z z z z z

    Si 0 0 0( ) (1 )cz n RC , entonces rechazamos H0 a favor de la hiptesis

    alternativa. Adems, el p valor para esta prueba es

    p valor = 2 ( )cP Z z

    Prueba unilateral derecha: En este caso rechazamos H0 cuando la proporcin muestral

    estimada /X n sea suficientemente mayor que el valor 0 propuesto para ; por lo

    tanto, la regin crtica es

    2. . /RC Z Z z

    Si 0 0 0( ) (1 )cz n RC , entonces rechazamos H0 a favor de la hiptesis

    alternativa. Adems, el p valor para esta prueba es

    p valor = ( )cP Z z

    Prueba unilateral derecha: En este caso rechazamos H0 cuando la proporcin muestral

    estimada /X n sea suficientemente menor que el valor 0 propuesto para la proporcin

    poblacional, entonces la regin crtica es

    2. . /RC Z Z z

    Si 0 0 0( ) (1 )cz n RC , entonces rechazamos H0 a favor de la hiptesis

    alternativa. Adems, el p valor para esta prueba es

    p valor = ( )cP Z z

    Ejemplo 9: Una organizacin de salud se interesa en actualizar su informacin con

    respecto a la proporcin de hombres que fuman. Con base en estudios previos, se cree que

    la proporcin es de 40%. La organizacin lleva a cabo una encuesta en la que se selecciona

    en forma aleatoria 1200 hombres a los cuales se les pregunta sus hbitos de fumador. De

    los 1200, 420 son fumadores. Ser que la evidencia anterior apoya la nocin de que la

    proporcin de hombres que fuman es diferente del 40%? Emplee un nivel de significancia

    del 1% ( = 0.01). Encuentre el p valor para esta prueba

  • 88

    PRUEBAS PARA DOS PROPORCIONES

    Queremos comparar dos proporciones poblacionales; para ello, supondremos que se tienen

    dos muestras aleatorias independientes. La primera muestra es de Xn observaciones de una

    poblacin X que tiene una proporcin poblacional es X y la proporcin muestral resultante

    es X XX n . La segunda muestra consta de Yn observaciones de una poblacin Y cuya

    proporcin poblacional es Y y la proporcin muestral resultante es Y YY n .

    Para comparar las proporciones poblacionales realizaremos los siguientes contrastes

    alternativos:

    1) 0 0 0: : :

    1) 2) 3)

    : : :

    X Y X Y X Y

    a X Y a X Y a X Y

    H H H

    vs vs vs

    H H H

    Para tamaos muestrales grandes, la estadstica de prueba para los tres contrastes anteriores

    es la siguiente:

    0 0 0 0

    ~ (0,1)

    (1 ) (1 )

    X Y

    a

    X Y

    Z N

    n n

    Donde,

    0

    X X Y Y

    X Y X Y

    n n X Y

    n n n n

    Entonces, en virtud de la estadstica anterior se tiene que las regiones crticas de tamao y los valores p son los siguientes:

    Prueba bilateral.

    2 2. . / o 2 ( )cRC Z Z z Z z p valor P Z z

    Prueba unilateral derecha.

    . . / ( )cRC Z Z z p valor P Z z

    Prueba unilateral izquierda.

    . . / ( )cRC Z Z z p valor P Z z

  • 89

    En cualquiera de los tres casos, cuando cz , que es el valor calculado de la estadstica de

    prueba a partir de la informacin muestral, caiga en la regin crtica rechazamos la

    hiptesis nula H0 en favor de la alternativa.

    Ejemplo 10: Un economista al servicio del estado desea determinar si la frecuencia de

    desempleo en dos reas urbanas del estado son diferentes. Con base en muestras aleatorias

    de tamao 500 de cada ciudad, el economista encuentra 35 personas desempleadas en un

    rea y 25 en la otra. Bajo las suposiciones apropiadas y con un nivel de significancia del

    5% existe alguna razn para creer que las frecuencias de desempleo en las dos reas son

    diferentes? Cul es el valor p? Solucin:

    En la primera regin se tiene que:

    X = Nmero de desempleados en la primera regin

    X = la proporcin de desempleo en la primera regin.

    A partir de la informacin muestral se obtiene que la proporcin muestral resultante para

    esta regin es 35/500 0.07X .

    En la segunda regin se tiene que:

    Y = Nmero de desempleados en la segunda regin

    Y = la proporcin de desempleo en la segunda regin.

    A partir de la informacin muestral se obtiene que la proporcin muestral resultante para la

    segunda regin es 25/500 0.05Y .

    Nos piden contrastar al 5% ( = 0.05) de significancia si la frecuencia de desempleo en estas regiones es diferente. Esto es, debemos realizar el siguiente contraste de hiptesis

    0 0: : 0

    : : 0

    X Y X Y

    a X Y a X Y

    H H

    vs vs

    H H

    La estadstica de prueba para este contraste es

    0 0 0 0

    ~ (0,1)

    (1 ) (1 )

    X Y

    a

    X Y

    Z N

    n n

    Donde la proporcin comn estimada es

    0

    X X Y Y

    X Y

    n n

    n n

    = 35 25 0.06

    500 500X Y

    X Y

    n n

  • 90

    Entonces, la regin crtica de tamao = 0.05 para el contraste es

    0.025 0.025. . / 0 / 1.96 0 1.96RC Z Z z Z z Z Z Z

    El valor calculado de la estadstica es

    0 0 0 0

    0.07 0.058.8652

    0.06(1 0.06) 0.06(1 0.06)(1 ) (1 )500 500

    X Y

    X Y

    Z

    n n

    Como 8.8652cz RC , entonces rechazamos H0 a favor de H1 y concluimos que las

    frecuencias de desempleo en las dos regiones es diferente.

    El p valor = 2 ( ) 2 ( 8.8652) 0cP Z z P Z . Por lo tanto, la hiptesis nula se rechaza

    a cualquier nivel de significancia.