7 contraste varianza.pdf

26
Contraste de varianzas Josep Gibergans Bàguena P08/75057/02310

Upload: oescocia

Post on 10-Sep-2015

20 views

Category:

Documents


7 download

TRANSCRIPT

  • Contraste de varianzasJosep Gibergans Bguena

    P08/75057/02310

  • FUOC P08/75057/02310 Contraste de varianzas

    ndice

    Sesin 1

    Contraste de la varianza ..................................................................... 5

    1. Introduccin ........................................................................................ 5

    2. La distribucin 2 ................................................................................. 53. El contraste de la varianza ................................................................... 7

    4. Intervalo de confianza de la varianza .................................................. 10

    5. Resumen ............................................................................................... 12

    Ejercicios ................................................................................................... 13

    Sesin 2

    Comparacin de varianzas ................................................................. 16

    1. Introduccin ........................................................................................ 16

    2. La distribucin F de Snedecor .............................................................. 16

    3. Comparacin de dos varianzas ............................................................ 18

    4. Resumen ............................................................................................... 23

    Ejercicios ................................................................................................... 24

  • FUOC P08/75057/02310 5 Contraste de varianzas

    Contraste de la varianza

    1. Introduccin

    En esta sesin estudiaremos cmo debemos hacer inferencia estadstica sobre

    la varianza de una poblacin a partir de los datos de una muestra.

    Control de la varianza

    Consideremos el caso de una industria que fabrica tornillos para las ruedas de una marcade automviles. Estos tornillos deben tener un dimetro de 2,5 cm. Imaginemos que enel proceso de fabricacin se ha introducido un cambio y queremos tener informacin so-bre la calidad del proceso.

    Establecer mtodos para controlar la variabilidad de un proceso industrial es fundamen-tal para su calidad. Con este objetivo tomamos una muestra de tornillos y medimos eldimetro de cada uno. Podemos hacer un contraste de hiptesis sobre la media de los di-metros para saber si sta ha variado despus de introducir los cambios en la fbrica. Esimportante ver que aunque la media de los dimetros est cerca de 2,5 cm, es posible queel proceso no sea satisfactorio, en caso de tener una varianza muy alta. Es posible que lamedia se mantenga, con lo que se compensaran dimetros muy grandes (tornillos queno podremos atornillar) con dimetros muy pequeos (que rueden dentro del agujero).Es evidente que los dos casos son terriblemente negativos para la empresa. As pues, ade-ms de tener controlada la media, tambin es necesario un control sobre la varianza.Cuanto menor sea sta, de mayor calidad ser la produccin.

    A continuacin aprenderemos a hacer contrastes de hiptesis y a buscar inter-

    valos de confianza para la varianza. Para poder hacerlo, antes deberemos in-

    troducir la distribucin 2 y conocer sus propiedades ms importantes.

    2. La distribucin 2

    Algunas caractersticas importantes de esta distribucin son las siguientes:

    1) Las distribuciones n2 no son simtricas. Tienen asimetra hacia la derecha,que disminuye a medida que n aumenta. Podemos verlo en la figura:

    Si Z1, Z2, ..., Zn son variables aleatorias normales estndar independien-

    tes, entonces la variable que se obtiene al sumar los cuadrados de estas

    distribuciones:

    se distribuye segn una distribucin 2 con n grados de libertad, n2.

    Notacin

    La distribucin 2 tambin se conoce por la forma en que se lee, es decir, distribucin ji cua-drado.

    Z12 Z2

    2 ... Zn2+ + +

    2 con 1 grado de libertad En el caso de que considere-mos slo una variable normalestndar, Z, tendremos quela variable Z2 sigue una ley 2 con un grado de libertad.

  • FUOC P08/75057/02310 6 Contraste de varianzas

    A la hora de calcular probabilidades con las distribuciones n2, es muy impor-tante tener presente que stas no son simtricas.

    2) Para cada valor entero positivo del nmero de grados de libertad (n) hay

    una distribucin n2. As pues, existe un nmero infinito. Dado que no pode-mos disponer de infinitas tablas, slo las tenemos para unos determinados gra-

    dos de libertad. En cada tabla, en la primera columna tenemos los grados de

    libertad n y en la primera fila, la probabilidad, , de que la variable 2 con ngrados de libertad tome un valor superior a un valor a. La interseccin de esta

    fila y columna da este valor a, es decir:

    P( n2 a) =

    Ejemplo de utilizacin de las tablas

    1) Si queremos encontrar aquel valor a que hace que , buscaremos enla tabla la fila correspondiente a n = 7 grados de libertad y la columna correspondiente a =0,025, y en la interseccin tenemos que a = 16,013.

    2) Tambin podemos utilizar estas tablas para encontrar probabilidades acumuladas. Si que-remos encontrar aquel valor b tal que , deberemos tener en cuenta que sib deja a su izquierda un rea igual a 0,05, a su derecha dejar un rea igual a 1 0,05 = 0,95;por tanto, debemos encontrar el valor de b tal que . Y observando la tabla,tenemos que b = 7,962.

    3) La esperanza de una variable n2 es . Esta propiedad se demuestrafcilmente, ya que , entonces:

    Puesto que Var(Zi) = 1 y, por otro lado, Var(Zi) = E(Z2i ) (E(Zi))2, tenemos

    que E(Z2i) = Var(Zi) = 1, ya que la esperanza de una normal estndar es cero,

    E(Zi) = 0. Finalmente, tenemos que:

    Encontraris las tablas de la distribucin 2 en la web de la asignatura.

    P 72 a 0,025=

    P 162 b 0,05=

    P 162 b 0,95=

    E n2 n= n2 Z21 ... Z2n+ + =

    E n2 E Z21 ... z2n+ + E Z21 ... E Z2 n n E Z 2i =+ +==

    E n2 n E Z 12 n 1 n===

  • FUOC P08/75057/02310 7 Contraste de varianzas

    4) La varianza de una variable es Var( ) = 2n. Para demostrar esta pro-

    piedad, debemos tener en cuenta que , y que las varia-

    bles Zi son independientes; por tanto, tenemos que:

    Entonces: .

    Por un lado, antes hemos visto que y, por otro, podemos demostrar,

    aunque no lo haremos, que , de manera que ;

    finalmente, obtenemos que:

    3. El contraste de la varianza

    Supongamos que tenemos una muestra aleatoria de tamao n obtenida de

    una poblacin normal de media y varianza 2 desconocidas. Queremoscontrastar la hiptesis nula de que la varianza de la poblacin es igual a un

    valor . Como en todos los contrastes de hiptesis, utilizaremos el procedi-

    miento siguiente:

    1) Estableceremos las hiptesis nula y alternativa:

    a) Hiptesis nula: H0:

    b) Hiptesis alternativa. La hiptesis alternativa (H1) puede ser bilateral (la va-

    rianza de la poblacin es diferente de este valor ) o unilateral (la varianza

    de la poblacin es mayor o menor que ):

    Bilateral: H1:

    Unilateral: H1:

    Unilateral: H1:

    2) Calcularemos el estadstico de contraste. Consideremos una muestra con

    varianza muestral s2, extrada de una poblacin N(, 2).

    Bajo el supuesto de la hiptesis nula cierta (H0: ), tenemos que

    el estadstico de contraste:

    n2 n2n2 Z12 ... Zn2+ + =

    Var n2 Var Z12 ... Zn2+ + Var Z12 ... Var Zn2 n Var Zi2 =+ +==

    Var Zi2 E Zi4 E Zi2 2=

    E Zi2 1=

    E Zi4 3= Var Zi2 3 1= 2=

    Var n2 n 2 2 n==

    02

    2 02=

    0202

    2 022 022 02

    2 02=

    n 1 s202

    ----------------------

  • FUOC P08/75057/02310 8 Contraste de varianzas

    No demostramos este resultado porque est muy lejos de los objetivos de este

    curso de Estadstica.

    3) Fijado un nivel de significacin , determinamos un criterio de decisin. Paratomar una decisin, tendremos dos criterios: uno a partir del estadstico de con-

    traste y los valores crticos y el otro, a partir del p-valor. Dado un nivel de signi-

    ficacin y segn cul sea la hiptesis alternativa, tenemos tres casos posibles:

    a) En caso de que H1 sea , escribimos el valor crtico como x1 ,n 1, yes aquel valor que hace que P( > x1 ,n 1) = . Expresado grficamente:

    b) En caso de que H1 sea , escribimos el valor crtico como , y

    es aquel valor que hace que P( < x,n 1) = . Grficamente:

    donde s2 es la varianza de una muestra de tamao n, es una observacin

    de una variable .n 12

    2 02n 12

    2 02 x, n 1n 12

  • FUOC P08/75057/02310 9 Contraste de varianzas

    c) En caso de que H1 sea , entonces tenemos dos valores crticos (uno

    por cada cola), que escribiremos como x/2,n 1 y x1/2,n1 y que hacen que:P( < x/2,n1) = = /2 y P( >x1/2,n 1) = /2. Grficamente:

    A partir del valor calculado del estadstico de contraste:

    y a partir de los valores crticos correspondientes a la hiptesis alternativa y al ni-

    vel de significacin , rechazaremos la hiptesis nula en favor de la hiptesisalternativa si:

    En el caso H1: se cumple que x > x1,n1 En el caso H1: se cumple que x < x,n1 En el caso H1: se cumple que x < x/2,n1 o x > x1/2,n1

    La otra opcin que tenemos para tomar una decisin es, como ya hemos dicho

    antes, por medio del p-valor.

    El p-valor depende de la hiptesis alternativa planteada, de manera que si

    es el valor del estadstico de contraste:

    En el caso H1: , entonces p = P( > x).

    En el caso H1: , entonces p = P( < x).

    En el caso H1: no es fcil calcular el p-valor, dado que la distribucin

    no es simtrica. Siempre estudiaremos este caso con el estadstico de con-

    traste y los valores crticos.

    Diremos que este p-valor es significativo y rechazaremos la hiptesis nula si

    es menor que el nivel significativo escogido.

    2 02

    n 12 n 12

    x n 1 s2

    02----------------------=

    Rechazo o no rechazode la hiptesis nula

    Considerando los grficos ante-riores, si el estadstico de con-traste se encuentra en la regin sombreada, entonces rechaza-mos la hiptesis nula. En caso contrario, no la rechazamos.

    2 022 022 02

    Recordatorio

    El p-valor es la probabilidad de que un resultado sea al menos tan extremo como el estads-tico de contraste obtenido.

    x n 1 s2

    02----------------------=

    2 02 n 122 02 n 122 02

    2

  • FUOC P08/75057/02310 10 Contraste de varianzas

    Ejemplo de la variabilidad de unas piezas

    La longitud de las piezas fabricadas en un proceso industrial sigue una distribucin N(5;0,0625). Se considera que el tamao de las piezas es demasiado variable y se implanta unanueva tcnica para evitarlo. Una muestra de doce piezas ha dado, despus de este cambio,las medidas: 5,02, 4,87, 4,95, 4,88, 5,01, 4,93, 4,91, 5,09, 4,96, 4,89, 5,06, 4,85.

    Con un nivel de significacin 0,05, podemos afirmar que efectivamente ha habidoreduccin en la variabilidad del tamao de las piezas?

    A partir de las observaciones calculamos la varianza muestral:

    1) Establecemos las hiptesis nula, , y alternativa,

    .

    La hiptesis alternativa es unilateral, ya que lo que nos preguntan es si podemos afirmarque la variabilidad de las piezas se ha reducido, es decir, si ahora la varianza es menor quela que se tena antes.

    2) Calculamos el estadstico de contraste:

    Bajo la hiptesis nula, es decir, suponiendo que es una observacin de unavariable aleatoria 2 con 12 1 = 11 grados de libertad.

    3) Fijado un nivel de significacin = 0,05, con ayuda del ordenador, calcularemos el p-valor y veremos si est por debajo o no:

    p = P(2 1,0767) = 0,00007257510

    Tenemos un p-valor mucho menor que 0,05 (es lo bastante significativo); por tanto, re-chazamos la hiptesis nula y podemos afirmar que la variabilidad se ha reducido.

    Si queremos hacerlo a partir del estadstico de contraste, debemos buscar en las tablas elvalor crtico x,n1 = x0,05;11 = 4,5748. Puesto que 1,07467 < 4,5748, aceptamos H1; portanto, la variabilidad se ha reducido.

    4. Intervalo de confianza de la varianza

    Supongamos que a partir de una muestra de tamao n hemos obtenido el va-

    lor de la varianza s2. Cmo podemos construir un intervalo de confianza de

    la varianza poblacional?

    Sabemos que si s2 es la varianza muestral de una muestra aleatoria de tamao

    n tomada de una poblacin normal de varianza 2, el estadstico:

    es una observacin de una variable aleatoria 2 con n 1 grados de libertad.

    s2 1n 1------------ x xi 2 0,006106=

    i 1=

    n

    =

    H0 : 2 02 0,0625== H1 : 2 02 =0,0625=

    x n 1 s2

    02------------------------- 12 1 0,006106

    0,0625-------------------------------------------------- 1,07467===

    02 0,0625=

    n 1 s22----------------------

  • FUOC P08/75057/02310 11 Contraste de varianzas

    Por otro lado, la probabilidad de que una variable aleatoria 2 con n 1 gradosde libertad, , se encuentre comprendida entre los valores crticos x/2,n1y x1/2,n1 es:

    P(x/2,n1 < < x1/2,n1) = 1

    Por tanto, tenemos una probabilidad del (1 ) de que el estadstico

    se encuentre comprendido entre los valores crticos x/2,n1 y x1/2,n1, es decir:

    Manipulando esta expresin:

    e invirtiendo las fracciones de la desigualdad anterior, finalmente obtenemos:

    Para determinar un intervalo de confianza para la varianza a partir de una

    muestra de tamao n y varianza muestral s2:

    1) Fijamos el nivel de confianza, que escribimos como 1.

    2) Encontramos los valores de la distribucin que cortan una probabi-

    lidad de /2 en las dos colas, es decir, los puntos crticos x/2,n1 y x1/2,n1.

    3) El intervalo de confianza viene dado por:

    Ejemplo de la variabilidad de unas piezas (II)

    Queremos determinar un intervalo de confianza del 95% para la varianza de las piezas delejemplo anterior. La varianza muestral es:

    A partir de las tablas podemos encontrar los puntos crticos x/2,n1 = x0,025;11 y x1/2,n1 =x0,975;11 que cortan una probabilidad de /2 en las dos colas:

    x0,025;11 = 3,8157 y x0,975;11 = 21,920

    El intervalo de confianza viene dado por:

    n 12

    n 12

    n 1 s22----------------------

    x 2,n 1 n 1 s2

    2---------------------- x1 2,n 1

    x 2,n 1n 1 s2----------------------

    12------

    x1 2,n 1n 1 s2--------------------------

    Procedimiento

    Dada la desigualdad:

    se tiene que:

    o lo que es lo mismo:

    a 1b--- c>

    1c--- b 1

    a---< 0,05, no podemos rechazar lahiptesis nula y concluimos que la varianza del vigilante no es significativa-

    mente diferente de 4 s.

    b) Ahora encontraremos un intervalo de confianza para la varianza del tiem-

    po de ronda del vigilante. Tenemos que = 0,10 y, por tanto, /2 = 0,05 y 1/2 = 0,95. De las tablas obtenemos los valores crticos correspondientes:

    x0,05;11 = 4,575 y x0,95;11 = 19,675

    De manera que, sustituyendo estos valores en la expresin correspondiente al

    intervalo de confianza:

    tenemos un intervalo de confianza del 95% igual a [1,91; 8,22]. Observamos

    que 4 se encuentra dentro de este intervalo, de manera que no tenemos ningu-

    na evidencia para pensar que la varianza es diferente de 4.

    n 1 s22----------------------

    12 1 3,4222

    --------------------------------- 9,40==

    p P 112 9,40 0,4150==

    n 1 s2x1 2

    ---------------------- ; n 1 s2

    x 2---------------------- 12 1 3,42

    19,675--------------------------------- ; 12 1 3,42

    4,575---------------------------------=

  • FUOC P08/75057/02310 16 Contraste de varianzas

    Comparacin de varianzas

    1. Introduccin

    Esta sesin est dedicada a la comparacin de las varianzas de dos poblaciones

    normales, a partir de los datos obtenidos en dos muestras, una de cada poblacin.

    Comparacin de la variabilidad de los errores de medida de dos aparatos

    Supongamos que queremos comparar la precisin de dos aparatos de medida. La precisinde un aparato de medida viene determinada por la variabilidad de sus errores: cuanto me-nor sea esta variabilidad, ms preciso es. Por tanto, deberemos comparar la variabilidad delos errores de medida de los dos aparatos, es decir, deberemos comparar sus varianzas.

    Antes de comenzar con el contraste de igualdad de varianzas, deberemos in-

    troducir una nueva variable aleatoria: la distribucin F de Snedecor.

    2. La distribucin F de Snedecor

    A continuacin comentaremos muy brevemente las principales caractersticas

    de la distribucin F.

    1) Las distribuciones F no son simtricas. Todas presentan asimetra hacia la

    derecha, que decrece a medida que aumentan m y n.

    Si U y V son dos variables independientes que siguen distribuciones 2con m y n grados de libertad, respectivamente, entonces la variable que

    se obtiene al hacer el cociente:

    tiene una distribucin F de Snedecor con m grados de libertad en el nu-

    merador y n grados de libertad en el denominador, Fm, n.

    Supuesto de varianzas iguales

    Muchas veces, cuando hace-mos un contraste de hiptesis sobre la diferencia de medias de dos poblaciones, supone-mos que las varianzas de estas poblaciones son iguales. No existe ningn motivo para que esto sea cierto. Deberamos co-menzar por comprobar si las varianzas son iguales.

    Fm,n U mV n-------------=

  • FUOC P08/75057/02310 17 Contraste de varianzas

    2) Para cada par de valores enteros positivos de m y n hay una distribucin F.

    As pues, tambin en este caso tenemos un nmero infinito de distribuciones.

    Slo se dispone de tablas para unos determinados valores de los grados de liber-

    tad m y n.

    Dada una probabilidad , cada tabla nos da el valor b, que hace que sea la pro-babilidad de que la variable F con m grados de libertad en el numerador y n grados

    de libertad en el denominador sea mayor que b. La primera fila indica los grados

    de libertad del numerador (m) y la primera columna indica los grados de libertad

    del denominador (n). El valor b lo encontramos en la interseccin de esta fila y

    esta columna.

    Ejemplo de utilizacin de las tablas

    Queremos saber el valor a que hace que P(F5;10 b) = 0,05. En la tabla correspondiente a =0,05, primero buscaremos la columna de grados de libertad del numerador m = 5 y despusla fila de grados de libertad del denominador n = 10.

    El valor b se encuentra en la interseccin de estas filas y columnas. Tenemos que b = 3,33.

    3) Propiedad recproca: si U es una variable aleatoria Fm,n, entonces V = 1/U es

    una variable aleatoria Fn,m. Esta propiedad es de gran utilidad para encontrar va-

    lores que determinen probabilidades en la cola izquierda de la distribucin.

    Ejemplo de utilizacin de las tablas mediante la propiedad recproca

    Queremos determinar el valor a que hace que P(F5;10 < a) = 0,05, es decir, el valor que acu-mula una probabilidad de 0,05 y, por tanto, que determina un rea de 0,05 en la cola izquier-da de la distribucin.

    Como ya se ha comentado antes, no se dispone de todas las tablas para todas las proba-bilidades. En este ejemplo nos hara falta la tabla correspondiente a = 0,95, tabla que

    Encontraris las tablas de la distribucin F en la web de la asignatura.

  • FUOC P08/75057/02310 18 Contraste de varianzas

    no tenemos. Lo que haremos ser utilizar la propiedad recproca para determinar dichaprobabilidad.

    Queremos encontrar el valor de a que hace que P(F5;10 < a) = 0,05. Aplicando la propie-dad recproca a esta expresin, tenemos que:

    Manipulando un tanto la desigualdad del parntesis, tenemos que:

    Si ahora, para simplificar un poco la escritura, llamamos b = 1/a, nuestro problema se hareducido a encontrar el valor b que hace que P(F10;5 b) = 0,05. Y lo haremos de la formaque se ha mostrado en el apartado anterior. Buscaremos en la tabla de = 0,05 el valorinterseccin de la fila correspondiente a m = 10 grados de libertad del numerador y n = 5grados de libertad del denominador. Tenemos que b = 4,74 y, por tanto:

    4) La esperanza de una variable Fm,n es:

    y la varianza es:

    3. Comparacin de dos varianzas

    Consideremos que tenemos dos muestras aleatorias de dos poblaciones nor-

    males diferentes: una muestra de tamao m obtenida de la poblacin 1, que

    sigue una ley normal de media 1 y varianza desconocidas, y otra muestrade tamao n obtenida de la poblacin 2, distribuida segn una normal de me-

    dia 2 y varianza desconocidas.

    Ahora nos interesa contrastar la hiptesis nula que asegura que las varianzas

    de las dos poblaciones son iguales, es decir, , que tambin podemos

    expresar como . Una vez ms utilizaremos la siguiente manera de

    proceder para hacer un contraste de hiptesis:

    1) Establecemos las hiptesis nula y alternativa:

    a) Hiptesis nula:

    P 1F10;5----------- a 0,05=

    P F10;51a--- 0,05=

    a 1b--- 1

    4,74------------ 0,21===

    Sobre la esperanza de una variable F,...

    ... hay que destacar que la espe-ranza de un cociente no es ne-cesariamente el cociente de las esperanzas: la esperanza de U es m, por tanto, la de U/m es 1. De la misma forma, la esperan-za de V/n es 1 y el cociente es 1. En cambio, la esperanza del co-ciente es n/(n 2), que es ma-yor que 1.

    E Fm,n nn 2------------, para n 2=

    Var Fm,n 2n2 m n 2+

    m n 2 2 n 4 -------------------------------------------, para n 4=

    12

    22

    12 22=12 22 1=

    H0 : 12 22= H0 : 12 22 1=

  • FUOC P08/75057/02310 19 Contraste de varianzas

    b) Hiptesis alternativa. Puede ser bilateral (las varianzas de las dos poblaciones

    son distintas) o unilaterales (la varianza de una poblacin es mayor que la de

    la otra):

    Bilateral:

    Unilateral:

    Unilateral:

    2) Clculo del estadstico de contraste. Sabemos que, si consideramos una

    muestra de tamao m de una poblacin 1, distribuida segn una

    con varianza muestral , se tiene que:

    es una observacin de una variable 2 con (m 1) grados de libertad.

    Para una muestra de tamao n y varianza muestral de una poblacin nor-

    mal , se tiene que:

    es una observacin de una variable 2 con (n 1) grados de libertad. El cocien-te de dos variables 2 divididas por sus grados de libertad sigue una distribu-cin F. De esta manera:

    es una observacin de una variable F con (m 1) grados de libertad en el nu-merador y (n 1) grados de libertad en el denominador.

    Bajo el supuesto de la hiptesis nula cierta , tenemos el estadsti-

    co de contraste:

    donde y son muestras aleatorias independientes de tamaos muestrales m

    y n, respectivamente.

    Este estadstico de contraste es una observacin de una variable F de Snede-

    cor con (m 1) grados de libertad en el numerador y (n 1) grados de libertaden el denominador.

    H1 : 12 22 H1 : 12 22 1 H1 : 12 22 H1 : 12 22 1 H1 : 12 22 H1 : 12 22 1

    N 1, 12 s1

    2

    m 1 s1212

    ---------------------------

    s22

    N 2,22

    n 1 s2222

    -------------------------

    s12 12

    s22 22

    -------------------

    H0 : 12 22= Si , entonces12 22=

    s12 12

    s22 22

    ------------------- s1

    2 12s22 12

    --------------- s1

    2

    s22

    -------==

    s12

    s22

    -------

    s12 s2

    2

  • FUOC P08/75057/02310 20 Contraste de varianzas

    3) Fijado un nivel significativo , determinamos un criterio de decisin. Comosiempre que hacemos un contraste de hiptesis, a la hora de escoger un criterio

    de decisin tenemos dos alternativas: a partir del estadstico de contraste y los

    valores crticos correspondientes a un nivel de significacin o a partir delp-valor.

    Dado un nivel de significacin y segn la hiptesis alternativa, tenemos:

    a) En caso de que H1 sea , entonces escribimos el valor crtico

    como f1-,m1,n1 y es aquel valor que hace que:

    P(Fm1,n1 > f1,m1,n1) =

    Grficamente:

    b) En caso de que H1 sea , entonces escribimos el valor crtico

    como f,m1,n1 y es aquel valor que hace que:

    P(Fm1,n1 f,m1,n1) =

    Grficamente:

    21 22 1

    12 22 1

  • FUOC P08/75057/02310 21 Contraste de varianzas

    c) En caso de que H1 sea , tenemos dos valores crticos (uno por

    cada cola), que escribiremos como f/2,m1,n1 y f1/2,m1,n1 y que hacen que:

    P(Fm1,n1 < f/2,m1,n1) = /2 y P(Fm1,n1 > f1/2,m1,n1) = /2

    Grficamente:

    A partir del valor calculado del estadstico de contraste:

    y de los valores crticos correspondientes a la hiptesis alternativa y al nivel de

    significacin , rechazaremos la hiptesis nula en favor de la hiptesis alter-nativa si:

    En el caso se cumple que f > f1,m1,n1

    En el caso se cumple que f < f,m1,n1

    En el caso se cumple que f < f/2,m1,n1 o f > f1/2,m1,n1

    Tambin podemos hacerlo a partir del p-valor. Una vez calculado el estadstico

    de contraste, calcularemos el p-valor correspondiente.

    El p-valor depende de la hiptesis alternativa planteada, de manera que:

    En el caso se cumple que p = P(Fm1,n1 > f)

    En el caso se cumple que p = P(Fm1,n1 < f)

    En el caso se cumple que p = 2P(Fm1,n1 > f)

    Si p es menor que el nivel de significacin , diremos que el p-valor es significa-tivo y rechazaremos la hiptesis nula.

    12 22 1

    f s1

    2

    s22

    -------=

    Rechazo y no rechazo de la hiptesis nula

    Considerando los grficosanteriores, si el estadsticode contraste se encuentra en la regin sombreada, en-tonces rechazamos la hiptesis nula. En caso contrario, nola rechazamos.

    H1 : 12 22H1 : 12 22H1 : 12 22

    H1 : 12 22H1 : 12 22H1 : 12 22

  • FUOC P08/75057/02310 22 Contraste de varianzas

    Vale la pena comentar por qu en el caso bilateral , para calcular

    el p-valor, se multiplica por dos. En este caso debemos tener en cuenta que he-

    mos elegido la poblacin 1 arbitrariamente y, por tanto, habramos podido

    calcular el estadstico de contraste como:

    Fijaos en que se trata de una observacin de una variable aleatoria que sigue

    una ley Fn1,m1.

    Calcularemos el p-valor teniendo en cuenta estas dos posibilidades. As:

    p = P(Fm1,n1 > f) + P(Fn1,m1 > f0)

    Observamos que aplicando la propiedad recproca y el hecho de que f0 = 1/f,

    podemos escribir:

    Finalmente obtenemos que el p-valor correspondiente a una hiptesis alterna-

    tiva bilateral es p = 2P(Fm1,n1 > f).

    Ejemplo de comparacin de dos varianzas

    Se lleva a cabo un estudio para comparar el tiempo que tardan dos ordenadores de marcasdiferentes (A y B) en ejecutar un programa. Experiencias anteriores indican que las distri-buciones de tiempo son aproximadamente normales. Una muestra aleatoria de tiempopara once ordenadores de la marca A y otra para catorce de la marca B dan los siguientesresultados para las desviaciones tpicas muestrales:

    Ordenadores de la marca A:

    Ordenadores de la marca B:

    A la vista de estos resultados, podemos pensar que los tiempos de ejecucin de los ordena-dores de la marca A presentan ms variabilidad que los de la marca B?

    Haremos un contraste de hiptesis de la igualdad de varianzas con un nivel de significacinde 0,01.

    1. Establecemos las hiptesis nula y alternativa:

    Hiptesis nula:

    Hiptesis alternativa:

    2. Fijamos un nivel de significacin = 0,01, como dice el enunciado del ejercicio. A conti-nuacin calculamos el estadstico de contraste a partir de los datos muestrales:

    3. Con la ayuda del ordenador, calculamos el p-valor: . Pues-to que 0,31 > 0,01, no tenemos evidencias para rechazar la hiptesis nula. Concluimos,

    H1 : 12 22Es interesante observar que...

    ... para la hiptesis alternativa bilateral el p-valor es dos veces el rea de la cola de la derecha, aunque la distribucin F de Snedecor no es simtrica.

    f0 s2

    2

    s12

    -------=

    P Fn 1,m 1 f0 P 1Fm 1,n 1----------------------1f--- P Fm 1,n 1 f ==

    s1 6,1=

    s2 5,3=

    H0 : A2 B2=H0 : A2 B2

    sA2

    sB2

    ------- 6,12

    5,32----------- 1,32==

    p P F10,13 1,32 0,31==

  • FUOC P08/75057/02310 23 Contraste de varianzas

    pues, que las variabilidades de tiempo de ejecucin de los ordenadores A y B no son sig-nificativamente diferentes.

    Tambin podemos hacerlo a partir del valor crtico: observando las tablas para m 1 = 10y n 1 = 13 grados de libertad en el numerador y denominador, respectivamente, y paraun nivel de significacin = 0,01:

    f0,99;10;13 = 4,10

    Puesto que , no rechazamos la hiptesis nula.

    4. Resumen

    Hemos dedicado esta sesin a la comparacin de dos varianzas en el caso de po-

    blaciones normales. Hemos hecho contrastes de hiptesis sobre la igualdad

    de dos varianzas. Sin embargo, antes hemos introducido la distribucin F de

    Snedecor y hemos estudiado sus propiedades ms importantes; en particu-

    lar, la propiedad recproca, de gran importancia a la hora de calcular proba-

    bilidades en la cola izquierda de la distribucin. Despus hemos definido el

    estadstico de contraste correspondiente y hemos visto la manera de contrastar

    la igualdad de varianzas.

    Notacin

    La tabla nos da siempre el valor crtico de la cola derecha; por tanto, si en la tabla pone, por ejemplo, = 0,01 y busca-mos para 10 grados de libertad del numerador y 13 grados de libertad del denominador, escribimos as el valor 4,10:

    f0,99;10;13 = 4,101,32 4,10

  • FUOC P08/75057/02310 24 Contraste de varianzas

    Ejercicios

    1. Los errores aleatorios de dos aparatos de medida siguen las distribuciones

    y . Durante un periodo de tiempo determinado se han detec-

    tado los errores siguientes:

    Se quiere saber si el primer aparato es ms preciso que el segundo. Haced un con-

    traste de hiptesis con un nivel de significacin del 0,05.

    2. Se quiere comprobar el efecto de la humedad en el deterioro de dos materiales

    magnticos diferentes. Con este objetivo se probaron diez piezas del material 1 so-

    metindolo a una fuerte humedad. De la misma manera, se probaron trece piezas

    del material 2. La muestra del material 1 dio un deterioro medio de 83 con una

    varianza muestral de 25, mientras que la muestra del material 2 dio un valor me-

    dio de 83 con una varianza muestral de 16. Supondremos que las poblaciones son

    normales. Podemos concluir con un nivel de significacin = 0,1 que las varian-zas poblacionales de los materiales 1 y 2 son iguales?

    Solucionario

    1. Es un problema de comparacin de varianzas de dos poblaciones, ya que la

    precisin de un aparato viene dada por la magnitud de su desviacin tpica. Si

    las desviaciones de las dos poblaciones son iguales, entonces tendrn la misma

    precisin.

    A partir de los datos de la tabla, calculamos las medias y las varianzas muestra-

    les que necesitamos para realizar el ejercicio.

    Media de la muestra 1:

    Varianza de la muestra 1:

    Media de la muestra 2:

    Varianza de la muestra 2:

    Aparato 1 0,3 0,7 1,1 2,0 1,7 0,8 0,5Aparato 2 1,6 0,9 2,8 3,1 4,2 1,0 2,1

    N 0,12 N 0,22

    x1 1n--- x1i 0,32857=

    i 1=

    n

    =

    s21 1

    n 1------------ x1 x1i 2 1,46905=

    i 1=

    n

    =

    x2 1n--- x2i 0,900=

    i 1=

    n

    =

    s22 1

    n 1------------ x2 x2i 2 6,36667=

    i 1=

    n

    =

  • FUOC P08/75057/02310 25 Contraste de varianzas

    A partir de ahora seguiremos el procedimiento establecido para hacer un con-

    traste de igualdad de varianzas:

    1. Expresamos las hiptesis:

    Hiptesis nula: .

    Hiptesis alternativa: . Establecemos esta hiptesis alterna-

    tiva unilateral porque queremos saber si el primer aparato es ms preciso

    que el segundo. Si lo es, entonces su varianza ser menor.

    2. Seleccionamos un nivel de significacin = 0,05 y calculamos el estadsti-co de contraste:

    3. Observando las tablas, tenemos que: f0,95;6;6 = 4,28. Y aplicando la propie-

    dad recproca, tenemos que:

    Dado que 0,231 < 0,234, rechazamos H0 y aceptamos que el primer aparato es

    ms preciso que el segundo. Tambin podemos llegar a esta misma conclusin

    a partir del p-valor. Con la ayuda del ordenador podemos calcular el p-valor:

    P(F6,6 < 0,231) = 0,0489

    Y dado que 0,0489 < 0,05, rechazamos la hiptesis nula en favor de la hipte-

    sis alternativa.

    2. Sean y las varianzas poblacionales del deterioro de los materiales

    1 y 2, respectivamente. Haremos un contraste de hiptesis sobre la igualdad

    de varianzas:

    1. Establecemos las hiptesis nula y alternativa:

    Hiptesis nula:

    Hiptesis alternativa:

    2. Calculamos el estadstico de contraste:

    H0 : 12 22=

    H1 : 12 22

    s12

    s22

    ------- 1,4696,367--------------- 0,231==

    f0,05;6;6 1

    f0,95;6;6---------------- 1

    4,28------------ 0,234===

    12 22

    H0 : 12 22=

    H1 : 12 22

    s12

    s22

    ------- 2516------ 1,562==

  • FUOC P08/75057/02310 26 Contraste de varianzas

    3. Fijado el nivel de significacin = 0,1, buscaremos el valor crtico de la coladerecha de la de la distribucin F con m = 10 1 = 9 y n = 13 1 = 12 gradosde libertad en el numerador y en el denominador, respectivamente, en la tabla

    correspondiente a /2 = 0,05:

    Para calcular el valor crtico correspondiente a la cola izquierda de la distribu-

    cin, utilizamos la propiedad recproca:

    Por tanto, rechazamos la hiptesis nula cuando el estadstico de contraste sea

    menor que 0,326 o mayor que 2,80. En este caso tenemos que el estadstico de

    contraste se encuentra entre estos dos valores:

    0,326 < 1,562 < 2,8

    Grficamente:

    Por tanto, no rechazamos la hiptesis nula. Y concluimos que no tenemos nin-

    guna evidencia suficiente para pensar que las varianzas sean diferentes.

    A esta misma conclusin podemos llegar calculando el p-valor con la ayuda del

    ordenador:

    P = 2 P(F9,12 > 1,562) = 2 0,2318 = 0,4636

    Dado que 0,4636 > 0,1, no rechazamos la hiptesis nula.

    f0,95;9;12 2,80=

    f0,05;9;12 1

    f0,95;12;9------------------ 1

    3,07------------ 0,326===