unidad 5. probabilidad y estadistica enemay2015

21
130 UNIDAD 5 ESTIMACIÓN 5.1 DEFINCIÓN, CLASIFICACIÓN Y PROPIEDADE S DE LOS ESTIMADORS. Estimación de Parámetros. En la práctica profesional a menudo resulta necesario inferir información acerca de una población mediante el uso de muestras extraídas de ella; existen diversos motivos: económicos, de tiempo, tamaño poblacional, etc. Recordemos que en la unidad I utilizamos datos muestrales para calcular medidas estadísticas (media, varianza, etc.); ahora en inferencia estadística debemos diferenciar entre cálculos obtenidos a partir de una muestra con respecto a los obtenidos a partir de una población, es por ello que llamaremos parámetros poblacionales (θ) a las estadísticas obtenidas de una población, y llamaremos estadísticos (E) a las obtenidas a partir de una muestra. Una parte básica de dicha inferencia consiste en estimar los valores de los parámetros de la población (media μ, varianza 2 , etc.) a partir de las estadísticas correspondientes de la muestra (media , varianza S 2 , etc) como se explica a continuación. Un estimador es una medida estadística que especifica cómo utilizar los datos de la muestra para estimar un parámetro desconocido de la población. Clasificación: Puntuales o de punto Estimadores Por intervalos de confianza Si un estimador de un parámetro de la población consiste en un sólo valor de una estadística, se le conoce como estimador puntual del parámetro. Propiedades de los estimadores de punto. Cuando la media de la distribución muestral de una estadística es igual al parámetro que se está estimando de la población, entonces la estadística se conoce como estimador insesgado del parámetro; si no sucede así, entonces se denomina estimador sesgado. Ambos estimadores son puntuales, y sus valores correspondientes se llaman estimaciones insesgadas o sesgadas respectivamente. Dicho de otra manera, si E es una estadística cuya distribución muestral tiene media μE, y el parámetro correspondiente de la población es θ, se dice que E es un estimador insesgado de θ si

Upload: eduardo-be-pech

Post on 06-Nov-2015

125 views

Category:

Documents


4 download

DESCRIPTION

Probabilidad y Estadistica

TRANSCRIPT

  • 130

    UNIDAD 5

    ESTIMACIN

    5.1 DEFINCIN, CLASIFICACIN Y PROPIEDADE S DE LOS ESTIMADORS.

    Estimacin de Parmetros.

    En la prctica profesional a menudo resulta necesario inferir informacin acerca de una

    poblacin mediante el uso de muestras extradas de ella; existen diversos motivos: econmicos,

    de tiempo, tamao poblacional, etc.

    Recordemos que en la unidad I utilizamos datos muestrales para calcular medidas

    estadsticas (media, varianza, etc.); ahora en inferencia estadstica debemos diferenciar entre

    clculos obtenidos a partir de una muestra con respecto a los obtenidos a partir de una

    poblacin, es por ello que llamaremos parmetros poblacionales () a las estadsticas obtenidas

    de una poblacin, y llamaremos estadsticos (E) a las obtenidas a partir de una muestra.

    Una parte bsica de dicha inferencia consiste en estimar los valores de los parmetros

    de la poblacin (media , varianza 2, etc.) a partir de las estadsticas correspondientes de la

    muestra (media , varianza S2, etc) como se explica a continuacin.

    Un estimador es una medida estadstica que especifica cmo utilizar los datos de la

    muestra para estimar un parmetro desconocido de la poblacin.

    Clasificacin:

    Puntuales o de punto

    Estimadores

    Por intervalos de confianza

    Si un estimador de un parmetro de la poblacin consiste en un slo valor de una

    estadstica, se le conoce como estimador puntual del parmetro.

    Propiedades de los estimadores de punto.

    Cuando la media de la distribucin muestral de una estadstica es igual al parmetro

    que se est estimando de la poblacin, entonces la estadstica se conoce como estimador

    insesgado del parmetro; si no sucede as, entonces se denomina estimador sesgado. Ambos

    estimadores son puntuales, y sus valores correspondientes se llaman estimaciones insesgadas

    o sesgadas respectivamente. Dicho de otra manera, si E es una estadstica cuya distribucin

    muestral tiene media E, y el parmetro correspondiente de la poblacin es , se dice que E es

    un estimador insesgado de si

  • 131

    E =

    Por ejemplo, si se cumple = , se dice que es un estimador insesgado de .

    Por otra parte, si la estadstica E de la muestra tiende a ser igual al parmetro de la

    poblacin a medida que se hace ms grande el tamao de la muestra, entonces la estadstica

    recibe el nombre de estimador consistente del parmetro.

    Empleando smbolos, si

    nn

    ELm

    Resulta que la estadstica En es un estimador consistente.

    Por ejemplo, el promedio aritmtico es un estimador insesgado y consistente de la

    media, y la varianza de la muestra es un estimador sesgado y consistente de la varianza de la

    poblacin.

    Si varias estadsticas tienen distribuciones muestrales con la misma media, se dice que

    la estadstica que cuenta con la menor varianza es un estimador eficiente de la media

    poblacional, en tanto que las estadsticas restantes se conocen como estimadores ineficientes

    del parmetro.

    Por ejemplo, cuando las distribuciones muestrales del promedio aritmtico y de la

    mediana cuentan con medias que son, en ambos casos, igual a la media de la poblacin. Sin

    embargo, la variancia de la distribucin muestral del promedio aritmtico es menor que la de

    la distribucin de la mediana, por lo que el promedio aritmtico obtenido de una muestra

    aleatoria proporciona un estimador eficiente de la media de la poblacin, en tanto que la

    mediana obtenida de la muestra proporciona un estimador ineficiente de dicho parmetro.

    Es improbable que incluso el estimador insesgado ms eficaz estime con exactitud el

    parmetro poblacional. Es cierto que nuestra precisin aumenta con muestras grandes; pero

    no hay razn por la cual deberamos esperar que una estimacin puntual de una muestra dada

    sea exactamente igual al parmetro poblacional que se supone estima. Hay muchas situaciones

    en que es preferible determinar un intervalo dentro del cual esperaramos encontrar el valor

    del parmetro. Tal intervalo se llama intervalo de confianza.

    5.2 ESTIMACIN DE INTERVALOS DE CONFIANZA A PARTIR DE UNA MUESTRA.

    Mediante la distribucin de muestreo de la medida estadstica usada se definen

    intervalos de confianza, que comprenden con alta probabilidad el valor del parmetro

    poblacional desconocido.

    Sea E una estadstica obtenida de una muestra de tamao n para estimar el valor del

    parmetro , y sea E la desviacin estndar (conocida o estimada) de su distribucin muestral.

    La probabilidad, 1-, de que el valor de se localice en el intervalo de E-zcE a E+ zcE, donde zc

    es una constante, se escribe en la forma

    P [E-zc E E + zc E] = 1-

  • 132

    Si se fija el valor de 1-, se puede obtener el valor de zc necesario para que se satisfaga

    la ecuacin anterior, con lo cual queda definido el intervalo de confianza del parmetro , (E-zc E, E+zc E), correspondiente al nivel de confianza 1-.

    La constante zc que fija el intervalo de confianza se conoce como valor crtico o punto

    crtico. Si la distribucin de E es normal, el valor de zc correspondiente a uno de se obtiene de

    la tabla de reas bajo la curva normal o de la tabla siguiente:

    VALORES DE zc PARA DISTINTOS NIVELES DE CONFIANZA

    Nivel de confianza en porcentaje zc

    99.73

    99.00

    98.00

    96.00

    95.45

    95.00

    90.00

    80.00

    68.27

    50.00

    3.00

    2.58

    2.33

    2.05

    2.00

    1.96

    1.64

    1.28

    1.00

    0.674

    5.2.1 Intervalos de confianza para la media, conocida

    Estimacin de intervalos de confianza para la media poblacional, , cuando es conocida y poblacin distribuida normalmente, o conocida y el tamao de la muestra mayor de 30.

    Los lmites de confianza para la media de una poblacin con variable aleatoria X

    asociada estn dados por

    x zc x

    en donde zc depende del nivel de confianza deseado. Si x tiene distribucin normal, zc puede

    obtenerse en forma directa de la tabla anterior. Por ejemplo, los lmites de confianza de 95 y 99

    por ciento para estimar la media, , de la poblacin son 1.96 x y x 2.58 x ,

    respectivamente. Al obtener estos lmites hay que usar el valor calculado de x para la muestra correspondiente.

    Entonces, los lmites de confianza para la media de la poblacin quedan dados por

    X zc n

    en caso de que el muestro se haga a partir de una poblacin infinita o de que se efectu con

    reemplazo a partir de una poblacin finita, o por

    x

  • 133

    X zc n

    1

    p

    p

    N

    nN

    si el muestreo es sin reemplazo a partir de una poblacin finita de tamao Np.

    Ejemplo

    Las mediciones de los dimetros de una muestra aleatoria de 100 tubos de albaal

    mostraron una media de 32 cm. Suponiendo una desviacin estndar poblacional es de 2 cm.

    Obtnganse los lmites de confianza de

    a) 95 por ciento

    b) 97 por ciento

    para el dimetro medio de todos los tubos.

    Solucin:

    a) De la tabla, los lmites de confianza del 95% son

    Z

    -1.96 1.96

    x 1.96 n

    32 1.96 (2/ 100 )

    32 0.392 cm.

    o sea 31.608 y 32.292, Esto significa que con una probabilidad de 95%, el valor de se

    encuentra entre 31.608 y 32.392 cm.

    392.32608.31

    b) Si Z = zc es tal que el rea bajo la curva normal a la derecha de zc es el 1.5 % del rea total,

    entonces el rea entre 0 y zc es 0.5-0.015 =0.485, por lo que de la tabla de rea bajo la curva

    normal se obtiene zc = 2.17. Por lo tanto, los lmites de confianza del 97% son:

    z

    -2.17 2.17

  • 134

    x 2.17 n

    32 2.17 (2/ 100 )

    32 0.434 cm.

    y el intervalo de confianza respectivo es (31.566 cm., 32.434 cm.)

    o sea, 31.566 cm. < < 32.434 cm.

    Ejemplo

    Una muestra aleatoria de 50 calificaciones de cierto examen de admisin tiene un

    promedio aritmtico de 72 puntos. Suponiendo desviacin estndar poblacional, = 10, y si el examen se aplic a 1018 personas, obtener

    a) El intervalo de confianza del 95% para la media del total de calificaciones.

    b) El tamao de muestra necesario para que el error en la estimacin de la media no

    exceda de 2 puntos, considerando el mismo nivel de confianza.

    c) El nivel de confianza para que el intervalo 72 1 puntos contenga a la media

    poblacional.

    Solucin

    a) Los datos son los siguientes: x = 72, Zc = 1.96, = 10, Np = 1018 y n = 50, Como tenemos una poblacin finita, la frmula que se utilizar es la siguiente:

    X zc n

    1

    p

    p

    N

    nN

    Sustituyendo:

    72 1.96 50

    10 )11018(

    501018

    72 1.96 (1.4142) (0.9755)

    72 2.704

    y el intervalo de confianza respectivo es:

    69.296 < < 74.704

    b. Puesto que el error en la estimacin de la media es para poblacin finita,

    Error en la estimacin = 1

    P

    Pc

    N

    nN

    nz

    En este caso se tendra

    21

    P

    Pc

    N

    nN

    nz

  • 135

    o sea, para un nivel de confianza de 95%,

    1.96 n

    10

    11018

    1018

    n 2

    n

    6.19

    11018

    1018

    n 2

    Elevando al cuadrado la desigualdad, queda

    41017

    101816.384

    n

    n

    o sea

    n 87.85

    por lo cual, se requieren al menos 88 elementos en la muestra para que el error en la estimacin

    no exceda de 2 puntos, para 1- = 0.95.

    Lo anterior nos indica que si deseamos disminuir el error de estimacin debemos

    aumentar el tamao de la muestra.

    c) Los lmites de confianza son, en este caso

    72 zc 50

    10

    11018

    501018

    72 zc (1.4142) (0.9755)

    o sea

    72 1.3795 zc

    Puesto que se desea que el valor de la media sea 72 1 puntos, se verifica que

    1= 1.3795 zc

    es decir

    zc = 3795.1

    1= 0.725

    El rea bajo la curva normal estndar entre 0 y zc = 0.725 es, por interpolacin lineal,

    igual a 0.2657. Por lo tanto, el nivel de confianza es igual al doble del rea anterior, es decir,

    2(0.2657) = 0.5314 (o 53.14%), tal como se muestra en la figura

    f(z)

    z 0.725

  • 136

    Se puede observar que si deseamos disminuir el error de estimacin sin aumentar el

    tamao de la muestra, entonces el nivel de confianza disminuye, o sea, la probabilidad o

    confianza de que el valor poblacional se encuentre en el intervalo disminuye.

    Cuando la desviacin estndar poblacional sea desconocida y el tamao de la muestra

    n 30, podemos usar estas mismas frmulas sustituyendo el valor de por la desviacin

    estndar muestral, S, ya que es un estimador puntual consistente de . Sin embargo, hay que

    considerar que el resultado obtenido es slo una aproximacin.

    Ejemplo

    Se seleccion una muestra aleatoria de 50 ingenieros de entre un gran nmero

    empleado por una corporacin cuya lnea es la exploracin petrolera. Para cada ingeniero se

    determinaron las horas trabajadas en una semana determinada. Estos datos tuvieron un

    promedio de 46 y una desviacin estndar de 3 horas. Para esa semana determinada, estimar

    las horas promedio trabajadas por todos los ingenieros de esa corporacin con un coeficiente

    de confianza igual a 95%.

    Datos:

    = 50; =3 horas; = 46; 1- = 95%;

    es desconocida

    Sin embargo, es vlido utilizar la frmula con la distribucin normal x zc n

    sustituyendo el valor de por s, la desviacin estndar muestral, ya que es un estimador

    puntual consistente de , pues conforme aumenta el tamao de la muestra ms se aproxima s

    al valor de . Como veremos ms adelante, cuando es desconocida y n 30 corresponde

    seleccionar la distribucin t de Student, sin embargo, con la distribucin normal obtenemos un

    resultado aproximado.

    Solucin

    El valor crtico para un nivel de confianza de 95% es como sigue

    f(z)

    z

    -1.96 1.96

    x zc n

    46 1.963

    50

  • 137

    46 0.8315

    45.1685 < < 46.8315

    5.2.2 Intervalo de confianza para la media poblacional, es desconocida

    Intervalo de confianza para la media poblacional, , cuando es desconocida y la

    poblacin distribuida normalmente, o desconocida y n 30.

    Para estos casos se utilizar la distribucin t de student con 1 n grados de libertad.

    El intervalo de confianza para con nivel de confianza 1- es como sigue:

    1

    n

    Stx c

    Ejemplo

    Un da al azar se toma una muestra aleatoria de 10 varillas de la produccin de una

    laminadora, al probarlas a la tensin hasta la ruptura se obtiene una resistencia media de 4800

    kg./cm.2, con una desviacin estndar de 200 kg. /cm.2. Con un nivel de confianza del 95%,

    estime la resistencia media de las varillas producidas el da que se tom la muestra. Considere

    que la variable poblacional resistencia tiene distribucin normal.

    Solucin.- n = 10 2/4800 cmkgx S = 200 kg. /cm.2 1- = 95%

    Se desconoce la desviacin estndar poblacional, , y la poblacin est distribuida

    normalmente, por lo que usaremos la distribucin t de student para estimar el promedio

    poblacional, .

    Se estima que la media de la poblacin queda comprendida entre los lmites

    siguientes:

    11

    n

    Stx

    n

    Stx cc

    con = n-1 grados de libertad.

    En este caso los valores de t para el 95% de nivel de confianza y 9 grados de libertad

    son t = -2.26 y t = 2.26, en la siguiente figura se detalla esta situacin.

    f(t)

    t -2.26 2.26

    Sustituyendo valores se tiene

  • 138

    110

    20026.24800

    110

    20026.24800

    6.49504.4649

    5.2.3 Intervalo de confianza para la proporcin

    Intervalo de confianza para la proporcin poblacional, P, en muestras grandes (n30).

    La fraccin observada de xitos, o la proporcin de xitos en la muestra,n

    x, es la que se usa

    como estimacin de P y se representa mediante p .

    El intervalo

    n

    ppzp c

    1

    es la representacin de un intervalo de confianza de muestra grande para P con coeficiente

    confianza aproximadamente igual a 1-.

    Ejemplo.

    Una inspeccin cuidadosa de 70 soportes de concreto precolado que se ha de usar en

    una construccin, revel que 28 estaban fisurados. Estimar la proporcin verdadera de

    soportes de este tipo con fisuras, en un intervalo de confianza del 98%.

    Solucin.- n = 70 x = 28 1- = 98% 4.070

    28

    n

    xp

    n

    ppzp c

    1

    Sustituyendo: 70

    6.04.033.24.0

    1364.04.0 o sea 0.2635 < P < 0.5364

    5.2.4 Intervalo de confianza para la varianza.

    Si X1,..., Xn denotan una muestra aleatoria proveniente de una distribucin normal,

    entonces

    2

    1

    22

    2

    2

    2 )1()1(

    SnSn

    es una representacin de un intervalo de confianza para 2 con nivel de confianza igual

    a

    1-. Se utiliza la distribucin Ji cuadrada con = n-1 grados de libertad.

  • 139

    Distribucin Ji cuadrada, 2

    Ejemplo

    Se ha observado durante 20 das que una lnea de ensamble de una fbrica, tiene una

    desviacin estndar de 30 minutos al realizar el proceso de ensamble. Estime con un nivel de

    confianza del 90% la desviacin estndar del proceso durante un ao.

    Solucin.

    n = 20, S = 30 minutos = n 1 = 20 -1 = 19

    Se tiene que los lmites del intervalo de confianza para la varianza poblacional 2 est dado por

    2

    1

    22

    2

    2

    2 )1()1(

    SnSn

    Los valores crticos se obtienen en la tabla al entrar con el valor de y el rea correspondiente,

    como se ve en la siguiente figura:

    Sustituyendo 1.10

    )30)(120(

    1.30

    )30)(120( 222

    Entonces la varianza poblacional est comprendida entre los dos siguientes valores:

    07.169310.568 2 y si lo que se desea estimar es la desviacin estndar, , entonces

    90%

    1-

    1.145

    11.071

    f( )

    f( )

    5% 5% 90%

    10.1 30.1

    f( )

  • 140

    07.169310.568

    o sea 23.83 < < 41.15

    5.3 ESTIMACIN DE INTERVALO DE CONFIANZA A PARTIR DE DOS MUESTRAS

    5.3.1 Intervalo de confianza para diferencia de medias, conocidas

    Intervalo de confianza para diferencia de medias poblacionales, yx , cuando las

    desviaciones estndar poblacionales, x

    y y son conocidas y poblaciones distribuidas

    normalmente, o, x

    y y conocidas y tamaos de muestras mayores o iguales a 30.

    Considerando que las muestras aleatorias seleccionadas son independientes, los lmites

    de confianza para la diferencia de las medias cuando las poblaciones X y Y son infinitas, o

    cuando el muestreo se realiza con reemplazo de poblaciones finitas, se encuentran dados por:

    x- y zc yx

    x- y zcY

    Y

    X

    X

    nn

    22

    en donde x , nx y y , ny son los respectivos promedios aritmticos y tamaos de las dos

    muestras extradas de las poblaciones, y X y Y las desviaciones estndar de estas ltimas.

    En el caso de que las poblaciones X y Y sean finitas y el muestreo sin reemplazo, los

    limites de confianza son

    x- y zc yx

    yx zc11

    22

    Y

    YY

    Y

    Y

    X

    XX

    X

    X

    N

    nN

    nN

    nN

    n

    en donde NX y NY son los tamaos de las poblaciones X y Y, respectivamente.

    Ejemplo

    Se toman muestras aleatorias de 100 varillas de acero que se fabrican en las compaas

    A y B. De la muestra de la compaa A se obtiene un peso medio de 6.5 kg., asimismo, la muestra

    de la compaa B indica un peso medio de 6.3 kg. Considerando que las desviaciones estndar

    poblacionales de ambas compaas son A = 0.4 kg. y B = 0.3 kg. encontrar el intervalo de

    confianza del 95.45% para la diferencia de las medias poblacionales.

    Solucin

    nA = nB = 100 5.6Ax A = 0.4 kg 3.6Bx B = 0.3 kg. %45.951

    Los lmites de confianza para la diferencia de las medias son:

  • 141

    1.02.0

    100

    3.0

    100

    4.023.65.6

    22

    22

    B

    B

    A

    A

    cBAnn

    zxx

    por lo tanto el intervalo de confianza respectivo es:

    3.01.0 BA

    Cuando las desviaciones estndar poblacionales sean desconocidas y los

    tamaos de las muestras mayores o iguales a 30, podemos usar estas mismas frmulas

    sustituyendo los valores de por las desviaciones estndar muestrales , ya que stas

    son estimadores puntuales consistentes de . Sin embargo, hay que considerar que el

    resultado obtenido es slo una aproximacin.

    5.3.2 Intervalo de confianza para la diferencia de medias, desconocidas

    Intervalo de confianza para la diferencia de medias poblacionales, yx , cuando las

    desviaciones estndar poblacionales son desconocidas y poblaciones distribuidas

    normalmente, o, desviaciones estndar poblacionales desconocidas y muestras mayores o

    iguales a 30. Considerando 22

    2

    1 .

    Si 1x y 2x son las medias de muestras aleatorias independientes de tamao n1 y n2

    respectivamente, de poblaciones aproximadamente normales con varianzas poblacionales

    iguales pero desconocidas, 22

    2

    1 , un intervalo de confianza de 1- para 21 es:

    21

    2/2121

    21

    2/21

    11)(

    11)(

    nnStxx

    nnStxx pp

    Donde Sp es la estimacin comn de la desviacin estndar poblacional y t/2 es el valor

    t con 221 nn grados de libertad.

    Una estimacin puntual de la variable comn desconocida 2 puede obtenerse

    combinando las varianzas muestrales. Al representar el estimador de ambas con 2pS se escribe:

    2

    )1()1(

    21

    2

    22

    2

    112

    nn

    SnSnS p

    Por consiguiente 2pp SS

  • 142

    Ejemplo

    Se deben eliminar gases cidos de otros gases de refinera en una instalacin de

    productos qumicos para reducir al mnimo la corrosin de las plantas. Dos mtodos para

    eliminar estos gases produjeron el ritmo de corrosin (mm./ao) que se representan a

    continuacin:

    Mtodo A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8

    Mtodo B: 0.7, 0.8, 0.7 0.6, 2.1, 0.6, 1.4, 2.3

    Estimar la diferencia entre el ritmo promedio de corrosin para los dos mtodos, con

    un coeficiente de confianza de 0.90. Qu hiptesis se deben hacer para que sea vlida la

    respuesta?

    Solucin.

    6714.0Ax 0424.02 AS nA = 7 1- = 90% 10. y 05.2/

    15.1Bx 4886.02 BS nB = 8

    2827.0287

    )4886.0)(18()0424.0)(17(

    2

    )1()1( 222

    BA

    BBAAp

    nn

    SnSnS

    5316.02827.0 pS

    El intervalo de confianza para la diferencia de medias poblacionales BA est dado

    por:

    BA

    pBABA

    BA

    pBAnn

    Stxxnn

    Stxx11

    )(11

    )( 2/2/

    f(t)

    t

    -1.77 1.77

    Al entrar a la tabla de distribucin t de student con 13287221 nn y 05.2/ tt

    obtenemos 1.771 que es el valor crtico.

    Sustituyendo tenemos:

    8

    1

    7

    1)5316.0(77.1)15.16714.0(

    8

    1

    7

    1)5316.0(771.1)15.16714.0( BA

  • 143

    4869784.04786.04869784.04786.0 BA

    0083784.09656.0 BA

    Como el lmite inferior tiene signo negativo y el lmite superior tiene signo positivo, el

    cero est incluido dentro del intervalo. En estos casos se considera que no existe una diferencia

    significativa entre los promedios de los dos mtodos.

    Las hiptesis que deben hacerse para considerar vlida esta respuesta son:

    Las variables aleatorias provienen de distribuciones normales independientes.

    Las variables aleatorias tienen varianza comn, o sea 22

    2

    1 .

    Intervalo de confianza para la diferencia de medias poblacionales, yx , cuando las

    desviaciones estndar poblacionales son desconocidas y poblaciones distribuidas

    normalmente, o, desviaciones estndar poblacionales desconocidas y muestras mayores o

    iguales a 30. Considerando 22

    2

    1 .

    Si 1x y

    2

    1S , y 2x y 2

    2S son las medias y las varianzas de muestras pequeas

    independientes de tamao 1n y 2n respectivamente, de distribuciones aproximadamente

    normales con varianzas diferentes y desconocidas, un intervalo de confianza de 1- para

    21 est dado por:

    2

    2

    2

    1

    2

    12/21 )(

    n

    S

    n

    Stxx

    donde 2/t es el valor t con,

    11 2

    2

    2

    2

    2

    1

    2

    1

    2

    1

    2

    2

    2

    2

    1

    2

    1

    n

    n

    S

    n

    n

    S

    n

    S

    n

    S

    Grados de libertad.

    Ejemplo

    Puede tomarse un curso con crdito ya sea asistiendo a sesiones de clases en horas y

    das fijos, o haciendo sesiones en lnea que el estudiante puede hacer a su propio paso y en los

    tiempos que el estudiante escoja. El coordinador del curso desea determinar si estos dos das

    de tomar el curso resultaron en una diferencia significativa en rendimiento medido por el

    examen final para el curso. La siguiente informacin da las calificaciones en un examen con 45

    puntos posibles para un grupo de nL= 9 estudiantes que tomaron el curso en lnea y un segundo

    grupo de nC = 9 estudiantes que tomaron el curso de clases convencionales. Estos datos

    presentan suficiente evidencia para indicar que existe diferencia significativa entre las

  • 144

    calificaciones para estudiantes que tomaron el curso en lnea y las de quienes asistieron a una

    clase convencional? Calcular el intervalo con un nivel de confianza de 95%. Considere que la

    variable calificaciones tiene distribucin normal y que 2

    2.

    Calificaciones En lnea Saln de

    clase

    32 35

    37 31

    35 29

    28 25

    41 34

    44 40

    35 27

    31 32

    34 31

    Con los datos muestrales de la tabla anterior se calcularon los siguientes estadsticos:

    En lnea Saln de clase

    =35.22 = 31.56

    2 = 24.44

    2 = 20.03

    Como las desviaciones estndar poblacionales son desconocidas y diferentes, asimismo,

    la variable calificaciones tiene distribucin aproximadamente normal, entonces se utilizar la

    distribucin t de Student con las siguientes frmulas:

    2

    2

    2

    1

    2

    12/21 )(

    n

    S

    n

    Stxx

    11 2

    2

    2

    2

    2

    1

    2

    1

    2

    1

    2

    2

    2

    2

    1

    2

    1

    n

    n

    S

    n

    n

    S

    n

    S

    n

    S

    Sustituyendo: 84.15

    8

    9

    03.20

    8

    9

    44.24

    9

    03.20

    9

    44.24

    22

    2

    Se toma la parte entera de este resultado, o sea, = 15

    Con el valor de y con el rea en dos colas = 0.05 entramos a la tabla t de Student y

    obtenemos el valor crtico 2.131

  • 145

    Sustituyendo para obtener el intervalo tenemos:

    9

    03.20

    9

    44.24131.2)56.3122.35(

    3.66 4.7368

    El intervalo de confianza queda como sigue

    -1.076 < < 8.396

    Como el cero est incluido en el intervalo podemos concluir que no existe diferencia

    significativa entre el promedio de calificaciones del curso en lnea y el del saln de clase, con un

    nivel de confianza de 95%.

    5.3.3 Intervalo de confianza para diferencia de proporciones

    Intervalo de confianza para diferencia de proporciones poblacionales 21 PP , con

    muestras mayores o iguales a 30.

    Considrese el problema en el cual se desea estimar la diferencia entre dos parmetros

    binomiales 21 PP . Por ejemplo, se podra hacer que 1P representara la proporcin de

    fumadores con problemas de cncer en los pulmones y 2P la proporcin de no fumadores con

    el mismo padecimiento. La dificultad, entonces, consiste en estimar la diferencia entre estas dos

    proporciones. Primero, se seleccionan muestras aleatorias independientes de tamao n1 y n2

    de las dos poblaciones Bernoulli con parmetros 1 2, medias 11 pn y 22 pn , y varianzas

    111 qpn y 222 qpn , respectivamente, entonces se determinan los nmeros 1x y 2x de personas

    en cada muestra con cncer en los pulmones y se forman las proporciones muestrales 1

    11

    n

    xp

    y 2

    22

    n

    xp . Un estimador puntual de la diferencia entre las dos proporciones,

    21 pp , est

    dado por el estadstico 21 pp . Por lo tanto, la diferencia entre las proporciones muestrales,

    21 pp , se utilizar como estimacin puntual de 21 PP a la que se sumar y restar un error

    de estimacin y as establecer el siguiente intervalo de confianza:

    2

    22

    1

    112/2121

    2

    22

    1

    112/21

    )(

    )(

    n

    qp

    n

    qpzpppp

    n

    qp

    n

    qpzpp

    donde pq 1 .

    Ejemplo

  • 146

    Se est considerando cambiar el procedimiento de manufactura de partes. Se toman

    muestras tanto del procedimiento actual como del nuevo para determinar si este ltimo resulta

    mejor. Si 75 de 1500 artculos del procedimiento actual presentaron defectos y lo mismo

    sucedi con 80 de 2000 partes del nuevo procedimiento, determine un intervalo de confianza

    del 90% para la diferencia real de las fracciones de partes defectuosas entre los dos procesos.

    Solucin

    Sean AP y NP las proporciones reales de partes defectuosas para los procedimientos

    actual y nuevo, respectivamente. De aqu que 05.01500

    75 Ap y 04.0

    2000

    80 Np , y la

    estimacin puntual 01.004.005.0 NA pp

    Al utilizar la tabla de la distribucin normal se encuentra que 645.105.2/ zz

    Por lo tanto, al sustituir en la frmula, se obtiene el intervalo de confianza de 90%:

    2000

    )96.0)(04.0(

    1500

    )95.0)(05.0(645.1)04.005.0(

    2000

    )94.0)(06.0(

    1500

    )95.0)(05.0(645.1)04.005.0( 21 pp

    el cual se simplifica a,

    0217.00017.0 NA PP

    Dado que el intervalo contiene el valor cero, no hay razn para creer que el nuevo

    procedimiento ocasion una disminucin significativa en la proporcin de partes defectuosas

    con respecto al mtodo actual.

    EJERCICIOS

    1. Cules son las caractersticas de un buen estimador puntual?

    2. Consideras que la desviacin estndar muestral es un estimador consistente de la

    desviacin estndar poblacional? Por qu?

    3. Explique lo que significa margen de error en estimacin puntual.

    4. En la siguiente grfica se presentan las distribuciones muestrales para dos estimadores

    insesgados, una con una varianza pequea (A) y la otra con una varianza ms grande (B).

  • 147

    Verdadero valor

    del parmetro

    a) Cul de las dos distribuciones asegura que, con una alta probabilidad, una estimacin

    puntual caer cerca del valor verdadero del parmetro?

    b) Cmo se llama la caracterstica deseable en un estimador, que se describe en el

    ejercicio anterior?

    5. En determinados estudios de la calidad del agua es importante verificar la presencia o

    ausencia de varios tipos de microorganismos. Supongamos que 30 muestras de 100

    seleccionadas al azar muestran la presencia de un determinado microorganismo. Estimar la

    probabilidad verdadera P de encontrar este microorganismo en una muestra de este mismo

    volumen, con un intervalo de confianza de 90%.

    6.- La agencia de proteccin ambiental ha reunido datos de mediciones de DL50 (dosis letal, es

    decir, mata al 50% de los animales de prueba en un determinado intervalo de tiempo) para

    determinadas sustancias qumicas que se encuentran probablemente en ros y lagos de agua

    dulce. Para determinada especie de pescado, las mediciones de DL50 para el DDT en 12

    experimentos dieron los siguientes resultados: 16, 5, 21, 19, 10, 5, 8, 2, 7, 2, 4, 9 (las mediciones

    estn en partes por milln). Suponiendo que estas determinaciones de DL50 tienen una

    distribucin aproximadamente normal, estimar la DL50 promedio real para el DDT con un

    coeficiente de confianza igual a 90%.

    7. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la

    variabilidad de los resultados que producen muestras estndar. En un estudio de la cantidad de

    calcio en el agua potable, el cual se efecta como parte del control de calidad de un agua, se

    analiz seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis

    resultados, en partes por milln fueron 9.54, 9.61, 932, 9.48, 9.70, 9.26. Estimar la varianza de

    los resultados de la poblacin para este estndar, usando un intervalo de confianza de 90%.

    A

    B

  • 148

    8. Al producir resistores, la variabilidad de las resistencias es una cantidad importante porque

    refleja la estabilidad del proceso de manufactura. Estimar la varianza verdadera de las

    mediciones de resistencia, en un intervalo de confianza de 90%, si una muestra de 15 resistores

    present resistencias con una desviacin estndar igual a 0.5 ohms.

    9. Un rea en la que los errores de ingeniera son crticos es la construccin de presas. Cun

    grande se necesita que sea una muestra para estimar el porcentaje de presas que necesita

    reparacin inmediata a no ms de un punto porcentual de error de estimacin con un nivel de

    confianza de 90%?

    10. Una cisterna abastece de agua a una zona urbana, recibe segn las observaciones diarias de

    los ltimos 30 das una media de 100 m3/da, con una desviacin estndar de 12 m3/da.

    Simultneamente se observ que el consumo de agua tiene una media de 90 m3/da, con una

    desviacin estndar de 16 m3/da. Estime con un nivel de confianza del 99% la diferencia media

    que existe entre el abasto y el consumo. Suponga 2 =

    2 .

    11.- Las obleas de silicio se almacenan y despus se parten en muchos microchips que se

    montarn en los circuitos. Se comparan dos mtodos de ruptura. De 400 microchips partidos

    con el mtodo A, ya no se pueden utilizar 32 debido a grietas. De 400 microchips partidos con

    el mtodo B, slo 28 son intiles. Estimar la diferencia entre las proporciones de microchips

    mal partidos con respecto a los dos mtodos de ruptura. Usar un coeficiente de confianza igual

    a 0.95. Cul mtodo considera mejor?

    12.- En un experimento que se rese en Popular Science en 1981, se comparaban las

    economas de combustible para dos tipos de minivehculos diesel equipados en forma similar.

    Se supone que se utilizaron 12 automviles Volkswagen y 10 Toyota en pruebas a velocidad fija

    de 90 km/hr. Si para los doce Volkswagen se obtuvo un promedio de 16 km/litro con una

    desviacin estndar de 1.0 km/litro y para los 10 Toyota aqul fue de 11 km/litro, con una

    desviacin estndar de 1.8 km/litro, calcule un intervalo de confianza de 90% para la diferencia

    entre los kilmetros promedio por litro de estos dos miniautomviles. Asuma que las distancias

    por litro para cada modelo de vehculo se distribuyen aproximadamente en forma normal con

    varianzas poblacionales iguales.

    13. Se realiza un estudio de comparacin del tiempo total de impresin de diversas tareas, en

    segundos, con dos marcas de impresora lser. Los datos siguientes corresponden a la impresin

    de grficos.

  • 149

    Tarea Tiempo de la marca 1 Tiempo de la marca 2

    1 21.8 36.5

    2 22.6 35.2

    3 21.0 36.2

    4 19.7 34.0

    5 21.9 36.4

    6 21.6 36.1

    7 22.5 37.5

    8 23.1 38.0

    9 22.2 36.3

    10 20.1 35.9

    11 21.4 35.7

    12 20.5 34.9

    13 22.7 37.1

    14 20.5 34.2

    15 21.3 35.4

    a) Determine un intervalo de confianza de 95% para la diferencia promedio en los tiempos

    de impresin.

    b) Le sorprendera la afirmacin de que las dos impresoras son igualmente rpidas en la

    impresin de grficos? Explique su respuesta.

    Suponga que las variables poblacionales, tiempo de impresin, tienen distribucin aproximadamente normal y varianzas iguales.

    14. Se midi el nmero de ciclos hasta el colapso de vigas de concreto armado, tanto en agua

    de mar como en aire. Los resultados, en miles, fueron los siguientes:

    Agua de mar: 774, 633, 477, 268, 407, 576, 659, 963, 193

    Aire: 734, 571, 520, 792, 773, 276, 411, 500, 672

    Estimar la diferencia entre los ciclos promedio antes del colapso en agua de mar y aire, usando

    un coeficiente de confianza igual a 0.95. En el agua de mar, disminuye el nmero de ciclos antes

    del colapso?

  • 150

    BILBIOGRAFA

    1. Mendenhall/Beaver/Beaver, (2010). Introduccin a la Probabilidad y Estadstica, Dcimo

    Tercera Edicin, Editorial Cengage Learning, Mxico.

    2. Jay L. Devore, Probabilidad y Estadstica para Ingeniera y Ciencias, (2008). Sptima Edicin,

    Editorial Cengage Learning, Mxico.

    3. Irwin Miller, John E. Freund, (2008). Probabilidad y Estadstica para Ingenieros, Editorial

    Revert S.A. de C.V., Espaa.

    4. Triola Mario F., (2009). Estadstica, Dcima edicin, Editorial Pearson Addison Wesley,

    Mxico.

    5. Walpole/Myers/Myers/Ye, (2007). Probabilidad y Estadstica para Ingeniera y Ciencias,

    Octava Edicin, Editorial Pearson Prentice Hall, Mxico.