guia para el estudio de distribuciones muestrales y estimaciones

5
¿Qué es una distribución muestral? ¿En qué se diferencian las distribuciones muestrales de las trabajadas como la Bernoulli, Binomial, Hipergeométrica y Poisson? Como su nombre lo indica la distribución muestral analiza el comportamiento de variables aleatorias que son muestras, antes nosotros analizábamos las observaciones de una muestra e identificamos la distribución de cada variable aleatoria. Ahora no, lo que buscamos es tomar muestras y, como de una población podemos formar muchas entonces cada muestra se vuelve una variable y es aleatoria porque cada muestra se toma al azar. La idea es la siguiente, supongamos que tenemos una población de 15 observaciones y deseamos tomar muestras de tamaño 3, ¿cuántas muestras podríamos formar? Observemos que en el fondo lo que queremos saber es cuántos grupos de tres elementos podemos formar con quince elementos, ésto es una combinatoria en el sentido que no importa el orden en que se forme la muestra ya que no hay jerarquía entre las observaciones, lo importante es saber el total de grupos que se pueden forma de a 3: 15 C 3 = 455, esto quiere decir que hay 455 posibles muestras de tamaño 3 en una población de 15 elementos.                                Muestras de tamaño 3 Dado que cada muestra tiene la misma probabilidad de ser seleccionada, cada una de ellas se convierte en una variable aleatoria (variable porque cada muestra es distinta, varía, y aleatoria porque se eligen al azar) y tal como veníamos trabajando con las observaciones muestrales queremos averiguar el tipo de distribución que tienen. La distribución se determina o establece por el teorema del Límite Central según si se esta analizando la variable aleaotria media muestral o proporción muestral; para cada uno el teorema nos dice: Sea X 1 X 2 ,..., X n  un conjunto de n variables aleatorias independientes idénticamente distribuidas con media   y varianza  2 . Sea  X  la media de las variables aleatorias, a medida que n aumenta el teorema del límite central nos dice que la distribución de  X es normal con media   y varianza  2 n . Guía de apoyo para el estudio de distribuciones muestrales y estimadores puntuales Guía de apoyo para el estudio de distribuciones muestrales y estimadores puntuales

Upload: ecrestrepo

Post on 01-Feb-2016

249 views

Category:

Documents


2 download

DESCRIPTION

Guia de Ejercicios

TRANSCRIPT

Page 1: Guia Para El Estudio de Distribuciones Muestrales y Estimaciones

● ¿Qué es una distribución muestral? ¿En qué se diferencian las distribuciones muestrales de las trabajadas como la Bernoulli, Binomial, Hipergeométrica y Poisson?

Como su nombre lo indica la distribución muestral analiza el comportamiento de variables aleatorias que son muestras, antes nosotros analizábamos las observaciones de una muestra e identificamos la distribución de cada variable aleatoria. Ahora no, lo que buscamos es tomar muestras  y,   como de  una  población  podemos   formar  muchas  entonces   cada  muestra   se vuelve una variable y es aleatoria porque cada muestra se toma al azar.

La  idea es   la  siguiente,  supongamos que  tenemos  una población de 15 observaciones  y deseamos tomar muestras de tamaño 3, ¿cuántas muestras podríamos formar? Observemos que en el fondo lo que queremos saber es cuántos grupos de tres elementos podemos formar con quince elementos, ésto es una combinatoria en el sentido que no importa el orden en que se forme la muestra ya que no hay jerarquía entre las observaciones, lo importante es saber el total de grupos que se pueden forma de a 3: 15C3= 455, esto quiere decir que hay 455 posibles muestras de tamaño 3 en una población de 15 elementos.

                               Muestras de tamaño 3

Dado que cada muestra tiene la misma probabilidad de ser seleccionada, cada una de ellas se convierte   en   una   variable   aleatoria   (variable   porque   cada   muestra   es   distinta,   varía,   y aleatoria porque se eligen al azar) y tal como veníamos trabajando con las observaciones muestrales   queremos   averiguar   el   tipo   de   distribución   que   tienen.   La   distribución   se determina  o  establece  por  el   teorema del  Límite  Central   según si   se  esta  analizando  la variable aleaotria media muestral o proporción muestral; para cada uno el teorema nos dice:

Sea   X1 ,   X 2 ,...,   X n   un   conjunto   de   n   variables   aleatorias   independientes  idénticamente distribuidas con media     y varianza  

2 . Sea   X   la media de las  variables aleatorias, a medida que n aumenta el teorema del límite central nos dice que la  

distribución de  X es normal con media   y varianza 

2

n.

Guía de apoyo para el estudio de distribuciones muestrales yestimadores puntuales

Guía de apoyo para el estudio de distribuciones muestrales yestimadores puntuales

Page 2: Guia Para El Estudio de Distribuciones Muestrales y Estimaciones

En el caso de la media muestral no es difícil comprender el teorema pero podría suceder que nos preguntemos por qué sucede los mismo para el caso de la proporción muestral. Para comprender mejor el uso del teorema interpretemos el significado de proporción muestral:

Supongamos que,  de una población cuyas observaciones son variables aleatorias  de tipo binomial,   tomamos   una   muestra   aleatoria   de   tamaño   n ;   como   sabemos   la   variable binomial estudia el número de observaciones que cumple determinada característica dentro de la población, entonces si  X  representa dicho número y calculamos la proporción de la 

muestra   que   cumple   con   la   característica   tendremos:   P=Xn

  que   corresponde   a   un 

promedio; recordemos que   X   es   la suma de un conjunto de   n   observaciones tipo Bernoulli que son independientes y tienen la misma media y la misma varianza. Entonces nos encontramos de nuevo bajo los supuestos del teorema del límite central ( n  variables aleatorias   identicamente  distribuidas  con  misma media  y  varianza)  por   lo  cual   P   se 

distribuye normal con media  P  la probabilidad de éxito y varianzaP 1−P

n.

Con   base   en   lo   anterior   se   presentará   un   ejercicio   que   hace   referencia   al   cálculo   de probabilidades de medias muestrales y proporciones muestrales.

Media muestral

“Cuando un proceso de producción funciona correctamente, el número de unidades producidas   por   hora   sigue   una   distribución   normal   que   tiene  media   de   92  y desviación   típica   de   3,6.   Se   ha   tomado   una  muestra   aleatoria   de   cuatro   horas distintas.

a) Halle la media de la distribución de las medias muestrales en el muestreo.b) Halle la varianza de la media muestral.c) Halle el erro típico de la media muestral.d) ¿Cuál   es   la   probabilidad   de   que   la  media   muestral  sea   de   más   de   93 

unidades?” (Newbold Paul, Carlson William L., Thorne Betty, 2008, p. 269)

Hay algunas características importantes a tener en cuenta en el ejercicio:

➔ En el ejercicio nos deben dar la media y la desviación o la varianza poblacional.➔ El tamaño de la muestra.➔ Los ejercicios propuestos deben indicar que se está hablando de medias muestrales.

En ocasiones suele confundirsen los ejercicios de variables aleatorias normales con los de variables   aleatorias   muestrales.   La   forma   de   diferenciarlos   para   no   cometer   errores   es identificar  que en un ejercicio de variable  aleatoria  normal  no nos dan el   tamaño de la muestra y no hablan de medias muestrales.

Debemos recordar que en las lecturas nos indican cómo calcular la media, la varianza, el error típico y la forma de estandarizar la variable aleatoria normal  X . Aunque la forma de estandarizar es la misma que la normal sólo que ahora no se divide entre 

2  sino entre 

2

n:

Page 3: Guia Para El Estudio de Distribuciones Muestrales y Estimaciones

Z=X−

Esta nueva variable se distribuye normal estándar y como consecuencia podemos utilizar las tablas de probabilidad normal estándar.

Si consideramos el ejercicio presentado, la forma de resolverlo sería:

a) Dado   que   la   media   de   la   variable   aleatoria   media   muestral   es   la   media   de   la población   tenemos  que:   E X ==92 .  Esto  significa  que  el  promedio  de   las medias muestrales de unidades producidas por hora es 92.

b) Como   se   observa   en   las   lecturas   la   varianza   de   la   media   muestral   es 

Var X =

2

n=3,62

4=3,24   y nos permite determinar a través de la desviación 

típica cuán alejados estan los datos u observaciones del promedio o media de los datos.

c) Recordemos que el error típico es justamente la desviación típica, es decir la raíz de la varianza:  3,24=1,8  con lo cual diremos que los datos estan alejados alrededor de dos unidades del promedio de los datos o que estamos equivocándonos en cerca de 2 unidades por hora respecto al promedio de 92 unidades producidas por hora.

d) Para determinar la probabilidad de que la media muestral sea de más 93 unidades debemos realizar el siguiente proceso.

P X93=P X−92

1,8

93−921,8

=P Z0,55=0.7088≈0,71

Estandarizamos   la   variable;   recordemos   que estandarizamos   a   lado   y   lado   de   la   desigualdad   o igualdad planteada en la probabilidad. Luego, buscamos en la tabla de la normal estándar  o calculamos en excel el valor de la probabilidad.

Así concluimos que hay una probabilidad de 0,71 aproximadamente de que la media muestral sea de más de 93 unidades. Esto significaría por otra parte que el proceso de producción funciona correctamente.

Proporción muestral

Como se observa en las lecturas, la distribución de proporciones muestrales se maneja de forma análoga al de media muestral sólo que cambian los datos datos:

➔ Nos deben hablar de proporciones muestrales y por ende deben aparecer enunciados como 30 personas de 210, 25 elementos de 100, entre muchos otros y sino deben decirnos   el   15%   de   la   población   (u   otros   porcentajes)   cumple   determinada característica.

➔ Nos deben dar el tamaño de la muestra.

Con estos datos lo único que nos resta por hacer es determinar datos como la media, la varianza, el error típico y la probabilidad de que la variable aleatoria proporción muestral sea inferior, superior, al menos, a lo más, por lo menos, como mínimo, como máximo o se encuentre entre algunos valores.

Page 4: Guia Para El Estudio de Distribuciones Muestrales y Estimaciones

Veamos el siguiente ejemplo:

“Una   fábrica   tiene  438   obreros,   de   los   cuales   239  están   preocupados   por   las   futuras prestaciones sanitarias. Se ha pedido a una  muestra aleatoria de 80  de estos obreros que estime la proporción poblacional preocupada por las futuras prestaciones sanitarias.

a. ¿Cuál es el error típico de la proporción muestral preocupada?b. ¿Cuál es la probabilidad de que la proporción muestral sea inferior a 0.5?c. ¿Cuál es la probabilidad de que la proporción muestral este comprendida entre 0.5 y 0.6? (Newbold Paul, Carlson William L., Thorne Betty, 2008, p. 277)”

Como se  observa hemos   indicado con rojo  las  palabras   importantes  en  el  ejercicio  que justamente hacen referencia a los datos que nos tienen que dar para resolver un ejercicio de proporciones muestrales.

Ahora nos enfocaremos en mencionar los pasos para resolver el ejercicio:

a. Identifiquemos  P  y  n  que son parte fundamental: 

P=239438

≈0.5456 n=80

Dado que el error típico de una proporción muestral  se calcula con la expresión   p o desviación típica tenemos:

P= P 1−Pn=

239438

1− 239438

80≈0.0556

Por lo cual concluimos que el error típico es de 0.0556 aproximadamente, que significa que la  proporción estimada  de   la  población  esta  alejada  de   la  proporción muestral  cerca  de 0.0556 unidades.

b. Para determinar la probabilidad de que la proporción muestral sea inferior a 0.5 debemos estandarizar la variable aleatoria proporción muestral cuya distribución es normal con media 

P=239438

 y varianza  P ²≈0.0030989 .

P P0.5=P P−PP

0.5−PP

=P Z 0.5−0.54560.0556

=P Z−0.82 =0.21

Con esto concluimos que la probabilidad de que la proporción muestral sea inferior a 0.5 es de 0.21.

c.   Para   responder   este   literal   seguimos   un   proceso   análogo   al   del   ejercicio   anterior determinando la siguiente probabilidad:

  P 0.5 P0.6=P 0.5−PP

P−PP

0.6−PP

=P 0.5−0.54560.0556

Z0.6−0.54560.0556

             =P −0.82Z0.98=P Z0.98−P Z−0,82 =0.84−0.21=0.63

Page 5: Guia Para El Estudio de Distribuciones Muestrales y Estimaciones

Con lo cual concluimos que la probabilidad de que la proporción muestral se encuentre entre 0.5 y 0.6 es 0.63.

Basados en lo anterior ya hemos identificado características del significado de distribución muestral que según sea el contexto se referirá a media muestral o a proporción muestral, pero entonces ¿dónde dejamos o dónde encontramos el concepto de estimador puntual? Es muy simple en realidad puesto que lo que tenemos es que como una población puede ser tan grande  que  dificulte   el   cálculo  de  medidas   como  la  media  poblacional  o   la  proporción poblacional requerimos buscar métodos que nos permitar estimar dichos parámetros. Estos procesos son justamente el tomar muestral aleatorias y establecer mediante probabilidades si dichas muestras son representantes adecuados de los parámetros poblacionales.