2.1 tipos de muestreo.pdf
TRANSCRIPT
-
2.1 Muestreo.
En la prctica con frecuencia estamos interesados en establecer conclusiones
vlidas sobre un grupo grande de individuos u objetos. En lugar de examinar
el grupo completo, llamado poblacin, lo cual puede ser difcil o imposible,
examinamos solamente una parte pequea de esa poblacin, la cual llamamos
muestra. Hacemos esto con el fin de inferir ciertos hechos sobre la poblacin a
partir de los resultados que encontramos en la muestra, un proceso conocido
como inferencia estadstica. El proceso de obtencin de muestras se denomina
muestreo.
La inferencia estadstica se establece como una coleccin de tcnicas que
permiten formular inferencias que proporcionan una medida del riesgo de
stas, la inferencia estadstica se formula en base a una muestra de objetos de
la poblacin de inters. Si la poblacin consiste de N objetos y de estos se
selecciona una muestra que contiene n elementos el proceso debe de asegurar
que cada muestra de tamao n debe tener la misma probabilidad de obtenerse
o de seleccionarse.
Muestras Aleatorias
La confiabilidad de las conclusiones obtenidas concernientes a una poblacin
dependen de si la muestra se tom adecuadamente, para que represente a la
poblacin lo suficientemente bien. Uno de los problemas importantes de la
inferencia estadstica es precisamente cmo obtener una muestra. Una manera
de hacer esto es para poblaciones finitas es asegurar que cada miembro de la
-
poblacin tenga la misma probabilidad de estar en la muestra, lo cual se
denomina muestra aleatoria.
Si nuestras inferencias a partir de la muestra para la poblacin han de ser
vlidas, debemos obtener muestras que sean representativas de la poblacin.
Con mucha frecuencia estamos tentados a elegir una muestra mediante la
seleccin de los miembros ms convenientes de la poblacin. Tal
procedimiento puede conducir a inferencias errneas con respecto a la
poblacin. Cualquier procedimiento de muestreo que produzca inferencias que
sobreestimen o subestimen de forma consistente alguna caracterstica de la
poblacin se dice que est sesgado. Para eliminar cualquier posibilidad de
sesgo en el procedimiento de muestreo, es deseable elegir una muestra
aleatoria en el sentido de que las observaciones se realizan de forma
independiente y al azar.
Para seleccionar una muestra aleatoria de tamao n de una poblacin )(xf , la
variable aleatoria ,,...,2,1, niX i que represente la i- sima medicin o valor de
la muestra que observemos. Las variables aleatorias nXXX ,...,, 21 constituirn
entonces una muestra aleatoria de la poblacin )(xf con valores numricos
nxxx ,...,, 21 si las mediciones se obtienen al repetir el experimento n veces
independientes bajo esencialmente las mismas condiciones. Debido a las
condiciones idnticas bajo las que se seleccionan los elementos de la muestra,
es razonable suponer que las n variables aleatorias nXXX ,...,, 21 son
independientes y que cada una tiene la misma distribucin de probabilidad
)(xf . Es decir, las distribuciones de probabilidad de nXXX ,...,, 21 son,
-
respectivamente, )(),...(),( 21 nxfxfxf y su distribucin de probabilidad conjunta
es
)()()(),...,,( 2121 nn xfxfxfxxxf
Sean nXXX ,...,, 21 variables aleatorias independientes, cada una con la
misma distribucin de probabilidad )(xf . Definimos entonces nXXX ,...,, 21
como una muestra aleatoria de tamao n de la poblacin )(xf y escribimos
su distribucin de probabilidad conjunta como
)()()(),...,,( 2121 nn xfxfxfxxxf
Si se realiza una seleccin aleatoria de n = 8 bateras de almacenamiento de un
proceso de fabricacin, que mantiene las mismas especificaciones, y
registramos la duracin de cada batera con la primera medicin 1x como un
valor de X1, la segunda medicin 2x como un valor de X2, etctera, entonces
821 ,...,, xxx son los valores de la muestra 821 ,...,, XXX . Si suponemos que la
poblacin de duraciones de las bateras es normal, los valores posibles de
cualquier 8,...,2,1, iX i , sern precisamente los mismos que los de la poblacin
original, y por ello iX tiene la misma distribucin normal idntica que X.
Cuando se lleva a cabo una seleccin de objetos tangibles de una poblacin
que consiste en un nmero finito de objetos, se plantean dos formas diferentes
de obtener muestras aleatorias.
-
2.1.1 Muestreo con y sin reemplazo.
1.- Despus de llevar una mezcla de objetos de una poblacin, se inicia la
extraccin de un objeto de la poblacin y se observa la caracterstica medible,
esta caracterstica se denota por X1, posteriormente este objeto se regresa a la
poblacin para llevar a cabo una mezcla de todos ellos, terminada esta mezcla
se extrae un segundo objeto de la poblacin y se observa la caracterstica
medible la cual se denota por X2, posteriormente este objeto se regresa a la
poblacin para llevar a cabo una mezcla de todos ellos, terminada esta mezcla
se extrae un tercer objeto de la poblacin y se observa la caracterstica
medible la cual se denota por X3, as sucesivamente hasta llegar la
caracterstica Xn, con esto se forma una muestra de tamao n, X1, X2, . . . ,
Xn de la caracterstica medible X. A este proceso de muestreo se le conoce con
el nombre de muestreo con reemplazo.
2.- Despus de llevar a cabo una mezcla de objetos de una poblacin, se inicia
la extraccin de un objeto de la poblacin y se observa la caracterstica
medible, esta caracterstica se denota por X1, posteriormente este objeto no
regresa a la poblacin, se vuelve a llevar a cabo una mezcla de todos los
objetos restantes de la poblacin, terminada esta mezcla se extrae un segundo
objeto de la poblacin y se observa la caracterstica medible la cual se denota
por X2, y este objeto no regresa a la poblacin, se vuelve a llevar a cabo una
mezcla de todos los objetos restantes de la poblacin, terminada esta mezcla
se extrae un tercer objeto de la poblacin y se observa la caracterstica
-
medible la cual se denota por X3, y este objeto no regresa a la poblacin, se
vuelve a llevar a cabo una mezcla de todos los objetos restantes de la
poblacin, as sucesivamente hasta llegar la caracterstica Xn, con esto se
forma una muestra de tamao n, X1, X2, . . . , Xn de la caracterstica
medible X. A este proceso de muestreo se le conoce con el nombre de
Muestreo sin reemplazo.
La manera en que se selecciona una muestra se llama Plan de muestreo o
Diseo experimental, y determina la cantidad de informacin contenida en la
muestra. Adems, al conocer el plan de muestreo que se us en una situacin
particular, se puede determinar la probabilidad de observar muestras
especficas. Estas probabilidades permiten evaluar la confiabilidad o bondad
de las inferencias que se basan en estas muestras.
2.1.2 Muestreo aleatorio simple.
Este tipo de muestreo es el ms comnmente usado en el que cada muestra de
tamao n tiene la misma probabilidad de ser seleccionada.
Ejemplo 2.1
Suponiendo que se requiere seleccionar una muestra de tamao n = 2 de una
poblacin que contiene N = 4 objetos. Si stos se identifican mediante los
smbolos 321 ,, xxx y 4x , hay seis pares distintos que podran seleccionarse,
como se observa en la tabla 1.1. Si la muestra de n = 2 observaciones se
selecciona de modo que cada una de las seis muestras tenga la misma
probabilidad de ser elegida dada por 6
1 , entonces la muestra resultante se
llama muestra aleatoria simple, o slo muestra aleatoria.
-
Muestra Observaciones
En la muestra
Tabla 1.1
Maneras de seleccionar una muestra de
tamao 2 de 4 objetos
1
2
3
4
5
6
21, xx
31 , xx
41, xx
32 , xx
42 , xx
4,3 xx
Si el tamao de la poblacin es N y el tamao de la muestra es n, en el
muestreo aleatorio simple a cada elemento de la poblacin tiene asignada una
probabilidad de N
n de ser incluido en una muestra, de las N C n muestras
posibles, cada una con una probabilidad de nN C
1 de ser seleccionada.
Si selecciona una muestra de n elementos de una poblacin de N elementos
usando un plan de muestreo en el que cada una de las posibles muestras tiene
la misma probabilidad de ser seleccionada, entonces se dice que el muestreo
es aleatorio y la muestra resultante una muestra aleatoria simple