clas 4a tecnicas de muestreo
Post on 27-Jan-2016
82 Views
Preview:
DESCRIPTION
TRANSCRIPT
Dr. ELMER LIMACHE SANDOVAL
El Muestreo
El Muestreo es la disciplina que trata con el conjunto de técnicas para tomar u obtener una muestra representativa de una población.
Una muestra es representativa de una población cuando reproduce las características de la población
Tamaño N
Tamaño n
Parámetros
Estimadores
POBLACION
MUESTRA
Son teóricos o difíciles de medir
Los elementos de la población tienen características comunes, llamadas VARIABLES las cuales pueden ser cualitativas o cuantitativas
Términos técnicos en el Muestreo 1 Población
Muestra
Términos técnicos en el Muestreo
Unidad de muestreo
Unidad elemental
Unidad reportante
Términos técnicos en el Muestreo
• Marco de muestreoEs la lista de los elementos de la población
Base de datos (Registros)Mapas
Términos técnicos en el Muestreo
• Parámetro, estimador y estimación
),....,(ˆ21 nxxxf
700$ˆ
Errores en la Encuesta por Muestreo
• Errores de Muestreo. Se controla, se formula y se estima
mediante el diseño de la muestra
• Errores de No Muestreo. Sólo se controla mediante un sistema de
prevención, capacitación e inspección en todo el proceso de la encuesta.
Tamaño N
Tamaño n
Parámetros
800
Estimadores
750x
POBLACION
MUESTRA
Error muestral= 800-750 = 50
La Investigación por Muestreo ETAPAS
Establecimiento de Objetivos Población Objetivo y Marco de Muestreo Diseño de la muestra Método de medición Instrumento de medición Capacitación de investigadores de
campo Prueba piloto Organización del trabajo de campo Análisis de los datos
Diseño de la muestra
Plan de selección Tamaño de la muestra y distribución Plan de estimación de parámetros y del
error
Categorías del Muestreo
• Muestreo Probabilístico
• Muestreo No probabilístico
Las Técnicas de Muestreo
Muestreo por conveniencia Muestreo por juicio Muestreo por cuotas Muestreo bola de nieve
• Técnicas No probabilísticas
• Técnicas probabilísticas– Muestreo Irrestricto Aleatorio (MIA)– Muestreo Sistemático– Muestreo PPT– Muestreo Estratificado– Muestreo de Conglomerados y Multietápico
(Polietápico)
Muestreo Aleatorio Simple - MAS Con reposición
Sin reposición - MIA
Características: • Asigna probabilidades iguales de selección• Necesita listado de unidades (Marco de muestreo)• Utiliza tabla de números aleatorios, urnas con bolas,
generación de números aleatorios por computadora, etc.
• Eficiente sólo en poblaciones homogéneas• Aplicable en encuestas de pequeña escala• Forma parte de diseños de muestra más complejos
Muestreo Sistemático
Asigna probabilidades iguales de selección No siempre necesita listado de unidades No requiere tabla de números aleatorios, ni urnas con bolas, ni
generación de números aleatorios por computadora, etc. Eficiente sólo en poblaciones homogéneas La muestra se distribuye uniformemente en toda la población,
siempre que exista una “buena” ordenación en el marco de muestreo Aplicable en encuestas de pequeña escala y en la selección en
campo Forma parte de diseños de muestra más complejos Es equivalente al MIA cuando la ordenación es “aleatoria”. Por tanto,
utiliza las mismas fórmulas.
• Simple• Circular
Características:
Ejemplo 1: Selección sistemática simple
De una lista de 270 pacientes internos, se desea seleccionar una muestra sistemática de 30 pacientes. Entonces el intervalo de selección es:
k = 270/30 = 9, es exactamente entero.
Luego, se elige un número aleatorio entre 1 y 9 (arranque aleatorio) es a=5.
Los pacientes elegidos para la muestra son los que ocupan la posición:005, 014, 023, 032, 041, 050,
059, 068, 077, 086, 095, 104, 113,
122, 131, 140, 149, 158, 167, 176,
185, 194, 203, 212, 221, 230, 239,
248, 257, 266
No Teléfono Nombre Consult5 241-6733 Reátegui Diaz Olga 114 328-0446 Talavera Cruz Clara M. 123 476-8125 Alba Caballero Guillermo 232 495-1957 Tafur Documet Orlando 241 526-0930 Ramírez Valera Luis J. 250 485-9040 Tapia Torres Amador 359 295-1590 Raymundo Palomino 368 521-2173 Juárez Alvarez Camilo 377 474-1853 Martínez Romero Damián 486 425-1596 Burga Araujo Marcela 495 488-5125 Real Leiva Eugenio N. 4
104 568-7235 Jarra Lazo Verónica 4113 470-9334 Chucle Chumbe Juan E. 4122 574-4628 Morales Garcia Olimpia 5131 445-2746 Manrrique Angeles Livia 5140 392-6221 Yactayo Samán Juan de 5149 451-2431 Salcedo Escobar Angel 5158 458-6117 Fernández Aliaga Carlos 6167 471-8682 Cueto Arias Cirilo E. 6176 283-4416 Lázaro Villa Mario P. 6185 381-7542 Zamudio Buendía Ulises 6194 224-6670 Kegel Garcia Hene G. 7203 293-4892 Quiroga Guillermo 7212 465-4290 Temoche Romero Fanny 7221 459-3981 Rabanal Zelada Arístides 8230 451-4178 Espejo Morales Victor 9239 348-7368 Chirinos Alarcón Gloria J. 9248 446-8466 Demichelli Zevallos Ortiz 9257 547-4043 Espíritu Rojas Pedro 10266 444-9092 Mindreau Raquel E. 10
Ejemplo 2: Selección sistemática circular
De la misma lista anterior de 270 pacientes, se desea seleccionar una muestra de 32 pacientes.
Entonces el intervalo de selección es:
k = 270/32= 8.44 8 (parte entera)
Luego,se elige un número aleatorio entre 1 y 270, es a=103.
Los pacientes elegidos para la muestra son los que ocupan la posición:103, 111, 119, 127, 135, 143, 151,
159, 167, 175, 183, 191, 199, 207,
215, 223, 231, 239, 247, 255, 263,
001, 009, 017, 025, 033, 041, 049,
057, 065, 073, 081
No Aleatorio Teléfono Nombre
(Mes anterior: S/.)
Miembros
103 442-4245 Zanetti Helena Gereda de 4
111 550-0712 Julián Marquina Marilú 4
119 446-3500 Alva Arce Eduardo P. 5
127 420-7454 Chuna Alaña Ricardo 5
135 254-0592 Layseca Carmen L. Aguilar de 5
143 441-7002 Pereira Pereira Orlando 5
151 264-5137 Deza Bringas Luis 5
159 354-4145 Laredo Osorio Claudio 6
167 471-8682 Cueto Arias Cirilo E. 6
175 421-1548 Campos Nieves Walther E. 6
183 485-9040 Tapia Torres Amador H. 6
191 474-5992 Giraldo Cano Carlos 6
199 461-0482 Revolledo Luisa Quinto de 7
207 368-2112 Ferrari Macher Jorge 7
215 442-4043 La Torre Cabrejos Norma E. 8
223 536-1199 Escobar Ccora Zócimo 8
231 464-6458 Galagarza Aponte María S. 9
239 348-7368 Chirinos Alarcón Gloria J. 9
247 553-3669 Zeta Correa Venancio 9
255 429-8214 Arce Correa Federico M. 10
263 421-6940 Bianchi Burga Mariela 10
001 365-1774 Garcia Rodriguez Juan D. 1
009 425-4039 Hurtado Flores Jorge 1
017 536-2160 Remuzgo TruJillo Helmer 1
025 479-8230 Uribe Montes Gustavo 2
033 472-8700 Vadillo Quijandría Antonio 2
041 526-0930 Ramírez Valera Luis J. 2
049 441-4692 Quevedo Mejia Manuel A. 3
057 464-7182 Dávila Briceño Juan M. 3
065 526-5318 Girao Sara Camacho de 3
073 336-8720 Farro Sonco María E. 4
081 295-1914 Urbano Ura Jessica V. 4
Muestreo PPT
Con Reposición Sin reposición Sistemático
Características
• Asigna probabilidades desiguales a las unidades de muestreo
• Aplicable en la selección de unidades grandes (Ciudades, distritos, manzanas de viviendas, etc) que poseen medidas de tamaño
• Forma parte de los diseños complejos en encuestas a gran escala
• Requiere información auxiliar (medidas de tamaño) para su aplicación
Probabilidades Proporcionales Al Tamaño
Ejemplo 3: Selección de localidadescon PPT Se tiene un listado de 40 localidades
y el numero de teléfonos públicos instalados (TPI) en cada localidad. Se desea seleccionar una muestra de 10 localidades con probabilidad proporcional al numero de TPI. (n=10)
Elegimos de la tabla de números aleatorios, 10 números entre 1 y 3100. Los números aleatorios son:
2242, 0559, 2883, 0483, 2566, 2998, 2795, 1884, 0699, 2049
Las 10 localidades seleccionadas son:
- Localidad 28 - Localidad 07
- Localidad 38 - Localidad 06
- Localidad 33 - Localidad 39
- Localidad 36 - Localidad 24
- Localidad 08 - Localidad 25
LOCALIDADES NUMERO DE TPI [ INTERVALOS ]
1 85 1 – 85 2 50 86 - 135 3 120 136 - 255 4 80 256 – 335 5 72 336 – 407 6 135 408 – 542 7 52 543 – 594 8 105 595 – 699 9 94 700 – 793
10 145 794 – 938 11 42 939 – 980 12 100 981 – 1080 13 60 1081 – 1140 14 81 1141 – 1221 15 53 1222 – 1274 16 70 1275 – 1344 17 68 1345 – 1412 18 45 1413 – 1457 19 86 1458 – 1543 20 51 1544 – 1594 21 112 1595 – 1706 22 63 1707 – 1769 23 54 1770 – 1823 24 190 1824 – 2013 25 44 2014 – 2057 26 67 2058 – 2124 27 49 2125 – 2173 28 82 2174 – 2255 29 48 2256 – 2303 30 56 2304 – 2359 31 118 2360 – 2477 32 62 2478 - 2539 33 74 2540 – 2613 34 55 2614 - 2668 35 110 2669 – 2778 36 40 2779 – 2818 37 57 2819 – 2875 38 71 2876 – 2946 39 58 2947 – 3004 40 96 3005 – 3100
TOTAL 3100
Ejemplo 4: Selección sistemática PPT
De las 40 localidades, seleccionamos ahora 10 localidades bajo muestreo sistemático con probabilidad proporcional al número de TPI.Calculamos el intervalo de selección:
k = 3100 / 10 = 310 Elegimos de la tabla de números
aleatorios un arranque aleatorio (entre 1 y 310). El arranque aleatorio es a = 265, entonces los números aleatorios son:
265, 575, 885, 1195, 1505, 1815, 2125, 2435, 2745, 3055
Por lo tanto, las 10 localidades seleccionadas son:
- Localidad 04 - Localidad 07- Localidad 10 - Localidad 14- Localidad 19 - Localidad 23- Localidad 27 - Localidad 31- Localidad 35 - Localidad 40
LOCALIDADES NUMERO DE TPI [ INTERVALOS ]
1 85 1 – 85 2 50 86 - 135 3 120 136 - 255 4 80 256 – 335 5 72 336 – 407 6 135 408 – 542 7 52 543 – 594 8 105 595 – 699 9 94 700 – 793
10 145 794 – 938 11 42 939 – 980 12 100 981 – 1080 13 60 1081 – 1140 14 81 1141 – 1221 15 53 1222 – 1274 16 70 1275 – 1344 17 68 1345 – 1412 18 45 1413 – 1457 19 86 1458 – 1543 20 51 1544 – 1594 21 112 1595 – 1706 22 63 1707 – 1769 23 54 1770 – 1823 24 190 1824 – 2013 25 44 2014 – 2057 26 67 2058 – 2124 27 49 2125 – 2173 28 82 2174 – 2255 29 48 2256 – 2303 30 56 2304 – 2359 31 118 2360 – 2477 32 62 2478 - 2539 33 74 2540 – 2613 34 55 2614 - 2668 35 110 2669 – 2778 36 40 2779 – 2818 37 57 2819 – 2875 38 71 2876 – 2946 39 58 2947 – 3004 40 96 3005 – 3100
TOTAL 3100
Las fórmulas de tamaño de muestra que se generan son:
Bajo la teoría de normalidad asintótica, para muestras grandes:
2
2
1)D(NN
nP)P(11)D(N
P)NP(1-n
Tamaño de muestra
) E( ˆ P )ˆ(V Z E
2
ZE
D
Mediciones cuantitativa
s
Mediciones cualitativas
Ne
PQze
PQz
2
2
2
2
1 n
Ne
ze
z
2
22
2
22
1
n
Para el caso de la estimación de la Media Poblacional
Para el caso de la estimación de una Proporción Poblacional
Que son similares a:
Donde Z: valor de la distribución normal a una confianza determinada.
E: error o precisión 2: varianza poblacional
N: tamaño de la población.
P: proporción de individuos que poseen determinada característica.
Q: 1-P
Tamaño de muestra en mediciones cualitativas
Margen de P (%)Error (%) 1 5 10 20 25 35 45 50
0.1 39,600 190,000 360,000 640,000 750,000 910,000 990,000 1,000,000
0.5 1,584 7,600 14,400 25,600 30,000 36,400 39,600 40,000
1.0 396 1,900 3,600 6,400 7,500 9,100 9,900 10,000
2.0 99 475 900 1,600 1,875 2,275 2,475 2,500
3.0 44 211 400 711 833 1,011 1,100 1,111
4.0 25 119 225 400 469 569 619 625
5.0 16 76 144 256 300 364 396 400
10.0 4 19 36 64 75 91 99 100
Muestreo Estratificado
Directo de elementos en cada estrato Por conglomerados (con o sin submuestreo)
en cada estrato
• Requiere información auxiliar de una o mas variables para estratificar la población
• Es eficiente en poblaciones heterogeneas
• Reduce el costo del muestreo al reducir los tamaños de muestra sin perder precisión
• Forma parte de los diseños de muestras complejas
Características
PROBLEMA: Heterogeneidad de las unidades
SOLUCION: Estratificación de la población
Muestreo Estratificado
........
Población
n1 n2 n3 nL
n = n1 + n2 + n3 +.........+ nL
Criterio para estratificación
HOMOGENEIDAD: Entre elementos de un mismo
estrato HETEROGENEIDAD:
Entre estratos INDEPENDENCIA:
Entre estratos al seleccionar la muestra
El número de Estratos
Criterio del investigador Fórmula teórica:
donde,
Cn= costo por unidad de muestra
Ce= costo por estratificación
Formación de los Estratos• Criterio del investigador• Método de Dalenius
e
n
C
2nCL
Afijación de la muestra
Afijación Optima (costo, varianza y tamaño del estrato)
Afijación de Neyman ( varianza y tamaño del estrato)
Afijación proporcional (tamaño del estrato)
Afijación proporcional valoral (total X del estrato)
Afijación desproporcional ( no proporcional)
Afijación optimo relativo (proporcional al coef. De
variación del estrato)
Afijación Uniforme (igual en cada estrato)
Muestreo de Conglomerados
• Características• Las unidades de muestreo suelen ser un grupo de elementos que
comúnmente es llamado conglomerado de elementos. El muestreo de estas unidades es llamado muestreo de conglomerados.
• El marco de muestreo es una lista de conglomerados
• La medición se realiza a todos los elementos del conglomerado seleccionado.
• Se utiliza en las investigaciones por muestreo a gran escala
• Ventajas- Reduce el costo del muestreo, al no utilizar una lista de elementos de la población (marco) y sólo una lista de conglomerados que es más fácil y más barato de obtener.
- Reduce el tiempo de la organización y ejecución del trabajo de campo.
Esquema grafico de una muestra por conglomerados
Conglomerado no seleccionado
Conglomerado seleccionado
Criterio para la conglomeración
Homogeneidad: (Entre)Entre elementos de diferentes conglomerados
Heterogeneidad: (Dentro)Entre elementos del mismo conglomerado
Ejemplo 5: Encuesta “Conteo rápido”
• Selección de una muestra sistemática de mesas de sufragio, inmediatamente después del proceso de elecciones.
• Población: Los electores que participaron en la votación
• Conglomerado: mesa de sufragio
• Elemento: elector
• Unidad reportante: Acta electoral
• Marco de muestreo: Listado de mesas de sufragio ordenados por ubicación geográfica
Problema en el muestreo de conglomerados
• En los conglomerados compactos se espera que los elementos de un mismo conglomerado tengan características similares (pero no puede ser así)
• Puede no ser necesario entrevistar a todos los elementos de un mismo conglomerado compacto.
• El exceso de información al entrevistar a todos los elementos del conglomerado, incrementa el costo del muestreo.
Muestreo multietápico
• Características• Selecciona primero una muestra de conglomerados. Luego,
selecciona una submuestra de elementos en cada conglomerado seleccionado. Este tipo de muestreo se le denomina muestreo en dos etapas o bietápico.
• La generalización de este muestreo a más etapas se llama muestreo Multietápico o Polietápico (Mahalanobis).
• Ventajas• Las mismas ventajas del muestreo de conglomerados, es decir,
reducción del costo y tiempo
• La muestra se distribuye mejor que en el muestreo de conglomerados.
Esquema gráfico de una muestra bietápica
UPM no seleccionada
UPM seleccionada
USM seleccionadaUSM no
seleccionada
Selección de unidades
• Unidades Primarias– Listados y mapas con estadísticas de manzaneo– Selección con PPT simple y PPT sistemático
• Unidades Finales– Selección sistemática con conteo rápido – Rutas aleatorias– Tablas de Kish (selección de personas)
Ejemplo 6: Muestreo bietápico (Manzanas y viviendas)
• Diseño 1: – Selección de manzanas con probabilidades iguales
• fracción de muestreo constante en cada manzana seleccionada
– Selección de viviendas con probabilidades iguales en cada manzana seleccionada
• Diseño 2: – Selección de manzanas con probabilidades desiguales
• número constante de viviendas en cada manzana seleccionada
– Selección de viviendas con probabilidades iguales en cada manzana seleccionada
Tamaños de muestra
Tamaños óptimos Minimizan la varianza del estimador para un costo
de muestreo fijo Requiere los costos de muestreo por unidad
encada etapa Requiere estimación de varianzas en cada unidad
de muestreo y entre unidades de etapas diferentes Regla práctica
Utilizar diseño auto ponderado Obtener el tamaño de muestra de unidades finales bajo
fórmulas de MIA o MAE Distribuir el tamaño de muestra de unidades finales a todas
las etapas, según las condiciones de la auto ponderación.
Fin
top related