c:/muestreo en latex abelardo 12julio2006/muestreo...

243
Prólogo C Omo nunca antes, la sociedad produce enormes cantidades de informa- ción, de ahí que a menudo sea llamada sociedad de la información y del conocimiento. Los gobiernos, las empresas privadas, las instituciones y los ciudadanos usan datos intensamente para tomar decisiones bajo situaciones inciertas: los partidos políticos quieren saber cuántos votos tendrán en las próximas elecciones, las empresas desean conocer sus consumidores poten- ciales, los investigadores a menudo (con frecuencia) deben estimar las áreas afectadas por una plaga, en fin, las aplicaciones son infinitas. En tanto no es posible evaluar todos los datos o la población total, es más factible y eficiente extraer una muestra que pueda validar estadísticamente y con una confianza aceptable los resultados para los datos o la población en su conjunto. ¿Por qué este libro? El interés por escribir este libro que el lector tiene en sus manos, surgió porque muchos administradores, estudiantes y profesionistas de nuestras in- stituciones académicas frecuentemente nos pedían apoyo para calcular tamaños de muestras, con el fin de fundamentar sus decisiones o incluso sus proyec- tos de investigación. El objetivo del libro es precisamente ayudar a elegir el esquema de muestreo apropiado, calcular el tamaño de muestra y hacer las estimaciones correspondientes, lo cual no es una tarea fácil para las personas que carecen de una formación intermedia o avanzada en estadística, además de que la mayoría de los libros de esta temática suelen ser poco accesibles. Estructura del libro El libro contiene una introducción general y seis capítulos adicionales que cubren conceptos básicos de estadística y los métodos de muestreo aleatorio simple, aleatorio estratificado, sistemático, por conglomerados en una etapa y de respuestas aleatorizadas; así mismo, por su naturaleza aplicada, el libro está acompañado por muchos ejemplos y ejercicios para que el lector prac- tique los conceptos aprendidos. Pero es preciso aclarar dos cosas. En primer lugar, todos los métodos de muestreo cubiertos en este libro suponen que el investigador ya aplicó una encuesta piloto. Y en segundo lugar, para todos los métodos resaltamos la estimación puntual y por intervalo de la media, la proporción y el total poblacioneal, hechando mano de la información recabada con la encuesta piloto. En el capítulo 1 la introducción general describe en términos globales los métodos que cubren a detalle los capítulos posteriores, y también incluye ejer- cicios a fin de que el lector adquiera la habilidad de seleccionar el método de muestreo apropiado para su investigación y domine conceptos fundamentales como confiabilidad, precisión, muestra preliminar o piloto, marco de muestreo . El capítulo 2 aborda los conceptos básicos de estadística y muestreo estadís- tico que serán útiles para entender las técnicas de muestreo y como obtener los valores de las tablas de la distribución normal estándar y t-student; entre otras cosas, el capítulo versa sobre poblaciones, muestras, escalas de medi- ción, parámetros y estimadores, sumatorias, variables aleatorias, la distribu- ción normal y t-Student, los tipos de muestreo y las características deseables

Upload: others

Post on 04-Apr-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Prólogo

COmo nunca antes, la sociedad produce enormes cantidades de informa-ción, de ahí que a menudo sea llamada sociedad de la información y

del conocimiento. Los gobiernos, las empresas privadas, las instituciones y losciudadanos usan datos intensamente para tomar decisiones bajo situacionesinciertas: los partidos políticos quieren saber cuántos votos tendrán en laspróximas elecciones, las empresas desean conocer sus consumidores poten-ciales, los investigadores a menudo (con frecuencia) deben estimar las áreasafectadas por una plaga, en fin, las aplicaciones son infinitas. En tanto no esposible evaluar todos los datos o la población total, es más factible y eficienteextraer una muestra que pueda validar estadísticamente y con una confianzaaceptable los resultados para los datos o la población en su conjunto.

¿Por qué este libro?El interés por escribir este libro que el lector tiene en sus manos, surgió

porque muchos administradores, estudiantes y profesionistas de nuestras in-stituciones académicas frecuentemente nos pedían apoyo para calcular tamañosde muestras, con el fin de fundamentar sus decisiones o incluso sus proyec-tos de investigación. El objetivo del libro es precisamente ayudar a elegir elesquema de muestreo apropiado, calcular el tamaño de muestra y hacer lasestimaciones correspondientes, lo cual no es una tarea fácil para las personasque carecen de una formación intermedia o avanzada en estadística, ademásde que la mayoría de los libros de esta temática suelen ser poco accesibles.

Estructura del libroEl libro contiene una introducción general y seis capítulos adicionales que

cubren conceptos básicos de estadística y los métodos de muestreo aleatoriosimple, aleatorio estratificado, sistemático, por conglomerados en una etapay de respuestas aleatorizadas; así mismo, por su naturaleza aplicada, el libroestá acompañado por muchos ejemplos y ejercicios para que el lector prac-tique los conceptos aprendidos. Pero es preciso aclarar dos cosas. En primerlugar, todos los métodos de muestreo cubiertos en este libro suponen que elinvestigador ya aplicó una encuesta piloto. Y en segundo lugar, para todoslos métodos resaltamos la estimación puntual y por intervalo de la media, laproporción y el total poblacioneal, hechando mano de la información recabadacon la encuesta piloto.

En el capítulo 1 la introducción general describe en términos globales losmétodos que cubren a detalle los capítulos posteriores, y también incluye ejer-cicios a fin de que el lector adquiera la habilidad de seleccionar el método demuestreo apropiado para su investigación y domine conceptos fundamentalescomo confiabilidad, precisión, muestra preliminar o piloto, marco de muestreo. El capítulo 2 aborda los conceptos básicos de estadística y muestreo estadís-tico que serán útiles para entender las técnicas de muestreo y como obtenerlos valores de las tablas de la distribución normal estándar y t-student; entreotras cosas, el capítulo versa sobre poblaciones, muestras, escalas de medi-ción, parámetros y estimadores, sumatorias, variables aleatorias, la distribu-ción normal y t-Student, los tipos de muestreo y las características deseables

Page 2: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

de las encuestas.

Los capítulos 3 y 4 tratan sobre el muestreo aleatorio simple y estratifica-do, respectivamente. En el muestreo simple todas las muestras de tamaño ntienen la misma probabilidad de ser elegidas, mientras que en el estratificadola población total se divide en subpoblaciones o estratos con criterios clara-mente definidos. La idea central de la estratificación es reducir el costo dela investigación, porque muchas variables comparten características similarescomo gustos, sexo, hábitos alimenticios, ubicación geográfica, etc. De igualmanera para reducir costos, el capítulo 5 presenta la técnica del muestreo sis-temático, donde la muestra se compone de unidades extraídas dando saltos dek unidades de la población. Otra ventaja de este método es que sólo se fija unintervalo de selección de las unidades muestrales y por ello se evita el uso demétodos de aleatorización complejos.

Para finalizar, los capítulos 6 y 7 cubren los métodos de muestreo por con-glomerados en un etapa y de respuesta aleatorizada. El primer método ayu-da a simplificar los muestreos exhaustivos cuando la población es demasia-do grande y sus elementos comparten rasgos comunes. Por ejemplo, en lasencuestas nacionales de los clientes bancarios, de los usuarios de serviciospúblicos o del control de calidad de ciertos medicamentos. Por su parte, elmétodo de respuesta aleatorizada, que se complementa con el aleatorio sim-ple o el estratificado, intenta resolver el problema de la falta de respuestas apreguntas sensibles como el uso de enervantes, relaciones sexuales o de otraíndole. Además, para este caso se presenta el procedimiento desarrollado porS. Warner (1965) para obtener respuestas difíciles que ayuden estimar la pro-porción de personas con la característica de interés que se busca.

AgradecimientosQueremos dar las gracias a todas las personas que influyeron positivamente

en la realización de este libro. En especial, a nuestros alumnos de la Licen-ciatura en Informática, de Ingeniería en Telemática y los de la Facultad deCiencias de la Universidad de Colima, por su paciencia, tolerancia y sugeren-cias para mejorar los borradores. También a los alumnos Martín Hugo del ToroGuzmán, Hugo Torres López Y Henry Nicole Ramírez de la Facultad de Cien-cias, por su apoyo en la captura de la versión preliminar de los manuscritos.

Los autoresColima, México

Page 3: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Índice general

1. Introducción 1

2. Conceptos básicos de estadística 32.1. ¿Qué es la estadística y para qué sirve? . . . . . . . . . . . . . . . 32.2. Población y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.3. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.4. ¿Qué es una medición? . . . . . . . . . . . . . . . . . . . . . . . . . 62.5. Las escalas de medición . . . . . . . . . . . . . . . . . . . . . . . . . 72.6. Parámetros y estimadores . . . . . . . . . . . . . . . . . . . . . . . 82.7. Sumatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.8. Variable aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.9. La distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . 112.10.La distribución normal estándar . . . . . . . . . . . . . . . . . . . . 122.11.El Teorema Central del Límite . . . . . . . . . . . . . . . . . . . . . 132.12.La distribución t-Student . . . . . . . . . . . . . . . . . . . . . . . . 142.13.Los tipos de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . 152.14.El marco de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . 172.15.Pasos a seguir en el diseño de una encuesta . . . . . . . . . . . . . 182.16.Las ventajas y desventajas del muestreo . . . . . . . . . . . . . . . 222.17.Las características deseables en una investigación por muestreo . 232.18.Errores de las encuestas . . . . . . . . . . . . . . . . . . . . . . . . 242.19.Muestra preliminar o piloto . . . . . . . . . . . . . . . . . . . . . . . 242.20.La precisión de la estimación . . . . . . . . . . . . . . . . . . . . . . 25

2.20.1.Elementos para elegir la precisión o margen de error . . . . 262.21.Uso de tablas para la distribución normal estándar y t-student . 28

2.21.1.Distribución normal estándar para n > 30 . . . . . . . . . . 282.21.2.Distribución t-student para n ≤ 30 . . . . . . . . . . . . . . . 30

3. Muestreo aleatorio simple 333.1. Tipos de muestreo aleatorio simple . . . . . . . . . . . . . . . . . . 343.2. Selección de una muestra aleatoria simple . . . . . . . . . . . . . . 353.3. Estimación de la media poblacional . . . . . . . . . . . . . . . . . . 36

3.3.1. Estimador de la media y del total muestral . . . . . . . . . . 373.3.2. Estimación de la varianza . . . . . . . . . . . . . . . . . . . . 373.3.3. Estimación por intervalo . . . . . . . . . . . . . . . . . . . . 383.3.4. Determinación del tamaño de la muestra . . . . . . . . . . . 403.3.5. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.5. La estimación de una proporción poblacional . . . . . . . . . . . . 52

III

Page 4: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

3.5.1. La medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523.5.2. El estimador de la proporción poblacional P y su relación

con el estimador de una media poblacional . . . . . . . . . 523.5.3. La varianza de la población para una proporción . . . . . . 533.5.4. Los intervalos de confianza . . . . . . . . . . . . . . . . . . . 543.5.5. El tamaño de muestra requerido para estimar P . . . . . . 553.5.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

4. El muestreo aleatorio estratificado 654.1. Ventajas de utilizar MAE . . . . . . . . . . . . . . . . . . . . . . . . 664.2. ¿Cómo seleccionar una muestra aleatoria estratificada? . . . . . . 674.3. La estimación de la media poblacional . . . . . . . . . . . . . . . . 67

4.3.1. El estimador de la varianza de la media estratificada . . . . 684.3.2. El intervalo de confianza para la estimación de la media

estratificada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 694.3.3. El estimador del total estratificado . . . . . . . . . . . . . . 694.3.4. La varianza del estimador del total estratificado . . . . . . . 694.3.5. El intervalo de confianza . . . . . . . . . . . . . . . . . . . . 694.3.6. La determinación del tamaño de la muestra . . . . . . . . . 694.3.7. La asignación de la muestra . . . . . . . . . . . . . . . . . . 71

4.4. La selección de estratos . . . . . . . . . . . . . . . . . . . . . . . . . 724.4.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

4.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 874.6. La estimación de la proporción poblacional . . . . . . . . . . . . . 88

4.6.1. El estimador de la proporción y total poblacional . . . . . . 894.6.2. Los intervalos de confianza para la proporción y total pobla-

cional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 904.6.3. El tamaño de muestra para estimar la proporción estratifi-

cada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 904.6.4. Asignación de la muestra . . . . . . . . . . . . . . . . . . . . 914.6.5. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

4.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

5. El muestreo sistemático 1055.1. Tipos de población por su estructura . . . . . . . . . . . . . . . . . 1075.2. ¿Cómo seleccionar una muestra sistemática? . . . . . . . . . . . . 1085.3. La estimación de la media poblacional . . . . . . . . . . . . . . . . 110

5.3.1. La varianza de la media y del total. . . . . . . . . . . . . . . 1105.3.2. El intervalo de confianza de la media y el total . . . . . . . . 1115.3.3. La selección del tamaño de la muestra. . . . . . . . . . . . . 1115.3.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

5.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1225.5. La estimación de la proporción poblacional . . . . . . . . . . . . . 124

5.5.1. El estimador de la proporción y el total . . . . . . . . . . . . 1245.5.2. La varianza estimada de la proporción y el total sistemático 1255.5.3. El intervalo de confianza para la proporción y el total sis-

temático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

Page 5: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

5.5.4. La selección del tamaño de muestra para la proporción y eltotal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

5.5.5. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1265.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

6. El muestreo por conglomerados en una etapa 1396.1. ¿Qué puede ser un conglomerado? . . . . . . . . . . . . . . . . . . 1406.2. Una comparación con el muestreo estratificado . . . . . . . . . . . 1416.3. Acerca del tamaño del conglomerado . . . . . . . . . . . . . . . . . 1426.4. La estimación de una media y un total poblacional con M conocida143

6.4.1. El estimador de la media poblacional . . . . . . . . . . . . . 1436.4.2. El estimador del total poblacional . . . . . . . . . . . . . . . 1446.4.3. La varianza estimada de yc y τc . . . . . . . . . . . . . . . . . 1446.4.4. El intervalo de confianza de la media y el total . . . . . . . . 1446.4.5. La determinación del tamaño de muestra . . . . . . . . . . 1456.4.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

6.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1606.6. La estimación de la media y un total cuando se desconoce M . . . 162

6.6.1. ¿Qué sucede cuando se desconoce el tamaño de la poblaciónM? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

6.6.2. El estimador de la media y el total poblacional . . . . . . . 1626.6.3. La varianza estimada de la media y del total. . . . . . . . . 1636.6.4. El intervalo de confianza de la media y del total. . . . . . . 1636.6.5. Los tamaños de muestra para estimar la media y el total . 163

6.7. La estimación de una proporción poblacional . . . . . . . . . . . . 1646.7.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

6.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

7. El muestreo basado en el método de respuesta aleatorizada 1757.1. ¿Cuándo se utiliza esta técnica? . . . . . . . . . . . . . . . . . . . . 1767.2. Ventajas y desventajas . . . . . . . . . . . . . . . . . . . . . . . . . 1777.3. El modelo de respuesta aleatorizada bajo el MAS . . . . . . . . . . 177

7.3.1. El estimador de la proporción y el total poblacional . . . . 1797.3.2. La varianza estimada de los estimadores de la proporción

y del total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1797.3.3. El intervalo de confianza de la proporción y el total . . . . . 1797.3.4. El tamaño de la muestra para la proporción y el total . . . 1807.3.5. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

7.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1917.5. El modelo de respuesta aleatorizada bajo el MAE . . . . . . . . . 191

7.5.1. El estimador de la proporción y el total poblacional . . . . . 1927.5.2. La varianza de los estimadores de la proporción y total

poblacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1927.5.3. El intervalo de confianza para el promedio y total poblacional1927.5.4. El tamaño de la muestra para estimar la proporción y el total1937.5.5. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

7.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2097.7. Alternativa al modelo de respuesta aleatorizada . . . . . . . . . . . 2117.8. Respuesta aleatorizada versión Horvitz bajo MAS . . . . . . . . . 212

Page 6: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

7.8.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2137.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2207.10.Respuesta aleatorizada versión Horvitz bajo MAE . . . . . . . . . 2227.11.¿Cuál método de respuesta aleatorizada es mejor? . . . . . . . . . 223

A. Tablas de la distribución normal estándar y de la distribución t-student 225

Page 7: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir
Page 8: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Índice de figuras

2.1. Forma de la distribución normal para la variable estatura (Y ) con media90 cm. y DE=5 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2. Forma de la distribución normal estándar (Z), es decir, Z ∼ N(µ =

0, σ2 = 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.3. Comparación de la distribución normal estándar con las distribuciones

t-student con 1, 3, 5 y 10 gados de libertad . . . . . . . . . . . . . . . 15

5.1. La dispersión del marco de muestreo de una población aleatoria . . . . 1075.2. La dispersión del marco de muestreo de una población ordenada . . . . 108

A.1. Varianzas de distribuciones finitas (S2), en función de su forma yrango. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

III

Page 9: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir
Page 10: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Índice de cuadros

2.1. Ejemplo 1 para el uso de las tablas de la normal estándar . . . . 292.2. Ejemplo 2 para el uso de las tablas de la normal estándar . . . . 292.3. Ejemplo 3 para el uso de las tablas de la normal estándar . . . . 302.4. smallcaption . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.5. Ejemplo para el uso de las tablas de la distribución t-student . . 31

4.1. Plantas por hectárea infectadas . . . . . . . . . . . . . . . . . . . . 734.2. Faltas justificadas por año. . . . . . . . . . . . . . . . . . . . . . . . 774.3. El ingreso promedio mensual (miles de pesos) de las familias chia-

panecas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 804.4. El número de horas diarias que cada familia ve televisión . . . . . 844.5. Resultado del número más probable de coliformes fecales por 100

ml. de agua. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 874.6. Calificaciones de los egresados de la Normal Superior . . . . . . . 884.7. Daño promedio a corazoón de las tres sepas en porcentaje. . . . . 884.8. Porcentaje de tanino por kg. de nance. . . . . . . . . . . . . . . . . 89

5.1. Esquema de un muestreo sistemático . . . . . . . . . . . . . . . . 1065.2. El porcentaje de grasa por envase de leche ultrapasteurizada . . . 1125.3. El peso de los sacos de maíz (Kg) . . . . . . . . . . . . . . . . . . . 1155.4. El porcentaje de sacarosa por planta . . . . . . . . . . . . . . . . . 1185.5. El número de microprocesadores dañados por caja . . . . . . . . . 1205.6. Datos de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . 1235.7. Datos de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . 1235.8. Datos de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . 1245.9. Datos de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . 1245.10.Los alumnos satisfechos e insatisfechos. . . . . . . . . . . . . . . . 1265.11.Los colimenses que al menos en una ocasión se han enfermado

de dengue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1295.12.Los estudiantes que tienen licencia para conducir . . . . . . . . . 1315.13.Los asegurados que contrajeron gripe o tos por lo menos una vez

en los últimos seis meses . . . . . . . . . . . . . . . . . . . . . . . . 1345.15.Albañiles que consumen cerveza . . . . . . . . . . . . . . . . . . . . 1365.16.Muestra de colchones. . . . . . . . . . . . . . . . . . . . . . . . . . 1375.17.colimenses que han visitado Francia. . . . . . . . . . . . . . . . . . 1375.18.colimenses que han visitado Palenque, Chiapas. . . . . . . . . . . 137

6.2. El gasto en útiles escolares por estudiante (en pesos). . . . . . . . 1476.4. El contenido de carbohidratos por reja de refresco . . . . . . . . . 1516.5. Ejemplares comprados por familia. . . . . . . . . . . . . . . . . . . 154

V

Page 11: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

6.6. Emigrantes de las 12 localidades. . . . . . . . . . . . . . . . . . . . 1576.7. Nivel de satisfacción de los médicos en cada hospital . . . . . . . 1616.8. Kg. de basura producidos por vivienda semanalmente. . . . . . . 1626.9. El total de cacahuates producidos por tramo . . . . . . . . . . . . 1656.10.El agua de coco por palmera (litros). . . . . . . . . . . . . . . . . . 1686.12.smallcaption . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1736.13.smallcaption . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

A.1. Distribución normal estándar acumulada. . . . . . . . . . . . . . . 226A.2. Puntos porcentuales de la distribución t-student. . . . . . . . . . 227A.3. Tabla de números aleatorios . . . . . . . . . . . . . . . . . . . . . . 229

Page 12: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 1

Introducción

LOs cambios radicales en las tecnologías de la información y las telecomu-nicaciones han generado una enorme cantidad de información sin prece-

dentes. La tecnología está cambiando el mundo en que vivimos. La importanciade este cambio es comparable al de las revoluciones industriales de los siglosXVIII y XIX. En las dos últimas décadas, la Internet y las tecnologías de la in-formación han transformado el funcionamiento de las empresas, los métodosde aprendizaje de los estudiantes, los métodos de investigación de los cientí-ficos y la forma en que los gobiernos prestan sus servicios a los ciudadanos.Las tecnologías digitales han demostrado ser un potente motor del crecimientoeconómico y de la competitividad. En general, estos cambios continuos y evo-lutivos han transformado a la sociedad, de una basada en la producción deobjetos físicos, a una donde el énfasis principal es la producción e intercambiode información. Por consiguiente, se ha alterado no sólo la interacción humanacon la información, sino que también el comportamiento individual y colectivode los individuos (Danger, et. al., 1996 [8]), ya que exige cambios muy rápidosa los nuevos paradigmas.

Los gobiernos, las empresas privadas, las instituciones, así como los ciu-dadanos, necesitan usar intensivamente información y datos para el análisisde fenómenos y toma de decisiones en circunstancias de gran complejidad eincertidumbre. La información sobre la cantidad y calidad de un recurso paratomar tales decisiones pueden ser obtenidas mediante una evaluación exhaus-tiva, esto es, cuantificar o calificar todo el recurso (población). Sin embargo, enla mayoría de las circunstancias no es posible o conveniente hacer la evalu-ación exhaustiva sobre toda la población, principalmente por la carencia derecursos, por ello se justifica que gran parte de los conocimientos, actitudesy decisiones humanas estén basadas en el análisis de información parcial, esdecir, en el estudio de muestras, concretamente en el uso del muestreo. Alhacer la evaluación con solamente una fracción de la población o del recurso,se espera que las determinaciones hechas también pertenezcan a la población,implícitamente se acepta esa suposición, aunque siempre se corre el riesgo deque tal suposición no sea totalmente cierta. El objetivo principal de las técni-cas de muestreo es darle objetividad a ese riesgo.

El uso del muestreo como un medio para obtener conocimiento y tomar de-cisiones, es algo normal y cotidiano en las actividades humanas. En estudios

1

Page 13: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 1. Introducción

de mercado, el muestreo sirve para conocer las preferencias de los consumi-dores de cierto producto; en los estudios demográficos y sociales, para conocerlos niveles de empleo y desempleo, los ingresos y niveles de escolaridad enlos habitantes de una ciudad o país, la prevalencia y la incidencia de la dro-gadicción, etc.; y en la industria, para el control de calidad en el proceso deproducción. En fin, el muestreo se utiliza prácticamente en todas las áreas delconocimiento.

Sin embargo, elegir el esquema de muestreo, calcular el tamaño de la mues-tra y realizar las estimaciones correspondientes no es una tarea fácil paratodas aquellas personas con poca formación en estadística. Por ello, este li-bro pretende ayudar a los investigadores, estudiantes y profesionales de lasdistintas áreas del conocimiento que frecuentemente se encuentran con estosproblemas para que realicen sus actividades de una forma apropiada y eficaz.Además, sirve en un primer curso de muestreo estadístico aplicado, dirigido aestudiantes de nivel licenciatura, en cualquier área del conocimiento. El ma-terial no supone conocimientos profundos sobre matemáticas o probabilidad ypor lo tanto, tampoco realizar demostraciones formales.

Los objetivos centrales que persigue este documento son:

Presentar la forma adecuada de seleccionar una muestra, lo que deno-minaremos diseños de muestreo, considerando las características de laspoblaciones de interés.

Exponer las fórmulas para calcular los estimadores.

Exponer las fórmulas adecuadas para calcular el tamaño de una mues-tra para satisfacer las exigencias preestablecidas sobre la calidad de losestimadores.

Proporcionar ejemplos ilustrativos para cada uno de los esquemas demuestreo para facilitar su comprensión.

2

Page 14: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2

Conceptos básicos de estadística

Que la estadística es bella,no lo vengo a presumir.

Sólo requiere de entrega,para poderla sentir.

OAML

2.1. ¿Qué es la estadística y para qué sirve?

EN la literatura existen numerosas definiciones de la estadística. En lugarde hacer acopio de diversas definiciones y darnos a la tarea de comparar-

las, señalando su ambigüedad o insuficiencia, aceptaremos la siguiente:

Estadística”La estadística es la ciencia que se ocupa de los métodos y pro-cedimientos para recoger, clasificar, resumir, hallar regularidades yanalizar los datos, siempre y cuando la variabilidad e incertidumbresea una causa intrínseca de los mismos; así como de realizarinferencias a partir de ellos, con la finalidad de ayudar a la toma dedecisiones y en su caso formular predicciones” (Johnson, 1996).

La estadística sirve para:

Describir las diferentes medidas en un conjunto de objetos me-diante el análisis de algunos de sus elementos.

Tomar decisiones sobre opciones diversas con información par-cial contenida en un conjunto de datos.

Predecir el comportamiento de una medida o característica, encondiciones no observadas.

Los usos y aplicaciones son innumerables; sin embargo, éstos se puedenresumir en algunos de los puntos ya descritos con la finalidad de inferir sobrela población (estimación y prueba de hipótesis).

Como en todas las áreas del conocimiento, el muestreo emplea una termi-

3

Page 15: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

nología específica que define de manera apropiada los conceptos que se uti-lizan, por lo que es conveniente revisar algunos de ellos, en particular de la es-tadística, y presentar la simbología que se emplea en las técnicas de muestreo.

ConjuntoEs una colección de objetos definidos y distinguibles cuyaúnica propiedad indispensable es que sean identificados comopertenecientes a dicho conjunto. A cada uno de los objetos que loconstituyen se le llama elemento.

Por ejemplo, todas las computadoras dentro de una empresa o laboratoriopueden constituir un conjunto; también los estudiantes y las sillas dentro deun salón de clases constituyen un conjunto. Cabe mencionar que no es unrequisito que los objetos sean de la misma naturaleza, aunque la mayoría delos casos que involucra las técnicas de muestreo los objetos suelen ser de lamisma clase, o al menos muy semejantes.

2.2. Población y muestra

Como se dijo, las técnicas de muestreo, y en general los métodos estadís-ticos, se aplican a un conjunto de datos propios de un conjunto de objetos.Denominamos población al conjunto de objetos tanto como al conjunto de va-lores. El segundo es una función del primero, y aunque con frecuencia no sedistinguen explícitamente, el contexto en que se usa el término de poblacióndeja en claro la referencia. En este libro se usará la población, que se refiereal conjunto de mediciones que se hacen sobre una característica de interés entodos y cada uno de los elementos del conjunto de objetos.

Población. Es una colección de objetos o de entes que se caracteri-zan por poseer o compartir ciertas características (propiedades) encomún.Muestra. Es un subconjunto de elementos o unidades, selecciona-dos con alguna técnica, de la población en estudio.

La población es el conjunto que incluye todas las partes constitutivas de unrecurso. Así, la población es un conjunto de números que tienen las unidadesen que se hace la medición.

En general, en el análisis no suelen incluirse las unidades de mediciónde los valores de una variable, es decir, éstos se analizan simplemente co-mo números. Sin embargo, resulta conveniente recordar que los valores deuna variable siempre representan dimensiones físicas o de otra naturaleza,como peso, volumen, longitud, etc., y que estas dimensiones son medidas enunidades como kilogramos, metros cúbicos, centímetros, etc., por lo que losresultados del análisis son coherentes si se usan las unidades de medición, loque facilita enormemente su interpretación.

4

Page 16: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Por ejemplo, si el recurso son los estudiantes de la Universidad de Colima yla característica de interés es su estatura promedio, la población original sontodos los estudiantes, pero la población a la que las técnicas de muestreo sereferirán son el conjunto constituido por las estaturas de esos estudiantes, queestarán denominadas por el número que indica la dimensión y las unidadesen que se miden; por ejemplo 1.75 metros podría ser uno de los elementosconstitutivos del conjunto población.

El muestreo, en un sentido amplio, es un proceso que tiene como propósitoobtener conocimientos de las características generales de una población, me-diante la muestra. En contraste, el censo es un proceso de revisión exhaustivode la población, es decir, mide la característica de interés de todas las unidadesde la población.

2.3. Variables

Una variable es una característica de los elementos de una población y seobtiene con una medición o una calificación. La altura de los estudiantes esuna variable, también lo es la marca de computadoras portátiles que se en-cuentran en el mercado actual. El peso de cada silla o de cada estudiantetambién es una variable.

Una variable continua, como su nombre lo indica, es aquella donde son posi-bles todos los valores dentro de un intervalo de los números reales, al menosteóricamente, ya que prácticamente, por limitaciones de los instrumentos demedición, muchos valores en ese intervalo no pueden ser observados. En gene-ral, este tipo de variables incluye mediciones en kilogramos, centímetros, etc.,cuya precisión puede ser incrementada indefinidamente, afinando más y másel instrumento de medición.

Una variable discreta se puede medir en una escala que no incluye todos losvalores posibles de un intervalo de los números reales. Ejemplos de este tipode variables son los conteos, el número de personas de un lugar, el número delibros en una biblioteca, entre otros.

Las variables por atributos permiten la clasificación en función de la pre-sencia de cierta propiedad en el elemento que desea evaluarse. La pertenenciaa un grupo étnico es un ejemplo de un atributo; podría haber un número va-riable de atributos, como tener varios grupos étnicos, lo que permitiría hacerdiversos grupos y cada elemento pertenecería solamente a uno de esos gruposo clases.

Las técnicas de muestreo se aplican directamente a conjuntos de valoresmedidos en escalas apropiadas para variables continuas, discretas o de atribu-tos.

Digamos que pudiera ser de interés describir económica y socialmente lasfamilias del estado de Colima, para ello se aplica un cuestionario a cada fami-

5

Page 17: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

lia con preguntas sobre su situación socioeconómica, como ingreso mensual,el número de integrantes de la familia, el número de individuos que trabajan,el tipo de ocupación, entre otras. El conjunto de mediciones de cualquiera deestas variables medidas es el sujeto de aplicación de las técnicas de muestreo.Otro ejemplo puede ser la determinación de la calidad del aire en la Ciudadde México, para ello se toman mediciones de diferentes contaminantes: el con-junto de las mediciones del contaminante es la variable a la que se aplican losconceptos del muestreo. Pueden ser muchas las variables que se midan, peroel muestreo que aquí estudiaremos es univariado, es decir, se toma solamenteuna variable a la vez; aunque el estudio incluya varias variables, el proceso serealiza sobre todas y no más de una al mismo tiempo.

Función es otro terminó muy usado. Matemáticamente, el concepto de fun-ción consta de tres elementos, dos conjuntos y una regla que asocia o vinculaa cada elemento del primer conjunto con uno y sólo uno de los elementos delsegundo conjunto. Una lista de nombres y un grupo de estudiantes pueden seruna función si cada nombre de la lista corresponde a uno y sólo uno de los es-tudiantes. Nótese que incluso todos los elementos del primer conjunto puedenestar vinculados al mismo elemento del segundo conjunto, pero lo que no esválido es que un elemento del primer conjunto esté vinculado con más de unelemento del segundo. Las funciones que comúnmente abordaremos en estetexto son funciones matemáticas, en las que los conjuntos contienen númerosy la regla de asociación es una ecuación.

Hemos mencionado que en el muestreo nos interesan los valores medidosdel subconjunto muestra, que son seleccionados del conjunto población. A es-tos valores se les denomina datos, es decir, un dato es el valor específico quetiene la característica de interés de un elemento de la población. Convienemencionar que dato se puede referir a un valor conocido o existente pero queaún no ha sido determinado. En este libro un dato es un valor que ya ha sidodeterminado.

En el este contexto experimento es el procedimiento que permite obtenerun dato. Este procedimiento incluye dos cosas: la forma de elegir el objeto, yla determinación del valor mediante algún método.

Es prioritario considerar la forma en que se decide el elemento que se obser-vará. La determinación del valor de la característica es la medición o la califi-cación, que algunas veces representa un problema difícil y requiere tratamien-tos específicos. Este es el tema que abordaremos a continuación.

2.4. ¿Qué es una medición?

La medición es una tarea en la que la estadística no interviene directa-mente, pero influye mucho en los resultados. Para hacer una medición debenusarse las técnicas adecuadas. En general la medición es la determinación delvalor de la característica de interés de un elemento de la muestra.

6

Page 18: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Para medir la altura de los estudiantes se emplean técnicas muy distintasa las que miden la longitud de un virus o una bacteria; pero los métodos es-tadísticos para analizar los datos de ambos casos pudieran ser los mismos.

Las técnicas de medición son muy diversas y algunas son difíciles de eje-cutar. La instrumentación, selección y validez de las técnicas de medición sonmotivo de estudio de otras disciplinas, pero la comparación entre técnicas demedición sí son motivo de aplicación de los métodos estadísticos por lo que noabordaremos en este libro las técnicas de medición.

2.5. Las escalas de medición

Las reglas que clasifican los datos en distintas categorías se denominan es-calas de medición: nominal, ordinal, intervalo y proporción (Siegel, 1977 [7]).

Escala nominal

La escala nominal se utiliza para clasificar a la población en categorías. Porejemplo, los seres humanos se clasifican en hombres y mujeres; los colores seclasifican en rojo, azul, verde, etc. En este tipo de datos no existe una relaciónde orden ni se pueden realizar operaciones aritméticas como suma, multipli-cación, división o resta. Sin embargo, se pueden establecer frecuencias y pro-porciones, así como calcular la moda y establecer relaciones de equivalencia.Las propiedades de las relaciones de equivalencia son: reflexión: X=X; simetría:si X=Y entonces Y=X; y transición: si X=Y y Y=Z, entonces X=Z. Las pruebasestadísticas no paramétricas son admisibles para datos con esta escala demedición.

Escala ordinal

La escala ordinal clasifica y ordena las observaciones. Sin embargo, nopuede definirse una distancia entre las observaciones. Las relaciones admisi-bles en esta escala son: >,<, =. Por ejemplo, la frecuencia con que un grupo depersonas lee una revista científica podría clasificarse en: regularmente, a ve-ces, pocas veces, casi nunca y nunca. Otro ejemplo es la definición de la jerar-quía militar de un regimiento: teniente> subteniente> sargento 3ro.> sargento1ro.> cabo. Un último ejemplo es la llegada a la meta de un corredor en unacompetencia de 20 participantes: su clasificación C es tal que C ∈ {1, 2, . . . , 20}.

Las medidas que se pueden calcular en esta escala son: moda, frecuencia,coeficiente de contingencia y mediana. Las pruebas estadísticas admisiblespara un conjunto de datos de esta naturaleza son las no paramétricas, enparticular las estadísticas de rango, así como los coeficientes de correlacióncon base en rangos, es decir, el coeficiente de Sperman y el de Kendall.

7

Page 19: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

Escala de intervalo

Esta escala incluye las dos anteriores; es decir, clasifica, ordena y ademásestablece la proporción entre dos intervalos contiguos. Esta escala necesitauna unidad de medida y un punto cero arbitrario (no es el cero que pertenecea los reales). En esta escala la proporción de dos intervalos cualesquiera esindependiente de la unidad de medida y del punto cero. Por ejemplo, la tem-peratura en grados Celsius o Farenheit se mide en una escala de intervalo, yaque la unidad de medida y el punto cero son arbitrarios.

Las pruebas estadísticas admisibles son las paramétricas y las no paramétri-cas. Dentro de las técnicas paramétricas se permite el cálculo de medias, dela desviación estándar, el coeficiente de correlación de Pearson, etc. Las prue-bas estadísticas admisibles son las t-student y la F de Snedecor. Las únicasmedidas que no se pueden obtener son el coeficiente de variación y la mediageométrica, porque necesitan el cero de los números reales.

Escala de proporción

Además de todas las características anteriores, la escala de proporción ubi-ca al punto cero en el origen. En esta medida, además de conocer la proporción,se debe conocer la distancia entre dos puntos. Admite también todas las ope-raciones matemáticas y de igual manera se pueden establecer relaciones deigualdad y orden. Las pruebas estadísticas admisibles son todas las pruebasparamétricas, así como todas las pruebas estadísticas anteriores mas el coefi-ciente de variación y la media geométrica. Ejemplo 1. El peso en kilogramos delos estudiantes del primer semestre de Ingeniería en Software de la Facultadde Telemática de la Universidad de Colima. Ejemplo 2. El diámetro en metrosde una plantación de parotas localizadas en Tecomán, Colima.

2.6. Parámetros y estimadores

ParámetrosSobre el conjunto población se pueden definir funciones muy di-versas como el valor más pequeño, el más grande, el que ocupa laposición central una vez que han sido ordenados ascendente o des-cendentemente, la suma de todos los valores después de elevarlos alcuadrado, el valor que se repite el mayor número de veces y muchosotros más. Todas esas funciones son parámetros. Los parámetrossuelen ser representados por letras griegas como µ, τ , σ.

Existe un número infinito de parámetros para una población dada; sin em-bargo, muchos no tienen utilidad, en cambio otros manifiestan el interés dela evaluación. Por ejemplo, la suma de todos los valores correspondientes algasto de agua por familia en una localidad (población), porque la suma repre-senta el gasto total de agua en dicha localidad. Por lo tanto, el promedio, eltotal, la varianza, la desviación estándar, el coeficiente de variación, la moda,

8

Page 20: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

la mediana, el porcentaje o proporción son algunos ejemplos de parámetros.

EstimadoresSon funciones que se pueden proponer para calcular o estimar losparámetros. Si se definen sobre el conjunto población entonces seestá calculando el parámetro; pero si esas funciones se definen paralos datos de una muestra, entonces se realiza una estimación delparámetro. A ambos casos se les llamarán estimadores. Además, acada parámetro le corresponde uno o más estimadores. Existe unnúmero infinito de estimadores, pero sólo algunos tienen interéspráctico.

Aclaremos mejor la diferencia entre parámetro y estimador. Un estimador esuna función de los datos que sirve para calcular (en un censo) o estimar (en unmuestreo) un parámetro. Una definición general del parámetro es una cons-tante que describe a la población, usualmente en forma numérica, mientrasque un estimador es una función de los datos disponibles (muestra o censo)que se usa para estimar o calcular los parámetros.

2.7. Sumatorias

La sumatoria es muy importante para comprender mejor los conceptos de-trás del muestreo. Algunos parámetros y estimadores incluyen en su definiciónla suma de varios valores o datos. Si se simboliza por yi a cualquiera de esosdatos, digamos el i-ésimo de ellos, y se tienen n datos, la suma de esos datosse simboliza empleando el operador de sumatoria (Σ),

y1 + y2 + · · · + yn =n

i=1

yi

Se puede combinar otras operaciones matemáticas con la sumatoria; porejemplo, si se desea sumar el cuadrado de cada dato, la simbología apropiadaes:

y21 + y2

2 + · · · + y2n =

n∑

i=1

y2i

El subíndice señala una etiqueta que identifica a cada dato cuando ésteaparece en una lista. Es importante hacer notar que el subíndice puede em-plear cualquier símbolo, aunque convencionalmente se emplean letras inter-medias minúsculas del alfabeto como ”i”, ”j”, ”k”, etc.; incluso los mismosdatos pueden usar subíndices diferentes para indicar las operaciones apropi-adas. Asimismo, un símbolo de dato como ”y” puede tener más de un subíndicecuando los datos tienen más de dos criterios o sentidos de clasificación, comopuede ser el caso de una tabla o una matriz que tiene renglones y columnas,como ”yij”, donde ”i” es el renglón y ”j” la columna, o al revés. Si existen másde dos criterios de clasificación podrán emplearse más de dos subíndices paraidentificar apropiadamente cada dato.

9

Page 21: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

En otras ocasiones se empleará un subíndice con algún otro símbolo, tal vezel de una variable, un parámetro o un estimador, para señalar que ese símbolopertenece al objeto identificado con la etiqueta que se usa como subíndice. Porejemplo, σy se refiere a la desviación estándar de la variable (de los datos de) y.

Veamos varios ejemplos sobre el uso de la sumatoria y los subíndices. Enlos ejemplos, i puede tomar valores entre 1 y n, mientras que yi puede sercualquier valor de la variable y. Por decir, si estamos hablando de la variable’íngreso familiar en el estado de Colima” (y), entonces yi representa el ingresoque tiene la familia i en el estado.

Propiedades de las sumatorias

a)n

i=1

c = c + c + c + · · · + c = nc

b)n

i=1

cyi = c(y1 + y2 + y3 + · · · + yn) = c

n∑

i=1

yi

c)n

i=1

(xi + yi) = (x1 + y1) + (x2 + y2) + · · · + (xn + yn)

= x1 + y1 + x2 + y2 + · · · + xn + yn

= (x1 + x2 + x2 + · · · + xn) + (y1 + y2 + · · · + yn)

=n

i=1

xi +n

i=1

yi

d)n

i=1

yi =r

i=1

yi +n

i=r+1

yi, donde r es un número entero mayor que 1 y menor

que n.Ejemplo:

5∑

i=1

yi = (y1 + y2) + (y3 + y4 + y5)

=2

i=1

yi +5

i=2+1

yi donde yi = cualquier valor

2.8. Variable aleatoria

El concepto de variable aleatoria se relaciona con una característica o di-mensión que tienen las unidades muestrales de una población, y que puedetomar diferentes valores, cada uno asociado a una unidad muestral. Esos va-lores posibles forman un conjunto, que a dicho conjunto se denomina espaciomuestral. Así, una variable aleatoria Y es una función que va del espacio mues-tral (constituido por las unidades muestrales) a otro espacio muestral que sonlos números reales o a un subconjunto de éstos, que son todos los valores que

10

Page 22: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

puede tomar la variable bajo un experimento aleatorio.

Por ejemplo, se desea saber si los miembros de un grupo de personas fumano no. El espacio muestral inicial es el grupo de personas y = yi y el segundoespacio muestral es S = { sí, no}, que corresponde al hecho de que una personadada (yi) fume o no fume. Entonces podríamos definir la función Y como unavariable aleatoria como sigue:

y(yi) =

{

1 si yi = sí fuma0 si yi = no fuma.

Esta variable es conocida como la variable indicadora del conjunto yi y sólotoma los valores 1 ó 0.

2.9. La distribución normal

Esta distribución tiene gran importancia debido a que es un modelo ade-cuado para muchos sucesos naturales y por su sobresaliente papel en la teoríaestadística (Teorema Central del Límite), puesto que sirve como punto de parti-da para el desarrollo de muchas técnicas de inferencia (Mood, et al., 1974 [4]).Es importante mencionar que debido a que la distribución normal es continua,solamente pueden calcularse probabilidades para intervalos que pertenecen alespacio muestral de Y , ya que para cualquier posible valor k de Y , P (Y = k) = 0.Aunque con la corrección por continuidad es posible calcular probabilidadespara cualquier posible valor k (Mood, et al., 1974 [4]). Decimos que una varia-ble aleatoria Y se distribuye normal si su función de densidad es:

fY (y) =

1√2πσ2

e−(y−µ)2

2σ2 si y ∈ R

0 de otra forma.

Donde:

E[Y ] = µ −∞ < µ < ∞V ar(Y ) = σ2 σ2 > 0

e y π son las constantes conocidas.El lector debe notar que µ y σ2 son los parámetros de la distribución, es de-

cir, Y ∼ N(µ, σ2). Para ejemplificar la forma de la distribución normal, supón-gase que se mide la estatura (Y ) en centímetros a una población de niños de 5años de edad y se encuentra que su promedio es de 90 cm. con una desviaciónestándar (DE) de 5 cm., es decir, Y ∼ N(µ = 90, σ2 = 25). La forma de la dis-tribución se presenta en la figura 2.1.

La distribución normal tiene forma acampanada (Figura 2.1), con un solopico o moda que es igual a la mediana y media porque es una distribuciónsimétrica en torno a este punto. Además, cuando Y ∼ N(µ = 90, σ2 = 25),el porcentaje de niños con una estatura entre 80 cm y 100 cm es de 95.45por ciento (área sombreada en la figura 2.1). Los puntos en que cambia ladirección de la concavidad de la campana se llaman puntos de inflexión, y

11

Page 23: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

están situados a una distancia de σ unidades por encima y por debajo de lamedia µ. El área total bajo la curva es 1 ó 100 por ciento, ya que es unadistribución de probabilidad definida.

70 75 80 85 90 95 100 105 110

00.

010.

020.

030.

040.

050.

060.

070.

08

Y

Figura 2.1: Forma de la distribución normal para la variable estatura (Y ) con media90 cm. y DE=5 cm.

2.10. La distribución normal estándar

Sea Y una variable aleatoria distribuida N(µ, σ2). Definamos la variablealeatoria Z = (Y − µ)/σ, que tiene distribución N(0, 1), es decir, es normal es-tándar porque su media es cero y su varianza es la unidad. Su función dedensidad es:

fZ(z) =

1√2π

e−z2

2 si z ∈ R

0 de otra forma.

La forma de la variable aleatoria Z se ilustra en la figura 2.2. Se puede veren la figura 2.2 que los valores con mayor ocurrencia de la variable aleato-ria Z están entre -3.6 y 3.6, la media igual a la mediana es igual a cero y sudesviación estándar igual a la varianza es uno. La importancia de esta funciónde densidad de probabilidad radica en que las probabilidades en cualquiermiembro de la familia, o sea, cualquier normal con media µ y varianza σ2,puede calcularse con la distribución normal estándar. La ventaja estriba enque tiene media cero y varianza uno (Mood, et al., 1974 [4]) y facilita el cálculode probabilidades porque la variable aleatoria normal original es una funciónno integrable, por lo que la integración se obtiene empleando tablas de la nor-mal estándar o con un software estadístico.

12

Page 24: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

Z

N 02

1

Figura 2.2: Forma de la distribución normal estándar (Z), es decir, Z ∼ N(µ = 0, σ2 =

1)

2.11. El Teorema Central del Límite

El Teorema Central del Límite es de gran importancia porque en él se basangran parte de los métodos estadísticos. Este teorema provee una aproximaciónefectiva a las probabilidades determinadas por sumas de variables aleato-rias independientes y explica la gran importancia de la distribución normalen la teoría de probabilidades. Su enunciado preciso es el siguiente: seanY1, Y2, . . . , Yn una muestra aleatoria de una función de probabilidades fY (y) (esdecir, variables aleatorias independientes e idénticamente distribuidas), conmedia µY y varianza σ2

Y . Sea Y = (Y1 + Y2 + · · ·+ Yn)/n la media aritmética de lasvariables aleatorias que integran la muestra. Para un tamaño de muestra n, ladistribución de la variable aleatoria Y es aproximadamente normal con mediaµY y varianza σ2

Y /n, es decir,

Y ∼ N(µY , σ2Y /n), cuando n → ∞

De acuerdo con el resultado anterior y estandarizando la variable aleatoria,la expresión puede escribirse como

Y − µY√

σ2Y

n

=Y − µY

σy

∼ N(0, 1)

El Teorema Central del Límite establece que para un tamaño de muestragrande, la distribución de Y es aproximadamente normal, independientemente

13

Page 25: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

de la función de probabilidades de la variable aleatoria Y (Mood, et al., 1974[4]).

Para casi todas las poblaciones, la distribución del muestreo de Y es aproxi-madamente normal si una muestra simple al azar es lo suficientemente grande,pero ¿qué significa una muestra suficientemente grande? Esto dependerá de lanaturaleza de la población muestreada y del grado de aproximación a la dis-tribución normal requerido.

Cuando la población muestreada tiene una distribución de probabilidadnormal, no se requiere el teorema central del límite. En este caso, utilizamosotro teorema que establece que ”si la población muestreada es una distribuciónde probabilidad normal, la distribución de probabilidad de Y es exactamentenormal para cualquier tamaño de muestra”.

Puesto que a menudo no conocemos el tipo de población muestreada, elTeorema Central del Límite nos dice la naturaleza de la distribución de muestreode Y para una muestra razonablemente grande, al margen del tipo de distribu-ción que siga la población.

2.12. La distribución t-Student

Es importante mencionar que la distribución t-student se publicó por primeravez en 1908, por el irlandés W.S. Gosset. En esa época Gosset trabajaba enuna cervecería irlandesa que desaprobaba la publicación de trabajos de inves-tigación. Por tal motivo Gosset publicó su trabajo con el seudónimo ”Student”.Razón por la cual se le asigno el nombre a esta distribución de ”t-student”.

Si Z es una variable N(0, 1) y χ2 es una variable χ2(ν) (Ji cuadrada) inde-pendiente de Z, entonces la variable aleatoria definida por:

t =Z

χ2/ν

tiene una distribución t-student con ν grados de libertad (Mood, et al., 1974[4]). Su función de densidad es la siguiente:

fT (t) =

1√νπ

[(ν + 1)/2]!

[ν/2]!

(

t2

ν+ 1

)−(ν+1)/2

si −∞ ≤ t ≤ ∞

0 de otra forma.

La función de densidad t-student es simétrica con respecto a cero, como elcaso de la función de densidad normal estándar. Además, para ν > 1, el valor

esperado de t es cero, E[t] = 0; y para ν > 3, Var[t] =ν

ν − 2. Además, note que

cuando ν −→ ∞, Var[t] −→ 1. De esta manera vemos que una variable aleatoriat-student tiene el mismo valor esperado que una variable aleatoria con dis-tribución normal estándar. Por ello, la forma de ambas distribuciones es muy

14

Page 26: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

semejante. No obstante, una variable normal estándar siempre tiene varianzade 1, mientras que la varianza de una variable t-student es superior a 1. Estose puede apreciar en la Figura 2.3, donde se compara la distribución normalestándar con la distribucione t-student con 1, 3, 5 y 10 grados de libertad. Esdecir, se observa que las dos funciones de densidad son simétricas respectoal origen, pero la distribución t-student posee mayor masa de probabilidad enlos extremos. Sin embargo, desde el punto de vista práctico las diferencias en-tre estas dos distribuciones son relevantes cuando el tamaño de muestra esmenor o igual a 30, . Así, en el presente libro sugerimos obtener los valoresde tablas que se utilizan para los ejemplos y ejercicios de los capítulos poste-riores, a partir de la distribución t-student cuando el tamaño de la muestrasea menor o igual a 30, de lo contrario obtenerlos de la distribución normalestándar.

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

t1

t3

t5

t10

N 02

1

Figura 2.3: Comparación de la distribución normal estándar con las distribucionest-student con 1, 3, 5 y 10 gados de libertad

2.13. Los tipos de muestreo

A manera de definición, un método de muestreo es una forma objetiva, ycomúnmente científica, de seleccionar unidades que pertenecen a la población.En este sentido el muestreo consiste en un conjunto de métodos de muestreo,por medio de los cuales es posible hacer aseveraciones sobre los parámetrosde una población apoyándose en la muestra.

Ahora bien, para conocer una población con base en la muestra recurrimosa dos procedimientos generales, que se diferencían en la manera de seleccionar

15

Page 27: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

las unidades de la población y el método usado para determinar el tamaño dela muestra. A tales procedimientos comúnmente se les denomina muestreoprobabilístico y muestreo no probabilístico; cada uno de ellos engloba una se-rie de métodos de muestreo (Rendón, 1997 [10]).

Muestreo probabilístico. Comprende los métodos que usan un mecanismoaleatorio para la selección de las unidades de la muestra. Cada unidad de lapoblación tendrá una probabilidad conocida de ser seleccionada, así como unaprobabilidad de ser incluida en la muestra; ninguna de tales probabilidades esigual a cero. Entonces, los métodos de este tipo de muestreo establecen unaestructura probabilística que es la base para desarrollar la teoría del muestreo.Otra característica importante en estos métodos de muestreo es que la calidad,el error o la precisión de los estimadores puede ser determinada y expresada entérminos probabilísticos. Algunos métodos de muestreo probabilístico son: elmuestreo aleatorio simple, el muestreo aleatorio estratificado, el muestreo sis-temático con iniciación aleatoria, el muestreo por conglomerados, el muestreode respuesta aleatorizada, etc. (Bradburn,1998 [5]). Este tipo de métodos demuestreo se desarrollará más adelante.

Muestreo no probabilístico. Incluye los métodos de muestreo donde la selec-ción de las unidades de la muestra se realiza por medios subjetivos o procedi-mientos no aleatorios; en consecuencia, no se tendrá una estructura proba-bilística para desarrollar una teoría de muestreo, ni podrá averiguarse la bon-dad de las estimaciones muestrales en términos cuantitativos. De hecho, lacalidad de las estimaciones se establece con base en la intuición y la experien-cia, o a través de argumentos subjetivos, ya que la única manera de cuan-tificar la bondad de los resultados sería teniendo la población total. Aunque elmuestreo no probabilístico resulta inadecuado para el desarrollo de la teoría,en ocasiones es la única alternativa viable (Bradburn,1998 [5]). Además, comolos métodos de muestreo son de fácil aplicación, los resultados se obtienencon mayor rapidez y no implica mucho gasto. Veamos a continuación algunosejemplos de muestreo no probabilístico:

Muestreo de juicio. También se le conoce como muestreo de expertos omuestreo dirigido. Su característica principal es la forma subjetiva conque son seleccionadas las unidades de la población. Por el elemento sub-jetivo no hay una manera de cuantificar la bondad de los resultadosmuestrales. En este caso, el investigador observa toda la población oparte de ella, y después selecciona una muestra compuesta por una omás unidades que en su opinión son típicas con respecto a la carac-terística que se desea estudiar. Está claro que el investigador, al medirlas unidades de esta forma seleccionadas, puede derivar estimaciones delos parámetros de inte-rés; sin embargo, las estimaciones dependerán dela selección subjetiva del investigador, de tal manera que otros investi-gadores podrían seleccionar muestras distintas y calcular otras estima-ciones. Sucede lo mismo con las estimaciones que se apoyan en el análi-sis ocular de la población de interés, porque no involucran la selecciónni la medición objetiva de las unidades. Asimismo, puede pasar cuando

16

Page 28: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

confiamos en la opinión experta de personas quien uno supone son cono-cedoras de las características de una población dada (Rendón, 1997 [10]).

Muestreo de cuota. Este método es ampliamente utilizado en las encuestasde opinión. Para su aplicación, la población se divide en grupos toman-do como base ciertas características generales. Una vez hechas las divi-siones, se tomará un número preestablecido de unidades al cual se ledenomina cuota y que satisfaga las características del grupo de interés.De este modo, la muestra total quedará integrada por la suma de todaslas cuotas. Por ejemplo, un investigador del observatorio vulcanológicode la Universidad de Colima está interesado en conocer la opinión dela población sobre un posible plan de emergencia frente a una eventualerupción volcánica. El investigador podría dividir la población en gruposdefinidos según la edad, el sexo, el estado civil, etc.; y después entrevistara cierto número (cuota) de personas de cada grupo, por ejemplo, en par-ques, salidas de las tiendas de autoservicio, las comunidades aledañas alvolcán, o en áreas específicas de la ciudad (Rendón, 1997 [10]).

Muestreo de voluntarios. Este método se usa principalmente en aquellassituaciones donde sea difícil el proceso de medición de las unidades. Porejemplo, si el proceso de medición requiere de mucho tiempo, resultapenoso y desagradable, o implica una gran concentración y esfuerzo men-tal, muchos individuos no desearán participar en el estudio. Por estas ra-zones, el método consiste en integrar una muestra con aquellas unidadesque acepten formar parte de ella, es decir, una muestra de voluntarios(Rendón, 1997 [10]).

Muestreo de unidades accesibles. Este método se usa frecuentementecuando resulta difícil el acceso o la comunicación a las unidades dela población. En este caso, la muestra se restringe a una parte de lapoblación, donde es fácil el acceso o comunicación. Por ejemplo, parainspeccionar el maíz a granel que es transportado en un barco, puedetomarse una muestra de maíz a cierta profundidad de la parte superiordel barco (Rendón, 1997 [10]).

Obsérvese que en los métodos de muestreo probabilístico, para fundamen-tar una estructura probabilística y desarrollar la teoría de muestreo, se debedisponer de un marco de muestreo que permita la elección de las unidadesmediante un procedimiento aleatorio. No contar con un marco por lo tardadoe impráctico de su elaboración, lleva a la necesidad de usar los métodos demuestreo no probabilístico, con las desventajas que ya fueron mencionadas.

2.14. El marco de muestreo

El marco de muestreo, o marco muestral, está constituido por un listado,real o virtual, de todas las unidades de muestreo.

17

Page 29: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

Unidad de muestreo o unidad muestralCada pieza acumulada constituye la población. A veces son colec-ciones de elementos de la población que cubren la población com-pleta. En ocasiones las unidades de muestreo están ”naturalmente”definidas; en otras, se definen arbitrariamente por quien realiza elmuestreo.

Idealmente, cada elemento de la población debe estar incluido en una ysólo una unidad muestral. Por eso, se dice que las unidades muestrales sonexcluyentes entre sí y exhaustivas sobre la población. No siempre se satisfacecabalmente esta condición ideal y su aceptación depende de las condicionesen que se suscite.

A veces no todas las partes de la población quedan incluidas en algunaunidad muestral, como en la evaluación de recursos mediante parcelas demuestreo circulares. Podría ser intrascendente si las partes que quedan exclu-idas no presentan una característica distintiva del resto de la población y lasinferencias todavía se pueden aceptar como aplicables a la población. Sin em-bargo, en otras aplicaciones puede ser decisivo el hecho de no incluir algunaspartes de la población en la muestra si esas partes excluidas se distinguen delas partes incluidas en alguna unidad de muestreo, y por lo tanto en el marco,entonces las estimaciones serán sesgadas, o bien solamente serán aplicablesa la población definida por el propio marco de muestreo. Si en las CienciasSociales se aplica una encuesta telefónica a una cierta población, debe quedarclaro que los resultados solamente son aplicables a la población constituídapor las personas en hogares que tienen teléfono y no a toda la población, yaque tener teléfono puede representar una diferencia importante.

Hacer el listado de las unidades muestrales que conforman la poblaciónparece una labor simple, pero en la práctica es una tarea muy complica-da, porque algunas poblaciones tienen características que demandarán tareasparticulares al momento de obtener el marco de muestreo.

Decimos que el marco de muestreo es real o virtual porque en ocasiones sepuede tener físicamente la lista de todas las unidades, mientras que en otrasbastaría con tener la posibilidad de generarlo para lograr el objetivo propuesto.

Entenderemos que el marco de muestreo contiene una identificación únicao etiqueta para cada unidad de muestreo, como puede ser un número progre-sivo desde 1 hasta N , donde N representa el número total de unidades mues-trales de la población. Además es importante que se tenga el nombre completo,dirección, ocupación, sexo, localización geográfica de cada unidad de muestreopara facilitar el levantamiento de la encuesta cuando las unidades muestralesson individuos.

2.15. Pasos a seguir en el diseño de una encuesta

1. El planteamiento de objetivos

18

Page 30: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Al empezar a diseñar un plan de muestreo o una encuesta, es importanteque se definan los objetivos, pues permitirán mantenerse en una línea deinvestigación sin perder tiempo con demasiados detalles.

2. La población bajo muestreo

Es trascendental que se definan desde el principio las unidades mues-trales que serán tomadas en cuenta y se establezcan reglas claras paraque el encuestador las identifique al momento de ubicarlas y hacer lamedición. Recuérdese que la población que se quiere muestrear debe co-incidir con la población sobre la cual se desea tener información.

3. La característica de la realización de la encuesta o mediciones

Es conveniente cerciorarse de que todos los datos sean pertinentes a laencuesta y que no se omitan datos esenciales. Particularmente, en el casode poblaciones humanas existe la tendencia a hacer un número excesivode preguntas innecesarias; nótese que un cuestionario demasiado largoproduce una baja general en la calidad de las respuestas, tanto en laspreguntas importantes como en las secundarias.

4. El grado de precisión deseado

Los resultados de una encuesta de muestreo siempre están sujetos a unnivel de incertidumbre porque sólo se mide una parte de la población.Esta falta de certeza se puede reducir al aumentar la muestra y emplearmejores dispositivos de medición. Sin embargo, esto suele costar tiempo ydinero. En consecuencia, la especificación del grado de precisión deseadoes un paso decisivo en la preparación de la encuesta o muestreo. Estepaso es responsabilidad de la persona que va a utilizar los datos, ya quees quien suele entender la magnitud del error tolerable de una encuestapara hacerla compatible con una buena decisión.

5. Los métodos de medición

Podemos escoger el método de medición y el método de inspección de lapoblación. Los datos del estado de salud de una persona se pueden obten-er de sus declaraciones, o de un examen médico. La encuesta puede em-plear un cuestionario autoadministrado, entrevista en la que los entrevis-tadores simplemente lean un cuestionario prescrito o una entrevista noestructurada. La inspección puede hacerse por correo, visitas persona-les, teléfono o una combinación de los tres medios.

Una parte importante del trabajo preliminar es la construcción de las for-mas de registro donde se asientan las preguntas y las respuestas. En loscuestionarios sencillos a veces es posible precodificar las respuestas, esdecir, colocarlas de tal modo que se puedan transferir rutinariamente auna computadora. De hecho, para la construcción de buenas formas deregistro se necesita preveer la estructura de las tablas de resúmenes fi-nales para obtener las conclusiones.

En seguida se enumeran algunos puntos que se deben de tomar en cuen-ta para el diseño de cuestionarios. Sin embargo, si usted va a escribir un

19

Page 31: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

cuestionario, consulte Tanur (1993) y Blair y Presser (1993) dos referen-cias útiles sobre este tema, debido a que los puntos que aquí se presentanson muy generales:

a) Decida lo que quiere escribir; éste es el paso más importante pararedactar un cuestionario. Escriba los objetivos de su encuesta y seapreciso para que se motive a las personas de la muestra a respondersin problema alguno.

b) Siempre verifique sus preguntas, antes de realizar la encuesta. Loideal es que las preguntas se verifiquen mediante una encuesta pilo-to. Pruebe con diferentes versiones de las interrogantes y preguntena los entrevistados en la prueba preliminar la forma en que interpre-taron las preguntas.

c) Elabore las preguntas de manera sencilla y clara. Las preguntas quepueden parecerle claras podrían no serlo para alguien que escuchatoda la pregunta por teléfono o para otra persona con otro idiomamaterno. Belson (1981, 240) probó la pregunta "¿Qué proporción detiempo que ve la televisión lo dedica a ver noticias?çon 53 personas.Sólo 14 de ellas interpretaron de manera correcta la palabra propor-ción como "porcentaje", "parte" o "fracción". Otras las interpretaroncomo ”cuanto tiempo” o ”cuales programas de noticias observa”.

d) Utilice preguntas específicas en lugar de preguntas generales, de serposible.

e) Relacione las preguntas que elabore en el concepto de interés.

f ) Decida si debe utilizar preguntas abiertas o cerradas.

g) Informe sobre la pregunta que se planteó realmente.

h) Evite preguntas que induzca o motiven al entrevistado a decir lo queusted quiere escuchar.

i) Utilice preguntas de opción forzosa.

j) Platee solo un concepto en cada pregunta.

k) Preste atención al efecto del orden de las preguntas.

6. El marco de muestreo

Antes de seleccionar la muestra, debemos dividir la población en unidadesde muestreo. éstas deben cubrir toda la población y no traslaparse en elsentido de que todo elemento de la población pertenezca a una y sola-mente una unidad. Algunas veces la unidad apropiada es obvia, en otrasno es sencillo escoger lo que será la unidad de muestreo. En el muestreode los residentes de una ciudad, por ejemplo, la unidad puede ser unapersona, los miembros de una familia o las personas que viven en unamanzana. En el muestreo de una cosecha de limón la unidad puede serun lote, una parcela o un área de terreno cuya forma y dimensiones sonnuestra elección.

7. La selección de la muestra

20

Page 32: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Existe actualmente una gran variedad de planes para seleccionar unamuestra. Por cada plan considerado se pueden hacer estimaciones deltamaño de la muestra partiendo de un conocimiento del nivel de precisióndeseado y la varianza de la población. Los costos relativos y el tiempoempleado en cada plan se estudian antes de tomar una decisión (Lohr,2000 [9]).

8. La encuesta piloto

Es de gran utilidad probar el cuestionario y los métodos de campo en pe-queña escala. Esto casi siempre ayuda a mejorar el cuestionario y puedeevitar otros problemas serios, por ejemplo, que el costo fuera más que elesperado.

9. La organización del trabajo de campo

Las encuestas extensas tienen muchos problemas de orden administra-tivo. Se debe supervisar al personal y entrenarlo para que apliquen lasencuestas y los métodos de medición apropiadamente. De ahí que sea útilun procedimiento de verificación previo de la calidad de las respuestas.Se debe hacer un plan para manejar las respuestas en blanco, es decir,la falla del encuestador para obtener la información de ciertas unidadesmuestrales (Lohr, 2000 [9]).

10. Resumen y análisis de los datos

Después de realizar las encuestas deben revisarse los cuestionarios ob-tenidos con la esperanza de corregir errores o cuando menos desecharlos datos equivocados. Habrá que decidir respecto al cálculo en caso deomisión de respuestas o la eliminación de datos durante la revisión. De-spués se hacen los cálculos para las estimaciones. Como vimos, los mis-mos datos pueden servir para diferentes métodos de estimación.

Un consejo práctico para la presentación de los datos es informar acercade la magnitud esperada del error en las estimaciones más importantes.Una de las ventajas del muestreo probabilístico es que se pueden hacertales enunciados (el error esperado).

11. La información para encuestas futuras

Cuanta más información de una población se tenga inicialmente, másfácil será el diseño de una encuesta que arroje estimaciones adecuadas.Toda muestra obtenida es una guía potencial de futuros muestreos porlos datos que revela sobre las medias, las desviaciones estándares y la na-turaleza de la variabilidad de las medidas principales, así como los costoseconómicos. Las prácticas de muestreo avanzarán más rápidamente si seprevé lo necesario para reunir y registrar ese tipo de información.

Hay otro aspecto importante en el que una muestra completa facilita laobtención de otras posteriores: el encuestador habilidoso aprende a re-conocer los errores de ejecución y a evitar que se repitan.

21

Page 33: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

2.16. Las ventajas y desventajas del muestreo

Las ventajas

Aunque el objetivo del muestreo, al igual que muchas otras disciplinas, con-siste en emplear recursos mínimos para obtener determinada información,o bien en conseguir la máxima información con recursos prefijados (Brad-burn,1998 [5]).

Los criterios generales para el uso de las técnicas de muestreo se puedenresumir en los siguientes puntos:

Se empleará el muestreo cuando la población sea tan grande que el censoexceda las posibilidades del investigador.

Se tomarán muestras cuando la población sea suficientemente uniformecomo para que cualquier muestra dé una buena presentación de la mis-ma.

Se tomarán muestras cuando el proceso de medida o investigación de loscaracteres de cada elemento sea destructivo (consumo de un artículo parajuzgar su calidad, determinación de una dosis letal, etcétera.).

Se utilizará el muestreo cuando las personas respondan con desagrado yasí disminuir el número de elementos que serán encuestados.

Se utilizarán las técnicas de muestreo para reducir costos, considerandotanto el costo absoluto como el costo relativo (con relación a la cantidadde información obtenida). Este criterio suele conocerse como el criterio deeconomía.

El muestreo es conveniente cuando la precisión (el ajuste del valor esti-mado al valor real de la característica en estudio) resulta ser muy buena.Este criterio suele conocerse con el nombre de criterio de calidad.

El muestreo es conveniente cuando la formación del personal y la inten-sidad de los controles y supervisión son onerosos.

En general, el muestreo será conveniente cuando constituya la soluciónde mayor eficiencia en el sentido del costo-beneficio.

Las desventajas

A veces el muestreo no es muy conveniente (Bradburn,1998 [5]). Por ejemplo:

Cuando se necesita información de todos los elementos que conforman lapoblación.

Cuando sea difícil cumplir con los requisitos de las técnicas de muestreoprobabilístico.

22

Page 34: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

El muestreo exige menos trabajo material que una investigación exhaus-tiva, pero más refinamiento y preparación (conocimientos adecuados delos diseñadores y preparación de los entrevistadores, inspectores y su-pervisores), lo que puede suponer un uso limitado.

Cuando el costo por unidad, que es mayor en las encuestas que los cen-sos, aconseje desestimar los métodos de muestreo.

2.17. Las características deseables en una inves-tigación por muestreo

Las características óptimas a las cuales deberían ajustarse las investiga-ciones por muestreo, son las siguientes:

Precisión: la proximidad al valor verdadero de las características poblacionalesestimadas.

Pertinencia: la capacidad de los resultados estadísticos obtenidos por muestreopara completar la información faltante.

Oportunidad: la utilidad de un estudio estadístico en función de su disponi-bilidad en el tiempo (puntualidad, rapidez y actualidad). En el caso de censosy grandes encuestas es aconsejable la publicación de resultados preliminaresbasados en muestras o submuestras.

Accesibilidad: aunque se disponga de un banco de datos informatizado, puedehaber dificultades legales para utilizarlo (la protección de la privacidad, el se-creto estadístico y la ley de la función estadística pública). La informaciónobtenida por muestreo ha de ser totalmente accesible, así como tener en cuen-ta la legislación vigente al momento del diseño del estudio por muestreo.

Detalle y cobertura: la población que posee datos extensos puede complemen-tar una investigación exhaustiva con una muestra.

Economía: las consideraciones sobre costos en las diferentes etapas de planifi-cación, el levantamiento y procesamiento de datos, la evaluación, el análisis yla publicación pueden indicar la inconveniencia de una investigación exhaus-tiva. Luego, este criterio ha de tenerse siempre presente a la hora de planificaruna investigación por muestreo.

Integración: Hay que tener una buena concepción global de la informacióny una buena comparabilidad. La información obtenida en la investigación pormuestreo ha de ser integrable y comparable con otras informaciones existenteso futuras.

23

Page 35: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

2.18. Errores de las encuestas

En general, en las encuestas puede haber varias fuentes de error (Brad-burn,1998 [5]), como las siguientes:

1. Error de muestreo o de estimación. Error al que estamos expuestos cuan-do sólo se miden las unidades correspondientes a una muestra de lapoblación, es decir, cuando sólo se estudia una fracción de la población.Este error es particular para cada una de las muestras posibles de tamañon, y se define como la diferencia entre el valor del estimador y el valor delparámetro.

2. Error de marco. Es el que se presenta debido a los problemas en la elabo-ración del marco de muestreo. Tales problemas ocurren al construir mar-cos incompletos, al no incluir todas las unidades de muestreo que son deinterés, o bien al incluir unidades ajenas a la población.

3. Error de respuestas en blanco. Este error se presenta a consecuencia delas fallas u obstáculos para medir algunas unidades de la muestra se-leccionada. Así, la respuesta en blanco puede ocurrir por omisión o nolocalización de algunas unidades, así como por la renuncia o imposibili-dad de medir algunas unidades.

4. Error de medición. Ocurre al medir las características de una unidad. Sepresenta porque el método de medición puede estar sesgado o es impre-ciso y algunas veces, como en el caso de poblaciones humanas, algunascaracterísticas son difíciles de medir, ya sea porque la persona entrevis-tada no posee la información exacta o da una respuesta incorrecta a lacaracterística de interés. Tal es el caso, por ejemplo, en la medición del in-greso familiar, el padecimiento de cierta enfermedad, el número de abor-tos por persona, las ganancias obtenidas en el negocio anterior, etcétera.

5. Error de procesamiento. Es el error que se puede cometer en la edición,codificación y tabulación de la información obtenida de la encuesta. Cuan-do la información se recolecta mediante una enumeración total se estáexpuesto a cometer los cuatro últimos errores. Si la recolección se realizamediante un muestreo, entonces estaremos expuestos a los cinco erroresy en tal caso a los cuatro últimos se les denomina errores no debidos almuestreo.

2.19. Muestra preliminar o piloto

Una muestra preliminar o piloto es una muestra que antecede a la definiti-va, cuya selección se hace de acuerdo a los lineamientos que marca el diseñode muestreo que se utilizará en el estudio definitivo.

La muestra preliminar juega un papel importante en el diseño de un estu-dio por muestreo, ya que será la fuente de información más inmediata para:

24

Page 36: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

1. Tener una primera aproximación de los costos que se involucran en elestudio.

2. Tener una primera aproximación del tiempo que se llevará en la real-ización del estudio.

3. Estimar los parámetros involucrados en la determinación del tamaño demuestra, usualmente la varianza y el coeficiente de variación.

4. Probar la factibilidad de: los métodos de selección de las unidades mues-trales, la medición de las variables y otros aspectos prácticos.

5. Probar la factibilidad del cuestionario.

6. Definir la precisión de los estimadores cuando no se tiene idea de losvalores entre los cuales ésta (precisión) puede considerarse razonable.

Algunos autores sugieren que la muestra preliminar podrá considerarse co-mo parte de la muestra definitiva, solamente cuando los métodos de selección,medición, incluyendo el cuestionario, no hayan sufrido cambios o modifica-ciones severas.

2.20. La precisión de la estimación

Cuando realizamos un estudio por muestreo es importante preguntarnos¿cuál es la cantidad de error tolerable o la precisión de la estimación?. Lapersona que utilizará los resultados del muestreo debe definir el error, puesconoce el fenómeno en cuestión y lo delicado de las conclusiones que se de-sprendan del análisis. Así, en el muestreo probabilístico es usual referirse a laprecisión de la estimación en los términos siguientes:

a) Como un límite máximo que se fija de antemano para la varianza, la desviaciónestándar o el coeficiente de variación del estimador. En este libro, este límitemáximo para todos los diseños de muestreo a estudiar se fijará en términos dela desviación estándar del parámetro de interés.

b) Como un límite máximo de error y una confiabilidad, ambos establecidosde antemano.

De igual manera es común denominar al error máximo como precisión delestimador, ésta se define como:

Precisión: es el alejamiento o distancia máxima que el investigador está dis-puesto a aceptar entre el estimador y el parámetro correspondiente (Cochran,1985 [1]). De este modo, θ denota al parámetro y θ su estimador; entonces, laprecisión del estimador, denotada por d, se define como:

d = |θ − θ|Esto significa que debemos especificar que θ y θ difieren en valor absoluto enuna cantidad menor que d.

25

Page 37: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

Confiabilidad: es el grado de seguridad deseado en la precisión, y se mideen términos de probabilidad, aunque se interpreta con base en el de muestreorepetido (Cochran, 1985 [1]). Así,

1 − α = confiabilidad,

donde α toma valores entre 0 y 1. La confiabilidad, generalmente, se expresaen porcentaje y los valores usuales son desde 80 %, observándose con más fre-cuencia 90 % y 95 %.

El postulado probabilístico siguiente especifica la relación entre los términosprecisión y confiabilidad:

P ⌊|θ − θ| ≤ d⌋ = 1 − α,

que es igual aP ⌊−d ≤ θ − θ ≤ d⌋ = 1 − α (2.1)

La ecuación anterior indica que la probabilidad de que la diferencia entre elestimador y el parámetro tome valores dentro de un intervalo delimitado porlos valores −d y d, es 1 − α. La determinación de un límite específico con suconfiabilidad asociada (1 − α) nos ayuda a comparar diseños diferentes (méto-dos de selección de la muestra) para especificar el procedimiento que dé laprecisión deseada con un costo mínimo.

2.20.1. Elementos para elegir la precisión o margen de error

Para los investigadores no experimentados en el diseño de encuestas o es-tudios donde se necesitan muestras para hacer inferencia hacia la poblaciónfijar la precisión es una labor confusa. Debido a que cuando por primera vez sepregunta a estas personas el grado de precisión deseado a menudo confiesanque nunca han considerado el asunto y que no tienen idea de la respuesta. Sinembargo, la elección adecuada de la precisión es fundamental para la toma dedecisiones acertadas por lo que a continuación proporcionamos algunos ele-mentos para su determinación.

Si la variable a medir es dicotómica recomendamos una precisión menor delocho por ciento. Por ejemplo, si se desea estimar y comparar los porcenta-jes de personas que tienen diabetes en dos estados de la republica Mexicana,podríamos elegir una precisión de cinco por ciento; sin embargo, si se tieneinformación de que los porcentajes en ambos estados son muy similares parapoder tomar una decisión más certera sobre si el porcentaje de diabéticos entrelos estados es distinto debemos de elegir un porcentaje de error mas pequeñodigamos 2.5 %, para poder discriminar con mayor confiabilidad. Ahora, supon-ga que la secretaría de Economía desea estimar en el país el porcentaje defamilias que tienen ingresos menores de 2,000 pesos mensuales para conocerel porcentaje de familias que viven en extrema pobreza, por tanto en este casose puede elegir una precisión de 7 % y con los resultados obtenidos se tendráuna imagen bastante clara de el porcentaje de familias en esta situación. Sin

26

Page 38: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

embargo, si la secretaría de economía además persigue implementar un pro-grama para subsidiar con 1000 pesos mensuales a cada una de las familias eneste estrato, por lo tanto una estimación con un error de 7 % puede provocarque al momento de implementar dicho programa el presupuesto para tal finno alcance, por lo que se sugiere un error más pequeño.

Si la variable respuesta es continua de igual manera recomendamos una pre-cisión menor del ocho por ciento del promedio verdadero o estimado. Estosignifica que para poder estimar la precisión del promedio o el total se necesitatener idea del valor verdadero del promedio o total verdadero, en caso de queno se tenga idea de estos se pueden estimar a partir de una muestra prelimi-nar (piloto). Por ejemplo, suponga que un nutriólogo desea estimar el promediode calorías consumidas de niños de 6 años de edad en el estado de Colima, co-mo experto el sabe que el consumo promedio de calorías por niño debe ser de400. Por lo tanto, él puede elegir una precisión de 20 calorías, que representael 5 % del promedio de consumo recomendado (d = 0.05 ∗ 400 = 20). En estecaso el nutriologo es un experto y tiene una idea bastante clara del valor delpromedio, pero suponiendo que no tiene la mas remota idea de este valor, elpuede estimar este promedio con una muestra piloto y obtener su precisióntambién multiplicando el 0.05 por el promedio de la muestra preliminar. Aho-ra, suponga que un investigador desea conocer el consumo promedio en pesosde energía eléctrica por hogar en el estado X. Además, suponga que no tienela mínima idea, por lo tanto él puede proceder a consultar a un experto en eltema o realizar un muestreo piloto y con base en esto tener una estimacióntentativa del promedio. Suponga que ya obtuvo el promedio preliminar (500pesos mensuales por hogar), por lo tanto la precisión que utilizará para cal-cular su muestra definitiva será igual a 25 que equivale al 5 % del promediopreliminar d = 0.05 ∗ 500 = 25. Si además, el investigador desea comparar endicho estado los consumos promedios entre los distintos municipios que sabetienen un desarrollo económico similar, quizá sea necesario una precisión máspequeña. Pero, por el contrario suponga que si solo es de su interés compararlos municipios del norte, centro y sur que sabe que de antemano son distintosla precisión es aceptable.

Por otro lado, si el parámetro que se desea estimar es el total ya sea a partir devariables dicotómicas o continuas se procede de igual forma y se recomiendaun error menor del 8 % del total preliminar. Por ejemplo si se desea estimar eltotal de drogadictos en el estado de Colima para el año 2008, para fijar la pre-cisión necesitamos una estimación tentativa del total. Supongamos que estees de 5000, por lo tanto la precisión será d = 0.05∗5000 = 250, es decir el 5 % deltotal preliminar. Esta forma de estimar la precisión del total es exactamente lamisma (d=(porcentaje/100)* valor preliminar del parámetro a estimar) que paraestimar la precisión para una proporción o un promedio. Por lo tanto, el lectordebe siempre recordar que la precisión se debe de calcular para el parámetrode mayor interés en su investigación ya que de lo contrario debe de determi-nar una precisión para cada parámetro y con ello obtener más de un tamañode muestra lo cual además de desgastarlo lo puede confundir. También, hayque dejar claro que si se determina la precisión usando la expresión que pre-sentamos anteriormente, d=(porcentaje/100)* valor preliminar del parámetro a

27

Page 39: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

estimar), el tamaño de muestra requerido usando el mismo porcentaje de errorpara estimar la proporción o total será el mismo. Lo mismo ocurrirá con eltamaño de muestra para el promedio y el total.

La forma que se sugiere para determinar la precisión tiene la ventaja de que esen términos relativos no absolutos, esto facilita el proceso porque es fácil fijarun error en términos de porcentaje ya que de esta manera uno tiene claro lamagnitud del error, mientras que tratar de fijar el error en términos absolutoses complicado ya que un valor pequeño puede ser un error relativo (porcentaje)muy pequeño que requerirá tamaños de muestras muy grandes o muy grandeque me proporcionara tamaños de muestra muy pequeños y resultados pococonfiables.

También es importante mencionar que el nivel de precisión se decidirá porla cantidad de recursos disponibles para el estudio, ya que se pueden obtenerresultados muy confiables con precisiones muy bajas, pero esto implica ma-yores costos. Por otro lado, sugerimos en la medida de lo posible para estimarla precisión extraer una muestra piloto para obtener las estimaciones prelimi-nares de los parámetros, conocer la calidad del cuestionario, las dificultadesde los encuestadores, los problemas del marco de muestreo y detalles que nosauxilien en el diseño de la encuesta definitiva. Finalmente, también es impor-tante dejar claro que en la mayoría de las encuestas donde se trabaja conpersonas los márgenes de error mas usados son 3 % y 5 %, ya que garantizanresultados bastante confiables y con costos razonables.

2.21. Uso de tablas para la distribución normal es-tándar y t-student

2.21.1. Distribución normal estándar para n > 30

Es conveniente mencionar que cuando el tamaño de la muestra es mayora 30, los valores de la distribución t-student son muy cercanos a los de ladistribución normal estándar, por lo cuál a menudo se utilizan los valores deésta última distribución en vez de la primera. Se debe tener presente que Zrepresenta a una variable aleatoria que tiene una distribución normal, conmedia cero (µ =0) y desviación estándar uno (σ = 1), mejor conocida comodistribución de probabilidad normal estándar. Casi siempre se usa la letra Zpara indicar esta variable aleatoria normal especial. Como con otras variablesaleatorias continuas los cálculos de probabilidad con cualquier distribuciónnormal, se llevan a cabo determinando las áreas bajo la grafica de la función dedensidad de probabilidad, por ejemplo supongamos que se requiere encontrar:

I. La probabilidad de que una variable aleatoria de una distribución normalestándar sea menor a 1.75, es decir, P (Z < 1.75). Para encontrar tal proba-bilidad hacemos uso del Cuadro A.1(Apéndice A), en el cual nos ubicamosen la hilera correspondiente al valor de 1.70 de Z sobre la primer colum-na y en la columna correspondiente al valor de 0.05 de Z sobre la primerhilera, e interceptando la hilera y columna ya ubicadas, encontramos que

28

Page 40: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

la probabilidad correspondiente es igual a 0.9599. Lo anterior se muestraen el Cuadro 2.1.

Cuadro 2.1: Ejemplo 1 para el uso de las tablas de la normal estándarZ

Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.090.00 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

.

.

.1.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

.

.

.3.80 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.99993.90 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

Debido a la relación existente, P (Z > Z0) = 1 − P (Z < Z0), solamente seejemplifica el uso del Cuadro A.1 para obtener la probabilidad de que unavariable aleatoria normal estándar sea menor a un valor especifico Z0 .

II. La probabilidad de que una variable aleatoria normal estándar se encuen-tre entre 1.64 y 1.98, esto es, P (1.64 < Z < 1.98). Encontrar P (1.64 < Z <1.98) es relativamente sencillo solamente recordando la siguiente relación:P (1.64 < Z < 1.98) = P (Z < 1.98) − P (Z < 1.64), con la cual únicamente esnecesario hacer lo que se hizo en I. para cada componente de la resta .Por tanto, al obtener de tablas P (Z < 1.98) = 0.9761 y P (Z < 1.64) = 0.9495se tiene que P (1.64 < Z < 1.98) = 0.9761 − 0.9495 = 0.0267. Ver Cuadro 2.2.

Cuadro 2.2: Ejemplo 2 para el uso de las tablas de la normal estándarZ

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.090.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

.

.

.1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

.

.

.3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.99993.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

III. Ahora supóngase que se requiere encontrar el valor de Z0 tal que la prob-abilidad de que una variable aleatoria normal estándar sea igual a 0.975,es decir, P (Z > Z0) = 0.975. En este caso se procede de manera inversa quea I., es decir, ahora se tiene la probabilidad y se busca el valor de Z0. Por lotanto, se busca en el Cuadro A.1(Apéndice A) el valor de probabilidad máscercano a 0.975 y se encuentra que éste es exactamente el mismo (0.975).En seguida se obtienen los valores de Z para éste valor de la columna ehilera en que se ubica (ver Cuadro 2.3). En este caso el valor de Z en lacolumna es de 0.06 y en la hilera 1.90, por lo que Z0 = 1.90 + 0.06 = 1.96.

Sin embargo, hay que tener presente que en la práctica el investigador loque fija para su estudio es la confiabilidad (1 − α) y para ésta confiabili-dad se debe encontrar el valor de Z0. Por ello, a continuación se muestra

29

Page 41: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

como llegar a partir de una confiabilidad especificada al valor de Z0 = Zα/2.

Suponga que el investigador decide para su estudio una confiabilidad de90 %. Así, el nivel de significancia en término de proporción será α = 0.1,lo que implica que el valor de tablas que se busca es Z0 = Zα/2 = Z0.05,que expresado en términos de probabilidad es equivalente a encontrarZ0.05 tal que P (Z < Z0.05) = 0.95. Por lo tanto, se busca en el Cuadro A.1(Apéndice A) el valor de probabilidad más cercano a 0.95 y se encuentraque éste es igual a 0.9495. Luego, para éste valor, se obtienen los valoresde Z de la columna e hilera en que se ubica (ver Cuadro 2.3), para estecaso el valor de Z en la columna es 0.04 y el de la hilera 1.6, por lo queZ0 = Zα/2 = Z0.05 = 1.6 + 0.04 = 1.64.

Un ejemplo más para garantizar el uso adecuado de esta tabla. Supongaque ahora el investigador decide una confiabilidad de 85 %; este implica unα = 0.15. Por lo tanto, el valor de tablas que se busca es Z0 = Zα/2 = Z0.075;en términos de probabilidad buscamos Z0 tal que P (Z < Z0) = 1 − 0.075 =0.925. Nuevamente se busca en el Cuadro A.1 (Apéndice A) el valor deprobabilidad más próximo a 0.9251 y se encuetra que es el mismo 0.9251.En seguida se obteinen los valores de Z para éste valor de la columna ehilera en que se ubica (ver Cuadro 2.3). Para este caso el valor de Z enla columa es igual a 0.04 y el de la hilera 1.4. De esta manera, Z0 =1.4 + 0.04 = 1.44. Es importante enfatizar que al usar esta tabla no seobtienen valores exactos, sino aproximados.

Cuadro 2.3: Ejemplo 3 para el uso de las tablas de la normal estándarZ

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.090.00 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

.

.

.1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

.

.

.1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

.

.

.1.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

.

.

.3.80 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.99993.90 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

Finalmente, para facilitar el uso de esta tabla, en el Cuadro (2.4) se presen-tan los valores de Zα/2 para los niveles de confianza más usuales.

2.21.2. Distribución t-student para n ≤ 30

De igual manera el investigador fijará para su estudio la confiabilidad, por loque únicamente explicaremos como encontrar de tablas el valor de t0 para és-ta distribución a apartir de la confiabilidad y tamaño de muestra especificados.

Si el investigador fija una confiabilidad de 1 − α y tiene un tamaño demuestra n; esto implica que el valor de tablas que se desea es t0 = t(n−1,α/2),

30

Page 42: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 2.4: Valores de Zα/2 para los niveles de confianza de uso más comúnNivel de confianza α α/2 Zα/2

90 % 0.1 0.05 1.644995 % 0.05 0.025 1.9600

97.5 % 0.025 0.0125 2.241499 % 0.01 0.005 2.5758

que en términos de probabilidad equivale a encontrar t0 = t(n−1,α/2) tal queP (t < t0 = t(n−1,α/2)) = 1 − α/2. Para encontrar éste valor se hace uso del CuadroA.2 (Apédice A), cuyos valores corresponden a una distribución t-student conν = n − 1 grados de libertad que deja una probabilidad a la derecha de ellos deα/2. Por lo tanto, para usar la tabla se requiren únicamente los valores de α/2y los grados de libertad que se obtienen en función del tamaño de la muestra,para lo casos abordados en el presente libro ν = n−1. En seguida en la primeracolumna se localizan los grados de libertad ν y en la segunda hilera el valor deα/2, y en la intercepción de ésta hilera y columna se obtiene el valor de t0.

Por ejemplo, suponga que un investigador fija para su estudio una confia-bilidad de 90 % y que cuenta con un tamaño de muestra de n = 6; esto implicaque α = 0.1(en términos de proporción), entonces el valor de tablas que se deseaes t0 = t6−1,0.05,es decir, se busca el valor de t0 tal que P (t < t0) = 1 − 0.05 = 0.95.Para encontrar éste valor de t0, se busca en el Cuadro A.2 en la primera colum-na los ν = 6 − 1 = 5 grados de libertad y en la segunda hilera el valor α/2 = 0.05y en la intercepción se obtiene el valor de t0 = 2.0150 (ver Cuadro 2.5 ).

Para cerciorarnos de que no habrá dudas para obtener los valores t0 detablas proporcionamos otro ejemplo. Suponga que otro investigador fija parasu estudio una confiabiilidad de 98 % y cuenta con un tamaño de muestra den = 16. Por lo tanto, α/2 = 0.01 y el valor de tablas que se desea es t0 = t(15,0.01),que es equivalente a buscar el valor de t0 talque P (t < t0) = 1 − 0.01. Paraencontrar tal valor, en el Cuadro A.2 se busca en la primera columna los ν =16 − 1 = 15 grados de libertad y en la segunda hilera el valor de α/2 = 0.01 y enla intercepción de ésta hilera y columna se obtiene el valor de t0 = 2.6025 (verCuadro 2.5).

Cuadro 2.5: Ejemplo para el uso de las tablas de la distribución t-studentα/2

ν 0.25 0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.00051 1.0000 3.0777 6.3138 12.7062 31.8205 63.6567 127.3213 318.3088 636.6192

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

5 0.7267 1.4759 2.0150 2.5706 3.3649 4.0321 4.7733 5.8934 6.8688

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

15 0.6912 1.3406 1.7531 2.1314 2.6025 2.9467 3.2860 3.7328 4.0728

.

.

....

.

.

....

.

.

....

.

.

....

.

.

....

180 0.6759 1.2863 1.6534 1.9732 2.3472 2.6034 2.8421 3.1361 3.3454210 0.6757 1.2856 1.6521 1.9713 2.3442 2.5994 2.8370 3.1295 3.3375

31

Page 43: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 2. Conceptos básicos de estadística

32

Page 44: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3

Muestreo aleatorio simple

Que el muestreo es imperfecto,no lo vengo a discutir.

Pero es el mejor amigo,que ayuda a decidir.

OAML

EL muestreo sirve para determinar, de la mejor manera, las característicasque describan a la población. La cantidad de información que la muestra

aporte depende del tamaño de esta y de la variabilidad existente entre los ele-mentos de la población en cuanto a la característica o variable de interés. Elevaluador decide la forma de seleccionar la muestra y el número de unidadesmuestrales que se evaluarán, y con esto podrá controlar la calidad de la infor-mación extraída y la precisión requerida.

Aunque es común en los estudios muestrales evaluar varias característicaso variables simultáneamente en cada sujeto o unidad muestral, en el estudiodel muestreo probabilístico solamente se trabaja con una variable a la vez. Sise requiere, se pueden estudiar todas las variables pero una por una y al finalconjuntar los resultados. Puede ocurrir el caso que de dos o más variables me-didas se obtenga otra variable, y esta última sea la de interés, este caso debeconsiderarse como una forma de medición y la variable generada simplementeserá solamente otra variable.

Con la información proveniente de la evaluación de la muestra, podemoshacer inferencias sobre la población. La validez de tales inferencias dependefundamentalmente del diseño de muestreo, es decir, de la forma en que se ob-tuvo la muestra. Para que los principios de la probabilidad sean aplicables alhacer la inferencia, es necesario que la selección de la muestra se haga me-diante una técnica de muestreo probabilístico.

33

Page 45: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

Muestreo aleatorio simple (MAS)Se denomina muestreo aleatorio simple o completamente al azar, aldiseño que habiendo decidido que el tamaño de la muestra será den unidades de muestreo (o simplemente de tamaño n), le asigna lamisma probabilidad de ser la elegida a cada una de todas las mues-tras posibles de ese tamaño. Es decir, cualquiera de las muestrasdistintas que podemos obtener de la población tendrá la misma pro-babilidad de ser elegida (Cochran, 1985 [1]).

La definición anterior de MAS es equivalente a que cada una de las unidadesde la población tienen la misma probabilidad de ser seleccionadas (Raj D.(1972)[14]).

El MAS es el más sencillo que veremos en este libro y nos dará las basespara desarrollar diseños más elaborados.

3.1. Tipos de muestreo aleatorio simple

Si sabemos que cada muestra posible tiene la misma probabilidad de serelegida, nos preguntamos ¿cuántas muestras posibles existen? Para responderesta pregunta tendríamos que analizar dos aspectos: la selección con reempla-zo y la selección sin reemplazo.

Muestreo aleatorio simple con reemplazo

En el muestreo con reemplazo, si el tamaño de la muestra esn y el de la población es N , existen Nn muestras diferentes. Elprocedimiento de selección consiste en seleccionar una unidad quetiene la posibilidad de ser incluida nuevamente en la muestra. Estaopción genera fórmulas de estimación más fáciles, pero en la prác-tica tiene poco sentido medir más de una ocasión la misma unidadmuestral, salvo en diseños específicos u otros más elaborados en losque las complicaciones teóricas sugieren simplificar los supuestosen que se sustenta su análisis.

Muestreo aleatorio simple sin reemplazo

En el muestreo sin reemplazo se pueden construir tantas muestrasdiferentes como combinaciones se pueden hacer de N elementos detamaño n (NCn), cantidad que se calcula con:

NCn =N !

n!(N − n)!

El procedimiento de integración de la muestra difiere en que una vezseleccionada una unidad, ésta ya no podrá volver a ser seleccionada.

Conviene reiterar que la definición de MAS asigna la misma oportunidad acada muestra posible, lo que haría suponer que todas las muestras posibles

34

Page 46: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

deberían configurarse antes de seleccionarlas, lo cual sería imposible en pobla-ciones grandes. Simplemente obsérvese que el número posible de muestras deuna población con 100 unidades muestrales y una muestra de tamaño 15,

sin reemplazo es 100C15 =100!

15!(100 − 15)!= 2.53338 × 1017 y con reemplazo es

10015 = 1 × 1030 muestras posibles. Afortunadamente, la definición se satisfacesimplemente dejando que cada unidad muestral tenga la misma oportunidadde ser incluida en la muestra; esa probabilidad es n/N y solamente necesita-mos conocer una muestra, que será la que usaremos.

Cuando el tamaño de la población (N ) es muy grande con respecto al tamañode la muestra (n) y el muestreo se lleva a cabo con reemplazo, la probabilidadde que una unidad muestral sea elegida dos veces es muy pequeña. De hecho,la probabilidad de elección de cualquier unidad una sola vez también es muypequeña; de ahí que el muestreo aleatorio simple con reemplazo se aproximeal aleatorio simple sin reemplazo.

En lo sucesivo consideraremos el muestreo aleatorio simple sin reempla-zo, a menos que se indique otra cosa. También, es pertinente mencionar queeste diseño de muestreo recibe diferentes nombres, como muestreo simple alazar, muestreo completamente aleatorio o muestreo irrestricto al azar. Por el-lo, es conveniente aclarar el concepto cuando se usa una u otra denominación.

3.2. Selección de una muestra aleatoria simple

Una vez que se ha determinado el número de elementos a extraer de lapoblación, el paso siguiente consiste en seleccionarlos y definir cuales serán,de tal manera que cada uno tenga la misma probabilidad de ser seleccionado.

Existen muchos métodos para este fin, entre ellos:

Empleando una tabla de números aleatoriosEste método consiste en extraer n números de dicha tabla (Cuadro A.3)que estén comprendidos entre 1 y N . Para lo cual se inicia en cualquierpunto de la tabla elegido al azar, siguiendo una ruta predeterminada ytomando tantas columnas como dígitos tenga N (tamaño de la población).Recordándose que la extracción es sin reemplazo. Para que el lector pue-da hacer uso de esta tabla a continuación se proporcionan dos ejemplos:

a). Supongamos que queremos una muestra aleatoria de 4 personas deuna población de 15 individuos debidamente enumerados del 1 al 15.Para obtener las 4 personas elegimos una hilera y una columna aleato-riamente del Cuadro A.3. Suponemos que la hilera seleccionada es la23 y la columna es la 4 y decidimos utilizar los últimos dos digítos delextremo derecho del grupo de 5, que en este caso es el 10 (primer elemen-to de la muestra). Ahora podemos proceder en cualquier dirección para

35

Page 47: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

obtener los individuos que restan en la muestra. Si decimos proceder ha-cia abajo de la columna, el siguiente número (inmediatamente debajo del10) es el 06. Entonces, nuestra segunda persona en la muestra sería la6. Si seguimos, llegamos al 22, pero solamente hay 15 elementos en lapoblación. Por consiguiente, ignoramos el 22 y continuamos hacia abajode la columna y nos encontramos el 15. Así, nuestra tercera persona enla muestra es la 15. Para obtener la cuarta persona que conformará lamuestra continuamos hacia abajo de la columna y nos encontramos un58, luego un 83, 83, 59 y 96, pero recordando que nuestra población so-lamente es de 15 personas los ignoramos y continuamos hacia abajo de lacolumna. Aparece un 07, así que nuestro cuarto elemento en la muestraes la persona 7.

b). Ahora supongamos que tenemos una población de 9,000 individos(enumerados del 1 al 9,000) y necesitamos elegir una muetra aleatoria de10 de ellos. De igual manera que el ejemplo anterior, elegimos una hileray una columna aleatoriamente del Cuadro A.3. Suponemos que la hileraseleccionada es la 5 de la columna 6 y decidimos utilizar los últimos 4digítos del extremo derecho del grupo de 5, que en este caso es el 5,838(primer elemento de la muestra). Para obtener los restantes individuos dela muestra podemos proceder en cualquier dirección. Si decidimos pro-ceder hacia abajo de la columna, el siguiente número (inmediatamentedebajo del 5,838) es el 0525. Entonces, nuestro segundo individuo en lamuestra sería la 525. Siguiendo, encontramos que los restantes individu-os que conformarán la muestra son: el 2,351, 8,605, 2,564, 7,222, 5,232,7,291, 0393 y el 4,456 .

Extracción de papelitos numeradosEste método es sencillo, pero laborioso si la población es grande, y con-siste en hacer papelitos debidamente numerados entre 1 y N . Se mezclanperfectamente en una bolsa y se extraen sin reemplazo uno por uno hastacompletar n, el tamaño de la muestra.

3.3. Estimación de la media poblacional

Al evaluar variables cuantitativas, la media (µ) de la variable ”y” es el pará-metro que con mayor frecuencia nos interesa estimar. Este parámetro tiene lasiguiente definición,

Media de la población = µy = µ =

N∑

i=1

yi

N

Otro parámetro de gran interés es el total (τy) de la variable ”y” para toda lapoblación, cuya definición se presenta a continuación:

Total de la población = τy = Nµy =N

i=1

yi

36

Page 48: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

En ocasiones se omite el subíndice ”y” ya que el contexto esclarece a quévariable se refiere.

Como no tenemos acceso a todas las N unidades muestrales de dondeproviene cada yi debemos definir estimadores de los datos de la muestra.

3.3.1. Estimador de la media y del total muestral

µ = y =

n∑

i=1

yi

n(3.1)

τ = Ny (3.2)

A los valores que arrojan estos estimadores (expresiones 3.1 y 3.2) apor-tadas por Scheaffer (1987[2]) se denominan estimaciones. Los estimadoresson variables aleatorias que tienen propiedades estadísticas derivadas de laprobabilidad, mientras que las estimaciones son simplemente números conlas unidades de medición correspondientes.

Los estimadores poseen algunas propiedades estadísticas deseables comoel insesgamiento y la consistencia; sin embargo, la revisión y demostración deestas propiedades no es tema de este libro y los interesados pueden consultaralgún libro de inferencia estadística (Mood, et al., 1974 [4]).

3.3.2. Estimación de la varianza

La varianza es otro parámetro importante de la población, simbolizada porσ2. Con su ayuda se hacen inferencias probabilísticas sobre la estimación dela media; también refleja la variabilidad que existe entre los valores de lasvariables. Este parámetro se define por la expresión

σ2Y = σ2 =

N∑

i=1

(yi − µ)2

N − 1

Al igual que µ y τ , σ2 también tiene su estimador muestral, el cual se obtienede la muestra. Este estimador se denota como

S2y = S2 =

n∑

i=1

(yi − y)2

n − 1=

n∑

i=1

y2i − ny2

n − 1

Estimador de la media y la varianza de la media poblacional

µy = µ (3.3)

σ2y =

[

N − n

N

]

σ2y

n(3.4)

37

Page 49: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

Al no conocer los parámetros incluidos en estas expresiones (3.3 y 3.4,recurrimos a utilizar sus estimadores (Scheaffer, 1987 [2]).

µy = µ = y (3.5)

S2y =

[

N − n

N

]

S2y

n=

[

1 − n

N

] S2y

n= [1 − f ]

S2y

n(3.6)

f = n/N se llama fracción de muestreo y representa la proporción de la poblaciónque está incluida en la muestra, por lo que también se interpreta como la in-tensidad del muestreo.

El factor (N − n)/N se denomina corrección por población finita (CPF), quetambién se puede expresar como [1 − (n/N)], donde el cociente (n/N) es lafracción de muestreo (f). La importancia del factor de corrección se reduce amedida que la fracción de muestreo se hace más pequeña, es decir, cuando lamuestra representa una proporción menor de la población. Por la reducciónde esta magnitud, en ocasiones suele omitirse si la fracción de muestreo esmenor que 5 %, esto es, si f = (n/N) < 0.05.

Teniendo estos estimadores (3.5 y 3.6) y con las propiedades de la distribu-ción normal, podemos establecer estimaciones por intervalo, para el promedioy el total poblacional, esto se presenta adelante detalladamente.

Estimadores del total y la varianza del total poblacional

µτ = τ = Nµ (3.7)

σ2τ = Nσ2

y (3.8)

Como no conocemos los parámetros incluidos en estas expresiones (3.7 y 3.8),utilizamos sus estimadores muestrales.

Estimadores del total y de la varianza del total muestral

µτ = τ = Nµ = Ny (3.9)

S2τ = N2

S2y

n

[

N − n

N

]

(3.10)

Las expresiones 3.9 y 3.10 pueden simplificarse algebraicamente. Además,en lo sucesivo simplificamos las expresiones y notación para facilitar su lec-tura.

Por lo general, la desviación estándar de los estimadores, o sea, la raízcuadrada positiva de sus varianzas, se le conoce como error estándar de lamedia y del total, respectivamente.

3.3.3. Estimación por intervalo

Debemos tener presente que lo que nos interesa estimar es la media o el to-tal de la población, es decir, µ ó τ basándonos en la información de la muestra,

38

Page 50: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

esto es, y, S2y , τ y S2

τ que ya hemos calculado. Asimismo, suponiendo que losestimadores y y τ tienen una distribución normal, o aproximadamente normal,se puede estimar por intervalo la media y total poblacional.

Intervalo de confianza para la estimación de la media

y ± tn−1,(α/2)Sy (3.11)

donde Sy =

(

N − n

N

)

S2y

n.

Es necesario aclarar la interpretación del intervalo (3.11) y el significado delos términos que aún no se han definido. Desde el punto de vista del muestreorepetido, significa que del total de muestras posibles de tamaño n, aproximada-mente (1 − α)100 % de ellas producirá intervalos del tipo (3.11) que cubren elvalor del parámetro, y que en (α)100 % dará intervalos diferentes que no cubrenel valor del parámetro. Nótese que cuando calculemos

y0 − tn−1,(α/2)Sy y y0 + tn−1,(α/2)Sy

donde y0 indica el valor de la media muestral obtenido con la muestra especí-fica. Nótese que implícitamente se acepta un error de α100 %, esto es, que elvalor del parámetro no esté entre tales límites. tn−1,(α/2) representa el valor deuna variable t de Student con (n − 1) grados de libertad y que deja del ladoderecho de la curva una probabilidad de α/2. Este valor se obtiene de la dis-tribución t de Student. Es necesario mencionar que cuando el tamaño de lamuestra es grande, digamos mayor de 30, los valores de t son muy similares alos de una variable aleatoria con distribución normal estándar, por esta razónes común utilizar los valores de Zα/2 de la variable normal estándar en lugarde los valores tn−1,(α/2).

Intervalo de confianza para la estimación del total

τ ± tn−1,(α/2)Sτ (3.12)

donde τ = Ny, Sτ =

N2S2

y

n

[

N − n

N

]

= N

S2y

n

[

N − n

N

]

. El intervalo de confianza

es la referencia de mayor importancia para los resultados de un muestreo. Eltamaño del intervalo nos indica la precisión que se ha logrado en la estimacióndel parámetro de interés.

Por supuesto que siempre es deseable un intervalo pequeño, pero su am-plitud depende del nivel de confiabilidad y del error estándar del estimador.Si deseamos más confiabilidad el intervalo tendría que ampliarse como resul-tado de una t más grande. La mayor confiabilidad se paga con menor precisión.

Por su parte, el error estándar depende de la variabilidad de la población ydel tamaño de la muestra. El tamaño de la muestra es el factor que podemosmanipular para lograr una precisión deseada, ya que la varianza de y, y por lotanto el error estándar, es cero cuando el tamaño de la muestra es igual al dela población.

39

Page 51: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

3.3.4. Determinación del tamaño de la muestra

Determinar el tamaño de muestra y tomar la decisión de cuál tamaño ele-gir, es uno de los problemas importantes a que debe enfrentarse el usuariodel muestreo. En la determinación de n se deben considerar tanto el aspectoteórico como el práctico. Por un lado, es necesario identificar el parámetro olos parámetros que se deben estimar, el esquema de muestreo a usar, la elec-ción del estimador o los estimadores; asimismo, las especificaciones que serequieren hacer o que se desea que reúna un estimador, todo esto como partede la teoría. Por otro lado, el aspecto práctico tiene gran influencia en la de-cisión del tamaño de muestra a usar en definitiva, ya que deben tomarse encuenta factores como el dinero y el tiempo disponibles, el objetivo del estudio,la cantidad de información que se captará, la cantidad de personal especializa-do que se necesita, el tipo y la calidad de los materiales, los instrumentos nece-sarios para las mediciones, etcétera.

Aquí se presentará un procedimiento para calcular un tamaño de muestra,para estimar la media poblacional o el total poblacional bajo una medida dela calidad en la estimación. El procedimiento comprende la precisión del esti-mador con referencia a un error absoluto máximo permisible (la precisión) yuna confiabilidad dada.

Tamaño de la muestra para estimar la media

Vamos a estimar una sola media poblacional, digamos Y , mediante su esti-mador y bajo el MAS, utilizando la relación de precisión y confiabilidad de ladeclaración (2.1), en este caso el parámetro θ = Y , mientras que d y (1 − α)indican, respectivamente, la precisión y confiabilidad fijadas de antemano porel investigador. Además, suponemos y tiene una distribución normal en con-secuencia establecemos la precisión como:

d = tn−1,α/2Sy (3.13)

donde tn−1,α/2 es el valor de una variable aleatoria t de Student que deja del la-do derecho de la curva una probabilidad de α/2; y Sy es la raíz cuadrada de lavarianza de y. Formalmente, el desarrollo debe hacerse en términos de σ2 y node S2

y , pero en virtud de que el parámetro no se conoce, usamos su estimador.Hay que resaltar que la precisión en este caso (3.13) se fijó en términos de ladesviación estándar, pero también se puede fijar en términos de la varianza yel coeficiente de variación.

Por tanto, a partir de la expresión (3.13) se procede a despejar n:

d = tn−1,(α/2)Sy ⇔ d = tn−1,(α/2)

(

N − n

N

)

S2

n⇔ d2 = t2n−1,(α/2)

(

(N − n)S2

Nn

)

d2 = t2n−1,(α/2)

(

1 − n

N

) S2

n⇔ d2 = t2n−1,(α/2)S

2

(

1

n− 1

N

)

d2

t2n−1,(α/2)S2

=

(

1

n− 1

N

)

⇔ 1

n=

d2

t2n−1,(α/2)S2

+1

N

40

Page 52: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

1

n=

Nd2 + t2n−1,(α/2)S2

Nt2n−1,(α/2)S2

⇔ n =Nt2n−1,(α/2)S

2

Nd2 + t2n−1,(α/2)S2

Por lo tanto, se obtiene una ecuación que indica cómo calcular un tamañode muestra para la estimación de una media poblacional, en términos de unaprecisión y una confiabilidad preestablecidas:

n =Nt2n−1,(α/2)S

2

Nd2µ + t2n−1,(α/2)S

2(3.14)

n = tamaño de muestra estimado para estimar la media poblacional, Y . Esuna muestra estimada porque no se conoce la varianza poblacional (σ2) y ensu lugar se utiliza su estimador correspondiente (S2), que es igual a: S2 =

n∑

i=1

y2i − ny2

n − 1.

N = tamaño de la población, el cual es un valor conocido.

tn−1,α/2 = valor de una variable aleatoria t de Student o normal estándar quetiene a la derecha de la curva una probabilidad de α/2. Este valor se conoce alfijar la confiabilidad deseada.

dµ = alejamiento máximo permitido entre el estimador y el parámetro (la pre-cisión), el cual es un valor conocido y que establece el investigador.

S2 = varianza muestral. Este valor se obtiene con los datos de una muestrapreliminar de tamaño n′.

Hemos usado el subíndice µ en la precisión d, para aclarar que se trata dela precisión referida a la media; en este caso es el parámetro que se está esti-mando, pero podría ser que la estimación deseada fuera otro parámetro, comoel total τ o algún otro. Además es importante mencionar que esta varianzamuestral (S2) será calculada con base en una muestra preliminar de tamañon′, la cual sólo será de utilidad para calcular el tamaño de muestra definitivo,pero no para el proceso de cálculo de estimaciones por intervalo de confianza.El tamaño de muestra preliminar n′ se determina de manera arbitraria, perodependerá de los recursos económicos y humanos disponibles, así como deltiempo y las condiciones físicas y administrativas del estudio. Está claro quea medida que se incremente n′ la estimación de la varianza poblacional serámejor. En caso de no realizar una encuesta piloto para la estimación e la vari-anza se proponen las dos siguientes alternativas:

Especificar el valor aproximado de la varianza con base en experiencia deestudios anteriores.

Especificar el valor aproximado de la varianza mediante el conocimientoque se tenga sobre la forma de la distribución y el rango de variación delos valores de la variable bajo estudio.

41

Page 53: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

Se presenta el la Figura A.1, donde aparecen formúlas sencillas de las var-ianzas de distribuciones a apartir de la forma y el rango de variación de lavariable estudiada. Tablas similares son presentas por Deming (1966)[13] yKish (1950)[12].

Tamaño de muestra para estimar el total poblacional

De igual manera utilizando la relación de precisión y confiabilidad de la declaración(2.1), y considerando el parámetro θ = τ . Además, τ tiene una distribución nor-mal y por tanto: d = tn−1,α/2Sτ ,

donde Sτ =

N2

[

N − n

N

]

S2y

n= N

[

N − n

N

]

S2y

n. Despejendo n se obtiene una

ecuación que indica cómo calcular un tamaño de muestra para la estimaciónde un total poblacional, en términos de una precisión y una confiabilidadpreestablecidas:

n =N2t2n−1,(α/2)S

2

d2t + Nt2n−1,(α/2)S

2

n: tamaño de muestra para estimar el total poblacional.N : tamaño de la población.S2: varianza estimada en la población de interés.dτ : precisión de la estimación del total poblacional que estamos dispuestos aaceptar.

Conviene recordar que τ = Nµ, y dτ = Ndµ, por lo tanto, se puede usar lafórmula para el cálculo del tamaño de la muestra que más convenga, sabiendocómo pasar de una a otra en las estimaciones de µ ó τ .

3.3.5. Ejemplos

Ejemplo 1. IBM produce semanalmente N = 1, 000 computadoras, de dondeel gerente de calidad seleccionó al azar una muestra n = 10 computadoras. Lainformación sobre el número de fallas encontradas en cada una de las com-putadoras se muestra a continuación: 6, 7, 9, 8, 5, 4, 7, 8, 7 y 6.

a) Haga una estimación puntual del promedio de fallas por computadora.

y =y1 + y2 + · · · + yn

n

y =6 + 7 + 9 + 8 + 5 + 4 + 7 + 8 + 7 + 6

10= 6.7

b) Calcule la varianza muestral del número de fallas (S2)

S2 =

n∑

i=1

y2i − ny2

n − 1

42

Page 54: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

S2 =62 + 72 + . . . + 72 + 62 − 10(6.7)2

9= 2.2333

c) Calcule la varianza y la desviación estándar de la media muestral delnúmero de fallas

S2y =

(

N − n

N

)(

S2

n

)

S2y =

(

1, 000 − 10

1, 000

)(

2.2333

10

)

S2y = (0.99)(0.2233) = 0.221

Sy =√

S2y =

√0.221 = 0.4702

d) Calcule un intervalo de confianza (IC) del promedio de fallas por com-putadora con una confiabilidad de 95 %.

y ± tn−1,α/2Sy

donde: y = 6.7, Sy = 0.4702 y tn−1,α/2 = t10−1,0.025 = 2.262

Por lo tanto,

6.7±(2.262)(0.4702)6.7±1.06345.6366≤ µ ≤7.7634

Es decir, con una confiabilidad de 95 % se estima que el valor verdadero delpromedio de fallas por computadora está entre 5.6366 y 7.7634.

e) Realice una estimación puntual del total de fallas.

τ = Ny=(1,000)(6.7)=6,700

f) Calcule un IC del total de fallas con la confiabilidad de 95 %

τ ± Ntn−1,α/2Sy

donde: τ = 6, 700, N = 1, 000, Sy = 0.4702 y tn−1,α/2 = t10−1,0.025 = 2.262

Por lo tanto,

6,700±(1,000)(2.262)(0.4702)6,700±(1,000)(1.0634)6,700±1,063.45,636.6≤ τ ≤7,763.4

43

Page 55: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

Es decir, con 95 % de confianza se estima que el total de fallas en la poblaciónestá entre 5,636.6 y 7,763.4.

g) Suponga que las computadoras seleccionadas son una muestra prelimi-nar de tamaño n′ = 10. ¿Cuál sería el tamaño de muestra necesario para esti-mar el promedio de fallas de tal manera que el promedio tenga una precisiónde 7 % del promedio preliminar (y) y una confiabilidad de 95 %?

n =N(tn−1,α/2)

2S2

Nd2 + (tn−1,α/2)2S2

donde: N = 1, 000, tn−1,α/2 = t10−1,0.025 = 2.262, S2 = 2.2333, y = 6.7

Como el valor de d no está definido en forma explícita se calcula obtenien-do 7 % del promedio preliminar (y = 6.7). Es decir, d = (0.07)(6.7) = 0.469,

Por lo tanto:

n =(1, 000)(2.262)2(2.2333)

(0.469)2 + (2.262)2(2.2333)= 49.38

Entonces, n = 50 es el número estimado de unidades muestrales (computa-doras) para que la muestra tenga una precisión de ±0.469 fallas con 0.05 deprobabilidad de no incluir en el intervalo de estimación al promedio verdadero.Es decir, n = 50 computadoras es el tamaño de muestra definitivo y todos losparámetros que se deseen estimar se deben de hacer tomando en cuenta estetamaño de muestra. Porque el muestreo preliminar o piloto únicamente es útilpara verificar que el cuestionario funciona bien al momento de aplicarlo, corro-borar que el marco de muestreo está correcto y obtener una estimación de lavarianza. Sin embargo, si en el muestreo piloto se encuentra que todo funcionacorrectamente, ya no se miden todas las unidades muestrales del tamaño demuestra definitivo (n), sino solamente las faltantes (n − n′) para completarlo,pues se utilizan las de la muestra piloto (n′). En este ejercicio solamente seseleccionarían 40 computadoras al azar de la población porque n′ = 10.

h) Suponga que las computadoras seleccionadas son una muestra prelimi-nar de tamaño n′ = 10. ¿Cuál sería el tamaño de muestra definitivo para es-timar el total poblacional de fallas de tal manera que sea estimado con unaprecisión de 7 % del total (τ) y con una confiabilidad de 95 %? La expresiónpara calcular el tamaño de muestra para estimar el total es:

n =N2(tn−1,α/2)

2S2

d2 + N(tn−1,α/2)2S2

donde: N = 1, 000, tn−1,α/2 = t10−1,0.025 = 2.262, S2 = 2.2333, τ = 6, 700. Tambiéncomo el valor de d no está definido en forma explícita se calcula obteniendo7 % del total poblacional preliminar (τ = 6, 700). Es decir, d = (0.07)(6, 700) = 469y por lo tanto:

44

Page 56: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

n =(1, 000)2(2.262)2(2.2333)

(469)2 + (1, 000)(2.262)2(2.2333)=

11, 427, 001.05

231, 388= 49.38

Nota: La n estimada es el tamaño de muestra definitivo, por lo que sólo faltarámedir las unidades muestrales restantes considerando las que ya se midieron.Esto procede siempre y cuando el muestreo piloto sea considerado apropiado.Esta nota es válida para todos los ejercicios posteriores incluso para los esque-mas de muestreo presentados en los capítulos restantes .

Ejemplo 2. La directora de Intercambio Académico y Becas de la Universi-dad de Colima selecciona una muestra de n = 15 estudiantes de la Facultadde Telemática cuya población es de N = 420 estudiantes, y a cada uno de losestudiantes le pregunta su gasto semanal en pesos. Los datos son: 120, 150,100, 80, 100, 90, 60, 70, 90, 100, 50, 90, 80, 65, 110.

a) Haga una estimación puntual del gasto semanal promedio por estudian-te.

y =y1 + y2 + · · · + yn

n

y =120 + 150 + 100 + . . . + 65 + 110

15= 90.3333

b) Calcule la varianza muestral para el gasto (S2)

S2 =

n∑

i=1

y2i − ny2

n − 1

S2 =1202 + 1502 + 1002 + · · · + 652 + 1102 − (15)(90.33)2

15 − 1

S2 = 637.381

c) Calcule la varianza y la desviación estándar de la media muestral para elgasto

S2y =

(

N − n

N

)(

S2

n

)

=

(

420 − 15

420

)(

637.381

15

)

= 40.9745

Sy =√

S2y =

√40.9745 = 6.4011

d) Calcule un intervalo de confianza (IC) del gasto promedio por estudiante.

y ± tn−1,α/2Sy

donde: y = 90.3333, Sy = 6.4011, tn−1,α/2 = t15−1,0.025 = 2.145

Por lo tanto:

45

Page 57: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

90.33±(2.145)(6.4011)90.33±13.729176.6043≤ µ ≤104.0624

Es decir, con una confiabilidad de 95 % se estima que el valor verdadero delgasto promedio por estudiante está entre 76.6043 y 104.0624.

e) Realice una estimación puntual del gasto total de los estudiantes.

τ = Ny=(420)(90.3333)=37,940

Se estima que el gasto semanal total de los estudiantes es de 37,940.0 pe-sos.

f) Calcule un IC del gasto total de los estudiantes con 95 % de confianza.

τ ± Ntn−1,α/2Sy

donde: τ = 37, 940, N = 420, Sy = 6.4011, tn−1,α/2 = t15−1,0.025 = 2.145

Por lo tanto:

37,940.0±(420)(2.145)(6.4011)37,940.0±(420)(13.7291)37,940.0±5766.222232,173.7938≤ τ ≤43,706.2062

Es decir, se estima que el gasto total de los estudiantes está entre 32,173.7938y 43,706.2062.

g) Suponga que los estudiantes seleccionados son una muestra preliminarde tamaño n′ = 15. ¿Cuál es el tamaño de muestra necesario para estimar elgasto promedio por estudiante de tal manera que el promedio se estime conuna precisión de ±6 pesos y con una confiabilidad de 95 %?

n =N(tn−1,α/2)

2S2

Nd2 + (tn−1,α/2)2S2

donde: N = 420, tn−1,α/2 = t15−1,0.025 = 2.145, S2 = 637.381, d = 6

Por lo tanto:

n =(420)(2.145)2(637.381)

(420)(6)2 + (2.145)2(637.381)= 69

Por lo tanto, 69 son las unidades muestrales (estudiantes) para tener unaprecisión de ±6 pesos con 0.95 de probabilidad de incluir en el intervalo de es-timación al promedio verdadero. En otras palabras se debe seleccionar aleato-riamente una muestra de n = 69 estudiantes de la población de N = 420, loque garantiza que se cumplirá la precisión especificada (d = 6 pesos) para el

46

Page 58: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

promedio con una probabilidad de 0.95.

h) Suponga que los estudiantes seleccionados son una muestra preliminarde tamaño n′ = 15. ¿Cuál es el tamaño de muestra definitivo para estimar eltotal poblacional del gasto de los estudiantes tal que el total sea estimado conuna precisión de 2,520 pesos y una confiabilidad de 95 %?

n =N2(tn−1,α/2)

2S2

d2 + N(tn−1,α/2)2S2

donde: N = 420, tn−1,α/2 = t15−1,0.025 = 2.145, S2 = 637.381, d = 2, 520

Por lo tanto:

n =(420)2(2.145)2(637.381)

(2, 520)2 + (420)(2.145)2(637.381)= 69

Ejemplo 3. El estado de Colima tiene N = 3, 000 familias, de las cuales se se-leccionó una muestra aleatoria de 12 . Se desea información sobre el númerode hijos que cada familia tiene en Estados Unidos. La información obtenida decada una de las n = 12 familias se presenta a continuación: 6, 3, 8, 5, 2, 1, 0,1, 1, 3, 4, 4.

a) Obtener el promedio de hijos que vive en Estados Unidos, por familia.

y =y1 + y2 + · · · + yn

n

y =6 + 3 + 8 + 5 + 2 + 1 + 0 + 1 + 1 + 3 + 4 + 4

12= 3.1667.

b) Calcule la varianza muestral (S2).

S2 =

n∑

i=1

y2i − ny2

n − 1

S2 =62 + 32 + 82 + · · · + 42 + 42 − (12)(3.17)2

12 − 1

S2 = 5.6061

c) Calcule la varianza de la media muestral (S2y ).

S2y =

(

N − n

N

)(

S2

n

)

=

(

3, 000 − 12

3, 000

)(

5.6061

12

)

= 0.4653

La varianza estimada del promedio de hijos viviendo en Estados Unidos porfamilia es de 0.4653. La desviación estándar es igual a: Sy =

S2y =

√0.4653 =

0.6821

d) El total de colimenses que radica en Estados Unidos.

47

Page 59: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

τ = Ny=(3,000)(3.1667)=9,500

e) Calcule un IC de 95 % de confianza del promedio de hijos por familia quevive en Estados Unidos.

y ± tn−1,α/2Sy

donde: y = 3.1667, Sy = 0.6821, tn−1,α/2 = t12−1,0.025 = 2.201

Por lo tanto:

3.1667±(2.201)(0.6821)3.1667±1.50141.6653≤ µ ≤4.6680

Es decir, con una confiabilidad de 95 % se estima que el valor verdadero delpromedio de parientes por familia en Estados Unidos se encuentra entre 1.6653y 4.6680.

f) Calcule un IC del total poblacional con 95 % de confiabilidad.

τ ± Ntn−1,α/2Sy

donde: τ = 9, 500, N = 3, 000, Sy = 0.6821, tn−1,α/2 = t12−1,0.025 = 2.201

Por lo tanto:

9,500±(3,000)(2.201)(0.6821)9,500±(3,000)(1.5014)9,500±4,504.24,995.9198≤ τ ≤14,004.0822

Es decir, con 95 % de confianza se estima que el total de colimenses que viveen Estados Unidos está entre 4,995.9198 y 14,004.0822.

g) Suponga que la muestra seleccionada corresponde a una muestra pre-liminar de tamaño n′ = 12. ¿Cuál es el tamaño de la muestra para estimar elpromedio de hijos por familia que radica en Estados Unidos de tal manera queel promedio sea estimado con una precisión de 0.5 parientes y con una confia-bilidad de 95 %?

n =N(tn−1,α/2)

2S2

Nd2 + (tn−1,α/2)2S2

donde: N = 3, 000, tn−1,α/2 = t12−1,0.025 = 2.201, S2 = 5.6061, d = 0.5

Por lo tanto:

n =(3, 000)(2.201)2(5.6061)

(3, 000)(0.5)2 + (2.201)2(5.6061)= 105

48

Page 60: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

h) Suponga que la muestra seleccionada es una muestra preliminar detamaño n′ = 12. ¿Cuál es el tamaño de muestra para estimar el total de col-imenses que vive en Estados Unidos tal que el total sea estimado con unaprecisión de 1,500 parientes y una confiabilidad de 95 %?

n =N2(tn−1,α/2)

2S2

d2 + N(tn−1,α/2)2S2

donde: N = 3, 000, tn−1,α/2 = t12−1,0.025 = 2.201, S2 = 5.6061, d = 1, 500

Por lo tanto:

n =(3, 000)2(2.201)2(5.6061)

(1500)2 + (3000)(2.201)2(5.6061)= 105

Ejemplo 4. El gobernador del estado de Colima, a través de la Secretaría deSalud, desea estimar el total de drogadictos que hay en la entidad. El estadotiene N = 900 colonias de las cuales se seleccionó una muestra aleatoria de 12colonias. En cada colonia se investigó el número de drogadictos. La informa-ción obtenida de cada una de las n′ = 12 colonias se presenta a continuación:16, 13, 18, 15, 22, 21, 10, 11, 8, 33, 34, 24.

a) Calcule el promedio de drogadictos por colonia en el estado.

y =y1 + y2 + · · · + yn

n

y =16 + 13 + 18 + 15 + 22 + 21 + 10 + 11 + 8 + 33 + 34 + 24

12= 18.75

drogadictos por colonia.

b) Calcule la varianza muestral (S2).

S2 =

n∑

i=1

y2i − ny2

n − 1

S2 =162 + 132 + 182 + · · · + 342 + 242 − (12)(18.75)2

12 − 1

S2 = 71.4773

c) Calcule la varianza y la desviación estándar del promedio muestral.

S2y =

(

N − n

N

)(

S2

n

)

=

(

900 − 12

900

)(

71.4773

12

)

= 5.8770

Sy =√

5.8770 = 2.4242

Sy =√

S2y =

√5.8770 = 2.4242

d) El número total de drogadictos en el estado.

49

Page 61: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

τ = Ny=(900)(18.75)=16,875

e) Calcule un IC para el promedio de drogadictos por colonia en el estado.

y ± tn−1,α/2Sy

donde: y = 18.75, Sy = 2.4242, tn−1,α/2 = t12−1,0.025 = 2.201

Por lo tanto:

18.75±(2.201)(2.4242)18.75±5.335813.4142≤ µ ≤24.0858

Es decir, con una confiabilidad de 95 % se estima que el valor verdadero delpromedio de drogadictos por colonia en el estado de Colima está entre 13.4142y 24.0858.

f) Calcule un IC para el total de drogadictos en el estado de Colima con 95 %de confiabilidad.

τ ± Ntn−1,α/2Sy

donde: τ = 16, 875, N = 900, Sy = 2.4241, tn−1,α/2 = t12−1,0.025 = 2.201

Por lo tanto:

16,875±(900)(2.201)(2.4242)16,875±(900)(5.3358)16,875±4,802.2212,072.82243≤ τ ≤21,677.1776

Es decir, con 95 % de confianza se estima que el total de drogadictos en elestado de Colima está entre 12,072.82243 y 21,677.1776.

g) Suponga que n′ = 12 es una muestra preliminar. ¿Cuál es el tamaño demuestra para estimar el promedio de drogadictos por colonia, con una pre-cisión de ±2 drogadictos y una confiabilidad de 95 %?

n =N(tn−1,α/2)

2S2

Nd2 + (tn−1,α/2)2S2

donde: N = 900, tn−1,α/2 = t12−1,0.025 = 2.201, S2 = 71.4773, d = 2

Por lo tanto:

n =(900)(2.201)2(71.4773)

(900)(2)2 + (2.201)2(71.4773)= 79 colonias.

50

Page 62: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

h) Suponga que n′ = 12 es una muestra preliminar. ¿Cuál es el tamaño demuestra para estimar el total de drogadictos en el estado, con una precisiónde 1800 drogadictos y una confiabilidad de 95 %?

n =N2(tn−1,α/2)

2S2

d2 + N(tn−1,α/2)2S2

donde: N = 900, tn−1,α/2 = t12−1,0.025 = 2.201, S2 = 71.4773, d = 1, 800

Por lo tanto,

n =(900)2(2.201)2(71.4773)

(1, 800)2 + (900)(2.201)2(71.4773)= 79 colonias.

3.4. Ejercicios

En los siguientes ejercicios estime lo siguiente:

a) El IC para el promedio y el total con una confiabilidad de 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar el promedio y el total con una precisióndel 5 % de la media y el total preliminar, con una confiabilidad de 95 %?

Ejercicio 1. Una empacadora de mango produce por hora N =1,000 rejas,cada una tiene 100 mangos, donde el gerente de calidad seleccionó una mues-tra de N =15 rejas. La información sobre el número de mangos dañados porrejas se presentan a continuación: 4, 5, 6, 6, 7, 4, 4, 5, 4, 5, 6, 6, 7, 4, 5.

Ejercicio 2. La Secretaría del Deporte del Estado de Colima, desea estimarlos alumnos a nivel bachillerato de la U de C que tienen una buena condiciónfísica para formar parte de la selección. Se tienen N =500 grupos y en prome-dio cada grupo tiene 40 alumnos. Se seleccionaron a 9 grupos aleatoriamente.En cada grupo se hicieron las pruebas necesarias. La información obtenida delos alumnos seleccionados es la siguiente: 5, 8, 6, 12, 5, 9, 11, 12, 10(alumnospor grupo que tienen condición física decuada)

Ejercicio3. Una exportadora de limón por cada hora acondiciona N =1,800limones. Se desea saber si el limón cumple con las especificaciones para eldiámetro. Para ello se toma una muestra de 15 limones aleatoriamente y a ca-da uno de ellos se le mide su diámetro. Los resultados son los siguientes: 3.2,4.8, 4.4, 3.1, 3, 5.1, 2.9, 5.3, 4.1, 3.1, 3.7, 2.6, 5.5, 2.6, 5.9.

Ejercicio 4. La Secretaría de Turismo del estado de Colima, desea estimarla cantidad de personas que visitan el Estado provenientes de Jalisco por día.En la caseta Guadalajara-Colima ingresan por día N=700 vehículos en prome-dio. Se seleccionan 20 vehículos aleatoriamente y a cada uno de los vehículosse revisa la cantidad de personas que vienen en él. Los resultados de lo que sedesea estimar es la siguiente: 4, 3, 6, 1, 3, 2, 5, 7, 4, 5, 3, 8, 1, 3, 6, 4, 4, 1, 6,5.

51

Page 63: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

3.5. La estimación de una proporción poblacional

Otra tarea que suele ser de interés al estudiar una población es la determi-nación de la proporción, P o π, de las unidades muestrales que pertenecen auno de dos grupos posibles. Por ejemplo, para conocer la proporción de per-sonas analfabetas de una población, la proporción que apoya a cierto partidopolítico o iniciativa gubernamental, la proporción de estudiantes de la Facul-tad de Telemática que tienen computadora portátil, la proporción de individuosen la ciudad de Colima que cree en Dios, etc. Todos estos ejemplos tienen dosopciones de respuesta: sí o no. Por lo tanto, para calcular dicha proporciónse hace la suma de todas las respuestas afirmativas (sí) y se divide sobre eltotal de respuestas (sí y no); esto se debe a que sólo se consideró dos gruposposibles. En ocasiones son más de dos grupos a los que pueden pertenecerlas unidades muestrales; este caso no lo consideraremos aquí, pero aun así sepodría tener la posibilidad de análisis si se considera que una unidad muestralpertenece o no pertenece a uno de los grupos.

Esta aplicación también se conoce como muestreo por atributos, donde ca-da unidad de muestreo podría pertenecer a determinado grupo debido a queposee cierto atributo.

3.5.1. La medición

La medición consiste en determinar si la unidad de muestreo tiene el a-tributo que la haría pertenecer a la proporción que se desea conocer. Paramuchos atributos tal determinación puede ser muy sencilla, por ejemplo, enun conjunto de N computadoras; pertenecer a cierta marca. Sin embargo, aveces es difícil determinar el atributo, por ejemplo, calificar a un paciente comoenfermo o no, es una condición en la que se presenta una gradualidad desdesano hasta enfermo. Es decir, el MAS para proporciones no considera los esta-dos intermedios, por lo que debe establecerse un criterio unívoco que permitacalificar al paciente como sano o enfermo solamente.

3.5.2. El estimador de la proporción poblacional P y su relacióncon el estimador de una media poblacional

Una manera fácil de introducir esta estimación es aceptar que se trata deuna variable Y que solamente puede tomar los valores de cero o uno. De estamanera podremos usar las fórmulas de los apartados anteriores, aunque con-viene adecuar la simbología. Para esto, sea Py la proporción de la población deuno de los dos grupos que posee el atributo evaluado en Y . La proporción dela población, PY , está definida por la siguiente expresión:

PY = P =

N∑

i=1

yi

N=

A

N

donde A es el número de unidades de la población que posee el atributo. Estáclaro que

yi es igual a A, ya que si la unidad de muestreo tiene el atributo

52

Page 64: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

de interés aporta un valor de uno y si no la tiene aporta un valor de cero.

Si se realiza un muestreo, se entiende que no se puede tener acceso a todaslas N unidades de la población, sino solamente a las n de la muestra. Con lamuestra definimos un estimador de la proporción de la población, simbolizadopor P = p y definido por la expresión:

py = p =

n∑

i=1

yi

n=

a

n(3.15)

De igual manera que la definición del parámetro, a =∑

yi representa elnúmero de unidades de la muestra que tienen el atributo de interés. El com-plemento de P es Q = (1 − P ) en el caso de la población y de la muestra esq = (1 − p), es decir, q es un estimador de Q.

3.5.3. La varianza de la población para una proporción

Ahora definamos la varianza de la población usando las mismas expre-siones que en el caso de una variable continua.

σ2Y = σ2 =

N∑

i=1

(yi − µ)

N − 1=

N∑

i=1

y2i − Nµ2

N − 1(3.16)

Como la variable sólo toma valores de cero o uno, entoncesN

i=1

y2i =

N∑

i

yi = NP

. Así, haciendo la sustitución en (3.16) tenemos:

σ2 =NP − NP 2

N − 1=

NP (1 − P )

N − 1=

NPQ

N − 1(3.17)

La expresiónN

i=1

y2i =

N∑

i

yi = NP en (3.17) representa el número de unidades

en la población que tiene el atributo que se desea evaluar.

Naturalmente, por ser el caso de un muestreo necesitamos un estimador deeste parámetro, que se define por la expresión:

s2y =

n∑

i=1

(yi − y)2

n − 1=

n∑

i=1

y2i −

(

n∑

i=1

yi

)2

n

n − 1=

a − a2

nn − 1

=a

(

1 − a

n

)

n − 1=

npq

n − 1(3.18)

donde a =n

i=1

yi en (3.18) representa el número de unidades en la muestra que

tiene el atributo que se desea evaluar.

53

Page 65: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

En la práctica, es común considerar que n − 1 es aproximadamente igual an, con lo cual la expresión más usada para calcular la varianza muestral es:S2

y = pq

Estimación de la varianza y el error estándar

Esta estimación sigue un desarrollo paralelo a lo expuesto para una variablecontinua. Existen otros procedimientos que se conocen como aproximaciónusando la distribución normal, que implica una corrección que hemos omitidopor su poca trascendencia práctica. Así, se tiene que p se distribuye normal-mente con los siguientes parámetros.

Media y varianza del estimador de P

E[P ] = E[p] = P (3.19)

S2p =

(

N − n

N

)(

S2y

n

)

=

(

N − n

N

)

(pq

n

)

(3.20)

En la práctica, la raíz cuadrada positiva de la varianza del estimador se conocecomo error estándar del estimador de la proporción.

Usando nuevamente el Teorema Central del Límite, p tiene aproximada-mente una distribución normal con media P (estimada por p) y una varianzaσ2

p (estimada por S2p ).

Total poblacional y varianza del estimador de τ

τ = Np

Sτ = N2

(

N − n

N

)(

S2y

n

)

= N2

(

N − n

N

)

(pq

n

)

La raíz cuadrada positiva de la varianza del estimador del total es el errorestándar del estimador del total.

3.5.4. Los intervalos de confianza

Con el mismo procedimiento que el del caso de una variable continua obtene-mos las expresiones para los intervalos de confianza.

El intervalo de confianza para la estimación de la proporción de la población

p ± tn−1,(α/2)Sp

donde Sp =

(

N − n

N

)

(pq

n

)

El intervalo de confianza para la estimación del total poblacional

τ ± Ntn−1,(α/2)Sp

54

Page 66: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

donde Sp =

(

N − n

N

)

(pq

n

)

Varianza acotada de una proporciónComo puede observarse en las expresiones de σ2

y y de S2p , existe el producto

PQ o pq. Entonces, en esas expresiones se puede apreciar que el tamaño de lavarianza depende de ese producto para el tamaño de población y una muestradadas. Esto nos indica que las varianzas de la población y del estimador seránlas máximas cuando P o p sean iguales a 0.5, ya que en estas condiciones elproducto mencionado tiene un valor máximo. Esta propiedad se puede emplearpara suponer una varianza máxima antes de realizar el muestreo, p = 0.5, y losresultados finales siempre serán iguales o más precisos que lo esperado. Enotras palabras, esto significa que en el MAS para una proporción cuando no sedispone del tiempo y recursos para realizar un muestreo piloto que sirva paracorroborar el marco de muestreo, el cuestionario, los problemas relacionadoscon el personal para levantar la encuesta y para estimar la varianza (S2 =pq), se supone varianza máxima (S2 = pq = (0.5)(0.5) = 0.25) para determinarel tamaño de muestra máximo (conservador). Este método sólo debe usarsecuando se tenga un marco de muestreo confiable, el cuestionario validado yencuestadores experimentados.

3.5.5. El tamaño de muestra requerido para estimar P

Respecto al tamaño de muestra requerido, recordemos que P puede serinterpretada como µ según la ecuación (3.19) y con el procedimiento que obtu-vimos la ecuación (3.14), tenemos lo siguiente.

El tamaño muestral para estimar P

n =N [tn−1,(α/2)]

2PQ

Nd2p + [tn−1,(α/2)]2PQ

donde:

dp: la precisión de estimación de la proporción poblacional que se está dis-puesto a aceptar.P : es la proporción de interés. Q = (1 − P ). Sin embargo, no se conocen, por loque se estiman con p y q, respectivamente.

El tamaño muestral requerido para estimar el total poblacional

n =N2[tn−1,(α/2)]

2PQ

d2τ + N [tn−1,(α/2)]2PQ

donde:

dτ : es la precisión de estimación del total poblacional que se está dispuestoa aceptar.P : es la proporción de interés. Q = (1 − P ). Sin embargo, éstas no se conocen,por lo que se estiman con p y q, respectivamente.

55

Page 67: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

3.5.6. Ejemplos

Ejemplo 1. Con la finalidad de estimar la proporción de estudiantes que fu-man en la Facultad de Medicina de la U de C , cuya población es de N = 430estudiantes, se seleccionó una muestra aleatoria de n = 80 estudiantes. Si lamuestra indica que 30 de los estudiantes seleccionados fuman, calcular losiguiente:

a) Cuantifique la proporción verdadera de los estudiantes que fuma.

p =

n∑

i=1

yi

n=

a

n=

30

80= 0.375 ó 37.5 % de estudiantes fumadores

q = 1−p = 1−0.375 = 0.625 ó 62.5 % de estudiantes no fumadores

b) La desviación estándar de la proporción muestral (Sp).

Sp =

(

N − n

N

)

(pq

n

)

donde: N = 430, n = 80, p = 0.375 y q = 0.625. Sustituyendo estos valores enla ecuación anterior, se tiene que:

Sp =

(

430 − 80

430

)(

(0.375)(0.625)

80

)

=√

(0.8139)(0.0029) =√

0.234375 = 0.0488

c) Calcule un IC de 95 % para la proporción verdadera.

p ± Zα/2Sp

donde: p = 0.375, Sp = 0.0488, Zα/2 = Z0.025 = 1.96

Por lo tanto:

0.375±(1.96)(0.0488)0.375±0.095650.2793≤ P ≤0.4707

Con 95 % de confianza se estima que la proporción verdadera de estudiantesque fuman en la Facultad de Medicina está entre 0.2793 y 0.4707, es decir,entre 27.93 y 47.07 %.

d) Estimar el total verdadero de estudiantes que fuma en la Facultad deMedicina.

τ = Np

donde: N = 430, p = 0.375

56

Page 68: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Por lo tanto

τ = (430)(0.375) = 161.25

e) La estimación por intervalo del total verdadero de estudiantes que fumanen la Facultad de Medicina de la U de C, con una confiabilidad de 95 %.

τ ± Zα/2NSp

donde: τ = 161.25, Sp = 0.0488, N = 430, Zα/2 = Z0.025 = 1.96

Por lo tanto:

161.25±(430)(1.96)(0.0488)161.25±(430)(0.09565)161.25±41.1295120.0938≤ τ ≤202.4062

Con 95 % de confianza se estima que el total de estudiantes que fuman enla Facultad de Medicina de la U de C está entre 120.0938 y 202.4062.

f) Suponga que n = 80 estudiantes es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar la proporción verdadera con una precisión de10 % de la proporción preliminar (p) y una confiabilidad de 95 %?

n =N(Zα/2)

2pq

Nd2 + (Zα/2)2pq

donde: N = 430, p = 0.375, q = 0.625. Como la precisión tiene que ser 10 %de la proporción preliminar (p=0.375), d = (0.10)(p)=(0.10)(0.375)=0.0375:

por lo tanto:

n =(430)(1.96)2(0.375)(0.625)

(430)(0.0375)2 + (1.96)2(0.375)(0.625)=

387.16

1.505= 258

g) Suponga que n = 80 estudiantes es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar el total poblacional con una precisión de 10 %del total poblacional preliminar (p) y una confiabilidad de 95 %?

n =N2(Zα/2)

2pq

d2 + N(Zα/2)2pq

donde: N = 430, p = 0.375, q = 0.625, Zα/2 = Z0.025 = 1.96 y d = (0.10)(430)(0.375) =16.125

Por lo tanto:

n =(430)2(1.96)2(0.375)(0.625)

(16.125)2 + (430)(1.96)2(0.375)(0.625)=

166479.33

647.16= 258 estu-

diantes (unidades muestrales)

57

Page 69: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

Ejemplo 2. Un ingeniero en telemática es el responsable de un centro de cóm-puto con N = 2, 000 computadoras donde por descuido algunas computadorasse infectaron con el virus XXX. Con la finalidad de estimar la proporción decomputadoras infectadas, es decir, que contienen el virus XXX, se seleccionóuna muestra aleatoria de n = 50 computadoras. Esta muestra indica que 22 delas 50 computadoras tienen el virus.

a) Estime la proporción verdadera de computadoras infectadas.

p =

n∑

i=1

yi

n=

a

n=

22

50= 0.44 ó 44 % computadoras infectadas

q = 1 − p = 1 − 0.44 = 0.56 ó 56 % computadoras limpias

b) ¿Cuál es desviación estándar de la proporción muestral (Sp)?

Sp =

(

N − n

N

)

(pq

n

)

donde: N = 2, 000, n = 50, p = 0.44, y q = 0.56

Por lo tanto:

Sp =

(

2, 000 − 50

2, 000

)(

(0.44)(0.56)

50

)

=√

(0.975)(0.0049) =√

0.0048048 = 0.0693

c) Encontrar un IC de 95 % para la proporción verdadera.

p ± Zα/2Sp

donde: p = 0.44, Sp = 0.0693 y Zα/2 = Z0.025 = 1.96

Por lo tanto:

0.44±(1.96)(0.0693)0.44±0.13580.3041≤ P ≤0.5759

Con 95 % de confianza se estima que la proporción verdadera de computado-ras infectadas en la población está entre 0.3041 y 0.5759, o sea, entre 30.41 y57.59 %.

d) Hallar el total verdadero de computadoras infectadas.

τ = Np

donde: N = 2, 000 y p = 0.44

58

Page 70: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Por lo tanto:τ = (2, 000)(0.44) = 880

e) Calcular un IC para el total verdadero de computadoras infectadas en lapoblación, con una confiabilidad de 95 %.

τ ± Zα/2NSp

donde: τ = 880, Sp = 0.0693, N = 2, 000 y Zα/2 = Z0.025 = 1.96

Por lo tanto:

880±(2,000)(1.96)(0.0693)880±(2,000)(0.1358)880±271.6608.2787≤ τ ≤1,151.7213

Con 95 % de confianza se estima que el total poblacional de computadorasinfectadas por el virus XXX está entre 608.2787 y 1,151.7213.

f) Suponga que n = 50 computadoras son una muestra preliminar. Por lotanto, ¿cuál es el tamaño de muestra para estimar la proporción verdaderacon una precisión de 0.07 y una confiabilidad de 95 %?

n =N(Zα/2)

2pq

Nd2 + (Zα/2)2pq

donde: N = 2, 000, p = 0.44, q = 0.56 y d = 0.07

Por lo tanto:

n =(2, 000)(1.96)2(0.44)(0.56)

(2, 000)(0.07)2 + (1.96)2(0.44)(0.56)=

1893.1404

10.7466= 177

g) Suponga que las n = 50 computadoras son una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar el total verdadero con una precisión de140 computadoras y una confiabilidad de 95 %?

n =N2(Zα/2)

2pq

d2 + N(Zα/2)2pq

donde: N = 2, 000, p = 0.44, q = 0.56, Zα/2 = Z0.025 = 1.96 y d = 140

Por lo tanto:

n =(2, 000)2(1.96)2(0.44)(0.56)

(140)2 + (2, 000)(1.96)2(0.44)(0.56)=

3786280.96

21493.14048= 177

Ejemplo 3. En el estado de Colima existen N = 3, 000 familias que agrupana toda la población. Se desea estimar la proporción de familias que tiene ser-

59

Page 71: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

vicio de Internet en su casa y se seleccionó una muestra preliminar de n = 100familias. Se encontró que 20 tenían servicio de Internet en su casa.

a) Realizar la estimación de la proporción verdadera de familias que tienenInternet.

p =

n∑

i=1

yi

n=

a

n=

20

100= 0.20 ó 20 % de familias poseen el servicio

q = 1 − p = 1 − 0.20 = 0.80 u 80 % de familias no tienen servicio

b) Hallar la desviación estándar estimada de la proporción muestral (Sp).

Donde: N = 3, 000, n = 100, p = 0.20 y q = 0.80

Por lo tanto:

Sp =

(

3, 000 − 100

3, 000

)(

(0.20)(0.80)

100

)

=√

(0.9667)(0.0016) =√

0.001547 = 0.03933

c) Calcular un IC de 95 % para la proporción verdadera.

p ± Zα/2Sp

donde: p = 0.20, Sp = 0.03933 y Zα/2 = Z0.025 = 1.96

De ahí que:

0.20 ± (1.96)(0.03933)0.20 ± 0.07710.1229 ≤ P ≤ 0.2771

Con 95 % de confianza se estima que la proporción verdadera de familias quetienen Internet en su hogar está entre 0.1229 y 0.2771, o sea, entre 12.29 y27.71 %.

d) Hallar el total verdadero de familias que tienen Internet.

τ = Np

donde: N = 3, 000 y p = 0.20

Por lo tanto:

τ = (3000)(0.20) = 600 familias en el estado

e) Calcular un IC para el total verdadero de familias con una confiabilidadde 95 %.

60

Page 72: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

τ ± Zα/2NSp

donde: τ = 600, Sp = 0.03933 , N = 3, 000 y Zα/2 = Z0.025 = 1.96

entonces:

600 ± (3, 000)(1.96)(0.03933)600 ± (3, 000)(0.0771)600 ± 231.3368.7532 ≤ τ ≤ 831.2468

Con 95 % de confianza se estima que el total de familias que tienen Internet ensu hogar está entre 368.7532 y 831.2468.

f) Suponga que n = 100 familias es una muestra preliminar, ¿cuál es eltamaño de muestra para estimar la proporción verdadera con una precisiónde 0.07 y una confiabilidad de 95 %?

n =N(Zα/2)

2pq

Nd2 + (Zα/2)2pq

donde: N = 3, 000, p = 0.20, q = 0.80, d = 0.07

Por lo tanto:

n =(3, 000)(1.96)2(0.20)(0.80)

(3000)(0.07)2 + (1.96)2(0.20)(0.80)=

1843.968

15.3147= 121 familias

g) Suponga que n = 100 familias son una muestra preliminar, ¿cuál es eltamaño de muestra para estimar el total verdadero con una precisión de 210familias y una confiabilidad del 95 %?

n =N2(Zα/2)

2pq

d2 + N(Zα/2)2pq

donde: N = 3, 000, p = 0.20, q = 0.80, Zα/2 = Z0.025 = 1.96 y d = 210

Por lo tanto:

n =(3000)2(1.96)2(0.2)(0.8)

(210)2 + (3000)(1.96)2(0.2)(0.8)= 121 familias (unidades mues-

trales)

Ejemplo 4. En el estado de Colima hay N = 20, 000 automóviles. Con la fi-nalidad de estimar la proporción de autos estadounidenses, se seleccionó unamuestra aleatoria de n = 250 autos, que arrojó 70 automóviles estadouniden-ses.

a) Haga la estimación puntual de la proporción verdadera de automóvilesestadounidenses.

61

Page 73: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

p =

n∑

i=1

yi

n=

a

n=

70

250= 0.28 ó 28 % autos estadounidenses

q = 1 − p = 1 − 0.28 = 0.72 ó 72 % otros autos

b) Calcule la desviación estándar de la proporción muestral (Sp).

Sp =

N − n

N

pq

n

donde: N = 20, 000, n = 250, p = 0.28 y q = 0.72

Por lo tanto:

Sp =

(

20, 000 − 250

20, 000

)(

(0.28)(0.72)

250

)

=√

(0.9875)(0.00081) =√

0.0007963 = 0.02822

c) Calcule un IC de 95 % para la proporción verdadera.

p ± Zα/2Sp

donde: p = 0.28, Sp = 0.02822 y Zα/2 = Z0.025 = 1.96

Por lo tanto:

0.28 ± (1.96)(0.02822)0.28 ± 0.05530.2247 ≤ P ≤ 0.3353

Con 95 % de confianza se estima que la proporción de automóviles extran-jeros en el estado está entre 22.47 y 33.53 %.

d) Encuentre el total verdadero de automóviles.

τ = Np

donde: N = 20, 000, p = 0.28

Por lo tanto:

τ = (20, 000)(0.28) = 5, 600 automóviles

e) Hallar por intervalo el total verdadero de automóviles estadounidenses enel estado, con una confiabilidad de 95 %.

τ ± Zα/2NSp

donde: τ = 5, 600, Sp = 0.02822, N = 20, 000 y Zα/2 = Z0.025 = 1.96

62

Page 74: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Por lo tanto:

5, 600 ± (20, 000)(1.96)(0.02822)5, 600 ± (20, 000)(0.0553)5, 600 ± 1, 1064, 493.8299 ≤ τ ≤ 6, 706.17

Con 95 % de confianza se estima que el total de automóviles está entre 4493.8096y 6706.1904.

f) Suponga que n = 250 automóviles es una muestra preliminar, ¿cuál es eltamaño de muestra para estimar la proporción verdadera con una precisión de0.05 y una confiabilidad de 95 %?

n =N(Zα/2)

2pq

Nd2 + (Zα/2)2pq

donde: N = 20,000, p = 0.28, q = 0.72 y d = 0.05

Por lo tanto:

n =(20, 000)(1.96)2(0.28)(0.72)

(20, 000)(0.05)2 + (1.96)2(0.28)(0.72)=

15489.3312

50.7745= 306 autos (mues-

tra)

g) Suponga que n = 250 automóviles es una muestra preliminar, ¿cuál es eltamaño de muestra para estimar el total verdadero con una precisión de 1,000automóviles y una confiabilidad de 95 %?

n =N2(Zα/2)

2pq

d2 + N(Zα/2)2pq

donde: N = 20,000, p = 0.28, q = 0.72, Zα/2 = Z0.025 = 1.96 y d = 1, 000

Por lo tanto:

n =(20, 000)2(1.96)2(0.28)(0.72)

(1000)2 + (20, 000)(1.96)2(0.28)(0.72)= 306 autos (muestra)

3.6. Ejercicios

En los siguientes ejercicios estime los parámetros siguientes:

a) El IC para la proporción y el total con una confiabilidad de 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la proporción y el total de tal maneraque la proporción y el total sean estimados con una precisión de 5 % de la pro-porción y el total preliminar con una confiabilidad de 95 %?

Ejercicio 1. Con la finalidad de saber si la Sociedad Colimense que cuenta

63

Page 75: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 3. Muestreo aleatorio simple

con N = 10, 000 personas, está de acuerdo con la reforma a PEMEX, se realizóuna encuesta tomando a n = 150 personas al azar de la población. Los resulta-dos arrojaron que 35 personas están de acuerdo.

Ejercicio 2. La Dirección de la Facultad de Telemática desea realizar unaencuesta a la Sociedad Colimense para saber si saben el perfil de egreso deIng. en Telemática. Se lleva acabo la encuesta en el estado que cuenta conN = 10, 000 personas, la encuesta se realizó a n = 100 personas tomadas alazar de la población. Los resultados que arrojó la encuesta es que 15 personasconocen el perfil de egreso de Ing. en Telemática.

Ejercicio 3. La Secretaría de Salud del estado de Colima desea realizar unaencuesta sobre si la población colimense conoce los productos transgénicos.Se realizó la encuesta en el estado cuya población es de N = 567, 996 personascon una muestra al azar n = 5000 individuos. Los resultados muestran que1, 570 personas conocen de los productos transgénicos.

Ejercicio 4. Con la finalidad de saber cuantas personas de la Ciudad de Co-lima utilizan tarjetas bancarias se llevó a cabo una encuesta. La Ciudad deColima cuenta con N = 6, 500 personas, la encuesta se realizó a n = 1, 000 per-sonas tomadas al azar. Los resultados arrojaron que 925 personas cuentancon tarjeta bancaria.

64

Page 76: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4

El muestreo aleatorio estratificado

En este mundo complejo,nunca es fácil elegir.

Pero con datos y muestras,tú lo podrás conseguir.

De una forma inteligente,que te conduzca a un buen fin.

OAML

CUando el costo de la investigación es excesivo y la población es heterogénea,el muestreo aleatorio simple no es en principio una buena opción. Por es-

ta razón, éste capítulo brinda la opción del Muestreo Aleatorio Estratificado(MAE). Que trata de hacer aún más precisas las estimaciones que se puedenobtener con un diseño básico de muestreo como el aleatorio simple (Cochran,1985 [1]).

Muestreo aleatorio estratificado (MAE)Si la población de N individuos se divide en E subpoblaciones oestratos que no se traslapan, con respecto a criterios que puedan serimportantes en el estudio y tratando en la medida posible que existahomogeneidad dentro de cada estrato. Los estratos contienen N1, ...,

NE unidades muestrales, de manera que N =E

h

Nh, y en cada uno

de estos estratos o subpoblaciones se realiza un muestreo aleatoriosimple con muestras respectivas de tamaño nh, así que la muestraestratifica de tamaño n es igual a la suma de todas las muestras de

cada estrato, es decir, n =E

h=1

nh

En general los estratos naturales o convenientemente definidos deberánser homogéneos internamente y heterogéneos entre ellos, con respecto a lavariable bajo estudio. Cada unidad muestral debe estar incluida en sólo unestrato, o sea, no debe haber traslapes entre los estratos. Las unidades quese incluyan en un estrato deben tener un valor similar en cuanto a la variablede interés, aunque al no conocer esos valores, se puede usar otra caracterís-tica para formar los estratos con la esperanza de lograr que los valores sean

65

Page 77: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

muy parecidos dentro de cada estrato. Los estratos formados funcionan inde-pendientemente, y se les aplica un muestreo aleatorio simple para elegir loselementos concretos que formarán parte de la muestra y obtener así las esti-maciones de los parámetros que nos interesan. En ocasiones las dificultadesque plantean los estratos son demasiado grandes, pues exigen un conocimien-to detallado de la población, como tamaño geográfico, género, edades, nivelesde estudio, etcétera (Pérez, 2000 [3]).

El MAE se utiliza cuando la población es muy heterogénea y las considera-ciones de costo limitan el tamaño de la muestra. Si no se toma en cuenta lavariabilidad y posiblemente los costos diferenciados y utilizamos el muestreoaleatorio simple, las estimaciones podrían ser menos precisas o el costo seríademasiado elevado. Por otro lado, para la población estratificada habrá quedeterminarse dos tamaños de muestra: para la población y para cada estrato,n y nh, respectivamente.

4.1. Ventajas de utilizar MAE

Algunos motivos para utilizar muestreo aleatorio estratificado en lugar demuestreo simple aleatorio son:

I. Produce estimaciones más precisas que las que se obtienen a partir delmuestreo aleatorio simple.

II. El costo por observación puede ser reducido mediante la estratificaciónde la población.

III. Se puede obtener información de parámetros poblacionales para cada es-trato de la población.

IV. Se simplifica el trabajo administrativo y el de control, ya que se pude usarpersonal especifico para cada estrato.

V. El tamaño de muestra será menor, si la estratificación es bien definida,en comparación con el muestreo simple aleatorio.

Notación

Para esta técnica de muestreo necesitamos una notación adicional que dis-tingue los elementos de la población, como la siguiente:

N : el número total de unidades muestrales en la población.E : el número de estratos en la población.h : un estrato.Nh : el número total de unidades en el estrato h.nh : el número de unidades en la muestra en el estrato h.i : alguna unidad muestral que siempre pertenece a algún estrato h.yhi : el valor obtenido en la i-ésima unidad dentro del estrato h.Wh = Nh/N : la ponderación, peso o tamaño relativo del estrato h.fh = nh/Nh : la fracción de muestreo para el estrato h.

66

Page 78: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

yh =

nh∑

i=1

yhi

nh

: la media muestral del estrato h.

S2h =

nh∑

i=1

(yhi − yh)2

nh − 1=

nh∑

i=1

y2hi − nhy

2h

nh − 1: la varianza en el estrato h.

Si se desea conocer la cantidad de horas promedio que cierto grupo depersonas de una ciudad ve la televisión, debemos pensar que habrá niños,jóvenes y adultos, y que el tiempo de horas libres varía de un grupo a otro. Deesta manera dividimos la población en tres estratos, ya que es lógico afirmarque las tendencias dentro de cada estrato son similares y son homogéneas.También podemos entender que el número total de personas de la poblaciónes la suma de los elementos de los estratos. Otro ejemplo es el siguiente: siqueremos conocer el ingreso promedio de las familias en Colima, donde sesupone que existen tres clases sociales bien definidas, podemos considerar lasfamilias de la misma clase social como un estrato, ya que es homogéneo.

4.2. ¿Cómo seleccionar una muestra aleatoria es-tratificada?

La selección de la muestra de cada estrato es diferente, ya que cada unotiene características y costos de medición distintos, por lo que el número deunidades también será diferente. Por ejemplo, el tamaño de la muestra delestrato debe ser mayor si es muy variable o si contiene más unidades. Por elcontrario, será menor si el costo de la medición es elevado. Antes de seleccionaruna muestra es preciso considerar qué tan grande debe ser la precisión de es-timación y de acuerdo con esto seleccionar el tamaño de la muestra (Cochran,1985 [1]).

En resumen, de un estrato dado se toma una muestra más grande si:

I. El estrato es más grande.

II. Los elementos del estrato tiene alta variabilidad.

III. El muestreo es más barato en el estrato.

4.3. La estimación de la media poblacional

Supongamos que ya hemos tomado nuestra muestra aleatoria estratificada,y entonces nos preguntamos, ¿cómo debemos usarla para estimar los princi-pales parámetros?, es decir, contestarnos preguntas como: ¿cuál es la mediade nuestra población? o, ¿cuál es el total?. Definiendo µh y τh como la mediay el total para el estrato h, respetivamente. De esta manera resulta obvio queτ1 + τ2 + ... + τE = τ , donde τ es el total de la población.

67

Page 79: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

Para comprender mejor las expresiones que nos dará la estimación de µy τ debemos tomar en cuenta que yh es un estimador insesgado de µh y que

Nyh es un estimador insesgado del total del estrato τh =

Nh∑

i=1

yhi, tal como en

el muestreo aleatorio simple. Hasta aquí todo parece razonable, como formarel estimador de τ , τ , con la suma de los τh y de esta manera construir unestimador para la media de la población al dividir τ entre N , el cual hereda lapropiedad de insesgamiento (Scheaffer, 1987 [2]).

El estimador de la media estratificada

yestr =

E∑

h=1

Nhyh

N

Nótese que se ha usado el subíndice estr en yestr para señalar que la esti-mación se hace con el muestreo estratificado.

Dado que cada estrato se maneja de manera independiente, las yk conh = 1, 2, . . . E también son independientes. Por lo tanto, la varianza de yestr

es la suma de las varianzas de las medias de cada estrato. Este estimador esinsesgado.

4.3.1. El estimador de la varianza de la media estratificada

S2yestr

= V (yestr) =1

N2

[

N21 V (y1) + N2

2 V (y2) + . . . + N2EV (yE)

]

=1

N2

[

N21

(

N1 − n1

N1

)(

S21

n1

)

+ . . . + N2E

(

NE − nE

NE

)(

S2E

nE

)]

=1

N2

E∑

h=1

N2h

(

Nh − nh

Nh

)(

S2h

nh

)

=E

h=1

N2h

N2

(

Nh − nh

Nh

)(

S2h

nh

)

=E

h=1

W 2h

(

Nh − nh

Nh

)(

S2h

nh

)

=E

h=1

W 2hS2

yh.

El siguiente paso es la obtención del intervalo de confianza de nuestra esti-mación. Cuando hay pocos grados de libertad en cada estrato, el procedimien-to para calcular el error de muestreo, (t

V (yestr)), consiste en leer el valor de ten las tablas de la t-student, como se hizo en el muestreo aleatorio simple, ycuando es mayor de 30 utilizaremos la tablas Z de la normal estándar.

68

Page 80: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

4.3.2. El intervalo de confianza para la estimación de la me-dia estratificada

yestr ± t(n−1,α/2)

1

N2

E∑

h=1

N2h

(

Nh − nh

Nh

)(

S2h

nh

)

yestr ± t(n−1,α/2)

E∑

h=1

W 2hS2

yh

Se ha revisado lo referente al estimador de la media estratificada; sin embar-go, en ocasiones el principal interés es conocer el total de la población, porejemplo, el gasto total semanal de las familias, o el total de personas que visi-tan algún puerto durante Semana Santa, o quizá la cantidad de personas queconsumen un producto A.

4.3.3. El estimador del total estratificado

τestr = Nyestr = N1y1 + N2y2 + . . . + NE yE =E

h=1

Nhyh,

La varianza se deduce de la varianza de la media y hereda todas sus propiedades.Para la estimación, tanto de la varianza de la media como del total, debe existirpor lo menos dos observaciones en cada estrato.

4.3.4. La varianza del estimador del total estratificado

V (Nyestr) = N2V (yestr) = N2

E∑

h=1

W 2h

(

Nh − nh

Nh

)(

S2h

nh

)

, (4.1)

La desviación estándar se necesita para crear un intervalo de confianza deltotal.

4.3.5. El intervalo de confianza

Nyestr ± t(n−1,α/2)

E∑

h=1

N2h

(

Nh − nh

Nh

)(

S2h

nh

)

4.3.6. La determinación del tamaño de la muestra

Ahora es tiempo de planear las unidades muestrales que se deben selec-cionar aleatoriamente en toda la población, y las de los estratos, para consti-tuir una muestra que satisfaga una precisión deseada, d.

69

Page 81: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

Cuando se decide precisar el tamaño de muestra se debe tomar en cuen-ta varios factores, como el tipo de muestreo, el parámetro a estimar, la pre-cisión admisible, la varianza poblacional y el nivel de confianza de la inferen-cia. Además, dependiendo de las estrategias de asignación, se puede recurrira información más específica o adicional.

Anteriormente se revisaron los elementos estadísticos que se deben tomaren cuenta para obtener un tamaño de muestra preciso, sin embargo, existenotros factores que son fundamentales para tomar una decisión al respecto.Para la asignación de la muestra a cada estrato también se requiere informa-ción sobre:

El número total de elementos del estrato.

La variabilidad de las observaciones del estrato.

El costo que representa muestrear cada estrato.

De aquí se puede concluir que cuanto mayor sea el tamaño muestral enlos estratos, se obtendrá información más precisa, por lo que a los estratosgrandes les corresponden tamaños muestrales grandes. También es fácil in-ferir que si en algún estrato hay mucha variabilidad debe considerarse untamaño de muestra mayor.

Por último, es importante considerar que si el costo de obtener una obser-vación varía entre estratos, se deberá tomar muestras pequeñas en estratosdonde el costo sea alto y viceversa, con el fin de minimizar el costo total delmuestreo. Así, la calidad de la información que se obtenga en las estimacionesprovendrá directamente de n, ya que al incrementarse ésta, la varianza de lamedia decrecerá. Para lograr una precisión deseada usamos:

dM = t(n−1,α/2)

V (θ)

donde

V (θ) : la varianza del estimador de interés.

α : el nivel de significancia.

El tamaño de muestra para estimar la media estratificada

n =

N(t(n−1,α/2))2

E∑

h=1

WhS2h

Nd2M + (t(n−1,α/2))2

E∑

h=1

WhS2h

Wh = Nh/NdM = el tamaño del error que se desea aceptar en la estimación de la media.

70

Page 82: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

El tamaño de muestra para estimar el total estratificado

n =

N2(t(n−1,α/2))2

E∑

h=1

WhS2h

d2T + N(t(n−1,α/2))2

E∑

h=1

WhS2h

,

Wh = Nh/N ,dT = tamaño del error que se desea aceptar en la estimación del total.

4.3.7. La asignación de la muestra

Como se vio, el muestreo estratificado involucra h estratos y por tanto tam-bién h tamaños de muestra, n1, n2, . . . , nh correspondientes a los estratos en quese divide la población. Asimismo, se tiene el tamaño de muestra total n, el cuales la suma de los h tamaños de muestra relacionados con los estratos. Se debetener presente que el número de unidades de que consta el estrato influye enel tamaño de muestra. Así, se asignará un tamaño de muestra mayor a losestratos más grandes y uno menor a los estratos más chicos. A los estratosque más aportan a la variabilidad, es decir, los estratos menos homogéneos,les corresponderá un tamaño de muestra mayor. De los estratos donde el costopor unidad sea alto, se tomarán muestras más pequeñas. Por lo tanto, existendiferentes métodos de asignación de la muestra.

Por su simplicidad, en la práctica se recurre con frecuencia a la denominadaasignación proporcional. Este procedimiento de asignación es recomendablecuando se sabe que los estratos tienen tamaños diferentes, que la variabilidadentre estratos se desconoce, pero puede suponerse ligeramente similar y quela variabilidad en el estrato más pequeño es menor que la del estrato másgrande; en cuanto al costo por unidad, se asume que es igual o que no cambiaentre estratos. El criterio de asignación proporcional, suponiendo que ya se hacalculado el tamaño de la muestra n requerido, consiste en determinar unaparte de n, la cual será proporcional al tamaño del estrato. Algebraicamente elcriterio está representado por:

ni =Nh

Nn = Whn; i = 1, 2, . . . , h,

o especificamente como:

n1 =N1

Nn, n2 =

N2

Nn, . . . , nh =

Nh

Nn.

Los estratos más grandes requieren un tamaño de muestra mayor, es decir, laasignación de n entre los estratos es proporcional al tamaño del estrato.

71

Page 83: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

4.4. La selección de estratos

En ocasiones es sencillo delimitar los elementos que corresponden a cadaestrato, pero ¿siempre es así? Definitivamente no. En estadística, cada proble-ma es una nueva experiencia, la cual no necesariamente tiene una respuestaúnica y un razonamiento lógico para llegar a la solución más satisfactoria. Estetrabajo puede resultar un poco complicado y tornarse desesperante en algu-nas ocasiones, por lo que a continuación se dan algunas ideas útiles.

¿Qué hago cuando. . . ?¿Cómo delimitar los estratos?¿Se debe estratificar después de seleccionar la muestra?

En ocasiones es una tarea sencilla debido a que los estratos están implíci-tos y se conoce el comportamiento con base en registros antiguos, nuestraexperiencia o simplemente en la naturaleza de los resultados que deseamosobtener.

¿Con base en qué se delimitan los estratos? Una primera aproximación es elcaso cuantitativo. Habrá que construirlos dado un interés particular, porquemuchas veces hasta el momento de diseñar la investigación se conocen losrangos de las estimaciones. Pero también podría tener el rango de salida de losdatos y algunas frecuencias en categorías generales de la variable de interéso de alguna variable altamente correlacionada. En este caso podemos usar elsencillo "método acumulativo de la raíz cuadrada de la frecuencia".

Los pasos del método acumulativo de la raíz cuadrada de la frecuencia:

I. Elegimos el número de estratos que se desea obtener.

II. Sacamos por rangos la frecuencia de la variable de interés o en su defectoa una altamente correlacionada con ella y con estos resultados formamosuna columna de datos.

III. Se forman dos columnas más, una constituida por la raíz de las frecuen-cias y otra por su raíz acumulada.

IV. Se divide la frecuencia acumulada final entre el número de estratos. Esteresultado es el ancho de la clase (AC).

V. Se utiliza la siguiente ecuación,

AChi = h∗AC, h = 1, 2, ...n

y donde h representa el estrato h.

VI. Se puede delimitar con las marcas de clase por estrato, eligiendo la raízde la frecuencia acumulada más cercana a la marca de clase y así cadaestrato estará formado por todas las clases de la variable original quecorrespondan a la marca de clase.

72

Page 84: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

4.4.1. Ejemplos

Ejemplo 1. En Tecomán, Colima, hay 780 parcelas sembradas con limón. Sedesea estimar el promedio de plantas por hectárea, que en determinada etapadel cultivo se infectaron de alguna enfermedad. De acuerdo con las condicionesecológicas en la región se siembran tres variedades de limón. Considerandoque el desarrollo de la enfermedad puede ser distinto de una variedad a otra,la población de parcelas se estratificó en E = 3 estratos. Los tamaños de losestratos son: N1 = 270, N2 = 180 y N3 = 330;N = N1 + N2 + N3 = 780. Supongaque para realizar las estimaciones se tomó una muestra de n = 63 parcelas.Los datos se presentan en el cuadro 4.1.

Cuadro 4.1: Plantas por hectárea infectadasEstrato 1 (n1 = 21) Estrato 2 (n2 = 21) Estrato 3 (n3 = 21)48 53 64 20 31 45 74 68 7762 45 47 36 17 26 70 72 7359 65 54 15 30 18 78 76 6945 48 46 40 25 35 69 80 7450 60 63 24 29 30 80 78 7155 57 46 19 42 27 72 71 7964 61 54 33 51 48 76 75 68

a) Realice la estimación puntual del promedio de plantas infectadas porhectárea.

El estimador de la media estratificada en este caso es,

yestr =N1y1 + N2y2 + N3y3

N

donde: N1 = 270, N2 = 180, N3 = 330, N = 780

y1 =48 + 62 + 59 + . . . + 46 + 64

21= 54.5714

y2 =20 + 36 + 15 + . . . + 27 + 48

21= 30.5238

y3 =74 + 70 + 78 + . . . + 79 + 68

21= 73.8095

Por lo tanto:

yestr =(270)(54.57) + (180)(30.52) + (330)(73.80)

780.

yestr =44, 581.5

780= 57.1612 plantas infectadas por parcela

b) Realice la estimación puntual del total de plantas infectadas.

El estimador del total estratificado es:

73

Page 85: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

τestr = Nyestr

donde: N = 780 y yestr = 57.1612

Por lo tanto:

τestr = (780)(57.1612) = 44, 585.736 plantas infectadas

c) Calcule la varianza del promedio estratificado.

El estimador de la varianza del promedio poblacional es:

S2yestr

=

(

N1

N

)2 (

N1 − n1

N1

)(

S21

n1

)

+

(

N2

N

)2 (

N2 − n2

N2

)(

S22

n2

)

+

(

N3

N

)2 (

N3 − n3

N3

)(

S23

n3

)

donde: N1 = 270, N2 = 180, N3 = 330, N = 780, n1 = n2 = n2 = n3 = 21,

S21 =

482 + 622 + 592 + . . . + 462 + 542 − (21)(54.57)2

21 − 1= 50.3571

S22 =

202 + 362 + 152 + . . . + 272 + 482 − (21)(30.52)2

21 − 1= 107.2619

S23 =

742 + 702 + 782 + . . . + 792 + 682 − (21)(73.80)2

21 − 1= 15.5619

Por lo tanto:

S2yestr

=

(

270

780

)2 (

270 − 21

270

)(

51.7709

21

)

+

(

180

780

)2 (

180 − 21

180

)(

107.2619

21

)

+

(

330

780

)2 (

330 − 21

330

)(

15.5619

21

)

= 0.6348

Syestr =√

S2yestr

=√

0.6348 = 0.7967

d) Estime por intervalo la media estratificada con una confiabilidad de 95 %.

yestr ± Zα/2Syestr

donde:N = 780, yestr = 57.4579 y Zα/2 = Z0.025 = 1.96

Por lo tanto:

57.1558 ± (1.96)(0.7967)57.4579 ± 1.555155.5943 ≤ µestr ≤ 58.7173

El promedio de plantas infectadas por hectárea en la población está entre55.5943 y 58.7173.

74

Page 86: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

e) Halle por intervalo el total de plantas infectadas en la población con unaconfiabilidad del 95 %

τestr ± NZα/2Syestr

donde: τestr = 44, 581.524, N = 780, Zα/2 = Z0.025 = 1.96 y Syestr = 0.7934

Por lo tanto:

44, 817.1929 ± (780)(1.96)(0.7934)44, 817.1929 ± (780)(1.5550)44, 817.1929 ± 1, 212.97843, 604.2409 ≤ τestr ≤ 46, 030.0449

El total de plantas infectadas por hectárea en la población está entre 43,604.2429y 46,030.0449.

f) Suponga que n = 63 es una muestra preliminar. Determine el tamaño demuestra para estimar la media con una precisión de ±3 % de la media estrati-ficada y una confiabilidad de 95 %. Además, asigne n a cada estrato en formaproporcional al tamaño del estrato.

n =

N(Zα/2)2

E∑

h=1

WhS2h

Nd2 + (Zα/2)2

E∑

h=1

WhS2h

Estratos Ni S2h WhS

2h

1 270 50.3571 17.43132 180 107.2619 24.75273 330 15.5619 6.5839

Total 780 48.7679

donde: Zα

2

= Z0.025 = 1.96, d = (.03)(57.1611) = 1.7148

E∑

h=1

WhS2h =

N1

NS2

1 +N2

NS2

2 +N3

NS2

3 = 48.7679

Por lo tanto:

n =(780)(1.96)2(48.7679)

(780)(1.7146)2 + (1.96)2(48.7679)= 59 parcelas (muestra)

Asignación de la muestra en forma proporcional.

n1 =N1

Nn =

270

780(59) = 20

n2 =N2

Nn =

180

780(59) = 14

75

Page 87: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

n3 =N3

Nn =

330

780(59) = 25

g) Suponga que n =63 es una muestra preeliminar. Determine el tamaño demuestra para estimar el total con una precisión de ±3 % del total estratifica-do y con una confiabilidad de 95 %. Además, asigne n a cada estrato en formaproporcional al tamaño.

n =

N2(Zα/2)2

E∑

h=1

WhS2h

d2 + (Zα/2)2

E∑

h=1

WhS2h

Aquí d = (0.03)(44585.628) = 1337.568 yE

h=1

WhS2h = 48.7679

Por lo tanto:

n =(780)2(1.96)2(48.7679)

(1337.568)2 + (780)(1.96)2(48.7679)= 59

De ahí que el número estimado de unidades muestrales (parcelas) que debenconstituir la muestra con una precisión de ±1, 337.568 plantas y 0.05 de proba-bilidad de no incluir en el intervalo de estimación al total verdadero, es de 59parcelas. Por tanto, la asignación proporcional es la misma. Es decir, la mues-tra a extraer de cada estrato será de 20 en el estrato 1, 14 en el estrato 2 y de25 en el estrato 3.

Ejemplo 2. La Facultad de Telemática de la Universidad de Colima deseaestimar el promedio y el total de faltas justificadas que tuvieron los alumnosen un año determinado. Al suponer que podrían encontrarse diferencias segúnel grado de estudios: primero, segundo, tercero y cuarto año, se decidió usar elmuestreo estratificado, de acuerdo con el grado de estudios. De esta manera,la población de N = 400 estudiantes que alberga la Facultad, quedó estratifica-da de la siguiente manera: Estrato 1 (primer año): N1 = 120 alumnos, Estrato2 (segundo año): N2 = 100 alumnos, Estrato 3 (tercer año): N3 = 90 alumnos,Estrato 4 (cuarto año): N4 = 90 alumnos

Se seleccionó una muestra de n = 40 alumnos: 12 para el estrato 1, 10 para elestrato 2, 9 para el estrato 3 y 9 para el estrato 4.(A.1)

a) Estime la media estratificada.

yestr =N1y1 + N2y2 + N3y3 + N4y4

N

donde: N1 = 120, N2 = 100, N3 = 90, N4 = 90, N = 400,

y1 =7 + 6 + 7 + . . . + 5 + 6

12= 6.3333,

y2 =4 + 5 + 4 + . . . + 6 + 6

10= 5,

y3 =3 + 3 + 3 + . . . + 3 + 4

9= 3.5556,

76

Page 88: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 4.2: Faltas justificadas por año.Estrato 1 Estrato 2 Estrato 3 Estrato 47 6 4 4 3 4 3 36 7 5 6 3 4 2 27 7 4 4 3 3 3 58 8 5 6 4 4 4 25 5 6 6 4 54 6

y4 =3 + 2 + 3 + . . . + 5 + 2

9= 3.2222.

Por lo tanto:

yestr =(120)(6.33) + (100)(5) + (90)(3.55) + (90)(3.22)

400

yestr =1870.00

400= 4.675 faltas justificadas en promedio de todos

los grados.

b) Realice la estimación de la varianza y la desviación estándar de la mediaestratificada.

S2yestr

=

(

N1

N

)2 (

N1 − n1

N1

)(

S21

n1

)

+

(

N2

N

)2 (

N2 − n2

N2

)(

S22

n2

)

+

(

N3

N

)2 (

N3 − n3

N3

)(

S23

n3

)

+

(

N4

N

)2 (

N4 − n4

N4

)(

S24

n4

)

donde: N1 = 120, N2 = 100, N3 = 90, N4 = 90, N = 400, n1 = 12, n2 = 10, n3 = 9,n4 = 9,

S21 =

72 + 62 + 72 + . . . + 52 + 62 − (12)(6,3333)2

12 − 1= 1.5152,

S22 =

42 + 52 + 42 + . . . + 62 + 62 − (10)(5)2

10 − 1= 0.8889,

S23 =

32 + 32 + 32 + . . . + 32 + 42 − (9)(3.5556)2

9 − 1= 0.2728,

S24 =

32 + 22 + 32 + . . . + 52 + 22 − (9)(3.2222)2

9 − 1= 1.4444.

Por lo tanto:

S2ye

=

(

120

400

)2 (

120 − 12

120

)(

1.5152

12

)

+

(

100

400

)2 (

100 − 10

100

)(

0.8889

10

)

+

(

90

400

)2 (

90 − 9

90

) (

0.2728

9

)

+

(

90

400

)2 (

90 − 9

90

) (

1.4444

9

)

= 0.02395

Syestr =√

S2yestr

=√

0.02395 = 0.1547

c) Calcule el total estratificado.

77

Page 89: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

yestr = Nyestr

donde:N = 400 y yestr = 4.675

Por lo tanto:

τestr = (400)(4.675) = 1870 faltas justificadas

d) Halle el intervalo para la media estratificada con una confiabilidad de95 %.

yestr ± Zα/2Syestr

donde: N = 400, yestr = 4.675Zα/2 = Z0.025 = 1.96

Por lo tanto:

4.675 ± (1.96)(0.1547)4.675 ± 0.303300254.3717 ≤ µestr ≤ 4.9783

Esto significa que el promedio de fallas justificadas está entre 4.3717 y 4.9783.

e) Cuantifique por intervalo el total estratificado con una confiabilidad de95 %.

τestr ± NZα/2Syestr

donde: τestr = 1870, N = 780, Zα/2 = Z0.025 = 1.96, Syestr = 0.1547

Por lo tanto:

1, 870 ± (400)(1.96)(0.1547)1, 870 ≤ (400)(0.3033)1, 870 ± 121.32011, 870 ± 121.32011, 748.6821 ≤ τestr ≤ 1, 991.3179

Esto quiere decir que total de plantas infectadas por hectárea está entre 1,748.6821y 1,991.3179.

f) Suponga que n = 40 es una muestra preliminar. ¿Cuál es el tamaño demuestra para estimar la media con una precisión de 5 % de la media estratifi-cada y una confiabilidad de 95 %? Además, distribuya n entre los estratos enforma proporcional al tamaño del estrato.

78

Page 90: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

n =

N(Zα/2)2

E∑

h=1

WhS2h

Nd2 +(

Zα/2

)2E

h=1

WhS2h

Estratos Ni S2h WhS

2h

1 120 1.5152 0.45452 100 0.8889 0.22223 90 0.2778 0.06254 90 1.4444 0.3250

Total 400 1.0643

donde:

Zα/2 = Z0.025 = 1.96, d = (0.05)(4.675) = 0.23375,E

h=1

WhS2h =

N1

NS2

1 +N2

NS2

2 +N3

NS2

3

Por lo tanto:

n =(400)(1.96)2(1.0643)

(400)(0.2337)2 + (1.96)2(1.0643)= 63.05353 alumnos (muestra)

Asignación de la muestra en forma proporcional.

n1 =N1

Nn =

120

400(64) = 18.9106 ≈ 19

n2 =N2

Nn =

100

400(64) = 15.7588 ≈ 16

n3 =N3

Nn =

90

400(64) = 14.1829526 ≈ 14

n4 =N4

Nn =

90

400(64) = 14.1829526 ≈ 15

g) Suponga que n = 40 es una muestra preliminar. Determine el tamaño demuestra para estimar el total con una precisión de 5 % del total estratificado yuna confiabilidad de 95 %. Además, asigne n a cada estrato en forma propor-cional al tamaño.

n =

N2(Zα/2)2

E∑

h=1

WhS2h

d2 + N(Zα/2)2

E∑

h=1

WhS2h

Aquí d = (0.05)(4.675)(400) = 93.5 yE

h=1

WhS2h=1.0643

Por lo tanto:

n =(400)2(1.96)2(1.0643)

(93.5)2 + (400)(1.96)2(1.0643))= 63.0353 alumnos (unidades

muestrales)

79

Page 91: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

Nótese que la asignación proporcional es la misma, es decir, la muestra aextraer de cada estrato será de 19 en el estrato 1, 16 en el estrato 2 , 14 en elestrato 3 y 15 en el estrato 4.

Ejemplo 3. El gobierno del estado de Chiapas desea estimar el ingreso prome-dio mensual (miles de pesos) de las familias chiapanecas. Supóngase que eltotal de familias es de 6,000. Por otro lado, el estado tiene 3 zonas geográficasbien definidas (costa, centro y altos) y entre ellos existen diferencias marcadasrespecto al ingreso; por ello, para realizar el estudio se estratificó al estadoen k = 3 estratos: Estrato 1 (Zona costa): N = 2, 000, Estrato 2 (Zona centro):N = 1, 500 y Estrato 3 (Zona altos): N = 2, 500

Para las estimaciones se tomó una muestra preliminar de n = 40 familias:15 para el estrato 1, 11 para el estrato 2 y 14 para el estrato 3 (Cuadro 4.3).

Cuadro 4.3: El ingreso promedio mensual (miles de pesos) de las familias chia-panecas.

Estrato 1 Estrato 2 Estrato 310 12 8 8 4 311 12 8 3 312 13 8 2 410 14 7 4 49 11 6 38 9 513 9 414 8 39 9 58 9 2

a) Realice la estimación puntual de la muestra estratificada.

yestr =N1y1 + N2y2 + N3y3

N

donde: N1 = 2, 000, N2 = 1, 500, N3 = 2, 500, N = 6, 000

y1 =10 + 11 + 12 + . . . + 14 + 11

15= 11.0667

y2 =8 + 8 + 8 + . . . + 9 + 8

11= 8.0909

y3 =4 + 3 + 2 + . . . + 4 + 4

14= 3.5

Por lo tanto:

yestr =(2000)(11.0667) + (1500)(8.0909) + (2500(3.50))

6000

80

Page 92: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

yestr =43019.6970

6000= 7.1699 miles de pesos mensuales (promedio)

b) Realice la estimación puntual del total estratificado.

El estimador del total estratificado es:

τestr = Nyestr

donde: N = 6, 000 y yestr = 7.1699

Por lo tanto:

τestr = (6, 000)(7.1699) = 43, 019.4 (total de ingresos mensuales)

c) Calcule la varianza y la desviación estándar del promedio estratificado.

S2yestr =

(

N1

N

)(

N1 − n1

N1

)(

S21

n1

)

+

(

N2

N

)(

N2 − n2

N2

)(

S22

n1

)

+

(

N3

N

)(

N3 − n3

N3

)(

S23

n3

)

donde: N1 = 2, 000, N2 = 1, 500, N3 = 2, 500, N = 6, 000, n1 = 15, n2 = 11, n3 = 14

S21 =

102 + 112 + 122 + . . . + 142 + 112 − (15)(11.0667)2

15 − 1= 4.0667

S22 =

82 + 92 + 82 + . . . + 92 + 82 − (11)(8.0909)2

11 − 1= 0.8909

S23 =

42 + 32 + 22 + . . . + 42 + 42 − (14)(3.50)2

14 − 1= 0.8846

Por lo tanto:

Syestr =

(

2000

6000

)2 (

2000 − 15

2000

)(

4.06

15

)

+

(

1500

6000

)2 (

1500 − 11

1500

)(

0.8909

11

)

+

(

2500

6000

)2 (

2500 − 14

2500

)(

0.8846

14

)

= 0.04583

Syestr =√

S2yestr

=√

0.04583 = 0.2141

d) Realice la estimación por intervalo de la media estratificada con una con-fiabilidad de 95 %.

yestr ± Zα2Syestr

donde: N = 6, 000, yestr = 7.1699, Zα2

= Z0.025 = 1.96

Por lo tanto:

7.1699 ± (1.96)(0.2140)7.1699 ± 0.41966.750375 ≤ µestr ≤ 7.589541

81

Page 93: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

Esto significa que el ingreso promedio de las familias en la población estáentre 6.750375 y 7.589541.

e) Realice la estimación por intervalo del total estratificado con una confia-bilidad de 95 %.

τestr ± NZα2Syestr

donde: τestr = 43019.6970, N = 6, 000, Zα2

= Z0.025 = 1.96, Syestr = 0.2141

Por lo tanto:

43, 019.6970 ± (6000)(1.96)(0.2141)43, 019.6970 ± (6000)(0.4195)43, 019.6970 ± 2, 517.598540, 502.1446 ≤ τestr ≤ 45, 537.2493

De ahí que el total de ingresos mensuales en las familias chiapanecas estéentre 40,502.1496 y 45,537.2493.

f) Supóngase que n = 40 es una muestra preliminar. Determine el tamañode muestra para estimar la media con una precisión de 5 % de la media estrati-ficada y una confiabilidad de 95 %. Además, asigne n a cada estrato en formaproporcional al tamaño del estrato.

n =

N(Zα2)2

E∑

h=1

WhS2h

Nd2 + (Zα2)2

E∑

h=1

WhS2h

Estratos Ni S2h WhS

2h

1 2,000 4.066 1.35562 1,500 0.8909 0.22273 2,500 0.8846 0.3686

Total 6,000 1.9469

donde: Zα2

= Z0.025 = 1.96, d = (.05)(7.1699) = 0.3585

E∑

h=1

WhS2h =

N1

NS2

1 +N2

NS2

2 +N3

NS2

3 = 1.9469

Por lo tanto:

n =(6000)(1.96)2(1.9469)

(6000)(0.3585)2 + (1.96)2(1.9469)= 57.6349 familia (muestra)

Asignación de la muestra en forma proporcional

82

Page 94: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

n1 =N1

Nn =

2000

6000(57.6349) = 19.2116

n2 =N2

Nn =

1500

6000(57.6349) = 14.4087

n3 =N3

Nn =

2500

6000(57.6349) = 24.0145

g) Suponga que n = 40 es una muestra preliminar. Determine el tamañode muestra definitivo para estimar el total con una precisión de 5 % del totalestratificado y una confiabilidad de 95 %. Además, asigne n a cada estrato enforma proporcional al tamaño.

n =

N2Zα2

K∑

i=1

WiSi

d2 + NZα2

K∑

i=1

WiS2i

donde: d = (0.05)(43019.69670) = 2150.9849 yE

h=1

WhS2h=1.4969

Por lo tanto:

n =(6,000)2(1.96)2(1.9469)

(2, 150.9849)2 + (6,000)(1.96)2(1.9469)= 57.6349 familias

(unidades muestrales)

Dado que el tamaño de muestra es el mismo, entonces se tiene la misma asig-nación en cada estrato, es decir, la muestra a extraer de cada estrato será de19 en el estrato 1, 15 en el estrato 2 y 24 en el estrato 3.

Ejemplo 4. En el estado de Colima hay N = 3,200 familias. Se desea estimar elnúmero de horas promedio por día que cada familia ve televisión. Sin embargo,se sabe que en el estado existen tres estratos sociales bien definidos: clase ba-ja, media y alta. Considerando que el número de horas de ver televisión puedeser distinto de estrato a estrato, la población se dividió en k = 3 estratos, loscuales son: Estrato 1 (Clase baja): N = 1000 familias, Estrato 2 (Clase media):N = 1600 familias y Estrato 3 (Clase alta): N = 600 familias

La distribución de la muestra de tamaño n = 30 familias fue de 10 para elestrato 1, 15 para el estrato 2 y 5 para el estrato 3 (cuadro 4.4).

a) Realice la estimación puntual de la muestra estratificada.

yestr =N1y1 + N2y2 + N3y3

N

donde: N1 = 1, 000, N2 = 1, 600, N3 = 600, N = 3, 200,

y1 =7 + 6 + 6 + . . . + 9 + 10

10= 7.60,

y2 =5 + 6 + 7 + . . . + 6 + 6

15= 6,

83

Page 95: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

Cuadro 4.4: El número de horas diarias que cada familia ve televisiónEstrato 1(n1 = 10) Estrato 2(n2 = 15) Estrato 3(n3 = 5)7 8 5 5 4 46 7 6 5 7 36 8 7 6 8 47 9 5 6 6 58 10 7 7 6 4

y3 =4 + 3 + 4 + . . . + 5 + 4

5= 4

Por lo tanto:

yestr =(1000)(7.60) + (1600)(6) + (600)(4.00)

3200

yestr =19600

3200= 6.125 horas diarias en promedio

b) Calcule el total estratificado.

τestr = Nyestr

donde: N = 3200 y yestr = 6.125

Por lo tanto:

τestr = (3200)(6.125) = 19, 600 horas totales por día

c) Calcule la varianza y la desviación estándar del promedio estratificado.

S2yestr

=

(

N1

N

)2 (

N1 − n1

N1

)(

S21

n1

)

+

(

N2

N

)2 (

N2 − n2

N2

)(

S22

n2

)

+

(

N3

N

)2 (

N3 − n3

N3

)(

S23

n3

)

donde: N1 = 1, 000, N2 = 1, 600, N3 = 600, N = 3, 200n1 = 10, n2 = 15, n3 = 5,

S21 =

72 + 62 + 62 + . . . + 92 + 102 − (10) (7.60)2

10 − 1= 1.60

S22 =

52 + 62 + 72 + . . . + 62 + 62 − (15) (6)2

15 − 1= 1.1421

S23 =

42 + 32 + 42 + 52 + 42 − (5) (4)2

5 − 1= 0.50

Por lo tanto:

84

Page 96: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

S2yestr

=

(

1000

3200

)2 (

1000 − 10

1000

)(

1.60

10

)

+

(

1600

3200

)2 (

1500 − 15

1600

)(

1.1421

15

)

+

(

600

3200

)2 (

600 − 5

600

)(

0.50

5

)

= 0.0378

Syestr =√

Syestr =√

0.0378 = 0.1945

d) Halle por intervalo de la media estratificada con una confiabilidad de95 %.

yestr ± Zα/2Syestr

donde: N = 3, 200, yestr = 6.125 y Zα/2 = Z0.2025 = 1.96

Por lo tanto:

6.125 ± (1.96)(0.1945)6.125 ± 0.381225.72723 ≤ µestr ≤ 6.522764

Esto significa que el promedio de horas por día que las familias de Colimaven televisión está entre 5.72723 y 6.522764.

e) Estime el intervalo del total estratificado con una confiabilidad de 95 %.

τestr ± NZα/2Syestr

donde: τestr = 19, 600, N = 3, 200, Zα/2 = Z0.025 = 1.96 y Syestr = 0.1945

Por lo tanto:

19,600±(3,200)(1.96)(0.1945)19,600±(3,200)(0.3978)19,600±1,272.9618,327.1521≤ τestr ≤20,872.8479

Entonces, el total de horas por día que las familias de Colima ven televisiónestá entre 18,327.1521 y 20,872.8479.

f) Suponga que n = 30 es una muestra preliminar. Determine el tamaño demuestra para estimar la media con una precisión de 5 % de la media estrati-ficada y una confiabilidad de 95 %. Además, asigne n a cada estrato en formaproporcional al tamaño de cada estrato.

n =

N(Zα/2)2

E∑

h=1

WhS2h

Nd2 + (Zα/2)2

E∑

h=1

WhS2h

donde:

85

Page 97: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

Estratos Ni S2h WhS

2h

1 1,000 1.60 0.502 1,600 1.1429 0.57143 600 0.50 0.0938

Total 3,200 1.1652

Zα/2 = Z0.0025 = 1.96, d = (.05)(6.125) = 0.30625 yE

h=1

WhS2h =

N1

NS2

1 +N2

NS2

2 +N3

NS2

3 =

1.1652

Por lo tanto:

n =(3200)(1.96)2(1.1945)

(3200)(0.30125)2 + (1.96)2(1.1945)= 52 familias (unidades mues-

trales)

Asignación de la muestra en forma proporcional

n1 =N1

Nn =

1000

3200(52) = 16

n2 =N2

Nn =

1500

3200(52) = 26

n3 =N3

Nn =

600

3200(52) = 10

g) Suponga que n = 30 es una muestra preliminar. Determine el tamañode muestra definitivo para estimar el total con una precisión de 5 % del totalestratificado y con una confiabilidad de 95 %. Además, realizar la asignaciónde n a cada estrato en forma proporcional al tamaño.

n =

N2Zα

2

E∑

h=1

WhS2h

d2 + NZα

2

E∑

h=1

WhS2h

donde: d = (0.05)(419, 600) = 980 yE

h=1

WhS2h=1.1652

por lo tanto:

n =(3200)2(1.96)2(1.1985)

(980)2 + (3200)(1.96)2(1.1985)= 52

El número estimado de unidades muestrales (familias) de la muestra paratener una precisión de ± 980 horas y 0.05 de probabilidad de no incluir enel intervalo de estimación al total verdadero es de 52 familias. La asignaciónproporcional es la misma, es decir, la muestra de cada estrato será 16 en elestrato 1, 26 en el estrato 2 y 10 en el estrato 3.

86

Page 98: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

4.5. Ejercicios

En los ejercicios siguientes estime:

a) El IC para la media y el total con una confiabilidad de 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la media y el total de tal manera quesean estimados con una precisión de 5 % de la media y el total preliminar conuna confiabilidad de 95 %?

Ejercicio 1. La QFB Patricia Edgwigis Valladares Celis, con el objetivo de es-timar el número de coliformes fecales, como bioindicadores de contaminaciónen el río Colima, cuya longitud es de N = 15, 000 metros, de los cuales N1 = 4, 000metros pertenecen a la zona preurbana, N2 = 8, 000 corresponden a la zona ur-bana, y N3 = 3, 000 a la zona post-urbana. Cabe mencionar que este estudio serealizó en las 4 estaciones del año 2004 pero aquí presentamos solamente losresultados de primavera . Para el estudio se tomó una muestra de n = 15 met-ros distribuidos de la siguiente manera n1 = 4 metros para la zona Pre-urbana,n2 = 8 metros para la zona urbana, y n3 = 3 metros para la zona post-urbana.Los resultados se presentan en el Cuadro 4.5.

Cuadro 4.5: Resultado del número más probable de coliformes fecales por 100ml. de agua.

Preurbana Urbana Posturbana350 920 1,600240 920 2,400

1,600 920 1,6002,400 1,600

2,4002,4001,6002,400

Ejercicio 2. La Secretaría de educación (SEP) desea estimar el promedio decalificaciones de los egresados de la Normal Superior ”Gregorio Torres Quin-tero” del estado de Colima, cabe mencionar que egresan 3 carreras: Lic. en ed-ucación preescolar, Lic. en educación primaria y Lic. en educación secundaria.La población de egresados para el 2007 es de N1 = 30 de educación preesco-lar, N2 = 46 de educación primaria y N3 = 80 de educación secundaria. Pararealizar el estudio se realizó una muestra de n = 16 estudiantes, distribuidosde la siguiente forma: n1 = 3 (preescolar), n2 = 5 (primaria) n3 = 8 (secundaria).Los datos se presentan en el Cuadro 4.6.Ejemplo 3. Un investigador de la Facultad de Medicina de la U de C deseaestimar el daño promedio de tres cepas causantes de la enfermedad de cha-gas. Por lo tanto, supóngase que 300 ratones tienen la cepa 1, 350 la cepa 2

87

Page 99: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

Cuadro 4.6: Calificaciones de los egresados de la Normal SuperiorPreescolar Primaria Secundaria

9.5 9.3 8.78.7 9.7 8.09.9 8.8 9.0

9.0 9.28.5 7.8

8.39.910.0

y 350 la cepa 3. Además, como se espera que el daño varie dependiendo de lacepa, se toma una muestra estratificada de tamaño n = 50 de la población. VerCuadro 4.7.

Cuadro 4.7: Daño promedio a corazoón de las tres sepas en porcentaje.Cepa 1 Cepa 2 Cepa 1(n1 = 15) (n2 = 17) (n3 = 18)

25 26 28 28 29 2923 24 27 26 31 3222 23 29 28 31 3322 22 28 29 32 3123 23 27 28 33 3325 24 28 27 32 3326 26 29 29 32 32

25 28 29 32 3328 33 31

Ejemplo 4. Un agrónomo desea estimar el promedio de taninos que tienenlos nances en el estado de Colima. Dado que existen 3 variedades diseña unesquema de muestreo estratificado. Supóngase que la población tiene: de lavariedad 1, 500 plantas; de la 2, 10,000; y de la variedad 3, 7,000 plantas.Así, toma una muestra de n = 44 distribuida de la siguiente manera: n1 = 10(variedad 1), n2 = 20 (variedad 2) y n3 = 14 (variedad 3). Ver Cuadro (4.8).

4.6. La estimación de la proporción poblacional

Suponga que surge la necesidad de estimar la proporción de unidadesmuestrales que poseen un cierto atributo, en otras palabras, nuestro interésradicará en saber cómo se manifiesta la característica C en cada uno de losestratos. En tal caso nos importa saber la proporción (ph) de unidades mues-trales que tienen la característica C en el estrato h.

Defínase

88

Page 100: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 4.8: Porcentaje de tanino por kg. de nance.Variedad 1 Variedad 2 Variedad 1

(n1 = 10) (n2 = 20) (n3 = 14)04 06 06 04 0705 05 05 05 0704 07 06 05 0703 06 05 04 0605 05 06 0605 05 07 0704 06 05 0703 06 05 0602 05 05 0505 05 07 04

yh,i =

{

1 éxito0 fracaso

que representa al i-ésimo componente del h-ésimo estrato. El éxito consiste entener la característica C.

Esta variable se comporta como una variable aleatoria del tipo binomial,por lo que el estimador de la proporción de la característica de interés para elestrato h es:

ph =

nh∑

i=1

yh,i

nh

Y su varianza correspondiente es,

S2ph

=

(

Nh − nh

Nh

)

ph(1 − ph)

nh

Obsérvese que ph es un estimador insesgado de Ph, la proporción de unidadesmuestrales que tienen la característica C (Scheaffer, 1987 [2]). De la mismamanera, N ∗ ph también es un estimador insesgado del total en el estrato h que

cuentan con la característica C. De tal maneraE

h=1

Nhph es un buen estimador

del total poblacional que cuenta con la característica C (Pérez, 2000 [3]).

4.6.1. El estimador de la proporción y total poblacional

pst =1

N(N1p1 + ... + NEpE)

=1

N

E∑

h=1

Nhph

τst = (N1p1 + ... + NEpE)

=E

h=1

Nhph = Npst

89

Page 101: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

El estimador de la varianza de la proporción y total poblacional

S2ph

=1

N2(N2

1 S2p1

+ ... + N2ES2

pE)

=1

N2

E∑

h=1

N2hS2

ph(proporción)

S2τst

= (N21 S2

p1+ ... + N2

ES2pE

)

=E

h=1

N2hS2

ph(total.)

4.6.2. Los intervalos de confianza para la proporción y totalpoblacional

De forma tradicional, construimos un intervalo que tiene la siguiente ecuación:

pst ± t(n−1,α/2)

1

N2

E∑

h=1

N2h

(

Nh − nh

N

)(

phqh

nh

)

τ ± Nt(n−1,α/2)

1

N2

E∑

h=1

N2h

(

Nh − nh

N

) (

phqh

nh

)

4.6.3. El tamaño de muestra para estimar la proporción es-tratificada

En cuanto a la determinación del tamaño de muestra, se procede de mane-ra análoga a la determinación vista en el apartado anterior. Se utiliza una mo-dificación de la ecuación (4.3.6) sustituyendo la estimación de la varianza σ2

h

por la varianza de la proporción estimada, que es phqh.

El tamaño de muestra para estimar la proporción estratificada

n =

N(

t(n−1,α/2)

)2E

h=1

Whphqh

Nd2M + (t(n−1,α/2))2

E∑

i=1

Whphqh

donde,

Wh =Nh

NdM = el tamaño del error que se desea aceptar en la estimación de la media

El tamaño de muestra para estimar el total estratificado

90

Page 102: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

n =

N2(t(n−1,α/2))2

E∑

h=1

Whphqh

d2T + N(t(n−1,α/2))2

E∑

i=1

Whphqh

Wh =Nh

NdT = el tamaño del error que se desea aceptar en la estimación del total

4.6.4. Asignación de la muestra

El criterio de asignación proporcional, suponiendo que ya se ha calculadoel tamaño de la muestra n requerido, considera como tamaño de muestra decada estrato una parte de n, la cual será proporcional al tamaño del estrato.Esto es, algebraicamente el criterio está representado por:

ni =Nh

Nn = Whn; i = 1, 2, . . . , h,

o especificamente como:

n1 =N1

Nn, n2 =

N2

Nn, . . . , nh =

Nh

Nn.

Nótese que a los estratos más grandes les corresponderá un tamaño de mues-tra mayor, esto es, la asignación de n entre los estratos es proporcional altamaño de cada estrato.

4.6.5. Ejemplos

Ejemplo 1. En el estado de Colima hay N = 5, 000 personas mayores de 60años, de las cuales N1 = 2, 600 son mujeres y N2 = 2, 400 son hombres. Conla finalidad de estimar el porcentaje y el total de personas que padecen dia-betes se tomó una muestra aleatoria de n = 220. De esta muestra n1 = 120 sonmujeres y n2= 100 son hombres, es decir, se estratificó a la población porquese sospecha que el padecimiento de la enfermedad es influido por el género.De las mujeres, 40 resultaron positivas en la prueba de la glucosa (padecendiabetes) y de los hombres, 50.

a) Estime la proporción estratificada.

pst =1

N(N1p1 + N2p2)

donde: N = 5, 000, N1 = 2, 600, N2 = 2, 400,

p1 =

n1∑

i=1

n1

=40

120= 0.327731,

91

Page 103: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

p2 =

n2∑

i=1

n2

=50

100= 0.5

Por lo tanto:

pst =1

5000(2600(0.3333) + 2400(0.5))

pst =1

5000(866.6667 + 1200) =

2066.6667

5000= 0.4133 ó 41.33 % de en-

fermos con diabetes

b) Halle el total estratificado

τ = Npst

donde: N = 5, 000 y pst = 0.4133

Por lo tanto:

τ = (5000)(0.4133) = 2, 006.6667 personas con diabetes

c) Calcule la varianza y la desviación estándar de la proporción estratificada.

S2ph

=1

N2(N2

1 S2p1

+ N22 S2

p2)

donde: N = 5, 000, N1 = 2, 600, N2 = 2, 400, p1 = 0.327731, p2 = 0.5,

S2p1

=

(

N1 − n1

N1

) (

p1q1

n1

)

=

(

2600 − 120

2600

)

(0.3333)(0.6667)

120= 0.001767,

S2p2

=

(

N2 − n2

N2

) (

p2q2

n2

)

=

(

2400 − 100

2400

)

(0.5)(0.5)

100= 0.002396

Por lo tanto:

S2ph

=1

50002((2600)2(0.0017663) + (2400)2(0.002396))

= 0.001030

Sp =√

S2p =

√0.001030 = 0.0321

d) Calcular un IC para la proporción estratificada con una confianza de90 %.

pst ± tα/2,n−1Sph

donde: pst = 0.4133, tα/2,n−1 = Zα/2 = Z0.05 = 1.645 y Sp = 0.0321

Por lo tanto:

92

Page 104: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

0.4133± (1.645)(0.0321)0.4133± 0.05280.355066 ≤ P ≤ 0.4609255

La proporción verdadera de personas que padece diabetes está entre 35.50y 46.09 %.

e) Realice una estimación por intervalo para el total estratificado.

τ ± Ntα/2,n−1Spst

donde: τ = 2006.6667, N = 5,000, tα/2,n−1 = Zα/2 = Z0.05 = 1.645 y Sp = 0.0321

Por lo tanto:

2006.6667± (5000)(1.645)(0.0321)2006.6667± (5000)(0.0528)2006.6667± 2641, 775.331715 ≤ τst ≤ 2, 304.627542

Esto significa que el total de personas que padecen diabetes está entre 1,802.7676y 2,330.5657.

f) Suponga que n = 220 es una muestra preliminar. Determine el tamaño demuestra para estimar la media con una precisión de 0.05 y una confiabilidadde 90 %. Además, realice la asignación de n a cada estrato en forma propor-cional al tamaño del estrato.

n =

N(Zα/2)2

E∑

h=1

phqh

Nd2 + (Zα/2)2

E∑

h=1

phqh

Estratos Nh ph qh Whphqh

1 2,600 0.3333 0.6667 0.11562 2,400 0.5 0.5 0.12

Total 5,000 0.2356

donde: Zα/2 = Z0.05 = 1.645, d = 0.05,E

h=1

WhS2h =

N1

Np1q1 +

N2

Np2q2 = 0.2356

Por lo tanto:

n =(5000)(1.645)2(0.2356)

(5000)(0.05)2 + (1.645)2(0.2356)=

3, 186.3344

13.1373= 242 personas

La asignación de la muestra en forma proporcional

n1 =N1

Nn =

2600

5000(242) = 126

93

Page 105: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

n2 =N2

Nn =

2400

5000(242) = 116

g) Suponga que n = 220 es una muestra preliminar. Determine el tamaño demuestra para estimar la proporción con una precisión de 100.3333 y una con-fiabilidad de 95 %. Además, haga la asignación de n a cada estrato en formaproporcional al tamaño.

n =

N2(Zα/2)2

E∑

h=1

Whphqh

d2 + N(Zα/2)2∑

d = (0.05)(2, 006.667) = 100.3333 yE

h=1

Whphqh=0.2356

Por lo tanto:

n =(5000)2(1.645)2(0.2356)

(100.3333)2 + (5000)(1.645)2(0.2356)= 242 personas

La asignación proporcional es la misma que en f); al estrato uno 126 y alestrato dos 116.

Ejemplo 2. Una empresa que produce artículos electrónicos tiene tres líneasde producción. La línea uno produce N1 = 2, 000 artículos por hora, la dosN2 = 1, 500 artículos por hora y la tres produce N3 = 2, 500 artículos por hora.La producción total por hora es de N = 6, 000. Con la finalidad de estimar elporcentaje y total de artículos defectuosos producidos por hora, se tomó unamuestra aleatoria de n = 150 artículos distribuidos de la siguiente manera:n1 = 50 de la línea uno, n2 = 30 de la línea dos y n3 = 70 de la línea tres, debidoa que las líneas de producción no son idénticas y se sospecha que el númerode artículos defectuosos por líneas son diferentes. En la muestra de la líneauno (n1) se encontraron 4 defectuosos; en la muestra de la línea dos, 3; y en lalínea tres hubo 8 defectuosos.

a) Realice la estimación de la proporción estratificada.

pst =1

N(N1p1 + N2p2 + N3p3)

donde: N = 6, 000, N1 = 2, 000, N2 = 1, 500, N3 = 2, 500, p1 =

n1∑

i=1

n1

=4

50= 0.08,

p2 =

n2∑

i=1

n2

=3

30= 0.1, p3 =

n3∑

i=1

n3

=8

70= 0.1143

Por lo tanto:

pst =1

6000(2000(0,08) + 1500(0.1) + 2500(0.1142))

94

Page 106: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

pst =1

6000(160 + 150 + 285.7142) =

595.7142

6000= 0.0992 ó 9.92 %

articulos producidos por hora

b) Realice la estimación del total poblacional.

τ = Npst

donde: N = 6, 000, pst = 0.0993

por lo tanto:

τ = (6000)(0.0993) = 595.8 articulos defectuosos por hora

c) Calcule la varianza y la desviación estándar de la proporción estratificada.

S2ph

=1

N2(N2

1 S2p1

+ N22 S2

p2+ N2

3 S2p3

)

donde: N = 6, 000, N1 = 2, 000, N2 = 1, 500, N3 = 2, 500, p1 = 0.08, p2 = 0.1,p3 = 0.1143,

S2p1

=

(

N1 − n1

N1

)(

p1q1

n1

)

=

(

2000 − 50

2000

)

(0.08)(0.92)

50= 0.0014,

S2p2

=

(

N2 − n2

N2

)(

p2q2

n2

)

=

(

1500 − 30

1500

)

(0.1)(0.9)

30= 0.0029,

S2p3

=

(

N3 − n3

N3

)(

p3q3

n3

)

=

(

2500 − 70

2500

)

(0.1143)(0.8857)

70= 0.0014

Por lo tanto:

S2ph

=1

60002((2000)2(0.0014) + (1500)2(0.0029) + (2500)2(0.0014))

= 0.000579

Sph=

S2p =

√0.000579 = 0.0240

d) Calcular un IC para la proporción estratificada con una confianza de90 %.

pst ± tα/2,n−1Sph

donde: pst = 0.0993, tα/2,n−1 = Zα/2 = Z0.05 = 1.645, Sp = 0.0242

Por lo tanto:

0.0992± (1.645)(0.0242)0.0992± 0.0398090.0594≤ P ≤ 0.1390

95

Page 107: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

La proporción verdadera de artículos electrónicos defectuosos que se producenpor hora está entre 5.94 y 13.9 por ciento.

e) Realice una estimación por intervalo del total poblacional.

τ ± Ntα/2,n−1Spst

donde: τ = 595.8, N = 6, 000, tα/2,n−1 = Zα/2 = Z0.05 = 1.645, Sp = 0.0242

Por lo tanto:595.8± (6000)(1.645)(0.024)595.8± (6000)(0.03948)595.8± 236.88356.555 ≤ τst ≤ 834.8730

El total de artículos electrónicos defectuosos que se producen por hora estáentre 358.92 y 832.68.

f) Suponga que n=150 es una muestra preliminar. Determine el tamaño demuestra para estimar la media con una precisión de 0.05 y con una confiabili-dad de 90 %. Además, asigne n a cada estrato en forma proporcional al tamañodel estrato.

n =

N(Zα/2)2

E∑

h=1

phqh

Nd2 + (Zα/2)2

E∑

h=1

phqh

Estratos Nh ph qh Whphqh

1 2,000 0.08 0.92 0.02452 1,500 0.1 0.99 0.02253 2,500 0.1143 0.8857 0.0422

Total 6,000 0.0892

donde: Zα/2 = Z0.05 = 1.645, d = 0.05,E

h=1

WhS2h =

N1

Np1q1 +

N2

Np2q2 +

N3

Np3q3 = 0.0892

Por lo tanto:

n =(6000)(1.645)2(0.0892)

(6000)(0.05)2 + (1.645)2(0.0892)=

1, 448.4302

15.2413= 96 artículos

electrónicos (muestra)

La asignación de la muestra en forma proporcional

n1 =N1

Nn =

2000

6000(96) = 32

n2 =N2

Nn =

1500

6000(96) = 24

96

Page 108: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

n3 =N3

Nn =

2500

6000(96) = 40

g) Suponga que n=150 es una muestra preliminar. Determine el tamañode muestra para estimar la proporción con una precisión de ±300 y con unaconfiabilidad de 90 %. Además, distribuya n entre los estratos en forma pro-porcional al tamaño.

n =

N2(Zα/2)2

E∑

h=1

Whphqh

d2 + N(Zα/2)2∑

aquí d = (0.05)(6000) = 300 yE

h=1

Whphqh = 0.0892

n =(6000)2(1.645)2(0.0892)

(300)2 + (6000)(1.645)2(0.0892)= 95.0325

La asignación proporcional es la misma que en el inciso anterior.

Ejemplo 3. La Secretaría de Educación Pública del estado de Colima deseaconocer el porcentaje y el total de personas que ven telenovelas. Suponga quela población de individuos en el estado es de N=10,000, de los cuales 30 % sonniños (estrato 1), 50 % son jóvenes (estrato 2) y el resto son adultos (estrato3). Se estratificó a la población de esa forma ya que los hábitos televisivos sonmuy diferentes entre niños, jóvenes y adultos. Para estimar el porcentaje ytotal de personas que ve telenovelas se tomó una muestra aleatoria de n=300individuos distribuidos de la siguiente manera: n1=90 del estrato uno, n2=150del estrato dos y n3=60 del estrato tres. Los resultados fueron: en el estratouno, 30 niños ven telenovelas; en el dos, 70; y en el estrato tres, 40.

a) Haga la estimación de la proporción estratificada.

pst =1

N(N1p1 + N2p2)

donde: N = 10, 000, N1 = 3, 000, N2 = 5, 000, N3 = 2, 000,

p1 =

n1∑

i=1

n1

=30

90= 0.3333,

p2 =

n2∑

i=1

n2

=70

150= 0.4666,

p3 =

n3∑

i=1

n3

=40

60= 0.6666,

97

Page 109: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

Por lo tanto:

pst =1

10000(3000(0.3333) + 5000(0.4666) + 2000(0.6666))

pst =1

10000(1000 + 2, 333.3333 + 1, 333.3333) =

4, 666.6667

10000= 0.4667

o el 46.67 % de personas ven telenovelas

b) Calcule la estimación del total estratificada.

τ = Npst

donde: N = 10,000, pst = 0.4667

Por lo tanto:

τ = (10, 000)(0.4667) = 4, 666.6667 personas ven telenovelas

c) Estime la varianza y la desviación estándar de la proporción estratificada

S2ph

=1

N2(N2

1 S2p1

+ N22 S2

p2)

donde: N = 5, 000, N1 = 1, 000, N2 = 3, 000, N3 = 2, 000, p1 = 0.3333, p2 = 0.4667,p3 = 0.6667,

S2p1

=

(

N21 − n1

N1

)(

p1q1

n1

)

=

(

3000 − 90

3000

)

(0.3333)(0.6667)

90= 0.0024,

S2p2

=

(

N22 − n2

N2

)(

p2q2

n2

)

=

(

5000 − 150

5000

)

(0.4667)(0.5333)

150= 0.0016,

S2p3

=

(

N23 − n3

N3

)(

p3q3

n3

)

=

(

2000 − 60

2000

)

(0.6667)(0.3333)

60= 0.0036.

Por lo tanto:

S2ph

=1

100002((3000)2(0.0024) + (5000)2(0.0016) + (2000)2(0.0035))

= 0.00076

Sp =√

S2p =

√0.00076 = 0.0276

d) Calcular un IC para la proporción estratificada con una confiabilidad de90 %.

pst ± tα/2,n−1Sph

donde: pst = 0.4667, tα/2,n−1 = Zα/2 = Z0.05 = 1.645, Sp = 0.0276

Por lo tanto:

0.4667± (1.645)(0.0276)

98

Page 110: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

0.4667± 0.04540.42228≤ P ≤ 0.51329

Esto significa que la proporción verdadera de personas que ve telenovelas estáentre 42.13 y 51.21 %, con una confiabilidad de 90 %.

e) Estime por intervalo el total estratificada con una confiabilidad de 90 %.

τ ± Ntα/2,n−1Spst

donde: τ = 4, 666.6667, N = 10,000, tα/2,n−1 = Zα/2 = Z0,05 = 1.645 y Sp = 0.0276

Por lo tanto:4666,6667± (10, 000)(1,645)(0,0276)4666,6667± (10, 000)(0,04539)4666,6667± 453,98114, 212.7259 ≤ τst ≤ 5, 120.6074

El total de personas que ve televisión está entre 4212.7259 y 5120.6074, conuna confiabilidad de 90 %.

f) Suponga que n = 300 es una muestra preliminar. Determine el tamaño demuestra para estimar la media con una precisión de 0.05 y una confiabilidadde 90 %. Además, realice la asignación de n a cada estrato en forma propor-cional al tamaño del estrato.

n =

N(Zα/2)2

E∑

h=1

phqh

Nd2 + (Zα/2)2

E∑

h=1

phqh

Estratos Nh ph qh Whphqh

1 3,000 0.3333 0.6667 0.06672 5,000 0.4667 0.5333 0.12443 2,000 0.6667 0.3333 0.0444

Total 10,000 0.2355

donde: Zα/2 = Z0.05 = 1.645, d = 0.05,E

h=1

WhS2h =

N1

Np1q1 +

N2

Np2q2 +

N3

Np3q3 = 0.2356

Por lo tanto:

n =(10000)(1.645)2(0.2355)

(10000)(0.05)2 + (1.645)2(0.2355)=

6, 374.1922

25.6374= 248.6284 per-

sonas (unidades muestrales)

99

Page 111: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

Asignación de la muestra en forma proporcional

n1 =N1

Nn =

3000

10000(249) = 75

n2 =N2

Nn =

5000

10000(249) = 125

n3 =N3

Nn =

2000

10000(249) = 50

g) Suponga que en realidad n = 300 es una muestra preliminar. Determineel tamaño de muestra definitivo para estimar la proporción con una precisiónde ±500 y una confiabilidad de 90 %. Además, haga la asignación de n a cadaestrato en forma proporcional al tamaño.

n =

N2(Zα/2)2

E∑

h=1

Whphqh

d2 + N(Zα/2)2

E∑

h=1

Whphqh

donde: d = 500 yE

h=1

Whphqh = 0.2356

por lo tanto:

n =(10000)2(1.645)2(0.2355)

(500)2 + (10000)(1.645)2(0.2355)= 249 personas (muestra)

Entonces la asignación proporcional es la misma, es decir, que la muestraa extraer de cada estrato será de 75 del estrato 1, 124 del estrato 2 y 50 delestrato 3.

Ejemplo 4. En la Facultad de Pedagogía se desea conocer el porcentaje y to-tal de alumnos que han leído Cien Años de Soledad de Gabriel García Márquez.El número total de alumnos es de N= 600, de los cuales 29 % son de primergrado (estrato 1), 25 % de segundo grado (estrato 2), 23 % de tercer grado (es-trato 3) y 23 % de cuarto grado (estrato 4). Se estratificó la población de esaforma debido a que los hábitos de lectura entre los grados son diferentes. Paraestimar este porcentaje y el total se tomó una muestra aleatoria de n=40 in-dividuos distribuidos de la siguiente manera: n1=13 del estrato uno, n2=12 delestrato dos, n3=8 del estrato tres y n4=7 del estrato 4. Los alumnos que hanleído el libro fueron 7, 6, 5 y 5 en el estrato 1, 2, 3 y 4, respectivamente.

a) Realice la estimación de la proporción estratificada.

pst =1

N(N1p1 + N2p2)

donde: N = 600, N1 = 174, N2 = 150, N3 = 138, N4 = 138,

100

Page 112: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

p1 =

n1∑

i=1

n1

=7

13= 0.5385,

p2 =

n2∑

i=1

n2

=6

12= 0.5454,

p3 =

n3∑

i=1

n3

=5

8= 0.625,

p4 =

n4∑

i=1

n4

=5

7= 0.71428

Por lo tanto:

pst =1

600(174(0.5385)+150(0.500)+138(0.625)+138(0.7143)) = 0.5892

ó 58.92 % alumnos leyeron el libro

b) Estime el total estratificado.

τ = Npst

donde: N = 600 y pst = 0.5892

Por lo tanto:

τ = (600)(0.5892) = 353.52

El total de alumnos de esa facultad que leyó el libro es de 353.52

c) Estime la varianza y la desviación estándar de la proporción estratificada.

S2ph

=1

N2(N2

1 S2p1

+ N22 S2

p2)

donde: N = 600, N1 = 174, N2 = 150, N3 = 138, N4 = 138, p1 = 0.5385, p2 = 0.500,p3 = 0.625, p4 = 0.7143,

S2p1

=

(

N21 − n1

N1

)(

p1q1

n1

)

=

(

174 − 13

174

)

(0.5385)(0.4615)

13= 0.0177,

S2p2

=

(

N22 − n2

N2

)(

p2q2

n2

)

=

(

150 − 12

150

)

(0.500)(0.500)

12= 0.02088,

S2p3

=

(

N23 − n3

N3

)(

p3q3

n3

)

=

(

138 − 8

138

)

(0.625)(0.375)

8= 0.02759,

S2p4

=

(

N24 − n4

N4

)(

p4q4

n4

)

=

(

138 − 7

138

)

(0.7143)(0.2857)

7= 0.02767.

Por lo tanto:

101

Page 113: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

S2ph

=1

6002((174)2(0.0177)+(150)2(0.0192)+(138)2(0.0276)+(138)2(0.0277))

= 0.0014

Sp =√

S2p =

√0.0056 = 0.0749

d) Calcular el IC para la proporción estratificada con una confianza de 90 %.

pst ± tα/2,n−1Sph

donde: pst = 0.5892, tα/2,n−1 = Zα/2 = Z0.05 = 1.645 y Sp = 0.0749

Por lo tanto:

0.5892± (1.645)(0.0749)0.5892± 0.12320.4761 ≤ P ≤ 0.7124

Esto significa que la proporción verdadera de lectores varía entre 46.60 y 71.24%, con una confiabilidad de 90 %.

e) Estime por intervalo el total poblacional, con una confianza de 90 %.

τ ± Ntα/2,n−1Spst

donde: τ = 353.5137, N = 600, tα/2,n−1 = Zα/2 = Z0.05 = 1.645 y Sp = 0.0749

Por lo tanto:

353.52± (600)(1.645)(0,0749)353.52± (600)(0.0626)353.52± 37.6108285.710 ≤ τst ≤ 434.9533

El total de alumnos lectores fluctúa entre 285.710 y 434.9533, con una confia-bilidad de 90 %.

f) Suponga que n = 40 es una muestra preliminar. Determine el tamaño demuestra para estimar la media con una precisión de 0.05 y una confiabilidaddel 90 %. Además, asigne n a cada estrato en forma proporcional al tamaño delestrato.

n =

N(Zα/2)2

E∑

h=1

phqh

Nd2 + (Zα/2)2

E∑

h=1

phqh

102

Page 114: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Estratos Nh ph qh Whphqh

1 174 0.5385 0.4615 0.07212 150 0.500 0.500 0.06253 138 0.625 0.375 0.05394 138 0.7143 0.2857 0.0469

Total 600 0.2354

donde: Zα/2 = Z0.025 = 1.645, d = 0.05 yE

h=1

WhS2h =

N1

Np1q1 +

N2

Np2q2 +

N3

Np3q3 = 0.2354

por lo tanto:

n =(600)(1.645)2(0.2354)

(600)(0.05)2 + (1.645)2(0.2354)= 179 personas (muestra)

Asignación de la muestra en forma proporcional

n1 =N1

Nn =

174

600(179) = 52

n2 =N2

Nn =

150

600(179) = 45

n3 =N3

Nn =

138

600(179) = 41

n4 =N4

Nn =

138

600(179) = 41

g) Suponga que n=40 es una muestra preliminar. Determine el tamaño demuestra para estimar la proporción con una precisión de ±30 y una confia-bilidad de 90 %. Además, haga la asignación de n a cada estrato en formaproporcional al tamaño.

n =

N2(Zα/2)2

E∑

h=1

Whphqh

d2 + N(Zα/2)2

E∑

h=1

Whphqh

donde: d = (0.05)(600) = 30 yE

h=1

Whphqh = 0.2354

por lo tanto:

n =(600)2(1.645)2(0.2354)

(30)2 + (600)(1.645)2(0.2354)= 179 personas (muestra)

La asignación de la muestra es la misma.

103

Page 115: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 4. El muestreo aleatorio estratificado

4.7. Ejercicios

En los siguientes ejercicios estime los parámetros siguientes:

a) El IC para la proporción y el total estratificado con una confiabilidad de95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la proporción y el total estratificado detal manera que la proporción y el total sean estimados con una precisión de5 % de la proporción y el total preliminar con una confiabilidad de 95 %?

Ejercicio 1. Un investigador estudió los niveles de colesterol sérico en 500personas mayores de 45 años (300 mujeres y 200 hombres). Dado que piensaque el género influye en la variable respuesta, estratificó a la población porgéneros. Para poder estimar la cantidad de personas que tiene altos niveles decolesterol, tomó una muestra aleatoria simple de 120 personas: 84 hombres y36 mujeres. Al momento de realizar las mediciones encontró que 3 mujeres y5 hombres tenían un alto nivel de colesterol.

Ejercicio 2. Un agrónomo sembró tres variedades de manzana. En total sem-bró 5,000 plantas distribuidas de la siguiente forma: 1,000 pertenecen a lavariedad uno, 2,500 a la dos y 1,500 a la tres. Con la finalidad de calcular elporcentaje y el total de plantas dañadas por una plaga X, tomó una muestraaleatoria de 250 plantas distribuidas de la siguiente manera: 100 de la primeravariedad, 100 de la segunda y 50 de la tercera. El número de plantas dañadaspor estrato es el siguiente: 15 plantas en la variedad uno, 4 en la variedad dosy 6 en la variedad tres.

Ejercicio 3. En una población urbana de 3,500 personas del estado de Mi-choacán, se desea conocer la cantidad de personas que utilizan Internet. Supón-gase que en dicha población el 45 % son adolescentes, el 30 % niños y el restoadultos. Para estimar el porcentaje y total de personas que utilizan Internetse tomó una muestra aleatoria de 600 individuos distribuidos de la siguientemanera: adolescentes: n1=200, niños: n2=150 y adultos: n3=250. Los resulta-dos del número de personas que usan Internet por estrato son: 70, 30 y 40,respectivamente.

Ejercicio 4. A un centro de salud asisten aproximadamente 7,000 personasde los cuales 4,000 son adolescentes y 3,000 son adultos. Se desea conocerel porcentaje de personas que hacen ejercicio diariamente y para ello se tomauna muestra aleatoria de 350 individuos (150 son adolescentes y 200 adultos)y se les pregunta si hacen ejercicio diariamente. Los resultados obtenidos sonlos siguientes: en el estrato de adolescentes, 12 hacían ejercicio diariamente,mientras que en el de los adultos 6.

104

Page 116: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5

El muestreo sistemático

La estadística produceresultados muy precisos.Cuando es bien utilizada

y se respetan sus principios.OAML

LA aleatoridad en la selección de la muestra da sustento a los métodos re-visados en capítulos anteriores: un proceso complicado y costoso. Por tal

motivo, podemos usar el diseño de muestreo o de encuestas por muestreo sis-temático, que es ampliamente utilizado para reducir el proceso de selecciónde la muestra. Este diseño sólo requiere fijar un intervalo y de ahí recorrerla población seleccionando las unidades que se encuentren en el punto se-leccionado del intervalo. Ello, evidentemente facilita el trabajo de campo en elmuestreo y reduce sustancialmente los errores que se podrían cometer en casode usar un procedimiento más laborioso (Pérez, 2000 [3]).

Cuando se toma la muestra de una superficie, las unidades se extraen pre-meditadamente de un plano cartesiano imaginario. De esta manera el tiempoque se consumirá y el costo de selección por unidad muestral será menor(Pérez, 2000 [3]).

Muestra sistemáticaEs una muestra que se obtiene con una unidad muestral por cadak unidades en la población de tamaño N , una vez que se obtuvo elprimer elemento, el cual se selecciona aleatoriamente dentro de losprimeros k elementos que conforman el marco de muestreo. De estamanera, tomando el valor apropiado de k, se dice que se tiene unamuestra de 1 en k.

A este tipo de muestra la denotaremos como:

Ysy

Regularmente, N es un múltiplo de k. A cada conjunto de k unidades se lellama grupo. Cabe señalar que existe el muestreo sistemático cuando N no es

105

Page 117: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

múltiplo de k.

El siguiente cuadro muestra el esquema de un muestreo sistemático, dondeN es un múltiplo de k.

Cuadro 5.1: Esquema de un muestreo sistemáticoGrupo 1 2 3 . . . k

1 1 2 3 . . . k2 k+1 k+2 k+3 . . . 2k3 2k + 1 2k + 2 2k + 3 . . . 3k...

......

......

...j (j − 1)k + 1 (j − 1)k + 2 (j − 1)k + 3 . . . jk...

......

......

...n (n − 1)k + 1 (n − 1)k + 2 (n − 1)k + 3 . . . nk = N

El cuadro (5.1) contiene las unidades que se seleccionan de la población,donde la primera unidad seleccionada (k) es aleatoria.

La mayoría de los autores coinciden en señalar que éste diseño es quizá elprocedimiento de selección de la muestra que se conoce más ampliamente, yque además presenta ventajas sobre la selección aleatoria simple entre las quese pueden mencionar:

Rapidez y facilidad en la selección de los elementos de la muestra en lapoblación.

Ninguna sucesión grande de elementos en la población queda sin repre-sentación.

Sé está menos expuesto a errores de selección que cometen los investi-gadores en el campo.

Bajo costo, por la simplicidad de la selección.

Mejor organización y control en el trabajo de campo.

En la práctica la estimación de la varianza sistemática del estimador bajoestudio presenta problemas, ya que se requieren cuando menos dos selec-ciones aleatorias por cada intervalo de selección (k), es decir, dos o más mues-tras sistemáticas para la misma población.

Conociendo la estructura de la población la anterior dificultad puede resol-verse considerando al muestreo sistemático equivalente al muestreo aleatoriosimple y por lo tanto la varianza sistemática será aproximadamente igual a lavarianza aleatoria simple del estimador bajo estudio.

Es conveniente y oportuno indicar en éste momento para que poblacioneses válida esta equivalencia.

106

Page 118: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

5.1. Tipos de población por su estructura

Población aleatoria

Una población es aleatoria (Figura 5.1) si sus elementos están aleatoriamenteordenados con respecto a la característica de interés. Kish L. (1972)[12], Scheaf-fer et. al. (1987)[2] y Azorin F. (1972) [15], entre otros coinciden al indicar que elmuestreo sistemático bajo éstas condiciones es equivalente al muestreo aleato-rio simple. Esto significa que la varianza bajo MAS es aproximadamente igual ala varianza bajo muestreo sistemático. De esta forma, el muestreo sistemáticoes equivalente al muestreo simple aleatorio.

5 10 15 20

02

46

810

X

Y

Figura 5.1: La dispersión del marco de muestreo de una población aleatoria

Población ordenada

Una población es ordenada (Figura 5.2) si los elementos dentro de la poblaciónestán ordenados de acuerdo con algún esquema y con respecto a la variablede interés. Scheaffer et. al. (1987)[?] indica que una muestra sistemática deésta población proporciona más información que una muestra aleatoria sim-ple por unidad de costo, debido a que la varianza sistemática del estimadorserá menor que la varianza del mismo cuado se emplea el muestreo aleatoriosimple.

Ya que no se puede obtener una estimación directa de la varianza sistemáti-ca del estimador se puede emplear una aproximación conservadora (la cuáles mayor de la que se esperaría) estimando la varianza del estimador con lasexpresiones dadas en el muestreo aleatorio simple.

Población periódica

Una población es periódica sí los elementos de la población tienen una variación

107

Page 119: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

−1 0 1 2 3

67

89

10

X

Y

Figura 5.2: La dispersión del marco de muestreo de una población ordenada

cíclica con respecto a la variable de interés. Scheaffer et. al. (1987) [2] señalaque una muestra sistemática extraída de ésta población proporciona menosinformación que una muestra aleatoria simple por unidad de costo. Como enlas situaciones anteriores la varianza sistemática del estimador no puede esti-marse a partir de una sola muestra sistemática. se puede aproximar su valorempleando las expresiones correspondiente que da el muestreo aleatorio sim-ple, pero como es de esperarse ésta aproximación subestimará la varianzaverdadera (sistemática).

Como una alternativa para que ésta subestimación sea mínima se sugierecambiar varias veces el punto de inicio aleatorio con el propósito de mezclarlos elementos de la población y al mismo tiempo seleccionar la correspondi-ente muestra sistemática. En consecuencia se puede suponer que la muestraasí extraída es sistemática y proviene de una población aleatoria.

Para lecturas adicionales véase por ejemplo, Kish L. (1972)[12] cap. 4, AzorinF. (1972)[15] cap.21 y Scheaffer et. al. (1987)[2] cap. 7.

5.2. ¿Cómo seleccionar una muestra sistemática?

Primero se debe decidir el tamaño del intervalo ”1 en k” unidades, posteri-ormente se selecciona aleatoriamente una unidad que se encuentre dentro delintervalo de la primera hasta la k−ésima unidad y así se continuará hasta lle-gar a N . Pero surge la pregunta de como seleccionar la k adecuada. En general,para una muestra sistemática de n elementos en una población de N , k debeser menor o igual N/n; si se desconoce N , entonces se determina un tamañode muestra n aproximado y así se podría obtener una k estimada (Pérez, 2000[3]).

108

Page 120: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

En seguida se dan formas de como elegir el valor de k dependiente deltamaño de la población:

I. Cuando el tamaño de la población, N , es múltiplo de n, (N = kn).Notación:

N : tamaño de la población.n: tamaño de la muestra.k = N/n: intervalo de selección o muestreo.

Procedimiento:

1) Seleccionar aleatoriamente un número entero i (arranque o inicioaleatorio) comprendido entre 1 y k, (1 ≤ i ≤ k ).

2) Luego de manera rígida o sistemática, (de aquí el nombre del proced-imiento) tomar el elemento i + k, que está k lugares del i-ésimo en lalista, el i + 2k que está 2k lugares después, y así sucesivamente hastacompletar el tamaño n de la muestra. Note que la tabla de númerosaleatorios u otro mecanismo de selección se emplea una sóla vez, eni.

Por ejemplo, si N = 1, 000 y se decide un tamaño de n = 10, entonces

k =1,000

10=100. Por lo tanto, el primer valor de k será un valor entre 1 y

100, el cual se elige al azar. Suponga que el primer valor es 40, entonceslos elementos que conformarán la muestra son: el 40, 140, 240, 340, 440,540, 640, 740, 840 y el 940.

II. Cuando el tamaño de la población, N , no es múltiplo de n, (N 6= nk).Notación:

N : tamaño de la población.n: tamaño de la muestra.k = N/n: intervalo de selección o muestreo.

En la prática es frecuente que N no sea múltiplo de n, con lo cual lamuestra sistemática al final puede tener n o n − 1 elementos.

Azorin F. (1972) señala que ésta diferencia de tamaños suele no tenerimportancia cuando la población es de tamaño superior a 50. Por otrolado, Kish L. (1972) indica que éste problema se puede resolver de variasmaneras y el investigador deberá seleccionar la más conveniente. De lassoluciones propuestas por dicho autor se describe la más usual: Consid-erar el marco de muestreo (lista) como si fuera circular.

Procedimiento:

1) Considerar el marco lista como un círculo de manera que la últimaunidad sea seguida por la primera.

2) Sea k el entero más próximo a N/n.

109

Page 121: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

3) Seleccionar aleatoriamente un número entero entre 1 y N .

4) En seguida seleccionar cada k-ésima unidad hasta completar los nelementos.

Por ejemplo, supóngase que N = 300 y se decide un tamaño de n = 9,

entonces300

9= 33.3333 y k = 33, ya que es el entero más próximo a 33.3333.

Además, supóngase que 270 es el entero seleccionado aleatoriamente en-tre 1 y 300. Por tanto, los elementos que conformarán la muestra son: el270, 3, 36, 69, 102, 135, 168, 201 y el 234.

III. Cuando se desconoce el tamaño de la población (N).

En este caso puede darse un valor tentativo de k; sin embargo, podría sermuy grande y nos daría un tamaño de muestra menor que el requerido enel estudio. Esto no representaría un problema si se tuviera la posibilidadde tomar nuevamente la muestra y así seleccionar la k que proporcione eltamaño requerido. Sin embargo, existen muchos casos en los que esto noes posible y es necesario tener una precisión dada al principio. Esto hacedifícil la tarea de estimar un valor adecuado de k (Pérez, 2000 [3]).

5.3. La estimación de la media poblacional

Una vez obtenida la muestra, el objetivo será caracterizar la población pormedio de una muestra estimando los parámetros de mayor interés, como lamedia y el total poblacional. Después se procede a estimar los parámetros consus correspondientes varianzas y por último los intervalos de confianza.

Estimación de la media y el total de la muestra sistemática

µ = ysY =

n∑

i=1

yi

n

τsY = NysY

A continuación se presentan los estimadores correspondientes a las varian-zas de la media y del total.

5.3.1. La varianza de la media y del total.

V (ysY ) =

(

N − n

N

)(

s2

n

)

V (τsY ) = N2

(

N − n

N

) (

s2

n

)

.

110

Page 122: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

El estimador de la varianza del total se obtiene multiplicando el estimadorde la varianza de la media por N2.

5.3.2. El intervalo de confianza de la media y el total

ysY ± tn−1, α2

(

N − n

N

) (

s2

n

)

,

donde ysY es la media de la muestra sistemática.

τsY ± tn−1, α2

N2

(

N − n

N

) (

s2

n

)

.

Obsérvese que la estimación de la varianza es la misma que la presenta-da en el muestreo simple aleatorio. Sin embargo, las varianzas poblacionalesno son las mismas. La varianza del estimador de la media de una muestrasistemática es:

V (ysY ) =σ2

n[1 + (n − 1)ρXY ] .

En la fórmula anterior aparece la medida de correlación, ρXY , que indica larelación que existe entre los elementos de la muestra. Así pues, el muestreosistemático estará muy ligado a este indicador. Si ρXY está alrededor de uno,quiere decir que los elementos están estrechamente relacionados y esto pro-ducirá una mayor varianza de la media que en el muestreo simple aleatorio,por lo que este último será el más indicado. En caso contrario, si ρXY está cercade cero, la estimación por muestreo sistemático es la más recomendada puesla varianza es aproximadamente igual al muestreo simple aleatorio. (Scheaffer,1987 [2]). Por lo tanto, es importante aclarar que los estimadores muestralesde este capítulo son apropiados cuando el coeficiente de correlación (ρXY ) escasi cero, de lo contrario la muestra debe ser seleccionada bajo MAS o MAE.

5.3.3. La selección del tamaño de la muestra.

Para determinar el tamaño de la muestra para estimar a µ, se procede comoen los capítulos anteriores. Primero, se elige un valor de d, es decir, la precisiónque se está dispuesto a aceptar en las estimaciones, y se iguala al producto deun valor de t (con sus correspondientes grados de libertad) por la desviaciónestándar de dicho estimador, como se representa a continuación:

d = t(n−1,α/2)

V (ysY ) (5.1)

111

Page 123: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

El tamaño de muestra para estimar la media

Despejando n de esta ecuación (5.1), se obtiene lo siguiente:

n =N

(

t(n−1,α/2)

)2σ2

Nd2 +(

t(n−1,α/2)

)2σ2

donde la varianza poblacional σ2 se puede sustituir por la muestral.

El tamaño de muestra para estimar el total

n =N2

(

t(n−1,α/2)

)2σ2

d2 + N(

t(n−1,α/2)

)2σ2

donde la varianza poblacional σ2 se sustituye por la muestral

5.3.4. Ejemplos

Ejemplo 1. Una línea de producción de leche ultrapasteurizada elabora N=1,000envases por hora (cada envase contiene un litro de leche). Se desea saber sicada envase de leche cumple con el porcentaje de grasa y para ello se tomauna muestra sistemática de 10 envases. Primero se elige k.

k =N

n=

1, 000

10= 100

Esto quiere decir que se debe muestrear cada 100 envases de leche, eligiendoaleatoriamente el primer elemento entre los primeros 100. Los datos están enel cuadro 5.2.

Cuadro 5.2: El porcentaje de grasa por envase de leche ultrapasteurizadaNúm. de muestra % de grasaEnvase 80 2.5Envase 180 2.6Envase 280 2.7Envase 380 2.6Envase 480 2.8Envase 580 2.9Envase 680 3.0Envase 780 2.6Envase 880 2.7Envase 980 2.8

Efectúe el proceso de estimación de los parámetros siguientes:

a) El promedio de grasa por envase.

ys =y1 + y2 + y3 + ... + yn

n

112

Page 124: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

ys =2.5 + 2.6 + 2.7 + 2.8 + 2.9 + 3 + 2.6 + 2.7 + 2.8

10= 2.72 ó 2.72 %

de grasa por envase.

b) La varianza muestral ((S2))

S2s =

n∑

i=1

y2i − ny2

n − 1

S2s =

(2.5)2 + (2.6)2 + . . . + (2.7)2 + (2.8)2 − (10)(2.72)2

10 − 1

S2s =

0.216

9= 0.024

c) Encontrar la varianza y la desviación estándar de la media muestral.

S2ys

=

(

1, 000 − 10

1, 000

)(

0.024

10

)

= 0.002376

Sys =√

S2ys

=√

0.002376 = 0.04874.

d) Estime la cantidad total de grasa que se encuentra en los envases.

τ = Nys = (1, 000)(2.72) = 2,720 gramos de grasa

e) Hallar el IC para el promedio de grasa por envase de leche.

ys ± tn−1,α/2Sys

donde: ys = 2.72, Sys = 0.0484 y tn−1,α\2 = t10−1,0.025 = 2.2622

Por lo tanto:2.72 ± (2.2622)(0.04874)2.72 ± 0.110262.6097 ≤ µ ≤ 2.8303

Es decir, con una confiabilidad de 95 % se estima que el promedio de grasapor envase de leche está entre 2.6097 y 2.8303.

f) Calcular el IC para el total con una confianza de 95 %.

y ± Ntn−1,α\2SSy

donde: τs = 2,720, N = 1, 000, SSy = 0.04874 y tn−1,α\2 = t10−1,0.025 = 2.2622

Por lo tanto:2,720 ± (1, 000)(2.2622)(0.04874)

113

Page 125: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

2,720 ± (1, 000)(0.11026)2,720 ± 110.269192, 609,7329 ≤ τs ≤ 2, 830.2671

Es decir, con 95 % de confianza se estima que el total de grasa está entre2,609.7329 y 2,830.2671.

g) Suponga que la muestra seleccionada corresponde a una muestra prelimi-

nar de tamaño n = 10. ¿Cuál es el tamaño de muestra para estimar el promediode grasa por envase, con una precisión de 0.05 por ciento de grasa por envasey una confiabilidad de 95 %?.

n =N(tn−1,α\2)

2S2s

Nd2 + (tn−1,α/2)2S2s

donde: N = 1, 000, tn−1,α\2 = t10−1,0.025 = 2.2622, S2s = 0.024 y d = 0.05

Por lo tanto:

n =(1, 000)(2.2622)2(0.024)

(1, 000)(0.05)2 + (2.2622)2(0.024)= 47 envases (muestra)

h) Suponga que la muestra seleccionada representa una muestra prelimi-nar de tamaño n = 10. ¿Cuál es el tamaño de muestra para estimar el total deenvases, con una precisión de 50 envases y una confiabilidad de 95 %?

n =N(tn−1,α\2)

2S2s

d2 + N(tn−1,α\2)2S2s

donde: N = 1, 000, tn−1,α\2 = t12−1,0,025 = 2.2622, S2s = 0.024 y d = 50

por lo tanto:

n =(1, 000)2(2.201)2(0.024)

(50)2 + (1, 000)(2.201)2(0.024)= 47 envases (unidades mues-

trales)

Ejemplo 2. Un tráiler transporta N = 2, 500 sacos de maíz, que están enu-merados del 1 al 2,500. Dado que los sacos no pesan lo mismo suponga quequiere saber el peso promedio por saco y el total de maíz que transporta dichotráiler. Para ello se toma una muestra sistemática de n = 20 sacos. A contin-uación elegimos k.

k =N

n=

2, 500

20= 125

Esto quiere decir que debemos muestrear cada 125 sacos de maíz eligiendoaleatoriamente el primer elemento entre los primeros 125. Los datos se pre-sentan en el cuadro 5.3.

a) Estime el peso promedio en kg por saco de maíz.

114

Page 126: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 5.3: El peso de los sacos de maíz (Kg)n Muestra Peso (Kg)1 Saco 10 71.892 Saco 135 74.243 Saco 260 77.604 Saco 385 82.945 Saco 510 73.176 Saco 635 77.097 Saco 760 66.298 Saco 885 75.179 Saco 1010 64.4110 Saco 1135 80.0811 Saco 1260 79.8212 Saco 1385 73.1513 Saco 1510 72.8814 Saco 1635 81.1515 Saco 1760 78.2916 Saco 1885 74.6217 Saco 2010 83.3118 Saco 2135 73.3619 Saco 2260 69.7520 Saco 2385 77.04

ys =y1 + y2 + y3 + . . . + yn

n

ys =71.89 + 74.24 + 77.60 + . . . + 77.04

20= 75.3125

b) Halle la varianza muestral (S2).

S2s =

n∑

i=1

y2i − ny2

n − 1

S2s =

(71.89)2 + (74.24)2 + (77.60)2 + . . . + (77.04) − (20)(75.3125)2

20 − 1

S2s =

483.0747

19= 25.4249

c) Calcule la varianza y la desviación estándar de la media muestral.

S2ys

=

(

N − n

N

)(

S2

n

)

=

(

2, 500 − 20

2, 500

)(

25.4249

20

)

= 1.2611

Sys =√

S2ys

=√

1.2611 = 1.12297

d) El total de kg que hay en los 2,500 sacos de maíz.

τs = Nys = (2, 500)(75.3125) = 188, 281.25

115

Page 127: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

e) Calcule un IC para el promedio de kilogramos de maíz por saco.

ys ± tn−1,α\2Sys

donde: ys = 75.3125, Sys = 1.12297 y tn−1,α\2 = t20−1,0.025 = 2.0930

Por lo tanto:75.3125 ± (2.093)(1.12297)75.3125 ± 2.350472.9621 ≤ µ ≤ 77.6629

Es decir, con una confiabilidad de 95 % se estima que el valor del promediode kg por saco de maíz está entre 72.9621 y 77.6629.

f) Construya un IC para el total de kg de maíz.

τ ± Ntn−1,α\2Sys

donde: τs = 188, 281.25, N = 2, 500, Sys = 1.12297 y tn−1,α\2 = t12−1,0.025 = 2.0930

Por lo tanto:188, 281.25 ± (2, 500)(2.0930)(1.12297)188, 281.25 ± (2, 500)(2.3503)188, 281.25 ± 5875.9819182, 405.201 ≤ τs ≤ 194, 157.299

Es decir, se estima que el total de kg de maíz que hay en los sacos está entre182,405.201 y 194,157.299.

g) Suponga que la muestra seleccionada corresponde a una muestra prelimi-nar de tamaño n=20. Calcule el tamaño de muestra para estimar el promediopor saco de maíz, con una precisión de 0.5 kg por saco y una confiabilidad de95 %.

n =N(tn−1,α\2)

2S2s

Nd2 + (tn−1,α\2)2S2s

donde: N = 2, 500, tn−1,α\2 = t20−1,0.025 = 2.0930, S2s = 25.4249 y d = 0.5

Por lo tanto:

n =(2, 500)(2.0930)2(25.4249)

(2, 500)(0.5)2 + (25.4249)(2.0930)2= 378.1276 sacos de maíz

(muestra)

Por lo tanto, 379 es el tamaño de muestra que tiene una precisión de ±0.5kg de maíz y 0.95 de probabilidad de incluir en el intervalo de estimación elpromedio verdadero.

116

Page 128: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

h) Suponga que la muestra seleccionada representa una muestra prelimi-nar de tamaño n = 20. ¿Cuál es el tamaño de muestra para estimar el total dekg con una precisión de 1,250 kg de maíz y una confiabilidad de 95 %?

n =N2(tn−1,α/2)

2S2

d2 + N(tn−1,α/2)2S2

donde: N = 2, 500, tn−1,α\2 = t20−1,0.025 = 2.0930, S2s = 25.4249 y d = 1, 250

Por lo tanto:

n =(2, 500)2(2.0930)2(25.4249)

(1250)2 + (2, 500)(2.0930)2(25.4249)= 378.1276 sacos de maíz

(muestra)

Ejemplo 3. Una plantación tiene 6,000 plantas de caña de azúcar. Por el a-rreglo de las plantas (en surcos) es fácil enumerarlas del 1 al 6,000. Supongaque se está interesado en conocer los gramos promedio de sacarosa por plantay el total de sacarosa en la plantación. Por lo tanto, se toma una muestra sis-temática de n = 30. Como de costumbre, hallamos k primero.

k =N

n=

6, 000

30= 200

Esto quiere decir que debemos muestrear cada 200 elementos (plantas),eligiendo aleatoriamente a la primer planta de entre las primeras 200 (cuadro5.4).

a) Calcule el promedio muestral.

ys =y1 + y2 + y3 + . . . + yn

n

ys =11.06 + 10.61 + 14.41 + . . . 12.16

30= 13.5645 gramos de sacarosa

por planta

b) Calcule la varianza muestral (S2s ).

S2s =

n∑

i=1

y2i − ny2

n − 1

S2s =

(11.06)2 + (10.61)2 + (14.41)2 + . . . + (12.16) − (30)(13.5645)2

30 − 1

S2s =

181.4551

29= 6.2571

c) Hallar la varianza y la desviación estándar de la media muestral.

S2ys

=

(

N − n

N

)(

S2

n

)

=

(

3000 − 30

3000

)(

6.2538

30

)

= 0.2075

Sys =√

S2ys

=√

0.2074 = 0.4554

117

Page 129: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

Cuadro 5.4: El porcentaje de sacarosa por plantaObs. Núm. de muestra % de sacarosa

1 50 11.062 250 10.613 450 14.414 650 14.455 850 9.466 1,050 13.477 1,250 14.688 1,450 13.999 1,650 9.7210 1,850 11.3711 2,050 12.2912 2,250 11.2213 2,450 13.2514 2,650 15.7815 2,850 14.6516 3,050 15.0117 3,250 16.8518 3,450 15.9319 3,650 13.2820 3,850 15.3921 4,050 12.8322 4,250 14.4923 4,450 20.3824 4,650 11.3325 4,850 16.2226 5,050 15.8327 5,250 15.6828 5,450 11.7029 5,650 9.4530 5,850 12.16

118

Page 130: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

d) Calcular el total estimado de sacarosa en la población.τs = Nys = (6, 000)(13.5645) = 81, 388.00 gramos

e) Encontrar un IC para el promedio de sacarosa por planta de caña deazúcar.

ys ± tn−1,α\2Sys

donde: ys = 13.5645, Sys = 0.4554 y tn−1,α\2 = t30−1,0.025 = 2.0452

Por lo tanto:13.5645 ± (2.0452)(0.4554)13.5645 ± 0.931712.6330 ≤ µ ≤ 14.4963

Es decir, con una confiabilidad de 95 % se estima que el valor de los gramospromedio de sacarosa por caña de azúcar se encuentra entre 12.6330 y 14.4963.

f) Construir un IC para el total de sacarosa por planta de caña de azúcar.

τ ± Ntn−1,α\2Sys

donde: τs = 81, 388, N = 6, 000, Sys = 0.4554 y tn−1,α\2 = t30−1,0.025 = 2.0452

Por lo tanto:81, 386.84 ± (6, 000)(2.0452)(0.4555)81, 386.84 ± (6, 000)(0.9316)81, 386.84 ± 5590.151775, 797.76736 ≤ τs ≤ 86, 978.23264

Es decir, con 95 % de confianza se estima que el total (gramos) de sacarosaen las plantas de caña de azúcar está entre 75,797.76736 y 86,975.6265.

g) Suponga que la muestra seleccionada corresponde a una muestra prelimi-nar de tamaño n=30. ¿Cuál es el tamaño de muestra necesario para estimar elpromedio de sacarosa por planta de caña de azúcar, con una precisión de 0.5gramos de sacarosa y una confiabilidad de 95 %?.

n =N2(tn−1,α\2)

2S2s

Nd2 + (tn−1,α\2)2S2s

donde: N = 6, 000, t(n−1,α\2) = t(30−1,0.025) = 2.0452, S2s = 6.2538 y d = 0.5

Por lo tanto:

n =(6, 000)(2.0452)2(6.2538)

(6, 00)(0.5)2 + (2.0452)2(6.2538)= 102.8941 plantas de caña de

azúcar (muestra)

119

Page 131: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

h) Suponga que la muestra seleccionada representa una muestra prelimi-nar de tamaño n=30. ¿Cuál es el tamaño de muestra para estimar el total desacarosa en la población, con una precisión de 3,000 gramos y una confiabili-dad de 95 %?

n =N(tn−1,α\2)

2S2s

d2 + N(tn−1,α\2)2S2s

donde: N = 6, 000, tn−1,α\2 = t30−1,0.025 = 2.0452, S2s = 6,2538 y d = 3, 000

Por lo tanto:

n =(6, 000)2(2.0452)2(6.2538)

(3, 000)2 + (6, 000)(2.0452)2(6.2538)= 102.8941 plantas de caña

de azúcar (muestra)

Ejemplo 4. Una línea por turno produce N = 1, 500 paquetes de microproce-sadores, donde cada paquete contiene 10 microprocesadores, y se desea es-timar el número de microprocesadores dañados por paquete. Se toma unamuestra sistemática de n = 15 paquetes. A continuación elegimos k.

k =N

n=

1500

15= 100

Esto quiere decir que se debe muestrear cada 100 elementos (paquetes).Los datos correspondientes se presentan en el cuadro 5.5.

Cuadro 5.5: El número de microprocesadores dañados por cajaObs. Muestra Núm. de defectuosos

1 Paquete 15 3.002 Paquete 115 4.003 Paquete 215 5.004 Paquete 315 2.005 Paquete 415 1.006 Paquete 515 5.007 Paquete 615 1.008 Paquete 715 1.009 Paquete 815 2.0010 Paquete 915 3.0011 Paquete 1,015 4.0012 Paquete 1,115 3.0013 Paquete 1,215 2.0014 Paquete 1,315 4.0015 Paquete 1,415 2.00

a) ¿Cuál es el promedio de microprocesadores dañados por paquete?

ys =y1 + y2 + y3 + . . . + yn

n

120

Page 132: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

ys =3 + 4 + 5 + 2 + 1 + 5 + 1 + 1 + 2 + 3 + 4 + 3 + 2 + 4 + 2

15= 2.8

b) Calcular la varianza muestral (S2).

S2s =

n∑

i=1

y2i − ny2

n − 1

S2s =

(3)2 + (4)2 + (5)2 + . . . (2)2 − (15)(2.8)2

15 − 1

S2s =

26.4

14= 1.8857

c) Hallar la varianza estimada de la media muestral.

S2ys

=

(

N − n

N

)(

S2

n

)

=

(

1500 − 15

1500

)(

1.8857

15

)

= 0.1245

Sys =√

S2ys

=√

0.1245 = 0.3528

d) Encontrar el número total de microprocesadores dañados.

τs = Nys = (1, 500)(2.8) = 4, 200

e) Construir un IC para el promedio de microprocesadores dañados con unaconfiabilidad de 95 %.

ys ± tn−1,α\2Sys

donde: ys = 2.8, Sys = 0.3528, tn−1,α\2 = t15−1,0.025 = 2.1448

Por lo tanto:2.8 ± (2.1448)(0.3528)2.8 ± 0.75662.0434 ≤ µ ≤ 3.5566

Es decir, se estima que el valor promedio de microprocesadores dañados porpaquete está entre 2.0434 y 3.5566.

f) Construir un IC para el total de microprocesadores dañados con una con-fianza de 95 %.

τ ± Ntn−1,α\2Sys

donde: τs = 4, 200, N = 1, 500, Sys = 0.3528, tn−1,α\2 = t15−1,0.025 = 2.1448

Por lo tanto:4, 200 ± (1, 500)(2.1448)(0.3528)4, 200 ± (1, 500)(0.7566)4, 200 ± 1, 134.9793

121

Page 133: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

3, 065.0276 ≤ τs ≤ 5, 334.9723

Es decir, se estima que el total de microprocesadores dañados fluctúa entre3,065.0276 y 5,334.9723.

g) Suponga que la muestra seleccionada corresponde a una muestra pre-liminar de tamaño n = 15. ¿Cuál es el tamaño de muestra para estimar elpromedio de microprocesadores por caja, con una precisión de ±0.5 micro-procesadores y una confiabilidad de 95 %?

n =N(tn−1,α\2)

2S2s

Nd2 + (tn−1,α\2)2S2s

donde: N = 1, 500, t(n−1,α\2) = t(15−1,0.025) = 2.1448, S2s = 1.8857 y d = 0.5

Por lo tanto:

n =(1, 500)(2.1448)2(1.8857)

(1, 500)(0.5)2 + (2.1448)2(1.8857)= 33.9138 paquetes de micro-

procesadores (muestra)

h) Suponga que la muestra seleccionada representa una muestra prelimi-nar de tamaño n = 15. ¿Cuál es el tamaño de muestra para estimar el total,con una precisión de ±750 microprocesadores y una confiabilidad de 95 %?

n =N2(tn−1,α\2)

2S2s

d2 + N(tn−1,α\2)2S2s

donde: N = 1, 500, t(n−1,α\2) = t(12−1,0.025) = 2.1448, S2s = 1.8857 y d = 750

Por lo tanto:

n =(1, 500)2(2.1448)2(1.8857)

(750)2 + (1, 500)(1.8857)(2.1448)2= 33.9138 paquetes de micro-

procesadores (muestra)

5.4. Ejercicios

En los siguientes ejercicios estime los parámetros siguientes:

a) El IC para la media y el total con una confiabilidad de 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la media y el total de tal manera quesean estimados con una precisión de 5 % de la media y el total preliminar conuna confiabilidad de 95 %?

Ejercicio 1. Asistieron N = 5, 000 personas a una fiesta, las cuales fueronenumeradas del 1 al 5,000 al momento de llegar. Se desea conocer la cantidadpromedio de cervezas ingeridas por individuo, siendo ésta la única bebida alco-hólica en la fiesta. Para ello se tomó una muestra sistemática de 25 personasa quienes se les preguntó el número de cervezas que ingirieron. Véase en el

122

Page 134: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

cuadro 5.6.

Cuadro 5.6: Datos de la muestra.Obs. No. de Muestra Ingeridas Obs. No. De Muestra Ingeridas

1 Persona 25 7.5 14 Persona 2,625 72 Persona 225 6 15 Persona 2,825 33 Persona 425 5 16 Persona 3,025 64 Persona 625 7 17 Persona 3,225 65 Persona 825 5 18 Persona 3,425 66 Persona 1,025 4 19 Persona 3,625 57 Persona 1,225 7 20 Persona 3,825 68 Persona 1,425 3 21 Persona 4,025 59 Persona 1,625 8 22 Persona 4,225 410 Persona 1,825 3.5 23 Persona 4,425 4.511 Persona 2,025 4.5 24 Persona 4,625 512 Persona 2,225 6 25 Persona 4,825 713 Persona 2,425 6.5

Ejercicio 2. Una empacadora de limones de Tecomán, Colima, empaca N =2, 000 cajas de limones por turno. Se desea estimar el número de limones daña-dos por caja. Se toma una muestra sistemática de n = 20. Use la informacióndel cuadro 5.7.

Cuadro 5.7: Datos de la muestra.Obs. Muestra Limones dañados Obs. Muestra Limones dañados

1 Caja 10 105 11 Caja 1,010 1052 Caja 110 106 12 Caja 1,110 1093 Caja 210 108 13 Caja 1,210 1004 Caja 310 100 14 Caja 1,310 1105 Caja 410 95 15 Caja 1,410 1006 Caja 510 110 16 Caja 1,510 1007 Caja 610 109 17 Caja 1,610 1058 Caja 710 100 18 Caja 1,710 1059 Caja 810 115 19 Caja 1,810 10010 Caja 910 80 20 Caja 1,910 100

Ejercicio 3. En una colonia de la ciudad de Guadalajara hay N = 2, 500 casas,las cuales se enumeraron del 1 al 2,500. La Comisión Nacional del Agua deseaestimar el gasto promedio de agua en cientos de litros por casa. Para ello tomóuna muestra sistemática de n = 12. Use la información del cuadro 5.8.

∗ Cientos de litros

Ejercicio 4. En una empresa que se dedica a la digitalización de documentos,se escanea N = 1, 500 cajas por día. Se desea conocer la cantidad de Docu-mentos no Escaneados Adecuadamente (DNEA), por lo que se enumeraron las

123

Page 135: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

Cuadro 5.8: Datos de la muestra.Obs. No. de Muestra Litros∗ Obs. No. De Muestra Litros

1 Medidor casa no. 2300 2.5 7 Medidor casa no. 1048 2.82 Medidor casa no. 8 2.2 8 Medidor casa no. 1258 2.63 Medidor casa no. 216 2.7 9 Medidor casa no. 1464 2.54 Medidor casa no. 424 2.9 10 Medidor casa no. 1672 2.45 Medidor casa no. 632 2.4 11 Medidor casa no. 1880 36 Medidor casa no. 840 2.2 12 Medidor casa no. 2088 2.9

cajas del 1 al 1,500 y se tomó una muestra n = 15 cajas. Véase la informacióndel cuadro 5.9.

Cuadro 5.9: Datos de la muestra.Obs. No. de Muestra DNEA Obs. No. de Muestra DNEA

1 Caja no. 60 2 9 Caja no. 860 52 Caja no.160 3 10 Caja no. 960 23 Caja no. 260 2 11 Caja no. 1060 34 Caja no. 360 4 12 Caja no. 1160 35 Caja no. 460 2 13 Caja no. 1260 26 Caja no. 560 3 14 Caja no. 1360 27 Caja no. 660 1 15 Caja no. 1460 48 Caja no. 760 4

5.5. La estimación de la proporción poblacional

Al igual que en los métodos anteriores, en ocasiones se desea estimar unaproporción, es decir, el objetivo es estimar la frecuencia de una característi-ca en particular. De esta forma, la observación que posea la característica deinterés tomará el valor de 1 o 0 de otro modo. No es difícil justificar que lavariable medida tenga una distribución binomial con parámetros n y p, donden representa el tamaño de la muestra y p la proporción o frecuencia relativade éxitos en las n observaciones. Las ecuaciones que se presentarán a con-tinuación son idénticas a las expuestas en la sección dedicada a proporcionesen el capítulo de muestreo simple aleatorio y poseen las mismas propiedadesestadísticas. Sin embargo, las varianzas de las poblaciones no necesariamenteson las mismas en ambos casos. Si nos referimos a una muestra sistemáticaproveniente de una población aleatoria con un tamaño poblacional grande, lasvarianzas pueden llegar a ser las mismas (Scheaffer, 1987 [2]).

5.5.1. El estimador de la proporción y el total

ps = ys =

n∑

i=1

yi

n(5.2)

124

Page 136: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

τs = Nps (5.3)

5.5.2. La varianza estimada de la proporción y el total sis-temático

S2ps

=

(

N − n

N

)

(psqs

n

)

(5.4)

S2τs

= N2

(

N − n

N

)

(psqs

n

)

(5.5)

donde qs = 1 − ps.

Por último, para estos estimadores (5.4 y 5.5) presentamos intervalos deconfianza, que nos indican los límites de la proporción y el total con una con-fiabilidad de (1 − α) por ciento.

5.5.3. El intervalo de confianza para la proporción y el totalsistemático

ps ± t(n−1,α\2)

(

N − n

N

)

(psqs

n

)

τs ± t(n−1,α\2)N

(

N − n

N

)

(psqs

n

)

5.5.4. La selección del tamaño de muestra para la propor-ción y el total

Para determinar el tamaño de muestra que estime ps o τs se elige una pre-cisión que estamos dispuestos a aceptar. Es decir,

d = t(n−1,α/2)

S2ps

, (5.6)

El tamaño de muestra para estimar la proporción

Despejando n de esta ecuación (5.6), obtenemos:

n =N

(

t(n−1,α/2)

)2psqs

Nd2 +(

t(n−1,α/2)

)2psqs

Para fines prácticos la varianza poblacional se sustituye por la varianza mues-tral.

125

Page 137: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

El tamaño de muestra para estimar el total

n =N2

(

t(n−1,α/2)

)2psqs

d2 + N(

t(n−1,α/2)

)2psqs

La varianza poblacional la podemos sustituir por la muestral, con fines prácti-cos.

5.5.5. Ejemplos

Ejemplo 1. La administración de la Universidad de Colima desea conocerla cantidad de alumnos que están satisfechos por las mejoras y los logros al-canzados por el presidente de México. Para realizar dicha encuesta se elegiránk alumnos entre los 10,000 estudiantes de la Universidad de Colima. Se pre-tende obtener una muestra de 18 alumnos. A continuación obtenemos k:

k =N

n=

10, 000

18= 555.5556

Dado que N no es multiplo de n por lo tanto k = 556, el entero más cercano.Por ello, el primer alumno que será encuestado se elegirá aleatoriamente entreel primero y el 10,000. Los datos se presentan en el Cuadro 5.10.

Cuadro 5.10: Los alumnos satisfechos e insatisfechos.No. de alumno Respuesta

422 0978 1

1,534 12,090 12,646 03,202 13,758 04,314 04,870 15,426 05,982 16,538 17,094 17,650 08,206 08,762 19,318 09,874 0

a) Determine la proporción verdadera de los alumnos satisfechos con el tra-bajo del presidente.

126

Page 138: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

ps =

n∑

i=1

yi

n=

a

n=

9

18= 0.5 ó 50 % de alumnos satisfechos

qs = 1 − ps = 1 − 0.5 = 0.5 ó 50 % de alumnos insatisfechos

b) La desviación estándar de la proporción muestral (Sp).

Sps =

(

N − n

N

)

(psqs

n

)

donde: N = 10, 000, n = 18, ps = 0.5 y qs = 0.5

Por lo tanto:

Sps =

(

10, 000 − 18

10, 000

)(

(0.5)(0.5)

18

)

=√

(0.9982)(0.0139) =√

0.9982 = 0.1177

c) Construya un IC de 95 % para la proporción verdadera.ps ± tn−1,α/2Sps

donde: ps = 0.5, Sps = 0.1177 y tn−1,α\2 = t17,0.025 = 2.1098

Por lo tanto:0.5 ± (2.1098)(0.1177)0.5 ± 0.24840.2516 ≤ Ps ≤ 0.7484

Con 95 % de confianza se estima que la proporción verdadera de alumnossatisfechos está entre 0.2516 y 0.7484, es decir, entre 25.163 y el 74.84 %.

d) Realice la estimación puntual del total verdadero de alumnos satisfechos.τ = Nps

donde: N = 10, 000 y ps = 0.5

Por lo tanto:τ = (10, 000)(0.5) = 5, 000

e) Estime por intervalo del total verdadero de alumnos satisfechos, con unaconfiabilidad de 95 %.

τ ± t(n−1,α\2)NSps

donde: N = 5, 000, ps = 0.1177, N = 10, 000 y t(n−1,α\2) = t(17,0.025) = 2.1098

Por lo tanto:5, 000 ± (10, 000)(2.1098)(0.1177)5, 000 ± (10, 000)(0.2484)500 ± 248.4

127

Page 139: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

2, 515.7973 ≤ τs ≤ 7, 484.2027

Por lo tanto, el total de alumnos satisfechos está entre 2,515.7973 y 7,484.2027.

f) Suponga que n = 18 alumnos es una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar la proporción verdadera con unaprecisión de 15 % de la proporción preliminar y una confiabilidad de 95 %?

n =N(t(n−1,α\2))

2psqs

Nd2 + (t(n−1,α\2))2psqs

donde: N = 10, 000, ps = 0.5, qs = 0.5, t(n−1,α\2) = t(17,0.025) = 2.1098 y d = (0.15)(ps) =(0.15)(0.5) = 0.075

Por lo tanto:

n =(10, 000)(2.1098)2(0.5)(0.5)

(10, 000)(0.075)2 + (2.1098)2(0.5)(0.5)= 194 por alumnos (mues-

tra)

g) Suponga que n = 18 estudiantes es una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar el total con una precisión de 15 %del total preliminar y una confiabilidad de 95 %?

n =N2

(

t(n−1,α\2)

)2psqs

d2 + N(

t(n−1,α\2)

)2psqs

donde:N = 10, 000, ps = 0.5, qs = 0.5, t(n−1,α\2) = t(17,0.025) = 2.1098 y d = (0.15)(10, 000)(0.5) =750

Por lo tanto:

n =(10, 000)2(2.1098)2(0.5)(0.5)

(750)2 + (10, 000)(2.1098)2(0.5)(0.5)= 194 alumnos (muestra)

Ejemplo 2. La Secretaría de Salud del estado de Colima está interesada enconocer la cantidad de colimenses que al menos en una ocasión se ha enfer-mado de dengue. Supóngase que N = 8, 000 personas y se pretende encuestara 16 personas. El primer paso es estimar k:

k =N

n=

8000

16= 500

Esto significa que a la primera persona que se le preguntará será elegidaaleatoriamente entre 1 y 500, consecutivamente cada 500 se tomará a otrapersona ( véase en el Cuadro 5.11).

a) Realice la estimación puntual de la proporción de colimenses que hanpadecido dengue.

128

Page 140: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 5.11: Los colimenses que al menos en una ocasión se han enfermadode dengue.

Núm. de personas Respuesta187 0687 1

1,187 01,687 02,187 02,687 03,187 13,687 14,187 04,687 05,187 05,687 16,187 06,687 07,187 07,687 0

ps =

n∑

i=1

yi

n=

a

n=

4

16= 0.25 ó 25 % de colimenses han padeci-

do dengueqs = 1 − ps = 1 − 0.25 = 0.75 ó 75 % que no han padecido la enfer-

medad

b) Halle la desviación estándar de la proporción muestral (SpS).

Sps =

(

N − n

N

)

(psqs

n

)

donde: N = 8, 000, n = 16, ps = 0.25 y qs = 0.75

Por lo tanto:

Sps =

(

8, 000 − 16

8, 000

)(

(0.25)(0.75)

16

)

=√

(0.998)(0.0117188) = 0.1081

c) Calcule un IC de 95 % para la proporción verdadera.

ps ± t(n−1,α\2)Sps

donde: ps = 0.25, Sps = 0.01081 y t(n−1,α\2) = t(15,0.025) = 2.1314

Por lo tanto:

129

Page 141: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

0.25 ± (2.1314)(0.1081)0.25 ± 0.23050.0195 ≤ Ps ≤ 0.4805

Por lo tanto, la proporción verdadera de colimenses que ha padecido denguealguna vez en su vida está entre 0.0195 y 0.4805, es decir, entre 1.95 y 48.05por ciento.

d) Determine la estimación puntual del total verdadero de colimenses quehan padecido dengue alguna vez.

τ = Nps

donde: N = 8, 000 y ps = 0.25

Por lo tanto:τ = (8, 000)(0.25) = 2, 000 colimenses

e) Encuentre por intervalo del total verdadero de colimenses que ha padeci-do dengue, con una confiabilidad de 95 %.

τ ± t(n−1,α\2)NSps

donde: τ = 2, 000, ps = 0.25 y N = 8, 000, t(n−1,α\2) = t(15,0.025) = 2.1314

Por lo tanto:2, 000 ± (8000)(2.1314)(0.1081)2, 000 ± (8, 000)(0.2305)2, 000 ± 1844.0155.9574 ≤ τs ≤ 3844.0426

De ahí que el total de colimenses que han padecido dengue alguna vez ensu vida está entre 155.9574 y 3,844.0426.

f) Suponga que los datos conformaron una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar la proporción verdadera con unaprecisión de 0.075 y una confiabilidad de 95 %?

n =N(t(n−1,α\2))

2psqs

Nd2 + (t(n−1,α\2))2psqs

donde: N = 8, 000, ps = 0.25, qs = 0.75, tn−1,α\2 = t15,0.025 = 2.1314 y d = 0.075

Por lo tanto:

n =(8, 000)(2.1314)2(0.25)(0.75)

(8, 000)(0.075)2 + (2.1314)2(0.25)(0.75)= 149 colimenses (unidades mues-

trales)

g) Suponga que n = 16 es una muestra preliminar. ¿Cuál es el tamaño de

130

Page 142: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

muestra necesario para estimar el total con una precisión de 600 y una con-fiabilidad de 95 %?

n =N2(t(n−1,α\2))

2psqs

d2 + N(t(n−1,α\2))2psqs

donde: N = 8, 000, ps = 0.25, qs = 0.75, tn−1,α\2 = t15,0.025 = 2.1314 y d = 600

por lo tanto:

n =(8, 000)2(2.1314)2(0.25)(0.75)

(600)2 + (8, 000)(2.1314)2(0.25)(0.75)= 149 colimenses (mues-

tra)

Ejemplo 3. Se tiene una población de 300 estudiantes y se pretende sabercuántos de ellos poseen licencia para conducir. Para realizar la estimación setoma una muestra sistemática de 19 estudiantes. A continuación obtenemos k:

dado queN

n=

300

19= 15.7895, entonce k = 16

Dado que N no es multiplo de n por ello k = 16 (el entero más cercano) y elprimer elemento se elige al azar entre el 1 y 300. La encuesta arrojó los datosque están en el Cuadro 5.12.

Cuadro 5.12: Los estudiantes que tienen licencia para conducirNúm. de estudiantes Respuesta

11 027 143 059 075 091 1107 1123 1139 0155 0171 0187 0203 1219 0235 1251 0267 1283 0299 1

a) Realice la estimación puntual para la proporción de estudiantes quecuentan con una licencia para conducir.

131

Page 143: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

ps =

n∑

i=1

yi

n=

a

n=

8

19= 0.4211 ó 42.11 % de estudiantes con li-

cenciaqs = 1 − ps = 1 − 0.4211 = 0.5789 ó un 57.89 % sin licencia

b) La desviación estándar de la proporción muestral (Sp).

Sps =

(

N − n

N

)

(psqs

n

)

donde: N = 300, n = 19, ps = 0.4211 y qs = 0.5789

Por lo tanto:

Sps =

(

300 − 19

300

)(

(0.4211)(0.5789)

19

)

=√

(0.936)(0.0120094)

=√

0.0120094 = 0.1096

c) Calcule un IC de 95 % para la proporción verdadera.

ps ± t(n−1,α\2)Sps

donde: ps = 0.4211, Sps = 0.1096 y t(n−1,α\2) = t(18,0.025) = 2.101Por lo tanto:

0.4211 ± (2.101)(0.1096)0.4211 ± 0.23030.1907 ≤ Ps ≤ 0.6514

Lo anterior significa que la proporción verdadera de estudiantes que cuen-tan con una licencia para conducir está entre 0.1907 y 0.6514, es decir, entre19.07 y el 65.14 %.

d) La estimación puntual del total verdadero de estudiantes que tienen unalicencia para conducir.

τ = Nps

donde: N = 300 y ps = 0.4211

Por lo tanto:τ = (300)(0.4211) = 126.3158

e) Construya un IC para el total verdadero de estudiantes que cuentan conlicencia para conducir, con una confiabilidad de 95 %.

τ ± t(n−1,α\2)NSps

donde: τ = 126.3158, N = 300, Sps = 0.1096 y t(n−1,α\2) = t(18,0.025) = 2.101

132

Page 144: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Por lo tanto:126.3158 ± (300)(2.101)(0.1096)126.3158 ± (300)(0.2303)126.3158 ± 69.093157.2227 ≤ τs ≤ 195.4089

f) Suponga que n = 19 estudiantes es una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar la proporción verdadera con unaprecisión de 10 % de la proporción preliminar y una confiabilidad de 95 %?

n =N(t(n−1,α\2))

2psqs

Nd2 + (t(n−1,α\2))2psqs

donde: N = 300, ps = 0.4211, qs = 0.5789, t(n−1,α\2) = t(18,0.025) = 2.101 y d =(0.10)(p) = (0.10)(0.4211) = 0.04211

Por lo tanto:

n =(300)(2.101)2(0.4211)(0.5789)

(300)(0.04211)2 + (2.101)2(0.4211)(0.5789)= 201 estudiantes (muestra)

g) Suponga que n = 19 estudiantes es una muestra preliminar. Por lo tanto,¿cuál es el tamaño de muestra necesario para estimar el total verdadero conuna precisión de 10 % del total preliminar y una confiabilidad de 95 %?

n =N2(t(n−1,α\2))

2psqs

d2 + N(t(n−1,α\2))2psqs

donde: N = 300, ps = 0.4211, qs = 0.5789, t(n−1,α\2) = t(18,0.025) = 2.101 y d =(0.10)(300)(0.42) = 12.633

Por lo tanto:

n =(300)2(2.101)2(0.4211)(0.5789)

(12.633)2 + (300)(2.101)2(0.4211)(0.5789)= 201 estudiantes (mues-

tra)

Ejemplo 4. Con la finalidad de saber la necesidad de implementar una cam-paña de vacunación, el IMSS desea conocer cuantos de sus asegurados con-trajeron gripe o tos por lo menos una vez en los últimos 6 meses. Tiene 12,000pacientes, de los cuales decide tomar una muestra de 22 pacientes (cuadro5.13)

N

n=

12000

22= 545.4545 ⇒ k = 545

De igual forma como N no es multiplo de n por ello k = 545 y el primer ele-mento se elige al azar de entre el 1 y 12,000.

a) La estimación puntual de la proporción.

133

Page 145: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

Cuadro 5.13: Los asegurados que contrajeron gripe o tos por lo menos una vezen los últimos seis meses

Núm. de paciente Respuesta341 0886 0

1,431 01,976 12,521 03,066 03,611 14,156 14,701 15,246 05,791 16,336 06,881 07,426 07,971 08,516 09,061 19,606 010,151 110,696 111,241 011,786 0

ps =

n∑

i=1

yi

n=

a

n=

8

22= 0.3636 ó 36.4 %

qs = 1 − ps = 1 − 0.36 = 0.6364 ó 63.6 %

b) La desviación estándar de la proporción muestral (Sps).

Sps =

(

N − n

N

)

(psqs

n

)

donde: N = 12, 000, n = 22, ps = 0.36 y qs = 0.64

Por lo tanto:

Sps =

(

12, 000 − 22

12, 000

)(

(0.3636)(0.6364)

22

)

=√

(0.9982)(0.010447)

=√

0.010453876 = 0.1025

c) Un IC de 95 % para la proporción verdadera.

134

Page 146: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

ps ± t(n−1,α\2)Sps

donde: ps = 0.3636, Sps = 0.1025 y t(n−1,α\2) = t(21,0.025) = 2.0796

Por lo tanto:0.3636 ± (2.0796)(0.1025)0.3636 ± 0.21310.1505 ≤ Ps ≤ 0.5767

Por lo tanto, la proporción verdadera de asegurados que han contraído gripe otos en los últimos seis meses entre 15.05 y el 57.67 %.

d) La estimación puntual del total.

τ = Nps

donde: N = 12, 000 y ps = 0.3636

Por lo tanto:τ = (12, 000)(0.3636) = 4, 363.6364 asegurados que han contraído

gripe o tos.

e) Un IC para el total verdadero de asegurados que han contraído gripe otos en los últimos seis meses, con una confiabilidad de 95 %.

τ ± t(n−1,α\2)NSp

donde: τ = 4, 363.6364, ps = 0.1025, N = 12, 000 y t(n−1,α\2) = t(21,0.025) = 2.0796

Por lo tanto:4, 363.6364 ± (12, 000)(2.0796)(0.1025)4, 363.6364 ± (12, 000)(0.2131)4, 363.6364 ± 2, 557.9081, 806.5790 ≤ τs ≤ 6, 920.6937

f) Suponga que 22 asegurados constituyen una muestra preliminar. ¿Cuáles el tamaño de muestra necesario para estimar la proporción verdadera conuna precisión de 10 % de la proporción preliminar y una confiabilidad de 95 %?

n =N2(t(n−1,α\2))

2psqs

d2 + N(t(n−1,α\2))2psqs

donde: N = 12, 000, ps = 0.3636, qs = 0.6364, t(n−1,α\2) = t(21,0.025) = 2.0796 yd = (0.10)(p) = (0.10)(0.3636) = 0.03636

por lo tanto:

n =(12, 000)(2.0796)2(0.3636)(0.6364)

(12, 000)(0.03636)2 + (2.0796)2(0.3636)(0.6364)= 713 asegurados

(muestra)

135

Page 147: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

g) Suponga que n = 22 asegurados en realidad es una muestra preliminar.Por lo tanto, ¿cuál sería el tamaño de muestra necesario para estimar el totalcon una precisión de 10 % del total preliminar y una confiabilidad de 95 %?

n =N2(t(n−1,α\2))

2pq

d2 + N(t(n−1,α\2))2pq

donde: N = 12, 000, ps = 0.3636, qs = 0.6364, t(n−1,α\2) = t(21,0.025) = 2.0796 yd = (0.10)(12, 000)(0.3636) = 436.32

Por lo tanto:

n =(12, 000)2(2.07966)2(0.3636)(0.6364)

(436.32)2 + (12, 000)(2.0796)2(0.3636)(0.6364)= 713 asegurados

(muestra)

5.6. Ejercicios

En los siguientes ejercicios estime los parámetros siguientes:

a) El IC para la proporción y el total con una confiabilidad de 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la proporción y el total de tal maneraque sean estimados con una precisión de 6 % de la proporción y el total pre-liminar con una confiabilidad de 95 %?

Ejercicio 1. Una empresa constructora tiene empleados a N = 1, 200 albañilespara una mega construcción. Con la finalidad de estimar el porcentaje de al-bañiiles a los que les gusta la cerveza, se toma una muestra sistemática den = 12 albañiles. Los resultados se presentan en el cuadro (5.15).

Cuadro 5.15: Albañiles que consumen cervezaObs. No. Muestra Consume Obs. No. Muestra Consume

2 7 0 7 607 11 107 1 8 707 03 207 0 9 807 14 307 1 10 907 15 407 0 11 1007 16 507 1 12 1107 1

Ejercicio 2. Una empresa que produce N = 5, 000 colchones por semana, de-cide tomar una muestra sistemática de n = 10 colchones, el objetivo es estimarel porcentaje de colchones que no cumplen con los requerimientos de calidad.Use la información del cuadro (5.16).

136

Page 148: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 5.16: Muestra de colchones.Obs. No. Muestra Cumple Obs. No. Muestra Cumple

1 210 1 6 2710 12 710 1 7 3210 13 1210 0 8 3710 14 1710 0 9 4210 15 2210 1 10 4710 1

Ejercicio 3. La embajada Francesa en México desea conocer el porcentaje decolimenses que han visitado Francia, supóngase que la población del estadode colima es de N = 10, 000 personas de las cuales se toma una muestra sis-temática de n = 20 individuos. Use la información del cuadro (5.17).

Cuadro 5.17: colimenses que han visitado Francia.Obs. No. Muestra Respuesta Obs. No. Muestra Respuesta

1 300 0 11 5300 02 800 0 12 5800 03 1300 1 13 6300 04 1800 0 14 6800 15 2300 1 15 7300 06 2800 0 16 7800 07 3300 1 17 8300 18 3800 0 18 8800 09 4300 1 19 9300 010 4800 0 20 9800 1

Ejercicio 4. La Secretaría de Turismo de México desea conocer el porcenta-je de colimenses que han visitado la ciudad maya de Palenque, Chiapas. Sesupone que la población del estado de Colima es de N = 10, 000 personas. Deesta población se extrae la muestra sistemática de n = 10 individuos. Use lainformación del cuadro (5.18).

Cuadro 5.18: colimenses que han visitado Palenque, Chiapas.Obs. No. Muestra Respuestas Obs. No. Muestra Respuestas

1 100 0 6 5100 02 1100 0 7 6100 03 2100 1 8 7100 04 3100 0 9 8100 05 4100 1 10 9100 0

137

Page 149: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 5. El muestreo sistemático

138

Page 150: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6

El muestreo por conglomerados enuna etapa

Nunca antes en su historia,la estadística había sidotan querida y repudiada.Tan querida por ser útil,objetiva y muy precisa.

Repudiada, por compleja,laboriosa e ingeniosa.

OAML

EN el estudio del diseño de encuestas o muestreos existen diferentes op-ciones para estimar un parámetro. Esas opciones pueden ser diferentes

en cuanto a costo, precisión o facilidad de aplicación se refiere. En ocasionesresulta absurdo intentar aplicar alguna de ellas a una población con ciertascaracterísticas. Por esto, ahora presentamos otro diseño de muestreo, que pro-porciona herramientas valiosas.

En los diseños de encuestas las unidades muestrales se pueden definir dediferentes formas. En el caso del muestreo por conglomerados, que revisamosen este capítulo, a diferencia de los anteriores, las unidades muestrales (aho-ra llamadas unidades de muestreo primarias o conglomerados) están consti-tuidas por varios elementos (o unidades de muestreo secundarias); en estosúltimos se realizará la medición, mientras que los primeros nos auxilian parahacer la selección aleatoria. Este es el principio del diseño.

Definición: La muestra por conglomeradosUna muestra obtenida aleatoriamente de coglomerados (de la mismaforma que en el muestreo simple aleatorio), en donde a las unidadesde muestreo primarias definidas les llamaremos conglomerados,las cuales son grupos de elementos (o unidades de muestreosecundarias), sobre las que se hará la medición o evaluación de lacaracterística de interés (Pérez, 2000 [3]). Es decir, en éste diseño seextrae bajo MAS una muestra de tamaño n de conglomerados dondecada conglomerado es una colección de elementos o conglomerados.

Como se sabe, si se desea realizar una selección aleatoria de unidades, debe-mos contar con el marco de muestreo adecuado. En ocasiones no es posible

139

Page 151: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

tener el marco de muestreo u obtenerlo es costoso, además de que el costo delmuestreo crece al tener que medir unidades separadas entre sí por una grandistancia física. En el muestreo por conglomerados este costo se reduce sus-tancialmente, ya que al levantar la información de elementos contiguos o muycercanos entre sí se evita el costo de transportación y puede operarse tambiénaun sin tener un marco de muestreo completo.

Por ello el muestreo por conglomerados, en una, dos o más etapas, es undiseño de muestreo efectivo para obtener una cantidad específica de informa-ción, a un costo mínimo, cuando se presentan las siguientes situaciones:

Cuando no se encuentra disponible, no es confiable o es muy caro obtenerun marco que contenga la lista de los elementos de la población, sin em-bargo, es posible disponer fácilmente de un marco que contenga la listade todos los conglomerados de la población.

Aún cuando fuese posible contar con un marco que contenga la lista detodos los elementos de la población, la selección de una muestra aleatoriasimple ocasionaría costos excesivamente altos; esto se puede ver clara-mente en poblaciones grandes y dispersas, es decir, el costo aumentacomo consecuencia de la distancia existente entre unidades de estudio.

6.1. ¿Qué puede ser un conglomerado?

En diseños como éste, es importante tener claro lo que será consideradocomo conglomerado, ya que éstos pueden ser naturales o convenientementedeterminados. Dado que cada problema tiene características propias, entoncesla definición de conglomerados, también la tendrá. Por lo tanto, únicamentese puede hablar de aspectos generales que es necesario que satisfagan losconglomerados, los cuales son:

Que las unidades que conforman cada conglomerado sean lo más diferen-tes entre sí, y además, que estén lo más próximo posible unas de otras,es decir, que las unidades dentro de cada conglomerado sean lo más he-terogéneas y cercas entre sí.

Que los conglomerados sean lo más similares entre sí, es decir, homogé-neos entre sí.

Por ejemplo, en la población de un municipio deseamos conocer ciertoparámetro. Los conglomerados podrían agrupar manzanas, colonias o barrios.La decisión se toma de acuerdo con la precisión que se quiera, la informacióndisponible, los objetivos o cualquier criterio que sea de interés para el inves-tigador. Si se tratara del control de calidad de cajas de artículos electrónicospodríamos designar a las cajas como conglomerados (sitios de muestreo) o enel caso de la evaluación nacional de salud, se elegirían hospitales, centros desalud, etcétera (Pérez, 2000 [3]).

140

Page 152: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Si una encuesta por conglomerados se aplicara a cajas que contienen pro-ductos terminados, entonces en este caso todos los conglomerados contendríanel mismo número M de productos terminados o elementos (unidades de muestreosecundarias), debido a la uniformidad del proceso de producción y empaque.En este ejemplo diremos que los conglomerados son de tamaño homogéneo,pero es evidente que los casos con estas características no son los más fre-cuentes y que en general encontraremos conglomerados de tamaños desiguales;es decir, las colonias no tienen el mismo número de habitantes, los sitios demuestreo forestal tampoco contendrán el mismo número de árboles, etc. Perolas técnicas de muestreo probabilístico cubren estas posibilidades, por lo queno hay de que preocuparse. En el diseño de muestreo el investigador elige losconglomerados aleatoriamente y mide todos sus elementos. Además, esos ele-mentos quedarán automáticamente seleccionados al elegir el conglomerado enla muestra, es decir, cada conglomerado de la muestra será censado (Cochran,1985 [1]).

En el diseño de muestreo por conglomerados en una etapa, se asume quetodos los elementos incluidos en los conglomerados seleccionados y que con-stituyen la muestra serán estudiados. Además, cabe señalar que entre estediseño y el aleatorio simple existe una gran similitud en cuanto a las expre-siones relacionadas con el tamaño de muestra, con la diferencia que el aleato-rio simple utiliza unidades muestrales elementales, mientras que el muestreopor conglomerados, considera grupos de unidades elementales.

6.2. Una comparación con el muestreo estratifica-do

Muestreo estratificado Muestreo por conglomera-dos

Mayor precisión con relaciónal muestreo simple aleatorio.

Menor precisión con relaciónal muestreo simple aleatorio.

Los estratos deben contenerelementos que sean muy ho-mogéneos entre ellos.

Los conglomerados debencontener elementos lo másheterogéneos posible entreellos.

Para obtener una mayor pre-cisión, la diferencia debe sergrande entre estratos.

Para una mayor precisión, losconglomerados deben ser muysimilares.

La varianza de la estimaciónde la media depende de lavariabilidad de los valoresdentro del estrato.

La varianza de la estimaciónde la media depende de lavariabilidad que existe entrelas medias de los conglomera-dos.

141

Page 153: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

Figura 1. Comparación gráfica del muestreo estratificado vs el deconglomerados.

En el estratificado se seleccionan algunas unidades de cada estrato. En elmuestreo por conglomerados se seleccionan algunos de ellos y de los selec-cionados se miden todas las unidades.

6.3. Acerca del tamaño del conglomerado

Es importante resaltar que el conglomerado debe ser de un tamaño ”mode-rado ” o de tal naturaleza que todas las observaciones (observación j en el con-glomerado i) puedan obtenerse con relativa facilidad. Sin embargo, no es difícilimaginar situaciones en las que el conglomerado sea grande. Por ejemplo, silos conglomerados elegidos son conjuntos de viviendas de 120 manzanas yde ellas deben ser elegidos todos los niños menores de 6 años, el conjunto acensar sería demasiado grande, o si el conjunto fuera un archivero y tuvieramiles de hojas y fuera necesario calcular estimaciones por hoja; en tales casoses razonable pensar que el esquema de muestreo por conglomerados en unaetapa no es apropiado, sino otro en dos etapas, Pérez (2000) [3].

NotaciónN : el número de conglomerados en la población o unidades de muestreo pri-marias (UMP ) que cubre a toda la población, sin traslapes.n: el número de conglomerados seleccionados de una muestra simple aleato-ria.Mi: el número de elementos o unidades de muestreo secundarias (UMS) en elconglomerado, i = 1, 2, ..., N .

M =N

i=1

Mi : el número de elementos o unidades de muestreo secundarias en

la población.M : el número promedio de UMS por UMP (o conglomerado) en la población.τi = yi. : el total del conglomerado i.

yi. =

Mi∑

j=1

yij

Mi

: la media a nivel de UMS del conglomerado i.

142

Page 154: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

y. =

N∑

i=1

yi.

N: el total promedio por UMP .

τ =N

i=1

τi =N

i=1

Mi∑

j=1

yij: el total de la población.

µ =τ

M: la media a nivel de UMS.

yij = : el valor de la j-ésima UMS en el i-ésimo conglomerado.

El punto en el subíndice simboliza todas las UMS del conglomerado i. Mise refiere al número de UMS que contiene el conglomerado i. Pudiera darse elcaso de que se seleccione sólo una parte del conglomerado, digamos mi entrelas Mi UMS, lo cual nos lleva al diseño de muestreo conglomerado en dosetapas que no está al alcance de este libro.

6.4. La estimación de una media y un total pobla-cional con M conocida

El muestreo por conglomerados es muy conveniente cuando el costo dellegar a las unidades primarias es muy alto con relación al costo de medir lasunidades secundarias dentro de un conglomerado. Para elegir los conglomera-dos (UMP ) que estarán en la muestra, se sigue el mismo procedimiento queen el muestreo simple aleatorio, por lo que los estimadores de la media, µ, y eltotal, τ , se obtienen de manera similar. Sin embargo, es importante observarque los datos del muestreo por conglomerados permiten obtener estimacionesa diferentes niveles de la población. Es decir, en una encuesta sobre los sitiospara medir la cantidad de madera de árboles, las observaciones individualesyij incluyen los volúmenes por árboles que hay, τi es el volumen total del sitio(para un conglomerado incluido en la muestra, pues se contabilizan a todoslos árboles del sitio), τ es el volumen de toda la población y µ es el volumenpromedio por árbol.

A continuación se presentan los estimadores suponiendo una muestra aleato-ria de n conglomerados y que cada uno contiene Mi elementos (Scheaffer, 1987[2]).

6.4.1. El estimador de la media poblacional

µ = yc =

n∑

i=1

yi.

n∑

i=1

Mi

=

n∑

i=1

Mi∑

j=1

yij

n∑

i=1

Mi

(6.1)

143

Page 155: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

6.4.2. El estimador del total poblacional

τc = Myc = M

n∑

i=1

yi.

n∑

i=1

Mi

= M

n∑

i=1

τi

n∑

i=1

Mi

(6.2)

Debe quedar muy claro que los estimadores (6.1 y 6.2) del promedio y deltotal son de UMS en toda la población (Scheaffer, 1987 [2]). Si se substituyen por N se obtendrían los parámetros µ y τ . Se necesita la varianza de estosestimadores para conocer la dispersión de los datos y para saber la precisiónde las estimaciones. Estas varianzas se muestran a continuación.

6.4.3. La varianza estimada de yc y τc

V (yc) =

(

N − n

N

)(

1

n

)(

1

M2

)

n∑

i=1

(yi. − ycMi)2

n − 1(6.3)

V (τc) = V (Myc) = M2V (yc) (6.4)

= M2

(

N − n

N

) (

1

n

)(

1

M2

)

n∑

i=1

(yi. − ycMi)2

n − 1

=(

NM)2

(

N − n

N

) (

1

n

)(

1

M2

)

n∑

i=1

(yi. − ycMi)2

n − 1

= N2

(

N − n

N

)(

1

n

)

n∑

i=1

(yi. − ycMi)2

n − 1

Al conocer los estimadores de las varianzas de yc y τc (6.3 y 6.4) se puedecalcular sus correspondientes intervalos de confianza, lo que dará los límitesen los que se encuentran las estimaciones, es decir, una idea acerca de laprecisión de las estimaciones. Es importante mencionar que los estimadoresde las varianzas obtenidos con las ecuaciones (6.3 y 6.4) son sesgadas, peropueden ser aceptables si n es "grande"(digamos n > 30) y el sesgo desapareceríasi los tamaños de los conglomerados fueran iguales (todas las Mi iguales).

6.4.4. El intervalo de confianza de la media y el total

yc ± t(n−1,α/2)

V (yc) (6.5)

τc ± t(n−1,α/2)

V (τc) (6.6)

144

Page 156: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

6.4.5. La determinación del tamaño de muestra

La precisión de las estimaciones depende del tamaño de la muestra y delmodo en que esté conformada. Así pues, en el diseño por conglomerados sebusca exactamente la situación inversa al diseño estratificado ya que formare-mos conglomerados que sean homogéneos entre ellos, pero que en su interiormantengan una marcada heterogeneidad. Es decir, que haya valores superio-res a la media general y otros menores a ella, de tal forma que el diseño re-sulte casi tan preciso como la selección aleatoria. Sin embargo, en algunasocasiones los conglomerados ya están definidos por algún esquema y no esposible construirlos de tal forma que el diseño sea más eficiente, lo cual rep-resenta una desventaja en cuanto a la precisión. Por otro lado, esta condicióntambién puede representar una ventaja ya que al utilizar un muestreo porconglomera-do, no requerimos de un marco de muestreo de elementos.

Obsérvese que a diferencia de los diseños anteriores, la muestra por con-glomerados también será definida por el tamaño relativo de los conglomera-dos. Además, el tamaño del límite para el error de estimación depende de lavariación entre los totales de conglomerados, es así que confirmamos que paraobtener límites pequeños de error de estimación debemos seleccionar conglom-erados con la menor variación posible entre estos totales.

Supondremos que el tamaño del conglomerado es fijo y nos interesa saberel número n de conglomerados que seleccionaremos. De la misma manera queen los diseños anteriores, al no conocer σ2

c o el tamaño promedio del conglom-erado, se complica la decisión sobre el número de conglomerados necesar-ios para conseguir una cantidad específica de información concerniente a unparámetro poblacional. Si este fuera el caso, usaríamos los estimadores de σ2

c yM que podrían estar disponibles en encuestas previas o, en todo caso, obten-erse a través de una encuesta piloto seleccionando una muestra preliminar,digamos n, y con esta información podemos calcular el tamaño de muestra n.

Procediendo de manera análoga a los diseños anteriores,

[

t(n−1,α/2)

V (θ)

]

es el error asociado a la estimación, llamado precisión, es decir,

d =

[

tn−1,α/2

V (θ)

]

, (6.7)

donde θ representa el estimador del parámetro de interés.

De la expresión anterior (6.7) y con θ = yc se despeja n para obtener eltamaño de muestra.

145

Page 157: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

El tamaño de muestra para estimar el promedio

n =N

(

t(n−1,α/2)

)2σ2

c

NM2d2 +(

t(n−1,α/2)

)2σ2

c

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1

Para determinar el tamaño de muestra con base en τc, se procede de formasimilar a la anterior dado que V (τc) = V (Myc) = M2V (yc). Así, utilizando esteresultado es fácil llegar a la siguiente ecuación para el tamaño de muestra paraestimar τ .

El tamaño de muestra para estimar el total usando Myc

n =N2(tn−1,α/2)

2σ2c

d2 + N(

tn−1,α/2

)2σ2

c

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1

6.4.6. Ejemplos

Ejemplo 1. La Universidad de Colima tiene 10,000 estudiantes inscritos en220 grupos con diferente número de estudiantes. Con la finalidad de estimarel gasto promedio por estudiante en útiles escolares, se toma una muestraaleatoria simple de 5 grupos, y de cada grupo se le pregunta a cada integrantesobre su gasto en útiles escolares (cuadro 6.2).

146

Page 158: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 6.2: El gasto en útiles escolares por estudiante (en pesos).

Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5104 107 96 91 11386 106 108 84 118114 101 114 70 105106 97 124 79 9674 64 103 92 119125 109 98 131 118114 97 96 88 11390 102 103 96 9798 93 124 99 127120 121 103 100 11997 130 105 77 11599 90 104 69 100112 98 99 83 80112 107 104 70 94104 114 100 81 113125 89 110 67 12893 89 102 70 92129 72 107 112 8281 116 102 100 12478 111 112 104 74121 93 116 87 12293 67 101 81 87114 94 106 101 8992 79 114 94 132107 91 94 126 94114 114 109 102 88101 109 91 69 134101 109 96 78 11198 121 99 122 14192 112 83 73 91

103 115 102 12779 123 123

109 136122 1149094

y1. = 3, 094 y2. = 3, 184 y3. = 3, 238 y4. = 3, 302 y5. = 3, 716

147

Page 159: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

Determine lo siguiente:

a) Encontrar la media.

µ = yc =

n∑

i=1

yi.

n∑

i=1

Mi

=

n∑

i=1

Mi∑

j=1

yij

n∑

i=1

Mi

donde:N = 220: es el número total de grupos en la poblaciónn = 5: el número de grupos o conglomerados seleccionadosM = 10, 000: el total de estudiantes en la poblaciónM1 = 30, M2 = 32, M3 = 32, M4 = 36 y M5 = 34 :tamaño de cada conglomeradoseleccionado

Por lo tanto:

yc =3, 094 + 3, 184 + 3, 238 + 3, 302 + 3, 716

30 + 32 + 31 + 36 + 34=

16, 534

163= 101.4356

b) Hallar el total.

τc = Myc

donde: M = 10, 000: el total de estudiantes en la poblaciónyc = 101.4356: el gasto promedio en útiles escolares por estudiante

Por lo tanto:

τc = (10, 000)(101.4356)= 1, 014, 355.8282 pesos

c) Calcular la varianza y la desviación estándar de la media.

V (yc) =

(

N − n

N

)(

1

nM2

)

n∑

i=1

(yi. − ycMi)2

n − 1donde:

M = 10, 000 : el total de estudiantes en la poblaciónN = 220 : el total de gruposn = 5: el número de grupos o conglomerados seleccionados

M =M

N= 45.45: el número promedio de estudiantes por grupo

yc = 101.4356: el gasto promedio en útiles escolares por estudiante

148

Page 160: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Por lo tanto:

V (yc) =

(

10, 000 − 5

10, 000

) (

1

(5)(45.45)2

)

×(3, 094 − (101.4356)(30))2 + . . . + (3, 716 − (101.4356)(34))2

5 − 1= 4.9391

V (yc) =√

4.9391 = 2.2224

d) Construir un IC al 90 % para la media poblacional µc.

yc ± t(n−1,α/2)

V (yc)

donde:yc = 101.4356: el gasto promedio en útiles escolares por estudiantet(n−1,α/2) = t(5−1,0.1/2) = 2.1318√

V (yc) = 2.2224

Por lo tanto:

101.4356 ± (2.1318)(2.2224)101.4356 ± 4.737796.6978 ≤ µc ≤ 106.1734

e) Calcular un IC de 90 % para el total.

τc ± tn−1,α/2V (τc)

donde: τc = 1, 014, 355.8282, tn−1,α/2 = t5−1,0.1/2 = 2.1318,√

V (τc) = M

V (yc) = (10, 000)(2.2224)=22, 223.861

Por lo tanto:

1, 014, 355.8282 ± (2.1318)(22, 223.861)1, 014, 355.8282 ± 47, 378.1353966, 977.6930 ≤ τc ≤ 1, 061, 733.9635

f) Suponer que n = 5 grupos es una muestra preliminar. ¿Cuál es el tamañode muestra necesario para estimar la media poblacional con una precisión de4 % de la media preliminar y una confiabilidad de 90 %?

n =N

(

tn−1,α/2

)2σ2

c

NM2d2 +(

tn−1,α/2

)2σ2

c

donde:

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1

149

Page 161: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

yc = 101.4356: el gasto promedio en útiles escolares por estudianteN = 220 : el total de gruposn = 5: el número de grupos o conglomerados seleccionados

M =M

N= 45.45: el número promedio de estudiantes por grupo

tn−1,α/2 = t5−1,0.1/2 = 2.1318

s2c =

(3, 094 − (101.4356)(30))2 + . . . + (3, 716 − (101.4356)(34))2

5 − 1= 52, 209.8943

d = (0.04)(101.4356) = 4.0574

Por lo tanto:

n =(220)(2.1318)2(52, 209.8943)

(220)(45.45)2(4.0574)2 + (2.1318)2(52, 209.8943)= 6.7616 grupos.

g) Suponer que n = 5 grupos es una muestra preliminar. ¿Cuál es el tamañode muestra necesario para estimar el total poblacional con una precisión de4 % del total preliminar y una confiabilidad de 90 %?

n =N2(tn−1,α/2)

2σ2c

d2 + N(

tn−1,α/2

)2σ2

c

donde:

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1

τc = 1, 014, 355.8282N = 220 : el total de gruposn = 5: el número de grupos o conglomerados seleccionadostn−1,α/2 = t5−1,0.1/2 = 2.1318

s2c =

(3, 094 − (101.4356)(30))2 + . . . + (3, 716 − (101.4356)(34))2

5 − 1= 52, 209.8943

d = (0.04)(1, 014, 355.8282) = 40, 574.2331

Por lo tanto:

n =(220)2(2.1318)2(52, 209.8943)

(40, 574.2331)2 + (220)(2.1318)2(52, 209.8943)= 6.7616 grupos

Ejemplo 2. La empresa Peñafiel procesa 1, 000 rejas de refresco por día. Conla finalidad de conocer si el proceso de producción cumple con el contenido decarbohidratos, cierto día se selecciona una muestra aleatoria simple de 6 rejas(cuadro 6.4).

a) Estimar el promedio de carbohidratos por refresco.

µc = yc =

n∑

i=1

yi.

n∑

i=1

Mi

=

n∑

i=1

Mi∑

j=1

yij

n∑

i=1

Mi

150

Page 162: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 6.4: El contenido de carbohidratos por reja de refrescoReja 1 Reja 2 Reja 3 Reja 4 Reja 5 Reja 6

6.8 7.1 7.1 7.8 7.7 6.76.6 7.4 7.3 7.9 7.5 6.97.1 7 6.9 7.7 7.8 6.77 7.4 7 7.6 7.6 6.6

6.9 8 7.1 7.6 7.8 6.87.4 7.2 7.3 7.6 7.9 6.66.9 7.5 7.3 7.4 7.8 6.87 7.3 7.3 7.6 7.9 7.27 7.8 7.2 7.6 8 6.8

6.8 7.3 7.2 7.5 7.6 7.17.2 7.8 7.4 7.5 7.7 6.77.2 7.2 7.4 7.9 7.6 77.2 7.4 7.1 7.3 7.4 6.76.8 7.5 7.2 7.7 8 6.77.1 7.7 6.9 7.8 8 6.77.1 7.5 6.4 7.4 7.8 6.87.2 7.5 6.9 7.7 7.6 6.77.1 7.6 7.5 7.3 7.9 6.77 7.4 7.1 7.9 7.8 6.7

7.2 7.8 7.2 7.4 7.7 6.86.7 7.4 7.3 7.8 7.5 6.97.1 8.1 7.2 7.6 8 6.86.7 7.5 6.9 7.7 7.8 6.67.2 7.8 7.2 7.7 7.6 6.9

y1. = 168.3 y2. = 180.2 y3. = 171.4 y4. = 183 y5. = 186 y6. = 162.9

donde:n = 6: el número de rejas seleccionadasM = 24, 000: el total de refrescos producidos en ese díaM1 = 24, M2 = 24, M3 = 24, M4 = 24, M5 = 24 y M6 = 24: número de refrescos porcada reja

Por lo tanto:

yc =168.3 + 180.2 + 171.4 + 183 + 186 + 162.9

24 + 24 + 24 + 24 + 24 + 24+=

1, 051.8

144= 7.3042 car-

bohidratos promedio por refresco.

b) La estimación del total de carbohidratos producidos

τc = Myc

donde:M = 24, 000: el total de refrescos producidos en ese díayc = 7.3042: el contenido promedio de carbohidratos por refresco

151

Page 163: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

Por lo tanto:

τc = (24, 000)(7.3042)= 175, 300.8 carbohidratos producidos

c) La estimación de la varianza de la media.

V (yc) =

(

N − n

N

)(

1

nM2

)

n∑

i=1

(yi. − ycMi)2

n − 1

donde:M = 24, 000: el total de refrescos producidos en ese díaN = 1, 000: las rejas de refresco producidasn = 6: el número de rejas seleccionadas

M =M

N=

24, 000

1, 000= 24: el número promedio de refrescos por reja

yc = 7.3042: el contenido promedio de carbohidratos por refresco

Por lo tanto:

V (yc) =

(

24, 000 − 6

24, 000

)(

1

(6)(24)2

)

×(168.3 − (7.3042)(24))2 + . . . + (162.9 − (7.3042)(24))2

6 − 1= 0.0239

d) Calcular un IC de 90 % para la media poblacional.

yc ± t(n−1,α/2)

V (yc)

donde:yc = 7.3042: el contenido promedio de carbohidratos por refrescotn−1,α/2 = t6−1,0.1/2 = 2.0150√

V (yc) = 0.1546

Por lo tanto:

7.3042 ± (2.0150)(0.1546)7.3042 ± 0.31166.9925 ≤ µc ≤ 7.6158

e) Calcular un IC de 90 % para el total.

τc ± tn−1,α/2V (τc)

donde: τc = 175, 300.8, tn−1,α/2 = t6−1,0.1/2 = 2.0150√

V (τc) = M

V (yc) = (24, 000)(0.1536) = 3, 711.5380

Por lo tanto:175, 300.8 ± (2.0150)(3, 711.5380)175, 300.8 ± 7, 478.9287

152

Page 164: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

167, 821.0713 ≤ τc ≤ 182, 778.9287

Es decir, con 90 % de confianza el total de carbohidratos en la población seubica entre 167, 821.0713 y 182, 778.9287

f) Suponga que n = 6 rejas es una muestra preliminar. ¿Cuál es el tamañode muestra para estimar la media verdadera con una precisión del 4 % de lamedia preliminar y una confiabilidad de 90 %?

n =N

(

tn−1,α/2

)2σ2

c

NM2d2 +(

tn−1,α/2

)2σ2

c

donde:

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1yc = 7.3042: el contenido promedio de carbohidratos por refrescoN = 1, 000 : las rejas de refresco producidasn = 6: el número de rejas seleccionadas

M =M

N=

24, 000

1, 000= 24: el número promedio de refrescos por reja

t(n−1,α/2) = t(6−1,0.1/2) = 2.0150

s2c =

(168.3 − (7.3042)(24))2 + . . . + (162.9 − (7.3042)(24))2

6 − 1= 83.1520

d = (0.04)(7.3042) = 0.2922

Por lo tanto:

n =(1, 000)(2.0150)2(83.1520)

(1, 000)(24)2(0.2922)2 + (2.0150)2(83.1520)= 6.8201 rejas

g) Suponga que n = 6 rejas es una muestra preliminar. Por tanto, ¿cuál es eltamaño de muestra para estimar el total verdadero con una precisión del 4 %del total preliminar y una confiabilidad del 90 %?

n =N2(tn−1,α/2)

2σ2c

d2 + N(

tn−1,α/2

)2σ2

c

donde:

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1

τc = 175, 300.8N = 1, 000 : las rejas de refresco producidasn = 6: el número de rejas seleccionadastn−1,α/2 = t6−1,0.1/2 = 2.0150

s2c =

(168.3 − (7.3042)(24))2 + . . . + (162.9 − (7.3042)(24))2

6 − 1= 83.1520

d = (0.04)(175, 300.8) = 7, 012.032

Por lo tanto:

153

Page 165: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

n =(1, 000)2(2.0150)2(83.1520)

(7, 012.032)2 + (1, 000)(2.0150)2(83.1520)= 6.8201 rejas

Ejemplo 3. El gerente del periódico Ecos de la Costa desea estimar el númeropromedio de ejemplares comprados por familia por mes en el estado de Colima.Los costos de transportes de un lugar a otro son altos, por esta razón se listanlos 4, 000 hogares del estado en 400 conglomerados geográficos (manzanas) de10 hogares cada uno, y se selecciona una muestra aleatoria simple de 5 con-glomerados. Se realizan las entrevistas y los resultados están en el cuadro 6.5.Realizar los cálculos que a continuación se piden.

Cuadro 6.5: Ejemplares comprados por familia.Manzana 1 Manzana 2 Manzana 3 Manzana 4 Manzana 5

3 4 2 2 13 3 1 2 21 1 3 1 33 3 1 3 13 2 3 1 32 3 1 1 11 4 1 2 23 2 2 2 52 3 1 2 43 2 3 1 4

y1. = 24 y2. = 27 y3. = 18 y4. = 17 y5. = 26

a) Estimación de la media.

µc = yc =

n∑

i=1

yi.

n∑

i=1

Mi

=

n∑

i=1

Mi∑

j=1

yij

n∑

i=1

Mi

donde: n = 5: el número de conglomerados seleccionadosM = 4, 000: el total de hogares en el estadoM1 = 10, M2 = 10, M3 = 10, M4 = 10 y M5 = 10: tamaño de cada conglomeradoseleccionado

Por lo tanto:

yc =24 + 27 + 18 + 17 + 26

10 + 10 + 10 + 10 + 10=

112

50= 2.24 ejemplares por familia

b) Estimación del total.

τc = Myc

154

Page 166: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

donde: M = 4, 000: el total de hogares en el estadoyc = 2.24: el promedio de ejemplares comprados por familia

Por lo tanto:τc = (4, 000)(2.24)= 8, 960 ejemplares comprados

c) Estimación de la varianza y la desviación estándar de la media.

V (yc) =

(

N − n

N

)(

1

nM2

)

n∑

i=1

(yi. − ycMi)2

n − 1

donde:N = 400: el número de conglomerados geográficosn = 5: el número de conglomerados seleccionadosM = 4, 000: el total de hogares en el estado

M =M

N=

4, 000

400= 10: el número promedio de hogares por conglomerado

yc = 2.24: el número promedio de ejemplares comprados por familia

Por lo tanto:

V (yc) =

(

400 − 5

400

) (

1

(5)(10)2

)

(24 − (2.24)(10))2 + . . . + (26 − (2.24)(10))2

5 − 1

= 0.0421

V (yc)=√

0.0421 = 0.2051

d) Un IC de 90 % para la media poblacional µc.

yc ± t(n−1,α/2)

V (yc)

donde:yc = 2.24: el número promedio de ejemplares comprados por familiatn−1,α/2 = t5−1,0.1/2 = 2.1318√

V (yc) = 0.2051

Por lo tanto:2.24 ± (2.1318)(0.2051)2.24 ± 0.43721.8028 ≤ µc ≤ 2.6772

Es decir, con un 90 % de confianza el número promedio de ejemplares com-prados por familia se ubica entre 1.8028 y 2.6772.

e) Un IC de 90 % para el total.

τc ± tn−1,α/2V (τc)

155

Page 167: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

donde: τc = 8, 960, tn−1,α/2 = t5−1,0.1/2 = 2.1318,√

V (τc = M

V (yc) = (4, 000)(0.2051) = 820.4145

Por lo tanto:8, 960 ± (2.1318)(820.4145)8, 960 ± 1, 748.99817, 211.0019 ≤ τc ≤ 10, 708.9981

Es decir, con un 90 % de confianza el total de ejemplares comprados en elestado se encuentra entre 7, 211.0019 y 10, 708.9981.

f) Suponga que n = 5 conglomerados geográficos es una muestra prelimi-nar. ¿Cuál es el tamaño de muestra para estimar la media verdadera con unaprecisión de 10 % de la media preliminar y una confiabilidad de 90 % ?

n =N

(

tn−1,α/2

)2σ2

c

NM2d2 +(

tn−1,α/2

)2σ2

c

donde:

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1

yc = 2.24: el número promedio de ejemplares comprados por familiaN = 400 : el número de conglomerados geográficosn = 5: el número de conglomerados seleccionados

M =M

N=

4, 000

400= 10: el número promedio de hogares por conglomerados

tn−1,α/2 = t5−1,0.1/2 = 2.1318

s2c =

(24 − (2.24)(10))2 + . . . + (26 − (2.24)(10))2

5 − 1= 21.3

d = (0.1)(2.24) = 0.224

Por lo tanto:

n =(400)(2.1318)2(21.3)

(400)(10)2(0.224)2 + (2.1318)2(21.3)= 18.4051 conglomerados

g) Suponga que n=5 conglomerados es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar el total verdadero con una precisión de 10 %del total preliminar y una confiabilidad de 90 % ?

n =N2(tn−1,α/2)

2σ2c

d2 + N(

tn−1,α/2

)2σ2

c

donde:

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1

156

Page 168: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

τc = 8, 960N = 400: el número de conglomerados geográficosn = 5: el número de conglomerados geográficos seleccionadostn−1,α/2 = t5−1,0.1/2 = 2.1318

s2c =

(24 − (2.24)(10))2 + . . . + (26 − (2.24)(10))2

5 − 1= 21.3

d = (0.1)(8, 960) = 896

Por lo tanto:

n =(400)2(2.1318)2(21.3)

(896)2 + (400)(2.1318)2(21.3)= 18.4051 conglomerados geográ-

ficos.

Ejemplo 4. Un investigador de la U de C desea estimar el total de emigrantesen el estado de Colima, cuya población es de 200, 000. No existe una listadisponible de personas de toda la población, por lo tanto, el estado es divididoen 800 localidades. Para lograr tal objetivo toma una muestra de 12 localidadesy entrevista a todos los habitantes de las 12 localidades y obtiene los resultadosdel cuadro 6.6.

Cuadro 6.6: Emigrantes de las 12 localidades.Localidad Habitantes Total de emigrantes

por localidad por localidad1 181 y1. = 102 316 y2. = 203 249 y3. = 144 73 y4. = 295 164 y5. = 426 120 y6. = 207 171 y7. = 188 241 y8. = 199 283 y9. = 1010 115 y10. = 2311 142 y11. = 2412 188 y12. = 13

a) La estimación de la media.

µc = yc =

n∑

i=1

yi.

n∑

i=1

Mi

=

n∑

i=1

Mi∑

j=1

yij

n∑

i=1

Mi

donde:n = 12: el número de localidades seleccionadasM = 200, 000: los habitantes en el estadoM1 = 181, M2 = 316, M3 = 249, M4 = 73, M5 = 164, M6 = 120, M7 = 171, M8 = 241,

157

Page 169: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

M9 = 283, M10 = 115, M11 = 142, M12 = 188 : total de habitantes por localidad

yc =10 + 20 + 14 + . . . + 23 + 24 + 13

181 + 316 + 249 + . . . + 115 + 142 + 188=

242

2, 243= 0.1079 emigrantes en pro-

medio

b) La estimación del total.τc = Myc

donde:M = 200, 000: los habitantes en el estadoyc = 0.1079: el promedio de emigrantes por localidad

Por lo tanto:

τc = (200, 000)(0.1079)= 21, 580 emigrantes en total

c) La estimación de la varianza y la desviación estándar de la media

V (yc) =

(

N − n

N

)(

1

nM2

)

n∑

i=1

(yi. − ycMi)2

n − 1

donde:N = 800: el número de localidades en las que está dividido el estado (conglom-erados)n = 12: el número de localidades seleccionadasM = 200, 000: los habitantes en el estado

M =M

N=

200, 000

800= 250: el número promedio de habitantes por localidad (con-

glomerado)yc = 0.1079: el número promedio emigrantes por localidad

Por lo tanto:

V (yc) =

(

800 − 12

800

) (

1

(12)(250)2

)

(10 − (0.1079)(181))2 + . . . + (13 − (0.1079)(188))2

12 − 1

= 0.0003

V (yc)=√

0.0003 = 0.0164

d) Un IC al 90 % para la media poblacional.

yc ± t(n−1,α/2)

V (yc)

donde:yc = 0.1079: el número promedio emigrantes por localidadt(n−1,α/2) = t(12−1,0.1/2) = 1.7959√

V (yc) = 0.0164

158

Page 170: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Por lo tanto:0.1079 ± (2.7959)(0.0164)0.1079 ± 0.02950.0784 ≤ µc ≤ 0.1374

Es decir, con 90 % de confianza el número promedio de emigrantes en el estadoestá entre 0.0768 y 0.1374

e) Un IC al 90 % para el total

τc ± tn−1,α/2V (τc)

donde:τc = 21, 580t(n−1,α/2) = t(12−1,0.1/2) = 1.7959√

V (τc = M

V (yc) = (200, 000)(0.0164) = 3, 280.3971

Por lo tanto:

21, 580 ± (1.7959)(3, 280.3971)21, 580 ± 5, 891.215415, 891.2154 ≤ τc ≤ 27, 471.2154

Esto significa que con 90 % de confianza el total de emigrantes en el estadose ubica entre 15, 891.2154 y 27, 471.2154.

f) Suponga que n = 12 conglomerados (localidades) es una muestra pre-liminar. ¿Cuál sería el tamaño de muestra necesario para estimar la mediapoblacional con una precisión de 10 % de la media preliminar y una confiabil-idad de 90 % ?

n =N

(

tn−1,α/2

)2σ2

c

NM2d2 +(

tn−1,α/2

)2σ2

c

donde:

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1yc = 0.1079: el número promedio de emigrantes por localidadN = 800: el número de localidades en las que está dividido el estado (conglom-erados)n = 12: el número de localidades seleccionadasM = 200, 000: los habitantes en el estado

M =M

N=

200, 000

800= 250: el número promedio de habitantes por localidad

tn−1,α/2 = t12−1,0.1/2 = 1.7959

s2c =

(10 − (0.1079)(181))2 + . . . + (13 − (0.1079)(188))2

12 − 1= 204.8415

d = (0.1)(0.1079) = 0.01079

159

Page 171: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

Por lo tanto:

n =(800)(1.7959)2(204.8415)

(800)(250)2(0.01079)2 + (1.7959)2(204.8415)= 81.5390

Por lo tanto, el tamaño de muestra requerido para estimar la media verdaderacon una precisión de 0.01079 es de n = 82 conglomerados (localidades).

g) Suponga que n = 12 conglomerados (localidades) es una muestra prelimi-nar. ¿Cuál es el tamaño de muestra para estimar el total poblacional con unaprecisión de 10 % del total preliminar y una confiabilidad del 90 % ?

n =N2(tn−1,α/2)

2σ2c

d2 + N(

tn−1,α/2

)2σ2

c

donde:

σ2c es estimada por s2

c =

n∑

i=1

(yi. − ycMi)2

n − 1τc = 21, 580N = 800: el número de localidades en las que está dividido el estado (conglo-merados)n = 12: el número de localidades seleccionadasM = 200, 000: los habitantes en el estado

M =M

N=

200, 000

800= 250: el número promedio de habitantes por localidad

tn−1,α/2 = t12−1,0.1/2 = 1.7959

s2c =

(10 − (0.1079)(181))2 + . . . + (13 − (0.1079)(188))2

12 − 1= 204.8415

d = (0.1)(21, 580) = 2, 158

Por lo tanto:

n =(800)2(1.7959)2(204.8415)

(2, 158)2 + (800)(1.7959)2(204.8415)= 81.5390

Por lo tanto, el tamaño de muestra requerido para estimar el total poblacionalcon una precisión de 2, 158 es de n = 82.

6.5. Ejercicios

En los siguientes ejercicios estime los parámetros siguientes:

a) El IC para la media y el total poblacional con una confiabilidad de 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la media y el total poblacional de talmanera que sean estimados con una precisión de 5 % de la media y el totalpreliminar con una confiabilidad de 95 %?

Ejercicio 1. La Secretaría de salud cuenta con 200 hospitales distribuidos enel territorio nacional, dentro de los cuales tiene laborando a 6, 000 médicos con

160

Page 172: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

estudios de postgrado. Con la finalidad de medir el nivel de satisfacción en eltrabajo de los empleados, se toma una muestra aleatoria simple de 6 hospi-tales, en cada uno de estos hospitales se realiza un censo. (El nivel de sat-isfacción se mide de 0 (nada satisfecho) a 10 (muy satisfecho)) (cuadro (6.7)).

Cuadro 6.7: Nivel de satisfacción de los médicos en cada hospitalHospital 1 Hospital 2 Hospital 3 Hospital 4 Hospital 5 Hospital 6

6 9 8 8 6 97 8 7 8 6 88 7 6 7 9 77 8 5 9 8 68 6 9 8 9 57 5 6 8 6 49 9 5 9 7 86 7 8 8 9 96 6 9 8 8 96 6 7 7 7 77 8 9 6 6 78 8 8 5 9 99 8 9 9 8 87 7 10 7 7 78 9 9 8 6 67 8 9 9 9 76 7 7 6 8 85 6 8 5 10 98 6 8 9 10 97 6 7 8 9 94 7 6 7 8 87 7 6 6 7 86 8 6 5 6 76 8 7 4 5 76 8 8 8 9 66 8 9 67 6 8 47 7 8 87 8 86 6 76 7 65 99108

161

Page 173: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

Ejercicio 2. El presidente municipal de Colima desea estimar el total debasura producida en la ciudad. Se supone que la ciudad está conformadapor 300 manzanas, y que el número de viviendas es de 10, 000. Además, conla finalidad de medir el promedio y total de basura producida por viviendasemanalmente, se toma una muestra aleatoria simple de n = 8 manzanas. Encada manzana se recaba toda la basura producida por cada vivienda. Use lainformación del cuadro (6.8).

Cuadro 6.8: Kg. de basura producidos por vivienda semanalmente.Mz 1 Mz 2 Mz 3 Mz 4 Mz 5 Mz 6 Mz 7 Mz 840 30 38 48 35 45 49 8260 35 29 36 38 38 35 8330 45 65 37 48 45 28 7340 48 82 72 65 66 25 6560 68 88 83 70 33 29 4550 75 95 93 35 22 79 6648 45 49 63 40

49 65 4065

6.6. La estimación de la media y un total cuandose desconoce M

6.6.1. ¿Qué sucede cuando se desconoce el tamaño de lapoblación M?

Con la información anterior, se puede estimar la media, el total o el inter-valo de confianza para el total poblacional. Sin embargo, para utilizar las ex-presiones anteriores se debe conocer M , pero en ocasiones no es posible saberese valor. A continuación se muestran los estimadores donde no es necesarioconocer M .

Es importante mencionar que los estimadores que a continuación se pre-sentan se recomiendan cuando los tamaños de los concloglomerados son apro-ximadamente iguales.

6.6.2. El estimador de la media y el total poblacional

Para hallar el estimador del total y la media poblacional se recurre a laexpresión del total promedio por conglomerado (y.):

τc = Ny. (6.8)

µc = yc =τc

Maprox

(6.9)

162

Page 174: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

donde y. =

n∑

i=1

yi.

n=

n∑

i=1

τi

n, Maprox = NM y M =

n∑

i=1

Mi

n.

6.6.3. La varianza estimada de la media y del total.

V (τc) = V (Ny.) = N2

(

N − n

N

) (

1

n

)

n∑

i=1

(yi. − y.)2

n − 1(6.10)

V (µc) = V (yc) =V (τc)

M2aprox

=1

M2

(

N − n

N

)(

1

n

)

n∑

i=1

(yi. − y.)2

n − 1(6.11)

Nota: recuérdese que cuando no se conoce M , entonces M =

n∑

i=1

Mi

n

Las varianzas (6.11 y 6.10) de estos estimadores nos indican la precisión delos mismos. Los intervalos de confianza para estos estimadores se construyende forma habitual.

6.6.4. El intervalo de confianza de la media y del total.

yc ± t(n−1,α/2)

V (yc)

τc ± t(n−1,α/2)

V (τc)

6.6.5. Los tamaños de muestra para estimar la media y eltotal

El tamaño muestral para estimar µ

n =N(tn−1,α/2)

2σ2t

Nd2 + (tn−1,α/2)2σ2t

donde σ2t es estimada por s2

t =

n∑

i=1

(yi. − y.)2

n − 1

Nota: El valor d es calculado con respecto al total promedio por conglomer-

ado

y. =

n∑

i=1

yi.

n

163

Page 175: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

El tamaño muestral para estimar τ

n =N2(tn−1,α/2)

2σ2t

d2 + N(tn−1,α/2)2σ2t

donde σ2t es estimada por s2

t =

n∑

i=1

(yi. − y.)2

n − 1

6.7. La estimación de una proporción poblacional

Muchas veces se quiere estimar la característica G específica de la población.Por ejemplo: suponga que se desea conocer la proporción de personas en elestado de Colima que padecen cierta enfermedad, o la preferencia por ciertopartido político, la aceptación de alguna cierta norma ecológica, etc. Por esto,cuando se desea estimar una proporción y el total, si se conoce M , se debenutilizar los mismos estimadores de la media y el total con M conocida quefueron presentados en el apartado 6.5, sólo que ahora la variable respuestacontendrá ceros y unos. En caso de desconocerse M , los estimadores de laproporción y el total deben ser los mismos que se usaron en el apartado 6.6.En ambos casos se realizan los cálculos exactamente como los ejemplos pre-sentados en los apartados 6.5 y 6.6, respectivamente. Es importante recordarque el muestreo por conglomerados se sugiere cuando:

Las unidades muestrales son grupos de elementos.

Se desea minimizar el costo por unidad muestreada.

Éste diseño puede combinarse con otros diseños; por ejemplo, el estrati-ficado.

6.7.1. Ejemplos

Ejemplo 1. Un agrónomo tiene una parcela experimental de 10, 000 m2. Conla finalidad de conocer la cantidad promedio por planta y el total de cacahua-tes producidos, divide la parcela en tramos de 4m2, y selecciona una muestraaleatoria de 15 tramos. Enseguida cuenta el número de cacahuates por planta.El cuadro 6.9 muestra los totales por tramo. Resuelva lo que se le pide acontinuación.

a) La estimación de la media por conglomerado (tramo).

y. =

n∑

i=1

yi.

n=

n∑

i=1

τi

n

donde:n = 15: el número de tramos seleccionadosτi = yi.: el total de cacahuates en el tramo i, i = 1, 2, . . . , 15

164

Page 176: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 6.9: El total de cacahuates producidos por tramoTramo Plantas Total/tramo

T1 35 y1. = 1, 680T2 34 y2. = 1, 360T3 28 y3. = 1, 904T4 33 y4. = 1, 485T5 34 y5. = 2, 346T6 27 y6. = 1, 809T7 28 y7. = 1, 148T8 33 y8. = 1, 320T9 31 y9. = 1, 953T10 35 y10. = 1, 645T11 34 y11. = 2, 414T12 29 y12. = 2, 146T13 28 y13. = 1, 232T14 26 y14. = 1, 404T15 29 y15. = 1, 450

Por lo tanto:

y. =1, 680 + 1, 360 + . . . + 1, 404 + 1, 450

15=

25, 290

15= 1, 686.4 cacahuates por con-

glomerado (tramo)

b) La estimación del total poblacional

τc = Ny. =N

n

n∑

i=1

yi

donde:y. = 1, 686.4: el promedio de cacahuates por tramo (conglomerado)

N =10, 000

4= 2, 500: los tramos en los que se dividió la parcela

n = 15: los tramos seleccionados

Por lo tanto:

τc = (2, 500)(1, 686.4) = 4, 216, 000 cacahuates por parcela.

c) La estimación de la media poblacional (por planta de cacahuate).

Como en este caso se desconoce M , se hace una aproximación para estimar lamedia poblacional:

Maprox = NM = N

n∑

i=1

Mi

n

donde:

165

Page 177: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

n = 15: el número de tramos seleccionadosN = 2, 500: el número de tramos en la poblaciónM1 = 35, M2 = 34, M3 = 28, M4 = 33, M5 = 34, M6 = 27, M7 = 28, M8 = 33, M9 = 31,M10 = 35, M11 = 34, M12 = 29, M13 = 28, M14 = 26 y M15 = 29

M =35 + 34 + . . . + 26 + 29

15= 30.9333

Por lo tanto:Maprox = (30.9333)(2, 500) = 77, 333.3333

El estimador de la media poblacional es:

yc =τc

Maprox

donde: τc = 4, 216, 000 y Maprox = 77, 333.3333

Por lo tanto:

yc =4, 216, 000

77, 333.3333= 54.5172 cacahuates en promedio por plan-

ta.

d) La varianza y la desviación estándar de la media poblacional.

V (yc) =V (τc)

M2aprox

=N2V (y.)

M2aprox

V (y.) =

(

N − n

N

)(

1

n

)

n∑

i=1

(yi. − y.)2

n − 1

donde:Maprox = 77, 333.3333y. = 1, 686.4n = 15: el número de tramos que fueron selecionadosN = 2, 500: el número de tramos en la población

V (y.) =

(

2, 500 − 15

2, 500

)(

1

15

)

(1, 680 − 1686.4)2 + . . . + (1, 450 − 1, 686.4)2

15 − 1= 10, 528.1337

Por lo tanto:

V (yc) =(2, 500)2(10, 528.1337)

(77, 333.3333)2= 11.0026

V (yc) =√

11.0026 = 3.3170

e) La estimación por intervalo de la media poblacional con una confianza de90 %.

yc ± t(n−1,α/2)

V (yc)

donde: yc = 54.5172: cacahuates promedio por plantat(n−1,α/2) = t(15−1,0.1/2) = 1.7613

166

Page 178: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

V (yc) = 3.3170

Por lo tanto:54.5172 ± (1.7613)(3.3170)54.5172 ± 5.842348.6749 ≤ µc ≤ 60.3595 cacahuates por planta

f) La estimación por intervalo del total poblacional con una confianza de90 %.

τc ± t(n−1,α/2)N

V (yc)

donde: τc = 4, 216, 000, t(n−1,α/2) = t(15−1,0.1/2) = 1.7613√

V (τc) = N

V (y.) = (2, 500)(√

10, 528.1337) = 256, 516.7356

por lo tanto:4, 216, 000 ± (1.7613)(256, 516.7356)4, 216, 000 ± 451, 805.52113, 764, 194.4788 ≤ τc ≤ 4, 667, 805.5211 cacahuates por parcela

g) Suponga que n = 15 tramos es una muestra preliminar. Determine eltamaño de muestra para estimar la media por conglomerados con una pre-cisión de 10 % del promedio preliminar y una confiabilidad de 90 %.

n =N(tn−1,α/2)

2σ2t

Nd2 + (tn−1,α/2)2σ2t

donde:

σ2t es estimada por s2

t =

n∑

i=1

(yi. − y.)2

n − 1y. = 1, 686.4: el promedio total de cacahuates por tramo (conglomerado)yi.: el total de cacahuates en el tramo i,i = 1, 2 . . . , 15N = 2, 500: los tramos en los que está dividida la parcela

s2t =

(1, 680 − 1686.4)2 + . . . + (1, 450 − 1, 686.4)2

15 − 1= 158, 875.2571

t(n−1,α/2) = t(15−1,0.1/2) = 1.7613, d = (0.1)(1, 686.4) = 168.64

Por lo tanto:

n =(2, 500)(1.7613)2(158, 875.2571)

(2, 500)(168.64)2 + (1.7613)2(158, 875.2571)= 17.2110 tramos (

unidades muestrales)

h) Suponga que n = 15 es una muestra preliminar. Determine el tamaño demuestra para estimar el total con una precisión de 10 % del total preliminar yuna confiabilidad de 90 %.

167

Page 179: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

n =N2(tn−1,α/2)

2σ2t

d2 + N(tn−1,α/2)2σ2t

donde:

σ2t es estimada por s2

t =

n∑

i=1

(yi. − y.)2

n − 1

y. = 1, 686.4: el total promedio de cacahuates por tramo (conglomerado)yi.: el total de cacahuates en el tramo i, i = 1, 2 . . . , 15N = 2, 500: los tramos en los que está dividida la parcela

s2t =

(1, 680 − 1686.4)2 + . . . + (1, 450 − 1, 686.4)2

15 − 1= 158, 875.2571

t(n−1,α/2) = t(15−1,0.1/2) = 1.7613τc = 4, 216, 000: el total estimado de cacahuates producidos en la parcelad = (0.1)(4, 216, 000) = 421, 600

Por lo tanto:

n =(2500)2(1.7613)2(158,875.2571)

(421,600) + (2500)(1.7613)2(158,875.2571)= 17.2110 tramos (mues-

tra)

Ejemplo 2. Suponga que un predio que está localizado en la playa de Man-zanillo tiene 1, 000 palmeras de coco. Un investigador desea conocer la canti-dad promedio de agua de coco que producen, para lo cual toma una muestraaleatoria de 8 palmeras, y mide la cantidad de agua por coco en cada palmera.El cuadro 6.10 muestra el total de agua en litros. Resuelva lo siguiente.

Cuadro 6.10: El agua de coco por palmera (litros).

P1 P2 P3 P4 P5 P6 P7 P81.12 0.94 0.77 0.81 0.95 0.77 0.88 0.830.68 1.33 0.95 1.49 1.23 0.72 1.06 0.851.07 0.76 1.07 0.99 1.11 0.77 0.87 0.820.85 0.95 0.73 0.89 1.14 0.85 0.95 0.970.79 1.26 0.96 1.03 1.66 0.56 0.86 0.90.89 0.75 0.93 1.42 1.5 1.12 0.94 0.711.02 1.28 1.09 0.99 0.58 0.83 0.720.51 0.99 1.28 0.89 0.89

0.96 1.081.09

y1.

= 6.93 y2.

= 7.27 y3.

= 8.45 y4.

= 8.9 y5.

= 7.59 y6.

= 5.37 y7.

= 9.45 y8.

= 6.69

a) Calcular el promedio por conglomerado.

168

Page 180: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

y. =

n∑

i=1

yi.

n=

n∑

i=1

τi

n

donde:n = 8: el número de palmeras seleccionadasτi = yi.: el total de litros en la palmera i, i = 1, 2, . . . , 8

por lo tanto:

y. =6.93 + 7.27 + . . . + 9.45 + 6.69

8=

60.65

8= 7.58125 litros por conglomerado

b) Estimar el total poblacional.

τc = Ny. = N

n∑

i=1

yi

n

donde:y. = 7.5813: el promedio de litros por conglomerado (palmera)N = 1, 000: el número de palmeras en el predion = 8: el número de palmeras seleccionadas

Por lo tanto:

τc = (1, 000)(7.58125) = 7, 581.25 litros de agua de coco en el predio

c) Estimar el promedio de litros por coco (media poblacional).

Como en este caso se desconoce M , se hace una aproximación para hallarla media poblacional:

Maprox = MN = N

n∑

i=1

Mi

n

donde:n = 8: el número de palmeras seleccionadasN = 1, 000: el número de palmeras en el predioM1 = 8, M2 = 7, M3 = 9, M4 = 8, M5 = 6, M6 = 7, M7 = 10, M8 = 8 cocos por cadapalmera seleccionada

M =8 + 7 + 9 + 8 + 6 + 7 + 10 + 8

8= 7.875

Por lo tanto:

Maprox = (7.875)(1, 000) = 7, 875 cocos en la población de 1,000 palmeras

El estimador de la media poblacional es:

169

Page 181: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

yc =τc

Maprox

donde: τc = 7, 581.25 y Maprox = 7, 875

por lo tanto:

yc =7, 581.25

7, 875= 0.9627 litros de agua producidos por cada coco

d) Calcular la varianza y la desviación estándar de la media poblacional.

V (yc) =V (τc)

M2aprox

=N2V (y.)

M2aprox

V (y.) =

(

N − n

N

)(

1

n

)

n∑

i=1

(yi. − y.)2

n − 1

donde:Maprox = 7, 875y. = 7.5813n = 8: el número de palmeras selecionadasN = 1, 000: el número de palmeras (conglomerados) en la población

V (y.) =

(

1, 000 − 8

1, 000

)(

1

8

)

(6.93 − 7.5813)2 + . . . + (6.69 − 7.5813)2

8 − 1= 0.21596

Por lo tanto:

V (yc) =(1, 000)2(0.21596)

(7, 875)2= 0.00348

V (yc) =√

0.00348 = 0.059

e) Construir un IC para la media poblacional con una confiabilidad de 90 %.

yc ± t(n−1,α/2)

V (yc)

donde:yc = 0.9627 litros de agua por cocot(n−1,α/2) = t(8−1,0.1/2) = 1.8946√

V (yc) = 0.059

Por lo tanto:0.9627 ± (1.8946)(0.059)0.9627 ± 0.11180.8509 ≤ µc ≤ 1.0745

Esto significa que la media poblacional está entre 0.8509 y 1.0745 litros de aguapor coco.

170

Page 182: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

f) Estime por intervalo el total poblacional con una confiabilidad de 90 %.

yc ± t(n−1,α/2)

V (yc)

donde:τc = 7, 581.25N = 1, 000t(n−1,α/2) = t(8−1,0.1/2) = 1.8946√

V (τc) = N

V (y.) = (1, 000)(√

0.21596) = 464.7111

Por lo tanto:

7, 581.25 ± (1.8946)(464.7111)7, 581.25 ± 880.43176, 700.8129 ≤ τc ≤ 8, 461.6817

Entonces, el total de litros de agua de coco en el predio está entre 6, 700.8129 y8, 461.6817.

g) Suponga que n = 8 palmeras es una muestra preliminar. Determine eltamaño de muestra para estimar la media por conglomerados con una pre-cisión de 10 % del promedio preliminar y una confiabilidad de 90 %.

n =N(t(n−1,α/2))

2σ2t

Nd2 + (t(n−1,α/2))2σ2t

donde:

σ2t es estimada por s2

t =

n∑

i=1

(yi. − y.)2

n − 1

y. = 7.5812: el total promedio de litros de agua de coco por palmera (conglomera-do)yi.: el total de litros de agua en la palmera i, i = 1, 2 . . . , 8N = 1, 000: las palmeras en el predio

s2t =

(6.93 − 7.5812)2 + . . . + (6.69 − 7.5812)2

8 − 1= 1.7416

t(n−1,α/2) = t(8−1,0.1/2) = 1.8946d = (0.1)(7.5812) = 0.75812

Por lo tanto:

n =(1, 000)(1.8946)2(1.7416)

(1, 000)(0.7581264)2 + (1.8946)2(1.7416)= 10.7594 palmeras (muestra)

h) Suponga que n = 8 palmeras es una muestra preliminar. Determine eltamaño de muestra definitivo para estimar el total con una precisión de 10 %del total preliminar y una confiabilidad de 90 %.

n =N2(t(n−1,α/2))

2σ2t

d2 + N(t(n−1,α/2))2σ2t

171

Page 183: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

donde:

σ2t es estimada por s2

t =

n∑

i=1

(yi. − y.)2

n − 1

y. = 7.5812: el total promedio de litros de agua de coco por palmera (conglomera-do)yi.: el total de litros de agua en la palmera i, i = 1, 2 . . . , 8N = 1, 000: las palmeras en el predio

s2t =

(6.93 − 7.5812)2 + . . . + (6.69 − 7.5812)2

8 − 1= 1.7416

t(n−1,α/2) = t(8−1,0.1/2) = 1.8946τc = 7, 581.25: el total de agua de coco en litros en el prediod = (0.1)(7, 581.25) = 758.125

Por lo tanto:

n =(1, 000)2(1.8946)2(1.7416)

(758.125)2 + (1, 000)(1.8946)2(1.7416)= 10.7594 palmeras (muestra)

6.8. Ejercicios

En los siguientes ejercicios estime lo siguiente:

a) El IC para la media y el total poblacional con una confiabilidad de 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la media y el total poblacional de talmanera que sean estimados con una precisión de 5 % de la media y el totalpreliminar con una confiabilidad de 95 %?

Ejercicio 1. El dueño de una plantación forestal necesita estimar el volumentotal de biomasa en m3 que tiene su plantación, lo que ha pensado es hacer unmuestreo por conglomerados. Para esto divide la plantación en 300 sitios, delos cuales selecciona aleatoriamente 40 y dentro de cada uno de ellos mide elvolumen de todos los árboles incluidos. En este caso nuestras UMP (los con-glomerados) son los sitios y las UMS son los árboles. Use los datos del Cuadro(6.12).

Ejercicio 2. La Secretaría de Desarrollo Social cuenta con 25 estancias in-fantiles esparcidas en el estado de Colima, donde padres confían diariamentea sus hijos. Con el objetivo de conocer el nivel de conformidad de los padresrespecto a este servicio, se tomo una MAS de 5 guarderías y se realiza unaencuesta. (El nivel de conformidad se mide de 0 a 5), ver Cuadro (6.13).

172

Page 184: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro 6.12: Volumen de biomasa en m3

Conglomerado Mi yi. Conglomerado Mi yi.

1 508 1,709 21 558 2,4402 302 1,075 22 598 2,0053 693 3,087 23 532 2,0574 598 1,729 24 599 2,5625 459 1,497 25 607 1,8536 695 2,725 26 609 2,6987 476 2,143 27 640 3,0668 675 2,945 28 659 1,9489 432 1,355 29 589 1,94210 567 2,267 30 674 2,41311 657 2,724 31 508 1,87012 650 2,537 32 302 98713 667 3,284 33 693 3,25814 598 2,370 34 598 2,70015 548 2,026 35 459 1,75016 657 1,987 36 583 2,00717 508 1,479 37 476 1,23118 499 1,668 38 675 2,70119 549 2,163 39 432 1,66920 543 2,463 40 567 1,904

173

Page 185: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 6. El muestreo por conglomerados en una etapa

Cuadro 6.13: Resultados de los conglomerados censadosEI1 EI2 EI3 EI4 EI53 2 4 3 23 2 4 3 42 3 2 4 42 3 3 4 33 2 5 4 33 1 5 5 44 1 3 3 43 1 3 2 52 2 4 2 52 2 4 3 44 4 5 4 34 3 5 4 35 2 4 3 32 1 3 2 23 2 3 2 53 2 4 5 43 1 4 54 1 4 33 2 5 3

4 5 44 3 2

4

174

Page 186: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7

El muestreo basado en el métodode respuesta aleatorizada

Cuando la gente no quierecooperar con las respuestas,

la estadística y su ingeniote ayudan a conseguirlo.

OAML

PAra que los resultados de una encuesta sean creíbles es necesario, entreotros aspectos, que las preguntas tengan suficiente calidad o validez, lo

que exige asumir que las respuestas sean ciertas. Para creer en los resultadosde una encuesta es necesario creer también en las respuestas de las personasque han sido entrevistadas. Sin embargo, tener respuestas verídicas es difícil.Hay muchos problemas implícitos al tratar de conseguirlas y de que éstas seansinceras (Lohr, 2000 [9]).

Las personas tienen inclinaciones, tendencias propias, actitudes, distintasformas de pensar, desconfianza, etc. Todas estas características pueden difi-cultar, en algunas ocasiones, la calidad de las respuestas. En este sentido, unode estos problemas típicos es el que se ha denominado deseabilidad social. Porello es importante estar consciente de que las personas entrevistadas tiendena responder en función de lo que consideran como bien visto socialmente. Porejemplo, el consumo de droga se cataloga como negativo, por lo que alguienque haya consumido o consuma drogas tenderá con facilidad a responder ”no”ante la pregunta ¿Ha usted consumido droga alguna vez? (Lohr, 2000 [9]).

Por otro lado, la deseabilidad social puede actuar de forma inconsciente,es decir, que el individuo no controle intencionalmente su respuesta. La de-seabilidad social también es preocupante cuando las preguntas se refieren acosas íntimas como las relaciones sexuales. En ese caso, las personas suelenmostrar resistencia a exponerse ante extraños y son más sensibles a respondersegún lo que se considera socialmente aceptable, por lo que se cubre la verdad(Lohr, 2000 [9]). Es decir, cuando una encuesta incluye una o más pregun-tas que se refieren a aspectos que pueden considerarse ”íntimos” hacen queel entrevistado se sienta en peligro o apenado si la responde correctamente(Méndez, I et. al. (2004) [16]. Por ello, debe garantizarse que las preguntas yla forma de hacerlas sean ingeniosas y con calidad para obtener resultados

175

Page 187: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

confiables.

Sin embargo, obtener respuestas confiables no es una tarea fácil debido aque los encuestadores se enfrentan a varias dificultades, las cuales son inher-entes a toda persona encuestada: inclinaciones, actitudes, formas de pensar,comportamientos, tiempo disponible, desconfianzas y una propensión a man-tener la intimidad. Esto a conllevado a que en las últimas décadas se realicenun gran número de investigaciones para asegurarse de la calidad y veracidadde las respuestas obtenidas sobre temas íntimos. De esta manera la necesi-dad del hombre por hacerse de información que tiene carácter íntimo o porcombatir la no respuesta lo han conducido a desarrolar nuevas técnicas en lametodología del muestreo, entre ellos: respuesta aleatorizada (Méndez C. E. I.et. al., 2007[17]).

Respuesta aleatorizadaLa técnica de respuesta aleatorizada es un método especialmentediseñado para asegurar privacidad a los entrevistados en el estu-dio de temas sensibles, delicados o embarazosos. Se intenta con el-lo evitar sesgos de los estrevistados en ciertas conductas hacia larespuesta socialmente más deseable. Es decir, le asegura al entre-vistado que su respuesta sobre temas sensibles (falsa o verdadera)no será conocida por el entrevistador, de ahí el nombre de respuestaaleatorizada(RA); la respuesta se realiza al azar. Se ha utilizado paraanalizar temas desde copiar en los exámenes, insolvencia, fraudes,haber sido arrestado, conducir bajo los efectos del alcohol, infideli-dad, tener hijos fuera del matrimonio, prácticas abortivas, etcétera..

Existen varios métodos para evitar la resistencia de las personas a respon-der con sinceridad cuando el tema es delicado. Este capítulo presenta dosmétodos para estimar proporciones (método de Warner, 1965 y método deWarner modificado propuesto por Horvitz et.al., 1967) sin obtener respues-tas directas de las personas entrevistadas. Es decir, se estima la proporciónsin que el entrevistado revele su posición personal respecto a la pregunta del-icada; por ello, el objetivo de estás técnicas es ayudar a que se den respuestasveraces y se conserve lo confidencial del asunto. Para estos dos métodos sepresenta una forma sencilla de calcular el tamaño de muestra necesario y conello estimar la proporción con la precisión y confiabilidad fijadas bajo el MASy el MAE.

7.1. ¿Cuándo se utiliza esta técnica?

Cuando las personas que son entrevistadas, se niegan a contestar o danuna respuesta falseada a preguntas sensitivas, que las ponen en aprietoso les pueden ser dañinas en algún sentido.

Se utiliza para estimar el porcentaje de la poblacional que tiene la caraterís-tica sensitiva.

176

Page 188: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Por características sensitivas o delicadas se entiende a las situaciones endonde los entrevistados sienten dañada su intimidad al pedir que respondanun cuestiorario. Por lo tanto, las preguntas sensitivas o delicadas sirven paracaptar las características sensitivas de los entrevistados; las cuales se tienenque manejar con cuidado debido a la no respuesta o a la respuesta falseadacontestando lo socialemente deseable.

7.2. Ventajas y desventajas

Ventajas DesventajasAumenta la probabilidad decontestar la verdad que enuna pregunta directa

Aumento en la complejidad dela pregunta

Mayor índice de respuesta Dificultad en entender elmétodo de aleatorizaciónRequiere de tamaños demuestas grandes

7.3. El modelo de respuesta aleatorizada bajo elMAS

Este método de respuesta aleatorizada fue desarrollado por S. L. Warner en1965 y consiste en clasificar a las personas en los grupos A y B, respectiva-mente. Cada persona estará en uno de los grupos, A o B . Sea π la proporciónde personas con ciertas caraterísticas de interés (grupo A). El objetivo es esti-mar π sin preguntar a cada persona directamente si pertenece o no al grupoA. A continuación se presenta el procemiento propuesto por Warner (1965):

I. Se construye un mazo de cartas, pero una fracción de ellas p, se marcacon la letra A (grupo A) y la fracción restante, 1−p, con las letras faltantesdel abecedario (grupo B).

II. Se selecciona una muestra aleatoria simple o estratificada de individuossin reemplazo de tamaño n de la población (N ).

III. A cada individuo que va a responder se le enseña el mazo de cartas paraque vea que las cartas estan marcadas con las letras del abecedario.

IV. En seguida se baraja adecuadamente el mazo de cartas y se le pide alindividuo que seleccione una carta, pero que no nos diga con que letraesta marcada.

V. A continuación se le explica que se le va a hacer una pregunta y que laresponda con "sí" o "no", pero resaltando que ponga mucha atención a lapregunta.

VI. Responda a la pregunta ¿Tienes la característica sensitiva?, por ejemplo¿ha consumido droga alguna vez?, si la carta que obtuvo esta marcada

177

Page 189: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

con la letra A, por el contrario responda a la pregunta ¿No tienes la car-acterística sensitiva?, para éste ejemplo, ¿Nunca has consumido droga?,si obtuvo cualquier otra letra del abecedario.

VII. Se tiene que hacer enfasis en que debe de responder con la verdad a laspreguntas y que solamente tiene que responder una de ellas dependiendode la letra que obtuvo, es decir, si la la carta que obtuvo esta marcadacon la letra A debe responder con la verdadad a la pregunta delicada yesta sería su única respuesta, lo mismo que si le toco cualquier otra letradel abecedario debe de responder con la verdad a la segunda preguntapregunta y esta sería la única respuesta.

VIII. La carta elegida por un individuo tiene que ser reemplazada antes deentrevistar a la siguiente persona.

IX. Este procedimiento se aplica a todos los n individuos.

X. Con las n respuestas de "sí" y "no" se hacen las estimaciones correspon-dientes con los estimadores propuestos en éste capítulo.

El método de aleatorización que originalmente utilizó Warner es una agujagiratoria en un disco con dos regiones delimitadas. La aguja apunta con prob-abilidad p a la región A y 1 − p a la región Ac. El entrevistado responde a lapregunta QA si la aguja señala a la región A, o a la pregunta QAc si la agujaseñala a la región Ac, de esta manera todo se conjuga a que el entrevistadorsólo anote sí o no para cada entrevistado.

Por ejemplo, supóngase que en el estado de Colima se desea estimar elporcentaje de hombres casados por lo civil que tienen hijos ilegales (fuera delmatrimonio). Además supóngase que se extrae una muestra aleatoria simplede n = 200 de la población de N = 10, 000. Así, cada uno de los hombres queconforman la muestra recibe una ficha con las siguientes preguntas:

QA: Pregunta 1: ¿tiene almenos un hijo fuera de su matrimonio?QAc: Pregunta 2: ¿no tiene hijos fuera del matrimonio?

La pregunta QA (pregunta 1) será respondida por el entrevistado si la agujamarca la región A, de lo contrario, si la aguja marca la región Ac el entrevistadoresponderá la pregunta QAc (pregunta 2). Cada entrevistado responderá un sío no porque solamente contestará una de las dos preguntas dependiendo de laregión que marque la aguja (A o Ac). Esto significa que se tendrán n repuestasdicotómicas (sí o no) a partir de las cuales se derivará la estimación de interés(porcentaje de respuestas afirmativas de la pregunta 1).

Por otro lado, es importante resaltar que el mecanismo de aleatorizaciónpuede ser una baraja, un dado, una modena, una urna, etc., pero se debetener claro cuál es su eqeuivalente a la región A y su respectiva probabilidad.Por ello, es importante recordar que el experimentador puede elegir arbitraria-

mente la fracción p de cartas marcadas con A, pero no debe ser igual a1

2. Tam-

poco se debe de usar p = 1 porque el entrevistado se daría cuenta que se le está

178

Page 190: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

preguntando si pertenece o no al grupo A, o sea, lo que no quiere responder.

Un valor de3

4es usualmente adecuado. Este método requiere generalmente

un tamaño de muestra muy grande para obtener una varianza del estimadorrazonablemente pequeña. Se necesita un tamaño de muestra grande debido aque cada respuesta origina poca información sobre la proporción poblacional,π. La técnica de respuesta aleatorizada que se ha presentado aquí es la mássimple de todas las que existen. Para mayor información al respecto, véanse losartículos de Campbell y Joiner (1973); Leysieffer y Warner (1976); y Greenberg,Kuebler, Albernathy y Horvitz (1971).

7.3.1. El estimador de la proporción y el total poblacional

Si suponemos que p 6= 1

2, el estimador de máxima verosimilitud de π es:

π =p − 1

2p − 1+

a

(2p − 1)n

y el estimador de máxima verosimilitud de τ es:

τ = Nπ

donde:N : tamaño de la población,a : el total de respuestas "sí" de los n entrevistados,p : fracción de las letras en el mazo de cartas marcadas con la letra A.

7.3.2. La varianza estimada de los estimadores de la propor-ción y del total

S2π =

(

N − n

N

)

1

n

[

1

16 (p − 1/2)2 −(

π − 1

2

)2]

S2τ = N2S2

π = N2

(

N − n

N

)

1

n

[

1

16 (p − 1/2)2 −(

π − 1

2

)2]

A continuación se proporcionan los intervalos de confianza para los pará-metros π y τ con una confiabilidad del (1 − α)100 %.

7.3.3. El intervalo de confianza de la proporción y el total

π ± Zα/2

S2π

τ ± Zα/2

S2τ

donde:π = la proporción de interésτ = el total de interés

179

Page 191: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

Zα/2 = el valor de tablas de la distribución normal√

S2π = la desviación estándar de la proporción de interés

S2τ = la desviación estándar del total de interés

7.3.4. El tamaño de la muestra para la proporción y el total

El tamaño de muestra para estimar la proporción

Si se fija una precisión deseada con una confiabilidad de (1 − α)100 %, en-

tonces d = Zα/2

(

S2π

)

. Por lo tanto, el tamaño de muestra se determina por la

ecuación:

n =NZ2

α/2k

Nd2 + Z2α/2k

donde:

k =1

16 (p − 1/2)2 −(

π − 1

2

)2

N = el tamaño de la poblaciónZα/2 = el valor de tablas de la distribución normalp = la proporción de cartas que están marcadas con la letra Ad = la precisión fijada por el investigador

El tamaño de muestra para estimar el total

n =N2Z2

α/2k

d2 + NZ2α/2k

donde:

k =1

16 (p − 1/2)2 −(

π − 1

2

)2

N = el tamaño de la poblaciónZα/2 = el valor de tablas de la distribución normalp = la proporción de cartas que están marcadas con la letra Ad = la precisión fijada por el investigador

7.3.5. Ejemplos

Ejemplo 1. En el estado de Colima se realiza una encuesta con la intenciónde estimar la proporción de estudiantes (N = 8, 000) en nivel medio superior ysuperior que han consumido algún tipo de dróga. Dado que se trata de una

pregunta delicada, se usó el método de respuesta aleatorizada con p =5

6. Se

tomó una muestra aleatoria simple de n = 200 estudiantes. En los resultadosse encontraron 45 respuestas "sí" de los 200 entrevistados.a) Calcule la proporción poblacional de interés.

π =p − 1

(2p − 1)+

a

(2p − 1)n

180

Page 192: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

donde: a =n

i=1

yi = 45, p =5

6y n = 200

Por lo tanto:

π =5/6 − 1

2(5/6) − 1+

45

(2(5/6) − 1)200= 0.0875 u 8.75 % de estudiantes

han consumido algún tipo de droga

b) Obtenga el total de estudiantes que alguna vez han consumido algún tipode droga.

τ = Nπ

donde: n = 8, 000 y π = 0.0875

Por lo tanto:

τ = (8, 000)(0.0875) = 700 estudiantes

c) Calcule la varianza y la desviación estándar de la proporción muestral.

S2π =

(

N − n

N

)

1

n

[

1

16(p − 1/2)2−

(

π − 1

2

)2]

donde: N = 8, 000, π = 0.0875, p =5

6, n = 200

Por lo tanto:

S2π =

(

8, 000 − 200

8, 000

)

1

200

[

1

16(5/6 − 1/2)2−

(

0.0875 − 1

2

)2]

= 0.001912676

Sπ =√

S2π =

√0.001912676 =0.043734144

Sπ =√

S2π =

√0.001912676 =0.043734144

d) Determine un IC de la proporción de interés con una confiabilidad de95 %.

π ± Zα/2

S2π

donde: π = 0.0875, N = 8, 000, Zα/2 = Z0.025 = 1.96 y sπ=0.043734149

Por lo tanto:0.0875 ± (1.96)(0.0437)0.0875 ± 0.0857189320.001781068 ≤ π ≤ 0.173218932

Entonces, la proporción de estudiantes que alguna vez han consumido algún

181

Page 193: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

tipo de droga está entre 0.178 y 17.32 %.

e) Calcule el intervalo de confianza del total con una confiabilidad de 95 %.

τ ± NZα/2

S2π

donde: τ = 700, N = 8, 000, Zα/2 = Z0.025 = 1.96 y sπ=0.043734149

por lo tanto:(8, 000)(0.0875) ± (8000)(1.96)(0.0437)(8, 000)0.0875 ± (8000)(0.0857)700 ± 685.751514.2486 ≤ τ ≤ 1, 385.7515

De ahí que el total de estudiantes en nivel medio superior y superior que algu-na vez hayan consumido algún tipo de droga esté entre 14.2486 y 1385.7515.

f) Suponga que n = 200 estudiantes es una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar la proporción poblacional con unaprecisión de 5 % de la proporción preliminar y una confiabilidad de 95 %?

n =N(Z2

α/2)k

Nd2 + Z2α/2k

donde:N = 8, 000 : el tamaño de la poblaciónZα/2 = 1.96

p =5

6d = (0.05)(0.0875) = 0.004375

k =1

16 (5/6 − 1/2)2 −(

0.0875 − 1

2

)2

= 0.3923

Por lo tanto:

n =(8, 000)(1.962)(0.3923)

(8, 000)(0.004375)2 + (1.962)(0.3923)= 330.285884 estudiantes

(unidades muestrales)

g) Suponga que n = 200 estudiantes es una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar el total poblacional con una pre-cisión del 5 % del total preliminar y con una confiabilidad de 95 %?

n =N2Z2

α/2k

d2 + NZ2α/2k

donde:N = 8, 000 : el tamaño de la poblaciónZα/2 = 1.96

p =5

6d = (0.05)(700) = 35

182

Page 194: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

k =1

16 (5/6 − 1/2)2 −(

0.0875 − 1

2

)2

= 0.3923

por lo tanto:

n =(8000)2(1.962)(0.3923)

(352) + (8000)(1.962)(0.3923)= 330.285884estudiantes (unida-

des muestrales)

Ejemplo 2. En el estado de Colima se realiza una encuesta para estimar la pro-porción de personas que han robado alguna vez en su vida. Hay una poblaciónde N = 15, 000. Dado que se trata de una pregunta delicada se usó el método

de respuesta aleatorizada con p =5

6. Se entrevistó aleatoriamente a n = 250

ciudadanos. Los resultados arrojaron 80 respuestas de "sí" de entre los 250entrevistados.

a) Calcule la proporción de interés poblacional.

π =p − 1

2p − 1+

a

(2p − 1)n

donde: a =n

i=1

yi = 80, p =5

6, n = 250

Por lo tanto:

π =5/6 − 1

2(5/6) − 1+

80

(2(5/6) − 1)250= 0.23 ó 23 % de ciudadanos que

alguna vez han robado

b) Calcule el total de ciudadanos que alguna vez han robado.

τ = Nπ

donde: N = 15, 000 y π = 0.23

Por lo tanto:τ = (15000)(0.23) = 3,450 ciudadanos

c) Estime la varianza y la desviación estándar de la proporción.

S2π =

(

N − n

N

)

1

n

[

1

16(p − 1/2)2 −(

π − 1

2

)2]

donde: N = 15, 000, π = 0.23, n = 250

Por lo tanto:

S2π =

(

15, 000 − 250

15, 000

)

1

250

[

1

16(5/6 − 1/2)2 −(

0.23 − 1

2

)2]

= 0.00192576

183

Page 195: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

Sπ =√

S2π =

√0.00192576 = 0.043883482

d) Construya un IC de la proporción de interés con una confiabilidad de95 %.

π ± Zα/2

S2π

donde: π = 0.23, Zα/2 = Z0.025 = 1.96, Sπ = 0.043883482

Por lo tanto:

0.23 ± (1.96)(0.0438)0.23 ± 0.0860116250.143988375 ≤ π ≤ 0.316011625

Esto significa que la proporción de ciudadanos que han robado alguna vezen su vida está entre 0.143988375 y 0.316011625, es decir, entre 14.39 y31.60 %.

e) Contruya un IC para el total con una confiabilidad de 95 %.

τ ± NZα/2

S2π

donde: τ = 3,450, N = 15,000, Zα/2 = Z0.025 = 1.96 y Sπ = 0.043883482

Por lo tanto:(15, 000)(0.23) ± (15, 000)(1.96)(0.0438)(15, 000)(0.23) ± (15, 000)(0.0860)3450 ± 1290.174372,159.82563 ≤ τ ≤ 4,4740.17437

Esto significa que el total de ciudadanos que alguna vez han robado se en-cuentra entre 2,159.82563 y 4,740.17437.

f) Suponga que n = 250 ciudadanos es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar la proporción verdadera con una precisión de3 % de la proporción preliminar y una confiabilidad de 95 %?

n =N(Z2

α/2)k

Nd2 + NZ2α/2k

donde:N = 15,000: el tamaño de la poblaciónZα/2 = 1.96

p =5

6π = 0.23d = (0.03)(0.23) = 0.0069

184

Page 196: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

k =1

16(5/6 − 1/2)2−

(

0.23 − 1

2

)2

= 0.4896

Por lo tanto:

n =(15,000)(1.962)(0.4896)

(15000)(0.004388)2 + (1.962)(0.4896)= 267.7214 ciudadanos (unidades

muestrales)

g) Suponga que n = 250 ciudadanos es una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar el total poblacional con una pre-cisión de 3 % del total preliminar y con una confiabilidad de 95 %?

n =N2Z2

α/2k

d2 + NZ2α/2k

donde:N = 15, 000: el tamaño de la poblaciónZα/2 = 1.96

p =5

6τ = 3, 450d = (0.03)(3, 450) = 103.5

k =1

16(5/6 − 1/2)2−

(

0.23 − 1

2

)2

= 0.4896

Por lo tanto:

n =(15, 000)2(1.962)(0.4896)

(103.52) + (15,000)(1.962)(0.4896)= 267.7214 ciudadanos (mues-

tra)

Ejemplo 3. En el estado de Colima se realiza una encuesta con la intención deestimar la proporción de ciudadanos que han usado juguetes sexuales algunavez en su vida. Se supone N = 7, 000. Como es una pregunta delicada se usó

el método de respuesta aleatorizada con p =5

6. Se entrevistó aleatoriamente a

n = 160 ciudadanos. Los resultados indican 40 respuestas de "sí" de entre los160 entrevistados.

a) Calcule la proporción de interés.

π =p − 1

2p − 1+

a

(2p − 1)n

donde: a = Σni=1yi = 40, p =

5

6y n = 160

por lo tanto:

π =5/6 − 1

2(5/6) − 1+

40

(2(5/6) − 1)160= 0.125 ó 12.5 % de ciudadanos

Esto significa que la proporción de ciudadanos que alguna vez en su vida han

185

Page 197: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

usado juguetes sexuales es de 0.125, es decir el 12.5 %

b) Realice la estimación del total de ciudadanos que alguna vez han usadojuguetes sexuales.

τ = Nπ

donde: N = 7,000 y π = 0.125

Por lo tanto:

τ = (7000)(0.125) = 875 ciudadanos

c) Obtenga la varianza y la desviación estándar de la proporción.

S2π =

(

N − n

N

)

1

n

[

1

16(5/6 − 1/2)2 −(

π − 1

2

)2]

donde: N = 7,000, π = 0.125, p =5

6, n = 160

por lo tanto:

S2π =

(

7000 − 160

7000

)

1

160

[

1

16(5/6 − 1/2)2 −(

0.125 − 1

2

)2]

= 0.00257645

Sπ =√

S2π =

√0.00257645 = 0.050758752

d) Construya un IC para la proporción de interés con una confiabilidad de95 %.

π ± Zα/2

S2π

donde: π = 0.125, Zα/2 = Z0.025 = 1.96 y Sπ = 0.050758752

Por lo tanto:0.125 ± (1.96)(0.05007)0.125 ± 0.0994871540.025512846 ≤ π ≤ 0.224487154

Esto significa que la proporción de ciudadanos que alguna vez en su vidahan usado juguetes sexuales está entre 0.02551 y 0.2244, o sea, entre 2.55 y22.44 %.

e) Obtenga un IC del total con una confiabilidad de 95 %.

τ ± NZα/2

S2π

donde: τ = 875, N = 7,000, Zα/2 = Z0.025 = 1.96 y Sπ = 0.050758

186

Page 198: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Por lo tanto:(7, 000)(0.125) ± (7, 000)(1.96)(0.09948)(7, 000)(0.125) ± (7, 000)(0.07740)875 ± 696.4100178.5899 ≤ τ ≤ 1571.41008

Esto significa que el total verdadero de ciudadanos que alguna vez han usa-do juguetes sexuales se encuentra entre 178.58 y 1,571.41.

f) Suponga que n = 160 ciudadanos es una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar la proporción poblacional con unaprecisión de 5 % de la proporción preliminar y una confiabilidad de 95 %?

n =NZ2

α/2k

Nd2 + Z2α/2k

donde:π = 0.125N = 7, 000: el tamaño de la poblaciónZα/2 = 1.96

p =5

6d = (0.05)(0.125) = 0.00625

k =1

16(5/6 − 1/2)2−

(

0.125 − 1

2

)2

= 0.4218

Por lo tanto:

n =(7, 000)(1.962)(0.4218)

(7, 000)(0.05075)2 + (1.962)(0.4218)= 250.045321 ciudadanos (mues-

tra)

g) Suponga que n = 160 ciudadanos es una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar el total con una precisión de 5 %del total preliminar y una confiabilidad de 95 %?

n =N2Z2

α/2k

d2 + NZ2α/2k

donde:N = 7, 000: el tamaño de la poblaciónZα/2 = 1.96

p =5

6τ = 875d = (0.05)(875) = 43.75

k =1

16(5/6 − 1/2)2−

(

0.125 − 1

2

)2

= 0.421875

Por lo tanto:

187

Page 199: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

n =(7000)2(1.962)(0.4218)

(43.75)2 + (7000)(1.962)(0.4218)= 250.045321 ciudadanos (mues-

tra)

Ejemplo 4. En el estado de Colima se realiza una encuesta con la intenciónde calcular la proporción de ciudadanos N = 5,000 que han vendido su votoalguna vez en su vida. Dado que se trata de una pregunta delicada, se empleó

el método de respuesta aleatorizada con p =5

6. Se tomó una muestra aleatoria

simple de 250 ciudadanos a quienes se les entrevistó. En los resultados seencontraron 60 respuestas de "sí".

a) Estime la proporción poblacional de interés.

π =p − 1

2p − 1+

a

(2p − 1)n

donde: a = Σni=1yi = 60, p =

5

6y n = 250

Por lo tanto:

π =5/6 − 1

2(5/6) − 1+

60

(2(5/6) − 1)250= 0.11

Esto significa que la proporción de ciudadanos en el estado de Colima quealguna vez en su vida han vendido su voto es de 0.11, es decir el 11 %

b) Calcule el total de ciudadanos que alguna vez han vendido su voto.

τ = Nπ

donde: N = 5,000 y π = 0.11

Por lo tanto:τ = (5, 000)(0.11) = 550

Esto significa que el total de ciudadanos de Colima que alguna vez han vendidosu voto es de 550.

c) Haga la estimación de la varianza y la desviación estándar de la propor-ción.

S2π =

(

N − n

N

)

1

n

[

1

16(p − 1/2)2 −(

π − 1

2

)2]

donde: N = 5, 000, π = 0.11, p =5

6, n = 250

Por lo tanto:

188

Page 200: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

S2π =

(

5, 000 − 250

5, 000

)

1

250

[

1

16(5/6 − 1/2)2 −(

0.11 − 1

2

)2]

= 0.00156

Sπ =√

S2π =

√0.00156 = 0.039490758

d) Haga un IC de la proporción de interés con una confianza de 95 %

π ± Zα/2

S2π

donde: π = 0.11, Zα/2 = Z0.025 = 1.96 y Sπ = 0.039490758

por lo tanto:

0.11 ± (1.96)(0.0395)0.11 ± 0.0774018860.032598114 ≤ π ≤ 0.187401886

Por lo tanto, la proporción de ciudadanos que alguna vez en su vida han ven-dido su voto está entre 0.03259 y 0.1874, es decir, entre 3.25 y 18.74 %.

e) Cree un IC del total con una confiabilidad de 95 %.

τ ± NZα/2

S2π

donde: τ = 550, N = 5, 000, Zα/2 = Z0.025 = 1.96 y Sπ = 0.039490758

Por lo tanto:

(5, 000)(0.11) ± (5, 000)(1.96)(0.0395)(5, 000)(0.11) ± (5, 000)(0.07740)550 ± 387.0094162.9905 ≤ τ ≤ 937.0094

Esto significa que el total de ciudadanos que alguna vez ha vendido su votoestá entre 162.9905 y 937.0094 personas.

f) Suponga que n = 250 ciudadanos es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar la proporción verdadera con una precisión de5 % de la proporción preliminar y una confiabilidad de 95 %?

n =NZ2

α/2k

Nd2 + Z2α/2k

donde:π = 0.11 N = 5, 000: el tamaño de la poblaciónZα/2 = 1.96

p =5

6d = (0.05)(0.11) = 0.0055

189

Page 201: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

k =1

16(5/6 − 1/2)2−

(

0.11 − 1

2

)2

= 0.4104

Por lo tanto:

n =(5000)(1.962)(0.4104)

(5000)(0.03949)2 + (1.962)(0.4104)= 271.110281 ciudadanos (mues-

tra)

g) Suponga que n = 250 ciudadanos es una muestra preliminar. ¿Cuál esel tamaño de muestra necesario para estimar el total verdadero con una pre-cisión de 5 % del total preliminar con una confiabilidad de 95 %?

n =N2Z2

α/2k

d2 + NZ2α/2k

donde:N = 5000: el tamaño de la poblaciónZα/2 = 1.96

p =5

6τ = 550d = (0.05)(550) = 27.5

k =1

16(5/6 − 1/2)2−

(

0.11 − 1

2

)2

= 0.4104

Por lo tanto:

n =(5000)2(1.962)(0.4104)

(27.5)2 + (5000)(1.962)(0.4104)= 271.110281

Por lo tanto, el número estimado de unidades muestrales (ciudadanos) quedeben constituir a la muestra para tener una precisión de ±27.5 con 0.95 deprobabilidad de incluir en el intervalo de estimación al total es de 272 ciu-dadanos.

190

Page 202: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

7.4. Ejercicios

En los siguientes ejercicios estime los parámetros siguientes:

a) El IC para la proporción y el total con una confiabilidad de 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la proporción y el total de tal maneraque sean estimados con una precisión de 5 % de la proporción y el total pre-liminar con una confiabilidad de 95 %?

Ejercicio 1. Un psicólogo está realizando un estudio para conocer el númerode homosexuales en el estado de Colima (N = 28, 000). Dado que se trata de

una pregunta delicada, se usó el método de respuesta aleatorizada con p =5

6.

Se tomó una muestra aleatoria simple de n = 200 hombres. En los resultadosse encontraron 45 respuestas de "sí" de los entrevistados.

Ejercicio 2. En el estado de Colima se está realizando un estudio de personasque alguna vez han tenido tendencias de robo menor (N = 50, 000). Dado quese trata de una pregunta delicada, se usó el método de respuesta aleatorizada

con p =5

6. Se tomó una muestra aleatoria simple de n = 200 personas. En los

resultados se encontraron 37 respuestas de "sí" de los entrevistados.

Ejercicio 3. Un psicólogo está realizando un estudio para conocer el númerode mujeres que han sufrido algún tipo de abuso sexual por parte de un famil-iar (N = 10, 000). Dado que se trata de una pregunta delicada, se usó el método

de respuesta aleatorizada con p =5

6. Se tomó una muestra aleatoria simple de

n = 500 mujeres. Se encontraron 20 respuestas de "sí" de los entrevistados.

Ejercicio 4. Un médico desea hacer un estudio para conocer el número depersonas que han consumido algún tipo de droga prohibida en el municipiode Coquimatlán del estado de Colima. (N = 5, 000). Dado que se trata de una

pregunta delicada, se usó el método de respuesta aleatorizada con p =5

6. Se

tomó una muestra aleatoria simple de n = 150 personas. En los resultados seencontraron 90 respuestas de "sí" de los entrevistados.

7.5. El modelo de respuesta aleatorizada bajo elMAE

Cuando la población es heterogénea se sugiere formar estratos para mejo-rar la precisión de las estimaciones. Los criterios para formar los estratos sonexactamente los mismos que en el MAE. Por lo tanto, para cada estrato sedebe conocer su tamaño y no deben traslaparse y además se debe contar conun marco de muestreo confiable para tener una tasa de respuesta en blancomuy cercana a cero. Por otro lado, ya que se determine el tamaño de muestracon la expresión correspondiente, la asignación de la muestra se realizará en

191

Page 203: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

forma proporcional, por su simplicidad y aceptación práctica. El procedimien-to del método de respuesta aleatorizada en MAE es exactamente el mismo queMAS. Por lo tanto, cada individuo que conformará la muestra se entrevistarácon el mismo procedimiento del método de respuesta aleatorizada bajo el MAS,con la diferencia que ahora el tamaño de muestra n se asigna en forma pro-porcional a cada estrato, es decir, n = n1 + n2 + ... + nE.A continuación se presentan los estimadores necesarios del método en su ver-sión estratificada.

7.5.1. El estimador de la proporción y el total poblacional

πst =N1π1 + N2π2 + .... + NEπE

Nτst = Nπst

Si p 6= 1

2es igual en cada estrato, entonces el estimador de máxima verosimili-

tud de πh es :

πh =p − 1

2p − 1+

ah

(2p − 1)nh

; h = 1, 2, ..., E

donde:p : la fracción de letras en el mazo de cartas marcadas con la letra A,ah : el total de respuestas afirmativas ("sí") de los nh entrevistados en el estratoh,

Se necesita la varianza de estos estimadores para determinar la dispersiónde los datos y saber la precisión de las estimaciones.

7.5.2. La varianza de los estimadores de la proporción y to-tal poblacional

S2πst

=E

h=1

(

Nh

N

)2 (

Nh − nh

Nh

)

1

nh

[

1

16(p − 1/2)2−

(

πh −1

2

)2]

S2τst

= N2

E∑

h=1

(

Nh

N

)2 (

Nh − nh

Nh

)

1

nh

[

1

16(p − 1/2)2−

(

πh −1

2

)2]

Con los estimadores de las varianzas de πst y τst se puede calcular intervalosque contengan el valor del parámetro con una probabilidad preestablecida.

7.5.3. El intervalo de confianza para el promedio y totalpoblacional

Los intervalos de confianza para πst y τst son:

πst ± Zα/2

S2πst

192

Page 204: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

τst ± Zα/2

S2τst

7.5.4. El tamaño de la muestra para estimar la proporción yel total

El tamaño de muestra para estimar la proporción

Fijando la precisión d = Zα/2

(√

S2πst

)

se tiene que:

n =NZ2

α/2

∑Eh=1 WhKh

Nd2 + Z2α/2

∑Eh=1 WhKh

donde:

Kh =1

16(p − 1/2)2−

(

πh −1

2

)2

N = el tamaño de la poblaciónπh= la proproción de interés en el estrato hZα/2 = el valor de tablas de la distribución normalp = la proporción de cartas que están marcadas con la letra Ad = la precisión fijada por el investigador

El tamaño de muestra para estimar el total

n =N2(Zα/2)2ΣE

h=1WhKh

d2 + N(Zα/2)2ΣEh=1WhKh

donde:

Kh =1

16(p − 1/2)2−

(

πh −1

2

)2

N= el tamaño de la poblaciónπh= la proproción de interés en el estrato hZα/2= el valor de tablas de la distribución normalp= la proporción de cartas que están marcadas con la letra Ad= la precisión fijada por el investigador

7.5.5. Ejemplos

Ejemplo 1. Una investigadora de la U de C está interesada en estimar la pro-porción de mujeres infieles en el estado (se encontró que las mujeres que estáncasadas por lo civil es de N = 10, 000 ). Obviamente, es una pregunta delicada ypor eso se usó el método de respuesta aleatorizada. Además, la investigadoracree que el nivel socioeconómico influye en la infidelidad, por lo que clasificóa la población en tres estratos: clase baja, (estrato 1), media (estrato 2) y al-ta (estrato 3). La población de cada estrato es de N1 = 4, 500, N2 = 3, 500 yN3 = 2, 000. Para el estudio se tomó una muestra aleatoria simple de n = 200

193

Page 205: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

señoras distribuidas de la siguiente manera: n1 = 80, n2 = 65 y n3 = 55 señoras.Las respuestas de ”sí” en las entrevistas por estrato son: 14 para el estrato 1,

16 para el estrato 2 y 17 para el estrato 3. En este caso p =5

6.

a) Calcule la proporción de mujeres infieles en el estado.

πst =N1π1 + N2π2 + .... + NEπE

N

donde:

πh =p − 1

2p − 1+

ah

2p − 1; h = 1, 2, ..., E, N1 = 4, 500, N2 = 3, 500, N3 = 2, 000, n1 =

80, n2 = 65, n3 = 55

a1 = 14, a2 = 16, a3 = 17, p =5

6

Por lo tanto:

π1 =5/6 − 1

2(5/6) − 1+

14

(2(5/6) − 1)80= 0.0125

π2 =5/6 − 1

2(5/6) − 1+

16

(2(5/6) − 1)65= 0.1199

π3 =5/6 − 1

2(5/6) − 1+

17

(2(5/6) − 1)55= 0.2136

πst =(4500)(0.0125) + (3500)(0.1199) + (2000)(0.2136)

10000= 0.0901 ó 9 %

de mujeres infieles

b) Determine el total de mujeres infieles en el estadoτst = Nπst

donde:N = 10,000 el total de mujeres casadas por lo civil en el estado de Colimaπst = 0.0901: la proporción de mujeres infieles en el estado

Por lo tanto:

τst = (10000)(0.090) = 900.8304

Esto significa que el total de mujeres infieles en el estado de Colima es de900.8304

c) Estime la varianza y la desviación estándar de la proporción.

S2πst

=E

h=1

(

Nh

N

)2 (

Nh − nh

Nh

)

1

nh

[

1

16(p − 1/2)2−

(

πh −1

2

)2]

donde:N = 10, 000 el total de mujeres casadas por lo civil en el estadoE = 3 los estratos en los que está dividida la población en estudioN1 = 4, 500, N2 = 3, 500, N3 = 2, 000n1 = 80, n2 = 65, n3 = 55

194

Page 206: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

a1 = 14, a2 = 16, a3 = 17

p =5

6π1 = 0.0125π2 = 0.1192π3 = 0.2136

Por lo tanto:

S2πst

=

(

4500

10000

)2 (

4500 − 80

4500

)

1

80

[

1

16 (5/6 − 1/2)2 −(

0.0125 − 1

2

)2]

+

(

3500

10000

)2 (

3500 − 65

3500

)

1

65

[

1

16 (5/6 − 1/2)2 −(

0.1192 − 1

2

)2]

+

(

2000

10000

)2 (

2000 − 55

2000

)

1

55

[

1

16 (5/6 − 1/2)2 −(

0.2136 − 1

2

)2]

= 0.0019

Sπst =√

S2πst

=√

0.0019 = 0.0438

d) Construya un IC para la proporción de interés con una confiabilidad de95 %.

πst ± Zα/2

S2πst

donde:πst = 0.0901: la proporción de mujeres infieles en el estadoα = 0.05Zα/2 = 1.96√

S2πst

= 0.0438

Por lo tanto:

0.0901 ± (1.96)(0.0438)0.0901 ± 0.08590.0042 ≤ πst ≤ 0.1760

Esto significa que la proporción de mujeres infieles casadas por lo civil enel estado de Colima está entre 0.0042 y 0.1760.

e) Haga un IC del total de interés con una confiabilidad de 95 %.

τst ± Zα/2

S2τst

donde:τst = 900.83042N = 10,000 el total de mujeres casadas por lo civil en el estado de Colima√

S2τst

= 0.0438

α = 0.05Zα/2 = 1.96

195

Page 207: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

S2τst

= (10, 000)(0.0438) = 438.1468

Por lo tanto:

900.8304 ± (1.96)(438.1468)900.8304 ± 858.751942.0785 ≤ τst ≤ 1, 759.5824

Esto significa que el total de mujeres infieles casadas por lo civil está entre42.0785 y 1,759.5824.

f) Suponga que n = 200 mujeres es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar la proporción poblacional con una precisiónde 75 % de la proporción preliminar y una confiabilidad de 95 %?

n =NZ2

α/2ΣEh=1WhKh

Nd2 + Z2α/2Σ

Eh=1WhKh

donde:

Kh =1

16(p − 1/2)2−

(

πh −1

2

)2

Wh =Nh

N; h = 1, 2, 3

N = 10,000 : total de mujeres casadas por lo civil en el estado de ColimaZα/2 = 1.96

p =5

6

K1 =1

16 (5/6 − 1/2)2 −(

0.0125 − 1

2

)2

= 0.3248

K2 =1

16 (5/6 − 1/2)2 −(

0.1192 − 1

2

)2

= 0.4175

K3 =1

16 (5/6 − 1/2)2 −(

0.2136 − 1

2

)2

= 0.4805

E∑

h=1

Whkh =4,500

10,000(0.3248) +

3,500

10,000(0.4175) +

2,000

10,000(0.4805) = 0.3884

d = (0.75)(0.0901) = 0.0676

Por lo tanto:

n =(10,000)(1.96)20.3884

(10,000)(0.0676)2 + (1.96)2(0.3884)= 316.5251 mujeres casadas

(muestra)

La asignación de la muestra en forma proporcional

n1 =N1

Nn =

4,500

10,000(317) = 143

n2 =N2

Nn =

3,500

10,000(317) = 111

196

Page 208: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

n3 =N3

Nn =

2,000

10,000(317) = 63

Por lo tanto, la muestra requerida para cada estrato queda distribuida de lasiguiente manera: 143 mujeres para el estrato 1, 111 para el estrato 2 y 63para el estrato 3.

g) Suponga que n = 200 mujeres es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar el total verdadero con una precisión de 75 %del total preliminar y una confiabilidad de 95 %?

n =N2(Zα/2)

2ΣEh=1WhKh

d2 + N(Zα/2)2ΣEh=1WhKh

donde:

Kh =1

16(p − 1/2)2−

(

πh −1

2

)2

Wh =Nh

N; h = 1, 2, 3

N = 10,000 el total de mujeres casadas por lo civil en el estado de Colimaα = 0.05Zα/2 = 1.96

p =5

6

K1 =1

16 (5/6 − 1/2)2 −(

0.0125 − 1

2

)2

= 0.3248

K2 =1

16 (5/6 − 1/2)2 −(

0.1192 − 1

2

)2

= 0.4175

K3 =1

16 (5/6 − 1/2)2 −(

0.2136 − 1

2

)2

= 0.4805

E∑

h=1

Whkh =4,500

10,000(0.3248) +

3,500

10,000(0.4175) +

2,000

10,000(0.4805) = 0.3884

τst = 900.83042d = (0.75)(900.83042) = 675.6228

Por lo tanto:

n =(10,000)2(1.96)2(0.3884)

(675.6228)2 + (10,000)(1.96)2(0.3884)= 316.5251 mujeres casadas

(unidades muestrales)

Dado que el tamaño de muestra es el mismo, la distribución queda con 143mujeres para el estrato 1, 111 para el estrato 2 y 63 para el estrato 3.

Ejemplo 2. Una persona está interesada en estimar la proporción de mujeresjóvenes que han abortado en Manzanillo (el total de jóvenes es N = 15,000).Además, la persona cree que el nivel social influye en tal problema, por lo queclasificó a la población en dos estratos: clase baja (estrato 1) y clase alta (es-trato 2), donde la población de cada estrato es N1 = 10,000 y N2 = 5,000. Parael estudio se tomó una muestra aleatoria simple (n = 300) de la población obje-

197

Page 209: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

tivo, que se distribuyó de la siguiente manera: n1 = 200 y n2 = 100 jóvenes. Elnúmero de respuestas de ”sí” por estrato fue de 50 para el estrato uno y de 30

para el estrato dos. En este caso p =5

6.

a) Realice la estimación de la proporción de mujeres que han abortado enManzanillo.

πst =N1π1 + N2π2 + .... + NEπE

N

πh =p − 1

2p − 1+

ah

(2p − 1)nh

; h = 1, 2, ..., E

donde:N1 = 10, 000 y N2 = 5, 000n1 = 200 y n2 = 100a1 = 50 y a2 = 30

p =5

6

Por lo tanto:

π1 =5/6 − 1

(2 (5/6) − 1)+

50

(2 (5/6) − 1) 200= 0.125

π2 =5/6 − 1

(2 (5/6) − 1)+

30

(2 (5/6) − 1) 100= 0.2

πst =(10, 000) (0.125) + (5, 000) (0.2)

15, 000= 0.15

Esto significa que la proporción de mujeres que han abortado en Manzani-llo es de 0.15, es decir, el 15 %

b) Calcule el total de mujeres que han abortado en Manzanillo.

τst = Nπst

donde:N = 15, 000 el total de jóvenes que han abortadoπst = 0.15 la proporción de jóvenes que han abortado

Por lo tanto:

τst = (15, 000)(0.15) = 2,250 mujeres

c) Obtenga la varianza y la desviación estándar de la proporción.

S2πst

=E

h=1

(

Nh

N

)2 (

Nh − nh

Nh

)

1

nh

[

1

16(p − 1/2)2−

(

πh −1

2

)2]

donde:N = 10, 000: el total de jóvenes que han abortadoE = 2: los estratos en los que está dividida la población del estudio

198

Page 210: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

N1 = 10, 000 y N2 = 5, 000n1 = 200 y n2 = 100a1 = 50 y a2 = 30

p =5

6π1 = 0.125π2 = 0.2

Por lo tanto:

S2πst

=

(

10000

15000

)2 (

10000 − 200

10000

)

1

200

[

1

16 (5/6 − 1/2)2 −(

0.125 − 1

2

)2]

+

(

5000

15000

)2 (

5000 − 100

5000

)

1

100

[

1

16 (5/6 − 1/2)2 −(

0.2 − 1

2

)2]

= 0.0014

La desviación estándar de la proporción es igual a 0.0379.

d) Elabore un IC para la proporción de interés con una confiabilidad de 95 %.

πst ± Zα/2

S2πst

donde:πst = 0.15: la proporción de jóvenes que han abortadoα = 0.05Zα/2 = 1.96√

S2πst

= 0.0379

Por lo tanto:

(0.15) ± (1.96)(0.0379)(0.15) ± (0.0742)0.0758 ≤ πst ≤ 0.2242

Entonces, se estima que la proporción de mujeres jóvenes que han aborta-do en Manzanillo está entre 0.0758 y 0.2242.

e) Haga un IC del total de interés con una confiabilidad de 95 %.

τst ± Zα/2

S2τst

donde:τst = 2,250√

S2τst

= N√

S2πst

N = 15, 000 :el total de jóvenes√

S2πst

= 0.0379

α = 0.05Zα/2 = 1.96

199

Page 211: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

S2τst

= (15000)(0.379) = 567.8743

Por lo tanto:

2250 ± (1.96)(567.8743)2250 ± 1, 113.01321, 136.9868 ≤ τst ≤ 3, 363.0132

Por lo tanto, el total de mujeres jóvenes que han abortado está entre 1,136.9868y 3,363.0132.

f) Suponga que n = 300 mujeres jóvenes es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la proporción verdadera con una pre-cisión de 49 % de la proporción preliminar y una confiabilidad de 95 %?

n =NZ2

α/2ΣEh=1WhKh

Nd2 + Z2α/2Σ

Eh=1WhKh

donde:

Kh =1

16 (p − 1/2)2 −(

πh −1

2

)2

Wh =Nh

N; h = 1, 2, 3

N = 15,000: el total jóvenesZα/2 = 1.96

p =5

6

K1 =1

16 (5/6 − 1/2)2 −(

0.125 − 1

2

)2

= 0.4219

K2 =1

16 (5/6 − 1/2)2 −(

0.2 − 1

2

)2

= 0.4725

ΣEh=1Whkh =

10, 000

15, 000(0.4219) +

5, 000

15, 000(0.4725) = 0.4388

d = (0.49)(0.15) = 0.0735

Por lo tanto:

n =(15, 000)2(1.96)2(0.4388)

(15, 000)(0.0735)2 + (1.96)2(0.4388)= 305.6316 mujeres jóvenes

(muestra)

La asignación de la muestra en forma proporcional

n1 =N1

Nn =

10, 000

15, 000(306) = 204 para el estrato 1

n2 =N2

Nn =

5, 000

15, 000(306) = 102 para el estrato 2

200

Page 212: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

g) Suponga que n = 300 jóvenes es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar el total con una precisión de 49 % del totalpreliminar y una confiabilidad de 95 %?

n =N2Z2

α/2ΣEh=1WhKh

d2 + NZ2α/2Σ

Eh=1WhKh

donde:

Kh =1

16 (p − 1/2)2 −(

πh −1

2

)2

Wh =Nh

N; h = 1, 2, 3

N = 15, 000: el total de jóvenesα = 0.05Zα/2 = 1.96

p =5

6

K1 =1

16 (5/6 − 1/2)2 −(

0.125 − 1

2

)2

= 0.4219

K2 =1

16 (5/6 − 1/2)2 −(

0.2 − 1

2

)2

= 0.4725

E∑

h=1

Whkh =10, 000

15, 000(0.4219) +

5, 000

15, 000(0.4725) = 0.4388

τst = 2250d = (0.49)(2250) = 1, 102.50

Por lo tanto:

n =(15, 000)2(1.962)(0.4388)

(1, 102.50)2 + (15, 000)(1.962)(0.4388)= 305.6316 mujeres jóvenes

(muestra)

Dado que el tamaño de muestra es el mismo, la distribución queda con 204jóvenes para el estrato 1 y 102 para el estrato 2.

Ejemplo 3. Un sexólogo desea realizar una investigación para conocer el númerode mujeres que han tenido relaciones sexuales premaritales en la ciudad deColima (se encontró que el número de mujeres era de N = 40, 000). Además, sepiensa que el nivel de vida influye en la decisión de tener relaciones sexualesantes del matrimonio, por lo que se clasificó a la población en tres estratos:pobres (estrato 1), nivel medio (estrato 2) y ricas (estrato 3). La población decada estrato es N1 = 19, 000, N2 = 16, 000 y N3 = 5, 000. Para el estudio se tomóuna muestra aleatoria simple de la población de mujeres distribuidas de lasiguiente manera: n1 = 2, 000, n2 = 1, 400 y n3 = 600 mujeres. Las respuestasde ”sí” en las entrevistas por estrato son: 520 para el estrato 1, 360 para el

estrato 2 y 180 para el estrato 3. En este caso p =3

4.

a) Calcule la proporción de mujeres que han tenido relaciones sexualesantes del matrimonio.

201

Page 213: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

πst =N1π1 + N2π2 + .... + NEπE

N

πh =p − 1

2p − 1+

ah

(2p − 1)nh

; h = 1, 2, ..., E

donde:N1 = 19, 000, N2 = 16, 000, N3 = 5, 000n1 = 2, 000, n2 = 1, 400, n3 = 600a1 = 520, a2 = 360, a3 = 180

p =3

4

Por lo tanto:

π1 =3/4 − 1

2 (3/4) − 1+

520

(2 (3/4) − 1) 2, 000= 0.02

π2 =3/4 − 1

2 (3/4) − 1+

360

(2 (3/4) − 1) 1, 400= 0.0142

π3 =3/4 − 1

2 (3/4) − 1+

180

(2 (3/4) − 1) 600= 0.1

πst =(19000) (0.02) + (16000) (0.0142) + (5000) (0.1)

40000= 0.0277

Por lo tanto, se estima que la proporción de mujeres que han tenido relacionesantes del matrimonio es de 0.0277 ó 2.77 %.

b) Determine el total de mujeres que han tenido relaciones sexuales antesdel matrimonio.

τst = Nπst

donde:N = 40, 000 : el total de mujeres en el estado de Colimaπst = 0.0277 : la proporción de mujeres que han tenido relaciones sexuales antesdel matrimonio

Por lo tanto:

τst = (40, 000)(0.0277) = 1, 108.5714 mujeres

c) Estime la varianza y la desviación estándar de la proporción.

S2πst

=E

h=1

(

Nh

N

)2 (

Nh − nh

Nh

)

1

nh

[

1

16(p − 1/2)2−

(

πh −1

2

)2]

donde:N = 40, 000 : el total de mujeres en el estado de ColimaE = 3 : los estratos en los que está dividida la población bajo estudioN1 = 19, 000, N2 = 16, 000, N3 = 5, 000n1 = 2, 000, n2 = 1, 400, n3 = 600a1 = 520, a2 = 360, a3 = 180

202

Page 214: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

p =3

4π1 = 0.02π2 = 0.0142π3 = 0.1

Por lo tanto:

S2πst

=

(

19000

40000

)2 (

19000 − 2000

19, 000

)

1

2000

[

1

16 (3/4 − 1/2)2 −(

0.02 − 1

2

)2]

+

(

16000

40000

)2 (

16000 − 1, 400

16000

)

1

1400

[

1

16 (3/4 − 1/2)2 −(

0.0142 − 1

2

)2]

+

(

5000

40000

)2 (

5000 − 600

5000

)

1

600

[

1

16 (3/4 − 1/2)2 −(

0.01 − 1

2

)2]

= 0.0002

Sπst =√

(0.0002) = 0.0133

d) Haga un IC para la proporción de interés con una confiabilidad de 95 %.

πst ± Zα/2

S2πst

donde:πst = 0.0277 : la proporción de mujeres que han tenido relaciones sexuales antesdel matrimonioα = 0.05Zα/2 = 1.96√

S2πst

= 0.0133

Por lo tanto:0.0277 ± (1.96)(0.0133)0.0277 ± 0.02600.0017 ≤ πst ≤ 0.0538

Por lo que se estima que la proporción de mujeres que han tenido relacionessexuales antes del matrimonio está entre 0.0017 y 0.0538.

e) Construya un IC para el total de interés con una confiabilidad de 95 %.

τst ± Zα/2

S2τst

donde:τ = 412.7946τst = Nπst

N = 40, 000 : el total de mujeres en el estado de Colima√

S2πst

= 0.0133

α = 0.05Zα/2 = 1.96√

S2τst

= (40, 000)(0.0133) = 531.5853

203

Page 215: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

por lo tanto:1, 108.5714 ± (1.96)(531.5853)1, 108.5714 ± 1041.887966.6835 ≤ τst ≤ 2, 150.4594.

Esto es, se estima que el total de mujeres que han tenido relaciones sexua-les antes del matrimonio está entre 66.6835 y 2,1501.4594.

f) Suponga que n = 4, 000 personas es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar la proporción poblacional con una precisiónde 75 % de la proporción preliminar y una confiabilidad de 95 %?

n =NZ2

α/2ΣEh=1WhKh

Nd2 + Z2α/2Σ

Eh=1WhKh

donde:

Kh =1

16(p − 1/2)2−

(

πh −1

2

)2

Wh =Nh

N; h = 1, 2, 3

N = 5, 000 : el total de mujeresZα/2 = 1.96

p =3

4

K1 =1

16(3/4 − 1/2)2−

(

0.02 − 1

2

)2

= 0.7696

K2 =1

16(3/4 − 1/2)2−

(

0.0142 − 1

2

)2

= 0.7641

K3 =1

16(3/4 − 1/2)2−

(

0.1 − 1

2

)2

= 0.8400

E∑

h=1

Whkh =19, 000

40, 000(0.7696) +

16, 000

40, 000(0.7641) +

5, 000

40, 000(0.84) = 0.7762

d = (0.75)(0.0277) = 0.0208

Por lo tanto:

n =(40, 000)(1.96)20.7762

(40, 000)(0.0208)2 + (1.96)2(0.7762)= 5, 885.8636 mujeres (mues-

tra)

La asignación de la muestra en forma proporcional

n1 =N1

Nn =

19, 000

40, 000(5886) = 2, 796 para el estrato 1

n2 =N2

Nn =

16, 000

40, 000(5886) = 2, 354 para el estrato 2

n2 =N2

Nn =

5, 000

40, 000(5886) = 736 para el estrato 3

204

Page 216: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

g) Suponga que n = 4, 000 es una muestra preliminar. ¿Cuál es el tamaño demuestra para estimar el total con una precisión de 75 % del total preliminar yuna confiabilidad de 95 %?

n =N2(Zα/2)

2ΣEh=1WhKh

d2 + N(Zα/2)2ΣEh=1WhKh

donde:

Kh =1

16(p − 1/2)2−

(

πh −1

2

)2

Wh =Nh

N; h = 1, 2, 3

N = 40, 000 : el total de mujeres en el estado de Colimaα = 0.05Zα/2 = 1.96

p =3

4

K1 =1

16(3/4 − 1/2)2−

(

0.02 − 1

2

)2

= 0.7696

K2 =1

16(3/4 − 1/2)2−

(

0.0142 − 1

2

)2

= 0.7641

K3 =1

16(3/4 − 1/2)2−

(

0.1 − 1

2

)2

= 0.8400

E∑

h=1

Whkh =19, 000

40, 000(0.7696) +

16, 000

40, 000(0.7641) +

5, 000

40, 000(0.84) = 0.7762

τst = 1, 108.5714d = (0.75)(1, 108.5714) = 831.4286

Por lo tanto:

n =(40, 000)2(1.962)(0.7762)

(831.4286)2 + (40, 000)(1.962)(0.7762)= 5, 885.8636

Dado que el tamaño de muestra es el mismo que el obtenido en f), la dis-tribución queda con 2,796 mujeres para el estrato 1, 2,354 para el estrato 2 y736 para el estrato 3.

Ejemplo 4. ”Mensex” está interesada en estimar la proporción de hombrescon disfunción eréctil. El número de hombres es de N = 10, 000 en el munici-pio de Temaltepec. Además,”Mensex” cree que los vicios que posea la personainfluyen en la disfunción eréctil, por lo que clasificó a la población en tres es-tratos: fumadores (estrato 1), alcohólicos (estrato 2) y estresados (estrato 3).La población de cada estrato es N1 = 4, 000, N2 = 4, 000 y N3 = 2, 000. Para elestudio se tomó una muestra aleatoria de la población de hombres distribuidade la siguiente manera: n1 = 100, n2 = 200 y n3 = 100. El número de respuestasde "sí" en las entrevistas es de 55 para el estrato 1, 30 para el estrato dos y 20

para el estrato tres. Para este caso p =3

4.

a) Calcule la proporción de hombres con disfunción eréctil en el municipiode Temaltepec.

205

Page 217: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

πst =N1π1 + N2π2 + .... + NEπE

N

πh =p − 1

2p − 1+

ah

(2p − 1)nh

; h = 1, 2, ..., E

donde:N1 = 4, 000, N2 = 4, 000, N3 = 2, 000n1 = 100, n2 = 200, n3 = 100a1 = 55, a2 = 70, a3 = 30

p =3

4

Por lo tanto:

π1 =3/4 − 1

2 (3/4) − 1+

55

(2 (3/4) − 1) 100= 0.6

π2 =3/4 − 1

2 (3/4) − 1+

70

(2 (3/4) − 1) 200= 0.2

π3 =3/4 − 1

2 (3/4) − 1+

30

(2 (3/4) − 1) 100= 0.1

πst =(4, 000) (0.6) + (4, 000) (0.2) + (2, 000) (0.1)

10, 000= 0.34

Por lo que se estima que la proporción de hombres con disfunción eréctil en elMunicipio de Temaltepec es de 0.34, es decir, el 34 %.

b) Calcule el total de hombres con disfunción eréctil en el Municipio deTemaltepec.

τst = Nπst

donde:N = 10, 000 : el total de hombres en el municipio de Temaltepecπst = 0.34

Por lo tanto:

τst = (10, 000)(0.34) = 3, 400

Por lo que el total de hombres con disfunción eréctil en el municipio de Temal-tepec es igual a 3,400.

c) Determine la varianza y la desviación estándar de la proporción.

S2πst

=E

h=1

(

Nh

N

)2 (

Nh − nh

Nh

)

1

nh

[

1

16(p − 1/2)2−

(

πh −1

2

)2]

donde:N = 10, 000 : el total de hombresE = 3 : los estratos en los que está dividida la población en estudio

206

Page 218: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

N1 = 4, 000, N2 = 4, 000, N3 = 2, 000n1 = 100, n2 = 200, n3 = 100a1 = 55, a2 = 70, a3 = 30

P =3

4π1 = 0.6π2 = 0.2π3 = 0.1

Por lo tanto:

S2πst

=

(

4000

10000

)2 (

4000 − 100

4000

)

1

100

[

1

16 (3/4 − 1/2)2 −(

0.6 − 1

2

)2]

+

(

4000

10000

)2 (

4000 − 200

3500

)

1

200

[

1

16 (3/4 − 1/2)2 −(

0.2 − 1

2

)2]

+

(

2000

10000

)2 (

2000 − 100

2000

)

1

100

[

1

16 (3/4 − 1/2)2 −(

0.1 − 1

2

)2]

= 0.0026

Y así, la desviación estándar es igual a Sπst =0.0505

d) Construya un IC para la proporción de interés con una confiabilidad de90 %.

πst ± Zα/2

S2πst

donde:πst = 0.34 : proporción de hombres con disfunción eréctil en el municipio deTemaltepecα = 0.10Zα/2 = 1.645√

S2πst

= 0.0505

Por lo tanto:

0.34 ± (1.645)(0.0505)0.34 ± 0.08310.2569 ≤ πst ≤ 0.4231

Esto significa que la proporción de hombres con disfunción eréctil del mu-nicipio de Temaltepec está entre 0.2569 y 0.4231

e) Haga un IC para el total de interés con una confiabilidad de 90 %.

τst ± Zα/2

S2τst

donde:τst = 3, 400√

S2τst

= N√

S2πst

207

Page 219: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

N = 10, 000 : el total de hombres en el municipio de Temaltepec√

S2τst

= (10, 000)(0.0505) = 505.4899

Por lo tanto:

3, 400 ± (1.645)(505.4899)3, 400 ± 831.45682, 568.5432 ≤ τst ≤ 4, 231.4568

Esto significa que el total de hombres con disfunción eréctil está entre 2,568.5432y 4,231.4568.

f) Suponga que n = 400 hombres es una muestra preliminar. ¿Cuál es eltamaño de muestra para estimar la proporción poblacional con una precisiónde 18 % de la proporción preliminar y una confiabilidad de 90 %?

n =N(Zα/2)

2ΣEh=1WhKh

Nd2 + (Zα/2)2ΣEh=1WhKh

donde:

Kh =1

16(p − 1/2)2−

(

πh −1

2

)2

Wh =Nh

N; h = 1, 2, 3

N = 10, 000 : el total de hombres en el municipio de TemaltepecZα/2 = 1.645

p =3

4

K1 =1

16(3/4 − 1/2)2−

(

0.6 − 1

2

)2

= 0.9900

K2 =1

16(3/4 − 1/2)2−

(

0.2 − 1

2

)2

= 0.9100

K3 =1

16(3/4 − 1/2)2−

(

0.1 − 1

2

)2

= 0.8400

E∑

h=1

Whkh =4, 000

10, 000(0.99) +

4, 000

10, 000(0.91) +

2, 000

10, 000(0.84) = 0.9280

d = (0.18)(0.34) = 0.0612

Por lo tanto:

n =(10, 000)(1.645)20.9280

(10, 000)(0.0612)2 + (1.645)2(0.9280)= 628.2335

Entonces, 628 es el número estimado de unidades muestrales (hombres) quedeben constituir a la muestra para tener una precisión de ±0.0612 con 0.90 deprobabilidad de incluir en el intervalo de estimación la proporción verdadera.

La asignación de la muestra en forma proporcional

208

Page 220: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

n1 =N1

Nn =

4, 000

10, 000(628) = 252 para el estrato 1

n2 =N2

Nn =

4, 000

10, 000(628) = 252 para el estrato 2

n2 =N3

Nn =

2, 000

10, 000(628) = 126 para el estrato 3

g) Suponga que n = 400 hombres es una muestra preliminar. ¿Cuál es eltamaño de muestra necesario para estimar el total verdadero con una pre-cisión de 18 % del total preliminar y una confiabilidad de 90 %?

n =N2Z2

α/2ΣEh=1WhKh

d2 + NZ2α/2Σ

Eh=1WhKh

donde:

Kh =1

16(p − 1/2)2−

(

πh −1

2

)2

Wh =Nh

N; h = 1, 2, 3

N = 10, 000 : el total de hombres en el municipio de Temaltepec

Zα/2 = 1.645; p =3

4

K1 =1

16(3/4 − 1/2)2−

(

0.6 − 1

2

)2

= 0.9900

K2 =1

16(3/4 − 1/2)2−

(

0.2 − 1

2

)2

= 0.9100

K3 =1

16(3/4 − 1/2)2−

(

0.1 − 1

2

)2

= 0.8400

E∑

h=1

Whkh =4, 000

10, 000(0.99) +

4, 000

10, 000(0.91) +

2, 000

10, 000(0.84) = 0.9280

τst = 3, 400d = (0.18)(3, 400) = 612

Por lo tanto:

n =(10, 000)2(1.6452)(0.9982)

(612)2 + (10, 000)(1.6452)(0.9280)= 628.2335

7.6. Ejercicios

En los siguientes ejercicios estime los parámetros siguientes:

a) El IC para la proporción y el total con una confiabilidad de 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la proporción y el total, de tal maneraque la proporción y el total sean estimados con una precisión de 9 % de laproporción y el total preliminar con una confiabilidad de 95 %?

Ejercicio 1. Una persona está interesada en estimar la proporción de jóvenes

209

Page 221: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

menores de 18 años que han tenido relaciones sexuales en el estado de Colima(N = 35, 000). Dado que se trata de una pregunta delicada, se usó el métodode respuesta aleatorizada. Además, la persona cree que el nivel social influye,por lo que clasificó a la población en tres estratos: clase baja (estrato 1), clasemedia (estrato 2), clase alta (estrato 3), donde la población de cada estrato esN1 = 15, 000, N2 = 11, 000 y N3 = 9, 000. Para el estudio se tomó una muestraaleatoria simple (n = 800) de la población objetivo, se distribuyó de la siguientemanera : n1 = 200, n2 = 250 y n3 = 350 jóvenes. El número de respuestas de"sí" por estrato fue de 70 para estrato uno, 130 para el estrato dos y 200 para el

estrato tres. Para este caso p =5

6.

Ejercicio 2. La Secretaría de Salud desea hacer un estudio para estimar laproporción de personas menores a 45 años que han contraído algún tipo deenfermedad de transmisión sexual (ETS) en el municipio de Manzanillo, Coli-ma (N = 20, 000). Dado que se trata de una pregunta delicada, se usó el métodode respuesta aleatorizada. Además se cree que el nivel socioeconómico influye,por lo que clasificó a la población en tres estratos: nivel bajo (estrato 1), nivelmedio (estrato 2), nivel alto (estrato 3), donde la población de cada estrato esN1 = 4, 000, N2 = 10, 000 y N3 = 6, 000. Para el estudio se tomó una muestraaleatoria simple (n = 2,000) de la población objetivo, se distribuyó de la sigu-iente manera: n1 = 500, n2 = 900, n3 = 600 personas. El número de respuestasde "sí" por estrato fue de 60 para el estrato 1, 100 para el estrato 2 y 123 para el

estrato 3. Para este caso p =5

6.

Ejercicio 3. Un psicólogo de la Universidad de Colima está interesado enestimar la proporción de jóvenes estudiantes de dicha universidad menoresde 20 años que han sufrido algún tipo de maltrato por parte de sus padres(N = 5,000). Dado que se trata de una pregunta delicada, se usó el método derespuesta aleatorizada. Además se cree que el nivel social influye, por lo que seclasificó a la población en tres estratos: clase baja (estrato 1), clase media (es-trato 2), clase alta (estrato 3), donde la población de cada estrato es N1 = 1, 000,N2 = 2, 500, N3 = 1, 500. Para el estudio se tomó una muestra aleatoria simple(n = 300) de la población objetivo, se distribuyó de la siguiente manera: n1 = 50,n2 = 100, n3 = 150 personas. El número de respuestas de "sí" por estrato fue de20 para el estrato uno, 60 para el estrato dos y 70 para el estrato tres. Para este

caso p =5

6.

Ejercicio 4. Un sociólogo de la Universidad de Arizona EUA está interesado enestimar la proporción de mujeres del estado de Colima menores a 25 años quehan tenido tendencias suicidas (N = 50, 000). Dado que se trata de una pregun-ta delicada, se usó el método de respuesta aleatorizada. Además se cree que elnivel social influye, por lo que se clasificó a la población en tres estratos: clasebaja (estrato 1), clase media (estrato 2), clase alta (estrato 3), donde la poblaciónde cada estrato es N1 = 15, 000, N2 = 25, 000, N3 = 10, 000. Para el estudio se tomóuna muestra aleatoria simple (n = 1, 000) de la población objetivo, se distribuyóde la siguiente manera: n1 = 200, n2 = 500, n3 = 300 personas. El número derespuestas de "sí" por estrato fue de 8 para el estrato uno, 10 para el estrato

210

Page 222: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

dos y 9 para el estrato tres. Para este caso p =5

6.

7.7. Alternativa al modelo de respuesta aleatori-zada

Como alternativa al método de Warner, Horvitz et. al., (1967) sugirierón quela cooperación de los entrevistados podría mejorar si el segundo enunciado (pregunta 2) no fuese delicado y no tuviese relación con el primero. A contin-uación se presenta esta variante de la idea original de Warner (1965) propuestapor Horvitz et. al., (1967)[6]:

I. Se construye un mazo de cartas, pero una fracción de ellas p, se marcacon la letra A (grupo A) y la fracción restante, 1−p, con las letras faltantesdel abecedario (grupo B).

II. Se selecciona una muestra aleatoria simple o estratificada de individuossin reemplazo de tamaño n de la población (N ).

III. A cada individuo que va a responder se le enseña el mazo de cartas paraque vea que las cartas estan marcadas con las letras del abecedario.

IV. En seguida se baraja adecuadamente el mazo de cartas y se le pide alindividuo que seleccione una carta, pero que no nos diga con que letraesta marcada.

V. A continuación se le explica que se le va a hacer una pregunta y que laresponda con "sí" o "no", pero restaltando que ponga mucha atención a lapregunta.

VI. Responda a la pregunta delicada, por ejemplo ¿ha consumido droga algu-na vez? si la carta que obtuvo esta marcada con la letra A, por el contrarioresponda a la pregunta inocua , por ejemplo, ¿naciste el mes de abril? siobtuvo cualquier otra letra del abecedario.

VII. Se tiene que hacer enfasis en que debe de responder con la verdad a laspreguntas y que solamente tiene que responder una de ellas dependiendode la letra que obtuvo, es decir, si la la carta que obtuvo esta marcada conla letra A debe responder con la verdadad a la pregunta delicada y estasería su única respuesta, lo mismo que si le toco cualquier otra letra delabecedario debe de responder con la verdad a la pregunta inocua y estasería la única respuesta.

VIII. La carta elegida por un individuo tiene que ser reemplazada antes deentrevistar a la siguiente persona.

IX. Este procedimiento se aplica a todos los n individuos.

X. Con las n respuestas de "sí" y "no" se hacen las estimaciones correspon-dientes con los estimadores propuestos en éste capítulo.

211

Page 223: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

7.8. Respuesta aleatorizada versión Horvitz bajoMAS

A continuación se presentan los estimadores puntuales y por intervalo parala proporción y el total, así como sus respectivos estimadores de tamaños demuestra:

Estimador de la proporción y del total

π =φ − (1 − p)pI

p

τ = Nπ = N

(

φ − (1 − p)pI

p

)

donde: φ =a

n, a = el total de respuestas afirmativas (sí) en la muestra de

tamaño n.

Varianza del estimador de la proporción y el total

V (π) =

(

N − n

N

)

V (φ)

p2=

(

N − n

N

)

φ(1 − φ)

p2n

V (τ) = N2V (π) = N2

(

N − n

N

)

V (φ)

p2=

(

N − n

N

)

N2 φ(1 − φ)

p2n

Intervalo de confianza de la proporción y el total

π ± Zα/2

V (π)

τ ± Zα/2N

V (π)

Tamaño de muestra para estimar la proporción

n =

NZ2α/2

(

φ(1 − φ)

p2

)

Nd2 + Z2α/2

(

φ(1 − φ)

p2

)

Tamaño de muestra para estimar el total

n =

N2Z2α/2

(

φ(1 − φ)

p2

)

d2 + N2Z2α/2

(

φ(1 − φ)

p2

)

212

Page 224: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

7.8.1. Ejemplos

Ejemplo 1. Se elige una muestra aleatoria simple de 350 de los 1,800 alum-nos del bachillerato de la Universidad de Colima. Cada estudiante de la mues-tra recibe una ficha con las siguientes preguntas:

Pregunta 1: ¿has fumado marihuana alguna vez?Pregunta 2: ¿cumples años el primero de enero?

Se tiene de los expedientes de todos los alumos del bachillerato que pI =1/365. Suponga que el mecanismo de aleatorización es una baraja con unafracción de cartas marcas con la letra A igual a p = 0.7 y la fracción restantecon las letras sobrantes del abecedario. De los resultados de la encuesta setiene que 125 contestaron sí.

a). Estime la proporción de estudiantes que han fumado marihuana.

π =φ − (1 − p)pI

p

donde: pI = 1/365, p = 0.7 y φ =125

350= 0.3571.

Por lo tanto,

π =

125

350− (1 − 0.7)

1

3650.7

= 0.509.

b) Estime la varianza de la proporción muestral.

V (π) =

(

N − n

N

)

φ(1 − φ)

p2n

donde: N = 1800, n = 350, p = 0.7 y φ =125

350Por lo tanto,

V (π) =

(

1800 − 350

1800

)

125

350

(

1 − 125

350

)

0.72(350)= 0.00109.

c) Estime un intervalo de confianza de 95 % para la proporción poblacional.

π ± Zα/2

V (π)

donde: π = 0.5090, Zα/2 = Z0.025 = 1.96 y V (π) = 0.00109

Por lo tanto,0.5090 ± (1.96)(

√0.00109)

0.5090 ± (1.96)(0,0330)0.4443 ≤ π ≤ 0.5737

d) Estime el total de estudiantes que ha fumado marihuana.τ = Nπ

donde: N = 1800 y π = 0.5090

Por lo tanto,τ = 1800(0.5090) = 916. Así, se tiene que el número de estudi-

213

Page 225: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

antes del bachillerato de la Universidad de Colima que alguna vez han fumadomarihuana es de 916.

e) Estime un intervalo de confianza de 95 % para el total poblacional.

τ ± Zα/2N

V (π)

donde: N = 1800, τ = 916, Zα/2 = Z0.025 = 1.96 y V (π) = 0.00109

Por lo tanto,916 ± (1.96)(1800)(

√0.00109)

799.7226 ≤ τ ≤ 1032.6774

f) Suponga que los 350 estudiantes encuestados son una muestra prelimi-nar. ¿Cuál sería el tamaño de muestra necesario para estimar la proporción detal manera que sea estimada con una precisión de d = 0.05 y una confiabilidadde 95 %?

n =

NZ2α/2

(

φ(1 − φ)

p2

)

Nd2 + Z2α/2

(

φ(1 − φ)

p2

)

donde: N = 1800, Zα/2 = Z0.025 = 1.96, d = 0.05, p = 0.7 y φ = 125/350

Por lo tanto,

n =

(1800)(1.96)2

(

(125/350)(1 − 125/350)

(0.7)2

)

(1800)(0.05)2 + (1.96)2

(

(125/350)(1 − 125/350)

(0.7)2

) = 514.2661

g) Suponga que los 350 estudiantes encuestados son una muestra prelim-inar. ¿Cuál sería el tamaño de muestra necesario para estimar el total de talmanera que sea estimado con una precisión de d = 90 y una confiabilidad de95 %?

n =

N2Z2α/2

(

φ(1 − φ)

p2

)

d2 + N2Z2α/2

(

φ(1 − φ)

p2

)

donde: N = 1800, Zα/2 = Z0.025 = 1.96, d = 90, p = 0.7 y φ = 125/350

Por lo tanto,

n =

(18002)(1.96)2

(

(125/350)(1 − 125/350)

(0.7)2

)

(90)2 + (18002)(1.96)2

(

(125/350)(1 − 125/350)

(0.7)2

) = 514.2661

Ejemplo 2. Se elige una muestra aleatoria simple de 180 empleadas de

214

Page 226: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

una empresa automotriz del total de su población (N = 1, 500). Cada empleadarecibe una ficha con las siguientes preguntas:

Pregunta 1: ¿se te ha escapado una flatulencia o gas en una reunión impor-tante?Pregunta 2: ¿está el minutero de tu reloj entre 0 y 5?

Sabemos que pI = 1/12. Suponga que el mecanismo de aleatorización es unabaraja con una fracción de cartas marcas con la letra A igual a p = 0.75 y lafracción restante con las letras sobrantes del abecedario. De los resultados dela encuesta se tiene que 130 contestaron sí a la pregunta correspondiente.

a). Estime la proporción de empleadas que se les ha escapado un gas enuna reunión importante.

π =φ − (1 − p)pI

p

donde: pI = 1/12, p = 0.75 y φ =130

180= 0.7222.

Por lo tanto,

π =

130

180− (1 − 0.75)

1

120.75

= 0.9352.

b) Estime la varianza de la proporción muestral.

V (π) =

(

N − n

N

)

φ(1 − φ)

p2n

donde: N = 1500, n = 180, p = 0.75 y φ =130

180Por lo tanto,

V (π) =

(

1500 − 180

1500

)

130

180

(

1 − 130

180

)

0.752(180)= 0.00174.

c) Estime un intervalo de confianza de 95 % para la proporción poblacional.

π ± Zα/2

V (π)

donde: π = 0.9352, Zα/2 = Z0.025 = 1.96 y V (π) = 0.00174

Por lo tanto,0.9352 ± (1.96)(

√0.00174)

0.8534 ≤ π ≤ 1

d) Estime el total de empleadas que se le ha escapado un gas.τ = Nπ

donde: N = 1500 y π = 0.9352

Por lo tanto,τ = 1500(0.9352) = 1402.8. Así, se tiene que el número de em-

pleadas en dicha empresa que se les ha escapado un gas en una reuniónimportante es de 1403.

215

Page 227: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

e) Estime un intervalo de confianza de 95 % para el total poblacional.

τ ± Zα/2N

V (π)

donde: N = 1500, τ = 1402.8, Zα/2 = Z0.025 = 1.96 y V (π) = 0.00174

Por lo tanto,1402.8 ± (1.96)(1500)(

√0.00174)

1280.163 ≤ τ ≤ 1500

f) Suponga que las 180 empleadas encuestadas son una muestra prelimi-nar. ¿Cuál sería el tamaño de muestra necesario para estimar la proporción detal manera que sea estimada con una precisión de d = 0.07 y una confiabilidadde 95 %?

n =

NZ2α/2

(

φ(1 − φ)

p2

)

Nd2 + Z2α/2

(

φ(1 − φ)

p2

)

donde: N = 1500, Zα/2 = Z0.025 = 1.96, d = 0.07, p = 0.75 y φ = 130/180

Por lo tanto,

n =

(1500)(1.96)2

(

(130/180)(1 − 130/180)

(0.75)2

)

(1500)(0.07)2 + (1.96)2

(

(130/180)(1 − 130/180)

(0.75)2

) = 235.692

g) Suponga que las 180 empleadas encuestadas son una muestra prelim-inar. ¿Cuál sería el tamaño de muestra necesario para estimar el total de talmanera que sea estimado con una precisión de d = 105 y una confiabilidad de95 %?

n =

N2Z2α/2

(

φ(1 − φ)

p2

)

d2 + N2Z2α/2

(

φ(1 − φ)

p2

)

donde: N = 1500, Zα/2 = Z0.025 = 1.96, d = 105, p = 0.75 y φ = 130/180

Por lo tanto,

n =

(15002)(1.96)2

(

(130/180)(1 − 130/180)

(0.75)2

)

(105)2 + (15002)(1.96)2

(

(130/180)(1 − 130/180)

(0.75)2

) = 235.692

Ejemplo 3. Una investigadora de la Universidad de Colima desea estimarel porcentaje de alumnas de nivel medio y superior de la institución que abor-taron durante el 2007. Se toma una muestra aleatoria simple de 210 mujeresde la población estudiantil de estos niveles(N = 4, 000). Cada una de estas mu-

216

Page 228: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

jeres recibe una ficha con las siguientes preguntas:

Pregunta 1: ¿tuvo un aborto provocado durante el 2007?Pregunta 2: ¿su matrícula en la U de C es impar?

Sabemos que pI = 1/2. Suponga que el mecanismo de aleatorización es unabaraja con una fracción de cartas marcas con la letra A igual a p = 0.7 y lafracción restante con las letras sobrantes del abecedario. De los resultados dela encuesta se tiene que 39 contestaron sí a la pregunta correspondiente.

a). Estime la proporción de alumnas que han tenido un aborto provocadoen el 2007.

π =φ − (1 − p)pI

p

donde: pI = 1/2, p = 0.7 y φ =39

210= 0.1857.

Por lo tanto,

π =

39

210− (1 − 0.7)

1

20.7

= 0.051.

b) Estime la varianza de la proporción muestral.

V (π) =

(

N − n

N

)

φ(1 − φ)

p2n

donde: N = 4000, n = 210, p = 0.7 y φ =39

210Por lo tanto,

V (π) =

(

4000 − 210

4000

)

39

210

(

1 − 39

210

)

0.72(210)= 0.00139.

c) Estime un intervalo de confianza de 95 % para la proporción poblacional.

π ± Zα/2

V (π)

donde: π = 0.051, Zα/2 = Z0.025 = 1.96 y V (π) = 0.00139

Por lo tanto,0.051 ± (1.96)(

√0.00139)

0 ≤ π ≤ 0.1241

d) Estime el total alumnas que han tenido un aborto provocado.τ = Nπ

donde: N = 4000 y π = 0.051

Por lo tanto,τ = 4000(0.051) = 204. Así, se tiene que el número de alumnas

que han tenido un aborto provocado es de 204.

e) Estime un intervalo de confianza de 95 % para el total poblacional.

τ ± Zα/2N

V (π)

217

Page 229: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

donde: N = 4000, τ = 204, Zα/2 = Z0.025 = 1.96 y V (π) = 0.00139

Por lo tanto,204 ± (1.96)(4000)(

√0.00139)

0 ≤ τ ≤ 496.2964

f) Suponga que las 210 alumnas encuestadas son una muestra preliminar.¿Cuál sería el tamaño de muestra necesario para estimar la proporción de talmanera que sea estimada con una precisión de d = 0.07 y una confiabilidad de95 %?

n =

NZ2α/2

(

φ(1 − φ)

p2

)

Nd2 + Z2α/2

(

φ(1 − φ)

p2

)

donde: N = 4000, Zα/2 = Z0.025 = 1.96, d = 0.07, p = 0.7 y φ = 39/210

Por lo tanto,

n =

(4000)(1.96)2

(

(39/210)(1 − 39/210)

(0.7)2

)

(4000)(0.07)2 + (1.96)2

(

(39/210)(1 − 39/210)

(0.7)2

) = 228.1452

g) Suponga que las 210 alumnas encuestadas son una muestra preliminar.¿Cuál sería el tamaño de muestra necesario para estimar el total de tal maneraque sea estimado con una precisión de d = 280 y una confiabilidad de 95 %?

n =

N2Z2α/2

(

φ(1 − φ)

p2

)

d2 + N2Z2α/2

(

φ(1 − φ)

p2

)

donde: N = 4000, Zα/2 = Z0.025 = 1.96, d = 280, p = 0.7 y φ = 39/210

Por lo tanto,

n =

(40002)(1.96)2

(

(39/210)(1 − 39/210)

(0.7)2

)

(280)2 + (40002)(1.96)2

(

(39/210)(1 − 39/210)

(0.7)2

) = 228.1452

Ejemplo 4. Se elige una muestra aleatoria simple de 135 funcionarios delgobierno federal del total de N = 2, 000. Cada funcionario de la muestra recibeuna ficha con las siguientes preguntas:

Pregunta 1: ¿alguna vez ha conducido en estado de ebriedad?Pregunta 2: ¿le gusta el fútbol?

218

Page 230: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Sabemos que pI = 0.7, el cual se obtuvo de un estudio previo reciente real-izado a esta misma población. Suponga que el mecanismo de aleatorización esuna baraja con una fracción de cartas marcas con la letra A igual a p = 0.75 yla fracción restante con las letras sobrantes del abecedario. De los resultadosde la encuesta se tiene que 100 contestaron sí a la pregunta correspondiente.

a). Estime la proporción de funcionarios que han conducido en estado deebriedad.

π =φ − (1 − p)pI

p

donde: pI = 0.7, p = 0.75 y φ =100

135= 0.7407.

Por lo tanto,

π =

100

135− (1 − 0.75)0.7

0.75= 0.7543.

b) Estime la varianza de la proporción muestral.

V (π) =

(

N − n

N

)

φ(1 − φ)

p2n

donde: N = 2000, n = 135, p = 0.75 y φ =100

135Por lo tanto,

V (π) =

(

2000 − 135

2000

)

100

135

(

1 − 100

135

)

0.752(135)= 0.00235.

c) Estime un intervalo de confianza de 95 % para la proporción poblacional.

π ± Zα/2

V (π)

donde: π = 0.7543, Zα/2 = Z0.025 = 1.96 y V (π) = 0.00235

Por lo tanto,0.7543 ± (1.96)(

√0.00235)

0.6593 ≤ π ≤ 0.8493

d) Estime el total de funcionarios que han conducido en estado de ebriedad.τ = Nπ

donde: N = 2000 y π = 0.7543

Por lo tanto,τ = 2000(0.7543) = 1508.6. Así, se tiene que el número de fun-

cionarios que han conducido en estado de ebriedad es de 1509.

e) Estime un intervalo de confianza de 95 % para el total poblacional.

τ ± Zα/2N

V (π)

donde: N = 2000, τ = 1508.6, Zα/2 = Z0.025 = 1.96 y V (π) = 0.00235

Por lo tanto,1508.6 ± (1.96)(2000)(

√0.00235)

219

Page 231: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

1318.571 ≤ τ ≤ 1698.629

f) Suponga que los 135 funcionarios encuestados son una muestra prelimi-nar. ¿Cuál sería el tamaño de muestra necesario para estimar la proporción detal manera que sea estimada con una precisión de d = 0.08 y una confiabilidadde 95 %?

n =

NZ2α/2

(

φ(1 − φ)

p2

)

Nd2 + Z2α/2

(

φ(1 − φ)

p2

)

donde: N = 2000, Zα/2 = Z0.025 = 1.96, d = 0.08, p = 0.75 y φ = 100/135

Por lo tanto,

n =

(2000)(1.96)2

(

(100/135)(1 − 100/135)

(0.75)2

)

(2000)(0.08)2 + (1.96)2

(

(100/135)(1 − 100/135)

(0.75)2

) = 185.9025

g) Suponga que los 135 funcionarios encuestadas son una muestra prelim-inar. ¿Cuál sería el tamaño de muestra necesario para estimar el total de talmanera que sea estimado con una precisión de d = 160 y una confiabilidad de95 %?

n =

N2Z2α/2

(

φ(1 − φ)

p2

)

d2 + N2Z2α/2

(

φ(1 − φ)

p2

)

donde: N = 2000, Zα/2 = Z0.025 = 1.96, d = 160, p = 0.75 y φ = 100/135

Por lo tanto,

n =

(20002)(1.96)2

(

(100/135)(1 − 100/135)

(0.75)2

)

(160)2 + (20002)(1.96)2

(

(100/135)(1 − 100/135)

(0.75)2

) = 185.9025

7.9. Ejercicios

En los siguientes ejercicios estime lo siguiente:a) Un intervalo de confianza para la proporción y el total con una confiabilidadde 95 %.b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuáles el tamaño de muestra para estimar la proporción y el total de tal maneraque sean estimados con una precisión del 10 % con respecto a la proporción yel total preliminar, respectivamente?

220

Page 232: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Ejercicio 1. Una investigadora desea estimar el porcentaje y total de mujerescasadas que sufrieron de maltrato por parte de su pareja durante el 2007.Supóngase que en el Municipio de Colima, Colima, se tiene una población dematrimonios de N = 10, 000, de la cual se toma una muestra aleatoria simple den = 138 parejas (pero a quienes se les pregunta es a los esposos). Cada esposorecibe una ficha con las siguientes preguntas:

Pregunta 1: ¿golpeo alguna vez a su esposa durante el 2007?Pregunta 2: ¿el número de su credencia es par?

Sabemos que pI = 0.5. Supóngase que el mecanismo de aleatorización esuna baraja con una fracción de cartas marcadas con la letra A igual a p = 0.8y la fración restante con las letras sobrantes del abecedario. De los resultadosde la encuesta se tiene que 65 respondieron sí.

Ejercicio 2. Un investigador desea estimar el porcentaje y total de mujeresde 24 años han tenido relaciones sexuales con dos o más hombres (e distintosmomentos). Se toma una muestra aleatoria simple de n = 160 mujeres de estaedad de un total de N = 15, 000. Cada una de estas mujeres (de la muestra)recibe una ficha con las siguientes preguntas:

Pregunta 1: ¿has tenido relaciones sexuales con 2 o más hombres?Pregunta 2: ¿naciste el 9 de Junio de 1984?

A partir de un censo preliminar se determino que del total de estas mujeresel 9 % nació el 9 de junio de 1984. Por lo tanto, pI = 0.09. Supóngase que elmecanismo de aleatorización es una baraja con una fracción de cartas mar-cadas con la letra A igual a p = 0.85 y la fración restante con las letras sobrantesdel abecedario. De los resultados de la encuesta se tiene que 40 respondieronsí.

Ejercicio 3. Una investigadora desea estimar el porcentaje de hombres (decierto municipio) entre 40 y 55 años que padecen o han padecido alguna vezdisfunción eréctil. Se toma una muestra aleatoria simple de n = 186 hombresdel total de la población (N = 8, 000). Cada uno de los hombres de la muestrarecibe una ficha con las siguientes preguntas:

Pregunta 1: ¿padece o ha padecido alguna vez disfunción eréctil?Pregunta 2: ¿usted tiene 43 años?

De los registros del Centro de salud Municipal se obtuvo que el 19 % de es-tos hombres tienen 43 años. Por lo tanto, pI = 0.19. Supóngase que el mecan-ismo de aleatorización es una baraja con una fracción de cartas marcadas conla letra A igual a p = 0.90 y la fración restante con las letras sobrantes delabecedario. De los resultados de la encuesta se tiene que 48 respondieron sí.

Ejercicio 4. Un investigador desea estimar el porcentaje de mujeres (de ciertaciudad) entre 16 y 20 años que padecen o han padecido alguna vez bulimia oanorexia. Se toma una muestra aleatoria simple de n = 210 mujeres del total de

221

Page 233: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

la población (mujeres entre 16 y 20 años, N = 4, 000). Cada uno de las mujeresde la muestra recibe una ficha con las siguientes preguntas:

Pregunta 1: ¿padece o ha padecido alguna vez bulimia o anorexia?Pregunta 2: ¿tu signo zodiacal es tauro?

Se cuenta con un marco de muestreo que específica la fecha de nacimientode estas mujeres, de donde a partir de éste se obtuvo que el 13 % de estas mu-jeres pertence al signo tauro. Por lo tanto, pI = 0.13. Supóngase que el mecan-ismo de aleatorización es una baraja con una fracción de cartas marcadas conla letra A igual a p = 0.75 y la fración restante con las letras sobrantes delabecedario. De los resultados de la encuesta se tiene que 100 respondieron sí.

7.10. Respuesta aleatorizada versión Horvitz bajoMAE

De igual manera, cuando la población es heterogénea se sugiere formarestratos para mejorar la precisión. Por ello, a continuación se presentan losestimadores versión Horvitz bajo MAE:

Estimador de la proporción y el total estratificado

πst =N1π1 + N2π2 + · · · + NEπE

N

τ = Nπst

donde:

πh =φh − (1 − p)pI

p.

φh =ah

nh

.

p = la fracción de letras en el mazo de cartas marcadas con la letra A.ah = el total de respuestas afirmativas (sí) de los nh entrevistados en el

estrato h ; h = 1, 2, ..., E.

Varianza de la proporción y el total estratificado

S2πst

=E

h=1

(

Nh

N

)2 (

Nh − nh

Nh

)

φh(1 − φh)

p2nh

S2τst

= N2

E∑

h=1

(

Nh

N

)2 (

Nh − nh

Nh

)

φh(1 − φh)

p2nh

Intervalo de confianza para la proporción y el total

πst ± Zα/2

S2πst

τst ± Zα/2N√

S2πst

222

Page 234: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

El tamaño de muestra para estimar la proporción y el total

Para estimar la proporción

n =

NZ2α/2

E∑

h=1

Whφh(1 − φh)

p2

Nd2 + Z2α/2

E∑

h=1

Whφh(1 − φh)

p2

donde:N = el tamaño de la población.Zα/2 = el valor de tablas de la distribución normal.p = la fracción de cartas que están marcadas con la letra A.d = la precisión fijada por el investigador.

Wh =Nh

Nφ =

ah

nh

Para estimar el total

n =

N2Z2α/2

E∑

h=1

Whφh(1 − φh)

p2

d2 + NZ2α/2

E∑

h=1

Whφh(1 − φh)

p2

donde:N = el tamaño de la población.Zα/2 = el valor de tablas de la distribución normal.p = la fracción de cartas que están marcadas con la letra A.d = la precisión fijada por el investigador.

Wh =Nh

Nφ =

ah

nh

7.11. ¿Cuál método de respuesta aleatorizada esmejor?

Dowling y Shachtman (1975)[18] han mostrado que la varianza del esti-mador de interés (π) de la versión Horvitz (1967) es menor que la propuestaoriginalmente por Warner (1965). Esto significa que usando la versión prop-uesta por Horvitz (1967) se obtienen estimaciones de la proporción y el totalmás precisas, por lo que se sugiere que el investigador use esta versión pararealizar sus estudios.

223

Page 235: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Capítulo 7. El muestreo basado en el método de respuesta aleatorizada

224

Page 236: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Apéndice A

Tablas de la distribución normalestándar y de la distribuciónt-student

225

Page 237: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Apéndice A. Tablas de la distribución normal estándar y de la distribuciónt-student

1 2

Z0

P (Z < Z0) =

∫ Z0

−∞

fZ(z)dz =

∫ Z0

−∞

1√2π

e−z2

2 dz = 1 − α/2

Cuadro A.1: Distribución normal estándar acumulada.Z

Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.090 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359

0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.57530.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.61410.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.65170.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.68790.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.72240.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.75490.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.78520.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.83891 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621

1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.88301.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90151.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.91771.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.93191.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.94411.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.97672 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817

2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.98572.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.98902.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.99162.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.99362.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99522.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.99642.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.99742.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.99863 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.99933.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.99953.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.99973.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.99983.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.99983.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.99993.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.99993.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.99993.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

226

Page 238: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

1 2

t0

P (T < t0) =

∫ t0

−∞

fT (t)dt =

∫ t0

−∞

1√νπ

[(ν + 1)/2]!

[ν/2]!

(

t2

ν+ 1

)−(ν+1)/2

dt

Cuadro A.2: Puntos porcentuales de la distribución t-student.α/2

ν 0.25 0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.00051 1.0000 3.0777 6.3138 12.7062 31.8205 63.6567 127.3213 318.3088 636.61922 0.8165 1.8856 2.9200 4.3027 6.9646 9.9248 14.0890 22.3271 31.59913 0.7649 1.6377 2.3534 3.1824 4.5407 5.8409 7.4533 10.2145 12.92404 0.7407 1.5332 2.1318 2.7764 3.7469 4.6041 5.5976 7.1732 8.61035 0.7267 1.4759 2.0150 2.5706 3.3649 4.0321 4.7733 5.8934 6.86886 0.7176 1.4398 1.9432 2.4469 3.1427 3.7074 4.3168 5.2076 5.95887 0.7111 1.4149 1.8946 2.3646 2.9980 3.4995 4.0293 4.7853 5.40798 0.7064 1.3968 1.8595 2.3060 2.8965 3.3554 3.8325 4.5008 5.04139 0.7027 1.3830 1.8331 2.2622 2.8214 3.2498 3.6897 4.2968 4.780910 0.6998 1.3722 1.8125 2.2281 2.7638 3.1693 3.5814 4.1437 4.586911 0.6974 1.3634 1.7959 2.2010 2.7181 3.1058 3.4966 4.0247 4.437012 0.6955 1.3562 1.7823 2.1788 2.6810 3.0545 3.4284 3.9296 4.317813 0.6938 1.3502 1.7709 2.1604 2.6503 3.0123 3.3725 3.8520 4.220814 0.6924 1.3450 1.7613 2.1448 2.6245 2.9768 3.3257 3.7874 4.140515 0.6912 1.3406 1.7531 2.1314 2.6025 2.9467 3.2860 3.7328 4.072816 0.6901 1.3368 1.7459 2.1199 2.5835 2.9208 3.2520 3.6862 4.015017 0.6892 1.3334 1.7396 2.1098 2.5669 2.8982 3.2224 3.6458 3.965118 0.6884 1.3304 1.7341 2.1009 2.5524 2.8784 3.1966 3.6105 3.921619 0.6876 1.3277 1.7291 2.0930 2.5395 2.8609 3.1737 3.5794 3.883420 0.6870 1.3253 1.7247 2.0860 2.5280 2.8453 3.1534 3.5518 3.849521 0.6864 1.3232 1.7207 2.0796 2.5176 2.8314 3.1352 3.5272 3.819322 0.6858 1.3212 1.7171 2.0739 2.5083 2.8188 3.1188 3.5050 3.792123 0.6853 1.3195 1.7139 2.0687 2.4999 2.8073 3.1040 3.4850 3.767624 0.6848 1.3178 1.7109 2.0639 2.4922 2.7969 3.0905 3.4668 3.745425 0.6844 1.3163 1.7081 2.0595 2.4851 2.7874 3.0782 3.4502 3.725126 0.6840 1.3150 1.7056 2.0555 2.4786 2.7787 3.0669 3.4350 3.706627 0.6837 1.3137 1.7033 2.0518 2.4727 2.7707 3.0565 3.4210 3.689628 0.6834 1.3125 1.7011 2.0484 2.4671 2.7633 3.0469 3.4082 3.673929 0.6830 1.3114 1.6991 2.0452 2.4620 2.7564 3.0380 3.3962 3.659430 0.6828 1.3104 1.6973 2.0423 2.4573 2.7500 3.0298 3.3852 3.646040 0.6807 1.3031 1.6839 2.0211 2.4233 2.7045 2.9712 3.3069 3.551060 0.6786 1.2958 1.6706 2.0003 2.3901 2.6603 2.9146 3.2317 3.4602120 0.6765 1.2886 1.6577 1.9799 2.3578 2.6174 2.8599 3.1595 3.3735180 0.6759 1.2863 1.6534 1.9732 2.3472 2.6034 2.8421 3.1361 3.3454210 0.6757 1.2856 1.6521 1.9713 2.3442 2.5994 2.8370 3.1295 3.3375

227

Page 239: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Apéndice A. Tablas de la distribución normal estándar y de la distribuciónt-student

h h

Normal Uniforme discreta

S2 =h2

36S2 =

h2

12+

h

6

h h

Uniforme continua Elipse

S2 =h2

12S2 =

h2

16

h h

Triangular simétrica Triangular asimétrica

S2 =h2

24S2 =

h2

18

h

Triangular doble

S2 =h2

8

Figura A.1: Varianzas de distribuciones finitas (S2), en función de su forma yrango.

Donde h=rango=Máximo Xi-Mínimo Xi.

228

Page 240: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Cuadro A.3: Tabla de números aleatorios1 2 3 4 5 6 7 8 9 10

1 7 5 3 8 2 5 1 6 6 4 5 0 9 0 6 5 4 8 4 3 3 2 9 0 5 0 0 3 2 6 2 7 5 0 4 5 4 4 7 1 0 0 6 3 9 5 9 4 5 42 9 2 8 4 1 2 0 5 6 6 6 9 8 8 0 8 3 2 2 6 0 6 3 8 0 1 2 1 3 0 2 9 2 0 5 4 7 0 5 4 1 2 0 7 2 7 5 7 6 93 1 2 3 2 3 1 8 6 4 4 0 5 0 9 0 4 4 4 2 4 1 8 8 3 9 2 8 2 9 0 0 8 1 6 3 9 4 9 3 3 1 0 9 5 7 5 6 9 4 84 0 8 6 0 2 5 1 2 9 6 7 4 6 0 0 6 8 9 7 5 3 7 7 8 9 0 0 5 5 5 6 8 2 9 0 5 7 4 2 2 7 3 9 6 4 4 7 5 4 95 8 0 3 9 9 8 2 3 7 6 0 0 3 8 8 4 4 5 7 3 3 9 8 8 1 6 5 8 3 8 9 5 9 5 5 7 4 0 4 6 6 7 4 0 7 0 8 0 5 46 5 9 3 4 3 6 6 1 3 0 3 6 4 3 4 1 5 8 3 8 2 6 0 4 9 3 0 5 2 5 1 9 0 5 3 7 3 7 6 8 8 8 4 4 0 8 8 5 1 87 0 0 1 5 7 8 2 0 6 7 7 1 2 3 1 5 7 4 4 5 3 3 7 9 3 4 2 3 5 1 0 1 0 1 5 0 4 5 1 6 6 0 5 3 1 8 3 5 4 68 1 2 0 6 9 4 6 3 0 2 5 8 6 2 4 1 1 7 2 5 5 5 0 1 4 7 8 6 0 5 2 3 8 4 0 3 6 9 1 0 8 3 5 8 9 3 1 9 1 99 7 8 7 6 8 4 8 6 8 0 0 7 4 0 4 0 3 9 6 5 0 6 5 9 0 1 2 5 6 4 8 7 6 9 3 2 4 5 8 6 8 5 1 2 5 2 6 6 3 910 1 2 2 9 1 5 0 7 4 1 2 9 6 5 8 3 3 6 3 6 4 0 3 4 5 6 7 2 2 2 3 3 0 5 5 5 8 7 5 0 2 1 0 2 4 1 5 0 7 811 3 8 7 5 8 1 4 8 7 1 3 0 2 7 3 2 2 2 1 7 2 5 5 3 9 7 5 2 3 2 0 2 1 1 9 2 0 7 6 7 1 7 7 7 5 4 9 0 6 012 6 4 3 5 9 0 6 4 1 2 5 6 5 5 3 5 0 5 2 1 4 9 6 9 5 2 7 2 9 1 1 9 9 6 3 8 1 7 8 2 3 9 5 7 0 3 3 4 5 713 6 7 0 8 5 9 0 2 2 1 1 2 1 4 3 2 4 7 9 7 4 0 4 6 8 7 0 3 9 3 5 9 8 3 0 8 5 7 5 5 6 5 4 4 5 0 8 3 3 514 4 6 8 9 0 5 9 5 9 2 7 7 6 1 0 3 6 6 6 4 6 2 3 3 6 9 4 4 5 6 9 4 9 5 8 6 0 7 9 1 6 0 0 8 3 3 5 0 7 815 7 5 8 9 6 4 7 7 3 2 0 0 2 5 6 5 6 9 1 9 8 8 7 5 3 9 9 8 6 5 9 8 7 0 9 2 2 5 7 5 6 3 2 3 8 8 5 0 0 816 8 7 2 5 2 4 6 1 3 5 8 0 7 5 1 0 5 9 8 7 3 6 3 2 0 4 1 2 4 9 7 3 5 4 4 7 5 1 0 4 8 6 8 5 3 5 9 9 8 217 3 3 1 7 1 3 3 5 5 1 7 6 5 3 3 2 7 3 6 5 4 9 2 5 6 0 7 8 3 2 9 0 8 2 0 9 4 7 3 4 6 3 9 0 6 5 8 6 6 918 5 3 2 1 4 6 5 3 7 0 5 6 1 2 1 6 8 0 2 7 0 3 8 5 0 0 2 7 2 0 5 6 5 4 5 9 3 5 9 3 2 5 2 4 9 4 4 0 7 419 6 7 2 8 4 1 9 3 9 4 9 5 1 0 0 9 6 6 7 5 0 6 3 4 8 3 6 9 5 0 1 7 9 8 3 5 7 5 8 3 9 3 6 3 5 3 7 8 7 920 9 4 8 0 0 2 7 7 3 6 4 4 9 0 6 4 5 5 3 7 5 3 0 9 8 0 2 8 2 0 6 3 1 6 1 9 3 4 8 8 1 4 4 5 5 8 4 7 7 421 5 5 7 4 3 8 6 5 4 7 5 5 5 1 9 9 8 7 5 9 9 1 3 8 8 5 5 7 4 7 7 3 9 1 6 6 8 8 8 9 0 8 6 9 7 9 4 9 0 322 6 0 8 4 7 4 3 4 5 6 6 4 9 5 1 0 8 0 9 2 5 8 9 6 5 9 8 8 4 4 8 9 8 6 9 8 1 8 7 6 3 5 3 5 4 7 2 2 9 423 5 4 2 1 8 3 4 0 1 4 6 9 1 2 7 9 7 8 1 0 3 1 9 9 5 6 2 8 1 8 8 3 8 7 1 4 9 1 5 9 1 5 6 1 4 1 5 0 2 324 9 5 9 1 0 9 2 8 1 4 9 9 0 5 1 4 6 0 0 6 9 5 4 7 4 7 0 5 5 7 7 7 1 2 3 3 5 2 7 3 8 1 9 1 6 4 5 5 2 025 9 2 0 3 8 2 4 9 8 3 3 2 7 2 6 9 9 1 2 2 2 4 7 1 6 9 8 5 5 6 2 6 5 4 7 0 6 0 5 4 4 6 0 4 8 5 2 6 7 626 6 1 8 6 6 3 1 9 5 0 7 5 2 7 3 3 1 8 1 5 0 8 2 8 9 1 2 2 8 5 7 8 9 4 3 1 6 3 2 6 8 5 2 8 9 5 2 3 1 427 1 8 1 9 2 7 1 9 8 6 5 8 5 3 9 6 6 8 5 8 2 3 6 4 3 6 0 0 3 3 8 5 9 8 3 2 8 5 7 6 7 8 3 1 5 7 9 6 9 528 1 1 9 4 7 4 3 1 7 2 2 4 6 7 2 0 2 7 8 3 8 8 9 6 6 3 1 3 0 6 3 3 8 2 2 9 5 1 6 4 3 1 0 9 7 6 8 7 6 229 7 7 5 3 6 0 3 3 6 1 4 6 2 3 9 0 7 7 8 3 0 7 0 2 8 4 3 7 2 7 1 8 2 7 8 5 1 9 2 4 4 9 4 4 1 9 5 8 9 930 6 1 1 9 5 5 2 5 4 6 1 5 4 0 4 5 6 6 5 9 0 4 9 0 6 4 5 8 0 3 4 0 0 8 9 1 8 7 5 2 3 5 9 5 5 9 7 5 9 531 9 6 0 8 6 3 7 2 4 7 4 7 8 7 6 2 9 0 9 6 0 5 9 7 9 5 0 2 7 8 1 2 4 8 6 3 7 9 3 3 7 0 8 9 4 5 3 5 9 532 5 7 9 4 8 8 8 0 4 4 0 9 4 2 7 3 1 5 0 7 2 9 8 6 9 5 3 6 8 6 6 1 1 8 4 5 1 0 4 2 0 1 7 3 3 3 7 1 2 233 0 0 0 7 1 4 5 3 3 0 3 1 6 3 3 3 4 9 9 8 0 5 3 3 7 6 5 8 7 1 9 8 6 8 0 7 6 3 6 1 7 6 4 4 4 7 9 1 5 234 6 4 1 3 1 6 0 0 5 4 6 8 3 0 8 6 7 0 8 6 6 6 0 2 8 9 8 9 9 4 1 0 2 3 8 9 0 9 2 9 6 5 6 3 1 2 1 7 9 935 7 4 8 7 1 1 6 8 4 8 8 1 1 7 8 5 8 1 0 8 6 6 9 7 6 3 1 9 3 8 3 7 9 5 2 5 2 2 6 6 1 3 0 6 4 5 0 6 1 536 3 2 4 9 0 2 7 2 4 6 0 7 5 3 1 6 3 1 9 3 4 8 2 4 1 8 9 5 7 0 5 7 0 6 2 2 4 0 5 1 3 7 5 0 1 4 2 4 5 237 5 4 1 1 4 0 9 8 8 6 6 0 6 9 0 5 0 1 0 5 0 1 3 3 3 7 4 6 1 2 1 3 8 9 5 8 1 0 1 5 9 0 4 4 3 0 9 7 2 638 7 5 6 3 9 0 0 3 3 6 4 3 2 9 5 4 7 2 6 0 3 7 4 3 3 4 9 4 2 2 6 5 0 9 8 8 1 8 4 9 1 4 6 9 8 1 7 1 9 439 0 2 1 7 1 9 2 7 1 3 1 3 8 3 9 7 9 1 9 1 3 0 0 5 0 8 4 0 5 5 4 3 1 8 0 1 4 3 7 8 1 7 3 2 2 2 1 1 8 840 3 8 5 7 3 9 8 4 7 4 5 9 6 0 6 0 4 6 9 8 8 3 9 1 9 0 3 7 0 2 6 9 7 6 3 1 5 9 8 5 0 6 7 1 0 8 6 8 0 841 7 8 4 0 6 2 3 7 0 6 4 8 5 2 4 5 6 7 1 6 2 6 5 7 6 5 0 5 9 9 9 8 9 2 3 6 1 4 7 3 8 3 7 0 5 5 8 7 1 842 1 5 9 8 9 9 6 4 0 5 6 6 2 9 5 1 0 2 6 4 8 5 6 5 6 8 0 2 1 0 6 2 3 7 8 1 5 0 6 5 6 4 8 7 5 9 1 7 6 243 1 1 0 5 8 0 2 6 5 8 3 3 5 4 2 4 3 6 6 3 4 4 3 3 4 7 3 6 3 6 1 1 7 9 5 0 3 5 7 7 9 3 3 3 0 0 0 1 6 244 3 9 6 9 4 0 8 3 5 9 3 8 0 5 3 5 2 3 4 0 7 1 9 0 1 1 2 7 4 8 7 2 1 5 9 9 0 2 3 8 9 0 2 0 3 4 1 1 7 345 4 5 0 4 1 3 4 5 2 8 7 9 4 1 7 2 7 9 9 2 1 1 5 5 0 9 0 4 4 6 1 3 2 8 2 9 8 3 8 1 8 0 5 6 8 9 6 0 6 646 3 3 6 1 8 1 2 1 4 2 6 5 4 0 7 5 8 1 4 2 6 5 6 2 5 9 2 4 9 4 2 9 9 3 1 3 2 8 2 8 8 4 4 1 9 5 8 7 2 947 0 1 5 4 7 3 8 6 4 0 6 5 1 0 1 2 6 1 5 9 5 3 3 4 7 7 3 7 5 0 0 4 0 5 9 2 9 5 8 0 3 0 0 1 1 6 2 7 7 448 4 6 1 2 0 9 7 2 4 3 3 0 2 3 6 2 7 9 1 1 1 3 3 4 0 4 3 9 7 9 0 1 4 8 8 2 8 1 9 9 1 9 0 2 3 0 0 4 1 149 2 6 1 9 9 0 0 2 1 4 5 8 6 4 1 6 5 5 1 2 8 6 3 9 9 5 8 3 1 4 4 2 2 4 0 2 5 9 6 9 8 7 0 6 0 1 5 1 8 650 7 2 4 3 1 7 0 5 1 3 1 4 5 8 3 2 4 7 8 8 5 3 4 1 3 2 6 6 2 0 4 4 6 9 0 4 0 4 5 3 5 0 3 6 2 7 4 1 0 7

229

Page 241: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Apéndice A. Tablas de la distribución normal estándar y de la distribuciónt-student

230

Page 242: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Bibliografía

[1] Cochran, William. Técnicas de Muestreo. Compañía Editorial Continental,S.A. México (1985).

[2] Scheaffer, R. L., Mendenhall, W. and Lyman, O. Elementos de Muestreo.Grupo Editorial Iberoamérica (1987).

[3] Pérez, L. C. Técnicas de Muestreo Estadístico. Teoría, práctica y aplica-ciones informáticas. Editorial Alfaomega-RA-MA (2000).

[4] Mood, A. M., Graybill, A. F. y Boes, D. Introduction to the Theory ofStatistics. McGraw Hill (1974).

[5] Bradburn, Norman M. and Seymour Sudman. Polls and Surveys: Under-standing What They Tell Us. Jossey-Bass Publishers (1988).

[6] Hortvitz, D. G., B. V. Shah, and W. R. Simmons. The unrelated questionrandomized response model. Proceedings of the Social Statistics Section,American Statistical Association, 65-72 (1967).

[7] Siegel, S. Estadística no paramétrica. Trillas, México (1977).

[8] Danger, S., Huizing, N., Walker, A., Rowland, A., Anderson, R., Sciaccalu-ga, R. EU Information Society Guide. Brussels, Belgium: The EU Com-mittee on the American Chamber of Commerce in Belgium (1996).

[9] Lohr, S. L. Muestreo: Diseño y análisis. International Thomson Editores(2000).

[10] Rendón S. G. Métodos Estadísticos (Muestreo, Diseños de Experimentales,Estadística no paramétrica). Universidad Autónoma Chapingo (1997).

[11] Warner, S. L. Randomized Response: A Survey Technique for Eliminating Eva-sive Answer Bias. Journal of the American Statistical Association, Vol. 60, No.309(63-69), 1965.

[12] Kish, L. Muestreo de encuestas. México: Editorial Trillas (1972).

[13] Deming, W. E. Some Theory of Sampling. New York: Jonh Wiley and Sons (1950).

[14] Raj D. The Desing of Sample Surveys . New York: Mcgraw-Hill, Company Book(1972).

[15] Azorin, F. Curso de muestreo y aplicaciones. Primera edición, Expaña: EdicionesAguilar S. A. (1972).

231

Page 243: C:/Muestreo en latex Abelardo 12julio2006/MUESTREO ...raymastudillo.webcindario.com/unidac/UACA/... · tos de investigación. El objetivo del libro es precisamente ayudar a elegir

Bibliografía

[16] Méndez, I. Eslava, G. y P. Romero. Conceptos básicos de muestreo. IIMAS,UNAM. Monografías. Vol. 12. No. 27 (1972).

[17] Méndez, C. E. I, Quintana C. R. H. Muestreo: Respuesta aleatorizada.[Disponibleen: http://www.dpye.iimas.unam.mx/finales2007/MuestreoRespuestaAleatorizada.ppt.]Especialidad en Estadística Aplicada. IIMAS, UNAM. (2007).

[18] Dowling, F. A. Shachtman, R. H. On the Relative Efficiency of Randomized Re-sponse Models. Jour. Amer. Stat. Assoc., 70, 84-87 (1975).

232