xii encuesta nacional urbana de seguridad ciudadana...el ministerio del interior y seguridad...
TRANSCRIPT
XII Encuesta Nacional Urbana de
Seguridad Ciudadana
Diseño de la Metodología Muestral
INSTITUTO NACIONAL DE ESTADÍSTICAS
Abril / 2016
N°02
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
1 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
2 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
ÍNDICE
1. Introducción ......................................................................................................................................... 3
2. Diseño muestral .................................................................................................................................. 5
2.1 Marco Muestral ................................................................................................................................ 5 2.2 Población Objetivo ........................................................................................................................... 9 2.3 Ámbito Geográfico ........................................................................................................................... 9 2.4 Nivel de Estimación ......................................................................................................................... 9 2.5 Tamaño de la Muestra ..................................................................................................................... 9 2.6 Errores de Muestreo ...................................................................................................................... 10 2.6.1 Errores Teóricos ............................................................................................................................ 10 2.7 Selección de las Unidades Muestrales .......................................................................................... 12 2.8 Factores de Expansión y Suavizamiento ....................................................................................... 15 2.8.1 Factores de Expansión .................................................................................................................. 15 2.8.2 Suavizamiento del Factor de expansión de selección de personas ............................................... 19
3. Estimadores y varianza de los estimadores ................................................................................... 23
3.1 Estimadores: Nomenclatura Utilizada ............................................................................................ 23 3.1.1 Estimador del Total ........................................................................................................................ 23 3.1.2 Estimador de la Razón ................................................................................................................... 25 3.2 Varianza de los Estimadores: Nomenclatura Utilizada .................................................................. 30 3.2.1 Varianza del Total Estimado de la variable “y” para el nivel requerido .......................................... 30 3.2.2 Varianza del Total Estimado de las personas de 15 o más años u Hogares que tienen el atributo en estudio a nivel regional ............................................................................................................................. 31 3.2.3 Varianza de la Tasa o Promedio por Persona de 15 o más años u Hogares para nivel regional .. 32 3.2.4 Varianza de Razones para el nivel requerido ................................................................................ 32
3.3 Coeficiente de Variación ................................................................................................................ 33
4. Anexos ............................................................................................................................................... 34
4.1 Estratos de Tamaños ..................................................................................................................... 34 4.2 Metodología de Selección de Kish ................................................................................................. 34 4.2.1 Registro de Personas del Hogar .................................................................................................... 34 4.2.1.1 Enumeración de los Informantes Potenciales ................................................................................ 34 4.2.2 Tabla Kish para Selección del Informante ..................................................................................... 36 4.2.3 Asignación de Letras Kish por Comuna ......................................................................................... 38 4.2.4 Procedimiento de Selección del Informante Kish ........................................................................... 39
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
3 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
1. Introducción
El Ministerio del Interior y Seguridad Pública, en adelante, el Ministerio, ha contratado la
aplicación anual, desde el año 20051, de la “Encuesta Nacional Urbana de Seguridad Ciudadana”
(ENUSC) al Instituto Nacional de Estadísticas, que ha permitido contar con información útil tanto
para la toma de decisiones, como para generar conocimiento sistemático sobre los niveles de
victimización e inseguridad que presenta el país.
Así, el objetivo de la ENUSC es obtener información sobre la percepción de inseguridad, la reacción
frente al delito y la victimización de personas y hogares a partir de una muestra representativa de
zonas urbanas a nivel nacional y regional. De este modo la ENUSC constituye uno de los pilares del
sistema de información para el diseño y seguimiento de las políticas de prevención y control del
delito.
Durante el año 2015 se firmó nuevamente un convenio entre el Ministerio y el INE para realizar la
duodécima versión (ENUSC XII), la cual fue levantada en el área urbana de 101 comunas del país,
con el objetivo de recabar información que permitió generar un conocimiento permanente de la
variabilidad de la victimización y sus consecuencias en la vida cotidiana de la población.
Para tal cometido, se encargó al INE, específicamente, al departamento de Investigación y
Desarrollo, confeccionar el diseño muestral de la encuesta, mediante la elaboración de una
muestra representativa a nivel nacional y regional de la población urbana de 15 años y más.
Es importante mencionar, que en esta nueva versión, se introdujeron actualizaciones significativas
en la encuesta, que incluyeron la consideración de nuevas temáticas de medición, así como
también, mejoras en la representatividad respecto de la versión anterior, considerando ahora
representatividad a nivel regional, y no sólo nacional.
Otro punto importante de estas actualizaciones, se refiere al diseño muestral, reflejado en la
incorporación de la verdadera prevalencia de la victimización en el cálculo de los tamaños
muestrales, esto es, el verdadero valor obtenido de la pregunta P20 (¿Durante los últimos 12
meses, usted o algún miembro de su hogar fue víctima de algún delito?), que hasta la versión
anterior, se había simulado una prevalencia de 10%. En este caso, se consideró la prevalencia
obtenida en la versión del año 2013, la cual alcanzó a 24,8% a nivel nacional. El motivo por el cual
1 Cabe notar que, si bien la encuesta se levanta desde el año 2003, es a partir del año 2005 que comienza a
levantarse en forma anual.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
4 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
se consideró la prevalencia del año 2013, fue porque el diseño muestral de ese año se asemejaba
mejor al de la versión del año 2015, pues ambas presentan representatividad a nivel nacional y
regional.
Con respecto al tamaño muestral, se introdujo en el cálculo un porcentaje adicional para cubrir
los efectos de la no respuesta. Para esto, se consideraron las tasas de reemplazo efectivas
utilizadas en ENUSC 2013 a nivel comunal, agregándoseles un pequeño porcentaje fijo (3%) para
cubrir los casos en que la no respuesta de este año fuera mayor.
Por otro lado, se introdujo una variación2 en la metodología de selección de las unidades de
primera etapa (manzanas), las cuales, en el marco muestral, fueron estratificadas en grupos de
tamaño, según el número de viviendas que contienen, por lo que la selección de cada manzana se
hizo en forma aleatoria en cada comuna por grupo de tamaño.
El marco de muestreo utilizado corresponde al Marco Muestral Maestro, en adelante, MMM, que
cuenta con información actualizada al año 2008.
El presente informe contiene una descripción metodológica del diseño muestral de la nueva
versión de la encuesta (ENUSC XII), incluyendo las características del marco muestral utilizado, el
cálculo del tamaño muestral, los métodos de selección de las unidades, la forma de expandir los
datos y la estructura de los estimadores y su varianza.
2 Recordar que hasta la versión XI de la encuesta, la estratificación del marco sólo correspondía a nivel
comunal. Este año, se añadió a la estratificación el grupo de tamaño, y por tanto, la selección de las unidades de primera etapa (manzanas) fueron seleccionadas aleatoriamente en cada uno de estos grupos de tamaño. En las versiones anteriores la selección de manzanas se realizaba en forma proporcional a una medida de tamaño dada por el número de manzanas en cada grupo y el número de viviendas dentro de cada manzana.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
5 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
2. Diseño muestral
El diseño muestral corresponde a una muestra probabilística, estratificada geográficamente y por
tamaño poblacional en el área Urbana, trietápica, con igual probabilidad de selección de las
Unidades de Primera Etapa (manzanas) dentro de cada comuna por grupo de tamaño3, y de la
unidades de segunda etapa (viviendas) dentro de cada manzana seleccionada.
2.1 Marco Muestral
Para este estudio se tomó como base muestral el MMM el cual se encuentra formado por el
universo de límites geográficos fijos, denominados manzanas, de las cuales se dispone de
información cartográfica y del número de viviendas contenidas en cada una de ellas, según
información recabada en el Censo de Población y Viviendas del año 2002, actualizada al año 2008.
La actualización del marco se realiza mediante registros administrativos provenientes de los
permisos de edificación de las nuevas construcciones, otorgadas mensualmente por las direcciones
de obras de las municipalidades, que captura el Formulario Único de Edificación del INE, lo que
permite precisar el número total de viviendas en la manzana, e incorporar aquellas creadas
posterior el CENSO.
Cada manzana del marco se encuentra organizada en forma jerárquica. Tal organización se
denomina División Político Administrativa, donde las unidades corresponden en forma
descendente a: Región, Provincia y Comuna4. A su vez, cada manzana se encuentra estratificada
por grupos de tamaño, los cuales fueron creados según el número de viviendas que contienen.
Estos grupos van del 1 al 5. El número mínimo de viviendas por manzana para ENUSC, corresponde
a 8 viviendas en el primer grupo, y el máximo a 931, en el último grupo. Según esto, el número
mínimo de viviendas a encuestar corresponde a 2 viviendas dentro del primer grupo, y el máximo,
a 31 viviendas dentro del último grupo.
La cobertura geográfica de este marco corresponde al área urbana de 101 comunas seleccionadas
por el ministerio, que se han venido levantando en los últimos años.
3 Para ver el detalle de estos grupos, ver Anexo 1.
4 Cabe señalar que este marco contiene sólo el área urbana de las comunas.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
6 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Desde este marco muestral se seleccionan las unidades primarias de muestreo (manzanas), las que
son “enumeradas” para luego seleccionar las unidades secundarias de muestreo (viviendas) de
entre todas las viviendas particulares ocupadas dentro de cada manzana. Luego, una vez en la
vivienda seleccionada, se procede a elegir a un representante de la vivienda, de 15 años o más,
quien responderá por todos los miembros de su hogar.
El proceso de enumeración consiste en visitar la manzana seleccionada y registrar todas las
viviendas que se encuentran en su interior, identificando el tipo de vivienda (vivienda particular,
comercio, otro uso, etc.).
Cabe señalar que en esta versión se enumeró aproximadamente el 40% del total de manzanas
seleccionadas en la muestra. Este 40% corresponde a 27 comunas donde se enumeró la totalidad
de las manzanas en la muestra (839 manzanas); y a 18 comunas donde se enumeró en forma
parcial (lo que equivalió a 154 manzanas). El detalle de las comunas enumeradas se muestra a
continuación:
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
7 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Tabla N°1: Comunas con Enumeración completa de la muestra
Región Comuna Total Manzanas a Enumerar
1 IQUIQUE 42
1 ALTO HOSPICIO 42
3 COPIAPO 31
4 LA SERENA 25
4 COQUIMBO 40
5 VALPARAISO 20
5 CONCON 17
5 VIÑA DEL MAR 25
5 QUILLOTA 23
6 RANCAGUA 30
7 TALCA 23
7 CURICÓ 26
8 CONCEPCION 21
8 CHIGUAYANTE 13
8 PENCO 11
8 SAN PEDRO DE LA PAZ 27
8 TALCAHUANO 24
8 HUALPEN 28
9 TEMUCO 33
9 PADRE LAS CASAS 26
10 PUERTO MONTT 23
10 OSORNO 33
11 COYHAIQUE 33
11 AYSÉN 41
12 PUNTA ARENAS 81
14 VALDIVIA 40
15 ARICA 61
Total general 839
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
8 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Tabla N°2: Comunas con Enumeración parcial de la muestra
Región Comuna Total Manzanas a Enumerar
2 CALAMA 57
5 QUILPUÉ 16
5 VILLA ALEMANA 26
6 RENGO 27
6 SAN FERNANDO 26
9 VILLARRICA 17
9 ANGOL 34
13 CONCHALÍ 34
13 EL BOSQUE 25
13 HUECHURABA 18
13 LO PRADO 13
13 MACUL 20
13 PUDAHUEL 24
13 RECOLETA 18
13 SAN JOAQUÍN 18
13 SAN RAMÓN 21
13 SAN BERNARDO 23
14 LA UNIÓN 20
Total general 437
Finalmente, el diseño da origen a la selección de una muestra trietápica, a seleccionar desde este
marco, donde las etapas son:
Unidad Primera Etapa: Manzanas
Unidad Segunda Etapa: Viviendas particulares ocupadas.
Unidad Tercera Etapa: Persona de 15 o más años.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
9 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
2.2 Población Objetivo
La población objetivo la constituyen los hogares que habitan las viviendas particulares ocupadas y
las personas de 15 o más años que los componen, siendo seleccionada una de ellas para responder
esta encuesta.
2.3 Ámbito Geográfico
La cobertura geográfica del estudio es Nacional-Urbano.
2.4 Nivel de Estimación
El nivel de estimación es Nacional-Urbano y Regional-Urbano.
2.5 Tamaño de la Muestra
Con base en la información del MMM se seleccionará una muestra de tamaño , siendo
donde:
: Percentil de la distribución Normal asociado a un intervalo de confianza bilateral del
95% (este valor corresponde a 1,96).
: Varianza de la variable de interés.
: Error absoluto requerido para la precisión deseada.
: Factor de ajuste del muestreo trietápico llamado Efecto del Diseño.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
10 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Nota: La variable de interés corresponde a la victimización general que se deduce de la pregunta
P20 de la X versión de la encuesta (ENUSC 2013), esto debido a que criterios como: el tamaño
muestral, los errores asociados y la cobertura geográfica, reflejan mejor las características exigidas
en esta nueva versión.
2.6 Errores de Muestreo
2.6.1 Errores Teóricos
A continuación se presentan los errores teóricos, a nivel nacional y regional, asociados a la
pregunta P_20, según los resultados de ENUSC 2013, para un tamaño muestral teórico
correspondiente a 25.933 viviendas.
Tabla N°3: Errores Teóricos asociados a la variable P_20 según Tamaño Muestral Teórico
Región Estimador de Razón
P20 (2013)
Error Absoluto Teórico
e i
Muestra Objetivo
m i
Nivel País 24,8% 0,9% 25.933
1 Tarapacá 38,2% 5,0% 945
2 Antofagasta 25,5% 5,0% 1.000
3 Atacama 18,7% 4,9% 667
4 Coquimbo 21,1% 3,2% 1.334
5 Valparaíso 21,1% 2,3% 2.674
6 O'Higgins 20,7% 2,6% 1.334
7 Maule 19,2% 3,1% 1.490
8 Biobío 22,2% 2,0% 3.152
9 Araucanía 26,5% 3,9% 1.006
10 Los Lagos 20,9% 4,4% 904
11 Aysén 17,9% 4,4% 537
12 Magallanes 11,2% 3,0% 530
13 Santiago 28,3% 1,7% 9.263
14 Los Ríos 19,4% 5,0% 605
15 Arica y Parinacota 22,2% 4,4% 492
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
11 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
2.6.2 Errores Efectivos
A continuación se presentan los errores efectivos, a nivel nacional y regional, asociados a la
variable: Victimización Agregada Delitos Consumados, para tamaño muestral efectivo
correspondiente a 25.660 viviendas.
Tabla N°3: Errores Efectivos asociados a la variable Victimización Agregada Delitos Consumados según
Tamaño Muestral efectivo
Región Estimador de Razón Victimización 2015
Error Absoluto Efectivo
ei
Muestra Efectiva
Nivel País 26,4% 0,98% 25.660
1 Tarapacá 40,4% 4,35% 944
2 Antofagasta 25,6% 5,50% 995
3 Atacama 31,1% 10,33% 664
4 Coquimbo 21,1% 4,41% 1.328
5 Valparaíso 24,4% 2,64% 2.669
6 O'Higgins 27,3% 3,83% 1.330
7 Maule 23,6% 4,28% 1.477
8 Biobío 25,0% 1,98% 3.148
9 Araucanía 26,1% 5,14% 1.001
10 Los Lagos 18,9% 3,22% 901
11 Aysén 10,3% 3,00% 537
12 Magallanes 11,3% 2,72% 530
13 Santiago 28,9% 1,70% 9.040
14 Los Ríos 23,1% 3,67% 605
15 Arica y Parinacota 24,8% 4,89% 491
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
12 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
2.7 Selección de las Unidades Muestrales
La selección de la muestra se realiza en tres etapas:
Unidades de Primera Etapa (UPE): La selección de las Unidades de Primera Etapa (manzanas), en
cada una de las comunas pertenecientes a la muestra, y dentro de cada grupo de tamaño, se
efectuó en forma aleatoria y con igual probabilidad.
Esto quiere decir que, a fin de optimizar la selección de las manzanas, en el sentido de elegir tanto
manzanas grandes como pequeñas, dentro de cada comuna, se realizó una estratificación
implícita, es decir, se clasificaron las manzanas del marco en grupos de tamaño, dependiendo del
número de viviendas que contenían. Esta clasificación permitió realizar una selección heterogénea
de manzanas, manteniendo la proporcionalidad dentro de cada grupo de tamaño (ver Anexo 1).
Luego, la probabilidad de inclusión de la ésima manzana, dentro de cada comuna por grupo
de tamaño g, es igual a
donde:
: Representa el índice de la comuna.
Representa el índice del grupo de tamaño
: Número de manzanas seleccionadas en la comuna del grupo de tamaño
: Número de manzanas en el marco en la comuna del grupo de tamaño
Unidades de Segunda Etapa (USE): Esta etapa se realiza una vez finalizado el proceso anterior y
consiste en la selección de viviendas en cada manzana. Este procedimiento implica una selección
aleatoria de forma sistemática con igual probabilidad.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
13 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Así, la probabilidad de inclusión de la ésima vivienda dentro de la ésima manzana de la
comuna del grupo de tamaño , es igual a:
donde:
: Número de viviendas en la muestra en la manzana de la comuna del grupo de
tamaño .
: Número actualizado5 de viviendas en la manzana de la comuna del grupo de
tamaño .
Unidades de Tercera Etapa (UTE): Se seleccionan utilizando el método de Kish escogiendo a una
persona de entre todas las personas de 15 o más años que habitan la vivienda (ver Anexo 2).
La forma explícita de la probabilidad de selección de la 3era etapa se calcula según el siguiente
algoritmo:
Al interior de cada vivienda seleccionada, se ordenan y listan las personas de 15 y más años, de
acuerdo al sexo y edad6, siendo listados primero los hombres y luego las mujeres en orden de
mayor a menor, respectivamente. Por lo tanto, la probabilidad de seleccionar la persona al
interior de la vivienda está dado por:
5 Puede ocurrir que al visitar alguna de las manzanas seleccionadas, el encuestador se encuentre con que el
número de viviendas es distinto al reportado por el marco (MMM), en este caso, se anota el nuevo número de viviendas y se registra bajo la denominación MM’hgi. En caso de no haber cambios, MM’hgi = MMhgi
(Número de viviendas en el MMM) Para las manzanas que no fueron enumeradas, se utiliza la información de enumeraciones anteriores. 6 Se excluyen del listado el personal de servicio doméstico puertas adentro y todas aquellas personas que no
se encuentren aptas para responder
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
14 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
donde:
: Total de personas, aptas para responder la encuesta, que residen en la vivienda , de
la manzana del estrato de tamaño en la comuna .
De esta forma las unidades muestrales seleccionadas son:
Unidades de Primera Etapa: 2.468 manzanas;
Unidades de Segunda Etapa: 25.933 viviendas7
Unidades de Tercera Etapa: 25.933 personas de 15 o más años.
7 Para asegurarse de alcanzar el tamaño propuesto se consideró una cierta cantidad de viviendas (de
reemplazo) para cubrir las viviendas teóricas que eventualmente no pudieran levantarse, debido a motivos como: rechazo, viviendas que ya no existen al momento de la encuesta, imposibilidad de establecer contacto con los miembros del hogar, etc. El cálculo de viviendas de reemplazo se realizó según las tasas de reemplazo efectivas utilizadas en ENUSC 2013, más un pequeño porcentaje fijo (3%), para cubrir los casos en que la no respuesta de este año fuera mayor.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
15 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
2.8 Factores de Expansión y Suavizamiento
El factor de expansión, según el diseño muestral, corresponde al aplicado a una muestra en tres
etapas. Este depende del número total de personas dentro del hogar encuestado, el número de
viviendas que tiene la manzana y el número de manzanas que tiene cada comuna por grupo de
tamaño.
El factor se interpreta como la cantidad de personas en la población que representa un individuo
en la muestra. Es distinto para cada persona y esta diferencia proviene del hecho que la muestra
no es autoponderada.
El factor de expansión incluye un ajuste a la población de personas por comuna, dada por las
proyecciones de población, por sexo y tramo de edad8, correspondientes al período de referencia
de la encuesta. Con este ajuste se busca aumentar la precisión de las estimaciones.
El suavizamiento se realiza como medida de mitigación para los ponderadores (o factores de
expansión), cuando estos, debido a los ajustes que se les van realizando, aumentan
significativamente su variabilidad. Se utiliza la principal variable de interés, sobre la cual se
identifica el umbral de suavizamiento a través de la minimización del error cuadrático medio.
2.8.1 Factores de Expansión
Factor de Expansión de selección de viviendas:
Dadas las probabilidades de selección de las unidades de primera etapa (manzanas), y de
segunda etapa (viviendas), el Factor de Expansión se calcula como el producto entre los
inversos de dichas probabilidades de la siguiente manera:
8 Personas Menores de 15 años y personas de 15 o más años.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
16 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
donde:
: Número de manzanas seleccionadas en la comuna del grupo de tamaño
: Número de manzanas en el marco en la comuna del grupo de tamaño
: Número de viviendas en la muestra en la manzana de la comuna del grupo de
tamaño .
: Número actualizado de viviendas en la manzana de la comuna del grupo de
tamaño .
Factor de Expansión para personas a nivel comunal:
Si bien para el cálculo de las estimaciones de las variables de interés se ocupa el factor
regional, en esta sección se describe la forma de cálculo del factor comunal, pues éste es
requerido como insumo para el cálculo de dicho factor regional.
Cabe señalar que no es posible emplear el factor comunal para efectuar estimaciones a este
nivel, debido que la encuesta ha sido diseñada para ser representativa a nivel nacional y
regional, por tanto su cálculo se utiliza sólo como un paso intermedio para llegar a la región
(que luego es ajustado por la población a ese nivel).
El factor de expansión corresponde al factor de expansión de selección de viviendas, ajustado
por la población de 15 o más años, diferenciada por sexo, a nivel comunal y multiplicado por el
ponderador que da cuenta de la selección del informante Kish sin distinguir el sexo. Su fórmula
de cálculo es:
donde:
: Proyección de población de 15 o más años, de sexo S en la comuna h.
: Estimación de población de 15 o más años, de sexo S en la comuna h.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
17 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Siendo
i j
hgij
S
añosh wP 15ˆ
Factor de Expansión para personas a nivel regional:
Corresponde al factor de expansión de Personas, ajustado por la población de 15 o más años a
nivel regional:
donde:
: Factor de expansión de Personas ajustado por la población de 15 o más años, de
sexo S, a nivel comunal.
S
añosrP 15 : Proyección de población de 15 o más años, de sexo S, en la región R.
S
añosrP 15ˆ : Estimación de población de 15 o más años, de sexo S, en la región R.
Siendo
rh i j
S
añosrP hgij15 wˆ
Factor de Expansión para hogares a nivel comunal:
Al ser el hogar inherente a las personas, seleccionar un individuo conlleva, de forma implícita,
la selección de uno de los hogares al interior de las viviendas.
En este contexto, podría definirse una probabilidad de selección del hogar, aun cuando
sabemos que esto no es una etapa adicional del diseño. Luego, la probabilidad de seleccionar
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
18 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
al hogar “l” (P_hgij (l)), en la vivienda j, de la manzana i perteneciente al grupo g y comuna h,
puede ser expresado de la siguiente forma:
Donde
: Número de personas por hogar
Factor de Expansión para hogares a nivel comunal ajustado por población de 15 años o más:
Donde
: Proyección de población de 15 o más años, de sexo S en la comuna h.
: Estimación de población de 15 o más años, de sexo S en la comuna h.
Y
i j k
S
añoshP hgijl15 wˆ
Factor de Expansión para hogares a nivel Regional ajustado por población de 15 años o más:
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
19 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Corresponde factor de expansión de hogares, ajustado por la población de 15 o más años a
nivel regional:
donde:
: Factor de expansión de hogares ajustado por la población de 15 o más años, de
sexo S, a nivel comunal.
S
añosrP 15 : Proyección de población de 15 o más años, de sexo S, en la región R.
S
añosrP 15ˆ : Estimación de población de 15 o más años, de sexo S, en la región R.
Siendo
h i j
hijl
S
añosr wP 15ˆ
2.8.2 Suavizamiento del Factor de expansión de selección de personas
Debido a las etapas de selección, los ponderadores iniciales a medida que se van ajustando,
aumentan significativamente su variabilidad. Como medida de mitigación se propuso realizar un
suavizamiento en dichos ponderadores. Para ello se requiere como insumo la principal variable de
interés a medir que permita identificar el umbral de suavizamiento a través de la minimización del
error cuadrático medio.
En este contexto, la variable de interés que se midió es el indicador de victimización agregada
calculado por comuna. Para realizar esta metodología de suavizamiento se utilizó la base datos a
nivel de informante Kish, calculándose la prevalencia de dicha variable.
Una vez obtenida la estimación, se procedió a realizar el suavizamiento del ponderador a partir de
la implementación de las siguientes etapas:
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
20 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
i. Se inspeccionó la existencia de valores extremos de este al interior de cada una de las
comunas,
ii. Se determinó puntos de corte a partir de los cuales realizar el suavizamiento,
iii. Se suavizaron los valores extremos identificados,
iv. Se estimó el error cuadrático medio (ECM) para la variable de interés para los distintos
puntos de corte,
v. Se eligió la opción de corte que minimizaba dicho error,
Considerando lo anterior, se analizaron 7 puntos de cortes distintos definidos como sigue:
Donde:
: Punto de corte en el cual se prueba el suavizamiento.
: Es el conjunto de viviendas seleccionadas en la manzana .
: Es el conjunto de manzanas seleccionadas en el grupo de tamaño .
: Es el conjunto de grupos de tamaño de la comuna .
: Es el total de personas seleccionadas en la comuna .
Luego, para realizar el suavizamiento se procede a truncar aquellos ponderadores identificados
como valores extremos de la siguiente forma,
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
21 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Si se suman todos los valores , se obtiene un total de unidades estimadas inferior que al
sumar los ponderadores base, por lo tanto se debe distribuir la diferencia faltante en el resto de
los ponderadores que no fueron truncados. Los pesos fueron distribuidos al interior de cada
comuna de la siguiente forma:
Donde es el factor suavizado.
Esto es, aquellos ponderadores identificados como valores extremos son truncados al valor
máximo establecido ( ), mientras que el peso “sobrante” de los ponderadores
truncados es distribuido sobre el resto de los ponderadores.
Luego, para determinar el punto de corte donde se realiza finalmente el suavizamiento, se calculó
un estadígrafo que diera cuenta del sesgo y de la variabilidad. Para esto se obtuvo el Error
Cuadrático Medio (ECM) asociado a la variable de interés. Como en esta encuesta se pretende
caracterizar la proporción de victimizados, se calculó dicho indicador por región y su desviación
típica. De esa forma el sesgo y el ECM, respectivamente, se calculan como:
Siendo,
: Subíndice de la región. Toma valores entre 1 y 15 según numeración de las regiones
del país.
: La proporción de victimizados en la región obtenido con el factor de expansión sin
truncar
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
22 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
: La proporción de victimizados en la región con el factor suavizado en el punto .
Nota: De los ejercicios realizados, el valor mínimo de la mediana del ECM para cada región se
alcanza cuando el ponderador es truncado a 7 veces la media. Luego, el factor a suavizar por este
ponderador es el correspondiente al que involucra las 3 etapas (selección de manzanas, viviendas
y personas). El que luego, será ajustado por población para recalcular los factores de personas y
hogares, que son los que finalmente servirán para estimar las variables de interés.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
23 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
3. Estimadores y varianza de los estimadores
3.1 Estimadores: Nomenclatura Utilizada
hijky : Valor de la variable medida en la persona de la vivienda , de la manzana , en la
comuna .
hijy : Valor de la variable medida en la vivienda , de la manzana , en la comuna .
chijky : Valor de la variable Y medida en la persona k, que cumple con la condición c y que
pertenece a la vivienda j, de la manzana i, en la comuna .
chijy : Valor de la variable Y medida en la vivienda j, que cumple con la condición c y que
pertenece a la manzana i, en la comuna .
chijP : Número de personas, que cumplen con la característica c, en la vivienda j de la manzana i
en la comuna .
: Factor de Expansión por persona asociado a la vivienda j de la manzana i en la comuna ,
según corresponda (comunal o regional)
: Factor de Expansión por hogar asociado a la manzana i en la comuna , según
corresponda (comunal o regional)
3.1.1 Estimador del Total
(a) Para la variable “y”:
Estimación regional del total para la variable “y”, a nivel de personas de 15 o más años:
i. Para todos las personas de 15 o más años:
h i j k
hijk
R
P yy ][wˆhgij
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
24 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
ii. Para las personas de 15 o más años que cumple la condición “C”:
h i j k
hijkhgij
R
P cCywy ][ˆ
La estimación regional del total para la variable “y” a nivel de hogares:
iii. Para todos los hogares:
h i j k
hijhgijl
R
H ywy ][ˆ
iv. Para los hogares que cumplen la condición “C”:
h i j k
hijhgijl
R
H cCywy ][ˆ
(b) Para el número de personas u hogares:
Estimación regional del número total de personas de 15 o más años:
h i j k
hgij
R wP
Estimación regional del número total de personas de 15 o más años con el atributo “C”:
h i j k
hijkhgij
R
C cIwP ][ˆ
donde:
0
. ,
la de 1
soen otro ca
Ccondicióncumple la muna h de la co
ana ide la manzj vivienda ona k si la pers
Ichijk
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
25 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Estimación regional del número total de hogares:
h i j
hgijl
R wH
Estimación regional del número total de hogares con el atributo “C”:
h i j
hijhgijl
R
C cIwH ][ˆ
donde:
0
.
, 1
soen otro ca
n ca condició cumple l
h comuna lade i manzanaladejvivienda la si
Ichij
3.1.2 Estimador de la Razón
La estimación de razones o proporciones para personas de 15 o más años (u hogares) se obtiene a
partir del cociente entre los totales estimados para cada variable:
(a) Estimador de razón entre dos variables cuantitativas X e Y
Personas:
i. Razón entre totales regionales estimados para todas las personas de 15 o más años:
""var
""var
][
][
ˆ
ˆˆ_
xiableladeEstimadoTotal
yiableladeEstimadoTotal
xw
yw
x
yR
h i j k
hijkhgij
h i j k
hijkhgij
R
P
R
PR
xyP
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
26 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
ii. Razón entre totales regionales estimados para las personas de 15 o más años que cumplen la
condición C:
C condicíón lacumplen que personas
n ""var
C condicíón lacumplen que personas
n ""var
][
][
ˆ
ˆˆ
_exiableladeEstimadoTotal
eyiableladeEstimadoTotal
xw
yw
x
yR
h i j k
hijkhgij
h i j k
hijkhgij
R
P
R
PR
xyP
C
C
cc
Hogares:
i. Razón entre totales regionales estimados para todas los hogares:
""var
""var
][
][
ˆ
ˆˆ_
xiableladeEstimadoTotal
yiableladeEstimadoTotal
xw
yw
x
yR
h i j
hijhgijl
h i j
hijhgijl
R
H
R
HR
xyH
iii. Razón entre totales regionales estimados para las personas de 15 o más años que cumplen la
condición C:
C condicíón lacumplen que hogares
n ""var
C condicíón lacumplen que hogares
n ""var
][
][
ˆ
ˆˆ
_eyiableladeEstimadoTotal
eyiableladeEstimadoTotal
xw
yw
x
yR
h i j
hijchgij
h i j
hijchgij
R
H
R
HR
xyH
C
C
cc
(b) Estimador de razón variable cuantitativa Y respecto de una cualitativa
Personas:
i. Razón entre el total regional estimado de la variable “Y” y el total regional estimado de
personas de 15 o más años.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
27 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
h i j k
hgij
h i j k
hijkhgij
R
R
PR
pyw
yw
P
yR
][
ˆ
ˆˆ_
ii. Razón entre el total regional estimado de la variable “Y” y el total regional estimado de
personas de 15 o más años que cumplen la condición “C”.
h i j k
hijkhgij
h i j k
hijkhgij
R
C
R
PR
py
c
c Iw
yw
P
yR
][
][
ˆ
ˆˆ_
iii. Razón entre el total regional estimado de la variable “Y” para personas de 15 o más años que
cumplen la condición “C” y el total regional estimado de personas de 15 o más años.
h i j k
hgij
h i j k
hijkchgij
R
R
PR
pyw
yw
P
yR C
c
][
ˆ
ˆˆ
_
iv. Razón entre el total regional estimado de la variable “Y” para personas de 15 o más años que
cumplen la condición “C” y el total regional estimado de personas de 15 o más años que
cumplen la condición “C”.
h i j k
hgij
h i j k
hijkchgij
R
R
PR
pyw
yw
P
yR C
c
][
ˆ
ˆˆ
_
Hogares:
i. Razón entre el total regional estimado de la variable “Y” y el total regional estimado de
hogares.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
28 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
h i j
hgijl
h i j
hijhgijl
R
R
PR
Hyw
yw
H
yR
][
ˆ
ˆˆ_
ii. Razón entre el total regional estimado de la variable “Y” y el total regional estimado de
hogares que cumplen la condición “C”.
h i j
hijhgijl
h i j
hijhgijl
R
C
R
PR
Hy
c
C Iw
yw
H
yR
][
][
ˆ
ˆˆ_
iii. Razón entre el total regional estimado de la variable “Y” para los hogares que cumplen la
condición “C” y el total regional estimado de hogares.
h i j
hgijl
h i j
hijhgijl
R
R
PR
Hyw
yw
H
yR
c
C
c
][
ˆ
ˆˆ
_
iv. Razón entre el total regional estimado de la variable “Y” para hogares que cumplen la
condición “C” y el total regional estimado de hogares que cumplen la condición “C”.
h i j
hijhgijl
h i j
hijhgijl
R
C
R
PR
Hy
c
c
C
cc Iw
yw
H
yR
][
][
ˆ
ˆˆ
_
(c) Estimador de razón entre dos variables cualitativas
Personas:
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
29 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
i. Razón entre el total regional estimado de personas de 15 o más años que cumplen la
condición “B”, y el total regional estimado de personas de 15 o más años que cumplen la
condición “C”.
h i j k
hijkhgij
h i j k
hijkhgij
R
C
R
BR
PP
c
b
cb Iw
Iw
P
PR
][
][
ˆ
ˆˆ
_
ii. Razón entre el total regional estimado de personas de 15 o más años que cumplen la
condición “C”, y el total regional estimado de personas de 15 o más años.
h i j k
hgij
h i j k
hijkhgij
R
R
CR
PPw
Iw
P
PR
c
b
][
ˆ
ˆˆ
_
Hogares:
i. Razón entre el total regional estimado de hogares que cumplen la condición “B”, y el total
regional estimado de hogares que cumplen la condición “C”.
h i j
hijhgijl
h i j
hijhgijl
R
C
R
BR
HH
c
b
cb Iw
Iw
H
HR
][
][
ˆ
ˆˆ
_
ii. Razón entre el total regional estimado de hogares que cumplen la condición “C”, y el total
regional estimado de hogares.
h i j
hgijl
h i j
hijhgijl
R
R
CR
HHw
Iw
H
HR
c
C
][
ˆ
ˆˆ
_
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
30 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
3.2 Varianza de los Estimadores: Nomenclatura Utilizada
Las fórmulas indicadas a continuación corresponden a la expresión matemática de cada varianza
según sea la estimación propuesta: totales o razones. En dichas fórmulas, las siguientes son las
notaciones utilizadas:
hijy : Valor de la variable Y medida en la vivienda j, de la manzana i, en la comuna h.
chijky : Valor de la variable Y medida en la persona k, que cumple con la condición c, en la vivienda j
de la manzana i en la comuna h.
hiP : Número de personas en la manzana i de la comuna h.
chiP : Número de personas, que cumplen con la condición c, en la manzana i de la comuna h.
hiH : Número de viviendas en la manzana i de la comuna h.
hn
: Número de manzanas en la muestra de la comuna h.
hPR : Corresponde a la razón entre el valor estimado de la variable “Y” (o el número estimado de
personas de 15 años o más que tienen el atributo) y el número estimado de personas de 15 años o más en la comuna h.
hHR = Corresponde a la razón entre el valor estimado de la variable “Y” (o el número estimado de
hogares que tienen el atributo) y el número estimado de hogares en la comuna h.
3.2.1 Varianza del Total Estimado de la variable “y” para el nivel requerido
La varianza de una estimación de totales se obtiene sumando el algoritmo de las personas que tienen el atributo.
La expresión matemática es:
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
31 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Personas:
h i
hiPhihij
h
h PRywn
nYV
h
2)]ˆ([1
)(ˆ
Donde
j k
hijk
P
hi yy
Hogares:
h i
hiHhihgij
h
h HRywn
nYV
h
2)]ˆ([1
)(ˆ
donde:
j
hij
H
hi yy
3.2.2 Varianza del Total Estimado de las personas de 15 o más años u Hogares que tienen el
atributo en estudio a nivel regional
Personas:
h i
hiPhihgij
h
h PRPwn
nPV
hc
2)]ˆ([1
)(ˆ
Hogares:
h i
hiHhihgij
h
h HRHwn
nHV
hc
2)]ˆ([1
)(ˆ
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
32 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
3.2.3 Varianza de la Tasa o Promedio por Persona de 15 o más años u Hogares para nivel
regional
La varianza de una tasa a nivel regional, TR, construida por la variable medida “YR” y el número de personas (u hogares) “PR” está dada por:
),(ˆ
ˆ
ˆ2)(ˆ
ˆ
ˆ)(ˆ
ˆ
1)(ˆ
2
2
RR
R
RR
R
RR
R
R PYVOCP
YPV
P
YYV
PTV
La Covarianza estimada entre las variables “YR” y “PR” se calcula a partir de la expresión siguiente:
Personas:
h i
hiPhihiP
P
hihgij
h
h PRPPRywn
nPYVOC
hchc]ˆ()ˆ([
1),(ˆ 2
Hogares:
h i
hiHhihiH
H
hihgijl
h
h HRHHRywn
nHYVOC
hchc]ˆ()ˆ([
1),(ˆ 2
3.2.4 Varianza de Razones para el nivel requerido
La varianza de proporciones es un caso particular de la varianza de tasas, donde: y
De esta forma la expresión matemática es:
siendo en este caso, , las personas de 15 o más años u Hogares que tienen el atributo y
El total de personas de 15 o más años u Hogares en el nivel estimado.
0)( PV
.0),( PYCOV
2
)ˆ()(
P
YVPROPV
cPY P
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
33 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
3.3 Coeficiente de Variación
El coeficiente de variación de una estimación Z (total, razón o promedio) se obtiene del cociente
entre la desviación estándar de la estimación (raíz cuadrada de la varianza) y el valor de la estimación.
La expresión matemática es:
Z
ZVZVC
ˆ
)ˆ()(ˆ
Conocido este valor, en conjunto con la estimación, es posible determinar el intervalo de confianza en
que se mueve el parámetro poblacional. Para ello, se sugiere considerar un intervalo con 95% de
confianza (k = 1,96). La expresión matemática es:
)ˆ(96,1ˆ)ˆ(96,1ˆ ZVZZZVZ
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
34 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
4. Anexos
4.1 Estratos de Tamaños
Tabla N°4: Clasificación de Manzanas según número de viviendas
Grupo Tamaño
Manzanas con Número de viviendas entre Viviendas a Encuestar
Mínimo Máximo Mínimo Máximo
1 8 23 2 7
2 24 44 5 13
3 45 81 9 24
4 82 154 19 31
5 157 931 28 31
4.2 Metodología de Selección de Kish
El método de selección del informante utilizado en la Encuesta Nacional Urbana de Seguridad
Ciudadana está basado en el método Kish, el cual asigna la misma probabilidad de ser elegido
como informante de la encuesta a todos aquellos miembros de la vivienda que cumplen
determinadas características.
Los pasos que se deben seguir para llevar a cabo dicha selección son los que se presentan a
continuación:
4.2.1 Registro de Personas del Hogar
Al llegar a la vivienda, el encuestador debe anotar en el Registro de Personas del Hogar (RPH) a
todas las personas que habitan la vivienda, identificando el número de hogares que la componen.
El ordenamiento de los miembros de la vivienda es por hogar, y dentro del hogar, es relacionado al
parentesco existente entre el jefe de hogar con cada uno de los individuos. Dentro de cada hogar,
el primer individuo en ser registrado es el jefe de hogar.
4.2.1.1 Enumeración de los Informantes Potenciales
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
35 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Luego de este ordenamiento, se debe realizar una enumeración de los potenciales informantes de
la encuesta, es decir, personas de 15 o más años que habitan la vivienda y que no forman parte del
servicio doméstico ni posean alguna discapacidad mental que les impida comprender las
preguntas9.
La enumeración es a nivel de la vivienda, considerando todos los hogares y debiendo ordenar a los
integrantes de la vivienda según sexo y edad; primero los hombres de mayor a menor y luego las
mujeres de mayor a menor. Los menores de 15 años tampoco son considerados para la
enumeración.
Ejemplo N°1:
Si se tiene una vivienda habitada por dos hogares, tales que: en el primer hogar habita el jefe de
hogar (52 años), la esposa (50 años), su mamá (65 años), una hija (24 años), un hijo (20 años) y un
nieto (2 años)10, y en el segundo hogar habita el jefe de hogar (40 años), la conviviente (32 años) y
una hija (10 años); la enumeración de los potenciales informantes queda dada por la columna
“Informante Kish”.
Tabla N°5: Ejemplo “Registro de Personas del Hogar”
Nº Línea Nombre de Pila Edad en Años
Cumplidos Parentesco Informante Kish
1 Jorge 52 Jefe de Hogar 1
2 Rosa 50 Cónyuge 5
3 Angelina 24 Hija 7
4 Miguel 20 Hijo 3
5 Alejandro 2 Nieto -
6 Eliana 65 Madre 4
7 Aida 48 Servicio Domestico -
9 Claudio 40 Jefe de Hogar 2
10 Ximena 32 Conviviente 6
11 Ester 10 Hija -
Las personas destacadas en color gris, corresponden a dos menores de 15 años y a una persona
que forma parte del servicio doméstico de la vivienda, por lo tanto, ninguno de ellos fue
9 Ejemplos de estos casos son personas con Alzheimer, síndrome de Down, etc.
10 Los parentescos son con respecto al jefe de hogar.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
36 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
considerado como posible informante. Los números de 1 a 7 señalados en la columna “Informante
Kish” de la Tabla N°5, hacen referencia al ordenamiento por sexo y edad explicado previamente.
4.2.2 Tabla Kish para Selección del Informante
La Tabla N°6 es lo que denominamos Tabla Kish. En ella, la fila destacada en gris, y que muestra las
categorías 1 - 11 y 12 o más, da cuenta del número de personas de 15 o más años, que podrían ser
encontradas en la vivienda visitada, y que han sido clasificadas como posibles informantes (en
base a los criterios establecidos en el punto anterior). Por otro lado, la columna destacada en gris,
y que muestra las letras A – T, hace referencia a lo que se ha denominado como Letra Kish. Esta
letra se asigna de forma aleatoria a cada una de las viviendas seleccionadas en la muestra, y dicho
procedimiento se presenta más adelante.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
37 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Tabla N°6: Tabla Kish para un promedio de 20 viviendas
TABLA DE KISH
Tabla Aleatoria Si el número de personas de 15 o más años en la vivienda es:
1 2 3 4 5 6 7 8 9 10 11 12 o más
Selecciónese a la persona de 15 o más años con el número:
A 1 1 1 1 1 1 1 1 1 1 1 1
B 1 1 1 1 1 1 1 1 1 1 1 2
C 1 1 1 1 1 1 1 1 2 2 2 2
D 1 1 1 1 1 2 2 2 2 2 2 3
E 1 1 1 1 2 2 2 2 3 3 3 3
F 1 1 1 2 2 2 2 3 3 3 4 4
G 1 1 1 2 2 2 3 3 3 4 4 5
H 1 1 2 2 2 3 3 3 4 4 5 5
I 1 1 2 2 3 3 3 4 4 5 5 6
J 1 1 2 2 3 3 4 4 5 5 6 6
K 1 2 2 3 3 4 4 5 5 6 6 7
L 1 2 2 3 3 4 5 5 6 6 7 7
M 1 2 2 3 4 4 5 6 6 7 7 8
N 1 2 3 3 4 5 5 6 7 7 8 8
O 1 2 3 3 4 5 6 6 7 8 8 9
P 1 2 3 4 4 5 6 7 7 8 9 10
Q 1 2 3 4 5 5 6 7 8 9 10 10
R 1 2 3 4 5 6 7 8 8 9 10 11
S 1 2 3 4 5 6 7 8 9 10 11 11
T 1 2 3 4 5 6 7 8 9 10 11 12
Finalmente, al interior de la tabla se encuentran distribuidos una serie de números que van del 1 al
12, y que tienen relación con el número de personas que, posiblemente, habitan la vivienda (y que
son potenciales informantes) y con los valores de letra Kish que pueden ser asignados a la
vivienda. Precisamente, esta distribución es la que asegura la aleatoriedad de la selección del
informante.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
38 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
4.2.3 Asignación de Letras Kish por Comuna
La asignación de las letras Kish, se ha optado realizarla por comuna a través de las manzanas que
la conforman y que han sido seleccionadas para la muestra.
Con este propósito se han considerado 20 letras (A-T) que pueden ser asignadas a las viviendas y
que se han dispuesto del siguiente modo:
Tabla N°7: Letras Kish
J K A T I L B S H M C R G N D Q F O E P
Dentro de cada comuna, y siguiendo esta disposición de letras, se comienzan a distribuir dichas
letras a través de las manzanas que fueron seleccionadas, terminando la asignación cuando la
última vivienda a encuestar, dentro de la última manzana de la comuna, ha recibido una letra. Este
proceso se repite para cada comuna que conforma la muestra, y cada vez que pasamos a una
nueva comuna se retoma la secuencia inicial, independiente de la letra en que se haya terminado
en la comuna anterior. Un ejemplo de esta asignación se muestra en la Tabla N°8.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
39 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Tabla N°8: Ejemplo “Asignación de Letras Kish por Comuna”
Número Correlativo de Viviendas a Encuestar según Directorio de manzanas
IdManzana
RPC Comuna Distrito Zona Manzana Total Viv. 1 2 3 4 5 6 7 8 9 10
322 1101 IQUIQUE 4 1 4 31 J K A T I
392 1101 IQUIQUE 4 3 13 21 L B S
492 1101 IQUIQUE 4 6 26 20 H M C
677 1101 IQUIQUE 5 4 17 24 R G N D
690 1101 IQUIQUE 5 4 30 15 Q F
961 1101 IQUIQUE 7 3 10 62 O E P J K A T I L B
990 1101 IQUIQUE 7 4 13 48 S H M C R G N D
1054 1101 IQUIQUE 8 2 16 28 Q F O E P
1887 1101 IQUIQUE 10 2 24 29 J K A T I
1925 1101 IQUIQUE 10 3 19 28 L B S H M
2039 1101 IQUIQUE 10 6 39 29 C R G N D
2095 1101 IQUIQUE 11 2 15 48 Q F O E P J K A
2135 1101 IQUIQUE 11 3 12 47 T I L B S H M C
2150 1101 IQUIQUE 11 3 27 54 R G N D Q
3162 1107 ALTO HOSPICIO 2 1 25 14 J K
3277 1107 ALTO HOSPICIO 2 1 142 49 A T I L
3293 1107 ALTO HOSPICIO 2 2 10 30 B S H
3296 1107 ALTO HOSPICIO 2 2 13 22 M C
3424 1107 ALTO HOSPICIO 2 3 47 50 R G N D
3435 1107 ALTO HOSPICIO 2 3 58 192 Q F O E P J K A T I
168138 1107 ALTO HOSPICIO 2 3 136 38 R G N
4.2.4 Procedimiento de Selección del Informante Kish
Ya conocido el proceso de registro de los individuos, quienes son los potenciales informantes y
luego de saber cómo es una tabla Kish y como se asignan las letras a cada vivienda, se procede a
definir como seleccionar al informante.
i) Asignar a cada vivienda una letra según los criterios establecidos en el punto 3 de este
anexo.
ii) Una vez logrado el contacto de la vivienda, se registran todos los individuos del hogar en el
RPH.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
40 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
iii) Se enumeran los individuos de 15 o más años, siguiendo un orden dado por sexo y edad, tal
como se describió en el punto 1 de este anexo. No se enumeran los menores de 15 años ni
personas de 15 o más años que formen parte del servicio doméstico o bien que presenten
alguna discapacidad mental que les impida comprender las preguntas.
iv) Determinar el número de informantes potenciales en la vivienda. Esto se obtiene mirando el
máximo valor registrado en la enumeración hecha en el paso iii.
v) Buscar en la Tabla Kish la letra asignada a la vivienda que se está encuestando.
vi) Buscar en la Tabla Kish, dentro de las categorías 1-11 y 12 ó más, aquella que coincida con el
número de informantes kish potenciales calculado en el paso iv.
vii) La celda que está en el cruce de la fila de la letra Kish (ubicada en el paso v) y la columna del
número de informantes potenciales dentro de la vivienda (ubicada en el paso vi) me indica la
persona a la cual debo entrevistar dentro de los posibles informantes que enumeré en el
paso iii.
A continuación se presenta un ejemplo para ilustrar este procedimiento mostrando cada una de
los pasos para la selección del informante.
Paso i):
Supongamos que estamos en la Comuna de Iquique, y dentro de la manzana 24 se ha seleccionado
la vivienda 2, a la cual se le ha asignado la Letra Kish G.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
41 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Tabla N°9: Ejemplo “Selección del Informante Kish – Paso i”
Paso ii):
Supongamos que la vivienda seleccionada en el paso “i” fue contactada y que el registro de las
personas que habitan en ella es el que se muestra a continuación:
Tabla N°10: Ejemplo “Selección del Informante Kish – Paso ii”
Nº Línea Nombre de Pila Edad en Años Cumplidos
Parentesco Informante Kish
1 Emilio 53 Jefe de Hogar
2 Amelia 51 Esposa
3 Eduardo 20 Hijo
4 Eliana 65 Madre
5 José 52 Jefe de Hogar
6 Rita 50 Esposa
7 Mario 28 Hijo
8 Angelina 24 Hija
9 Alejandro 2 Nieto
Paso iii):
Considerando el ordenamiento por sexo (Hombre primero y Mujer después) y el ordenamiento
por edad (de la mayor edad a la menor), y no considerando al único menor de edad de la vivienda
se procede a la enumeración del resto de las personas.
Número Correlativo de Viviendas a Encuestar según Directorio de manzanas
IdManzana RPC Comuna Distrito Zona Manzana Total Viv. 1 2 3 4 5 6 7 8 9 10
322 1101 IQUIQUE 4 1 4 31 J K A T I
392 1101 IQUIQUE 4 3 13 21 L B S
492 1101 IQUIQUE 4 6 26 20 H M C
677 1101 IQUIQUE 5 4 17 24 R G N D
690 1101 IQUIQUE 5 4 30 15 Q F
961 1101 IQUIQUE 7 3 10 62 O E P J K A T I L B
990 1101 IQUIQUE 7 4 13 48 S H M C R G N D
1054 1101 IQUIQUE 8 2 16 28 Q F O E P
1887 1101 IQUIQUE 10 2 24 29 J K A T I
1925 1101 IQUIQUE 10 3 19 28 L B S H M
2039 1101 IQUIQUE 10 6 39 29 C R G N D
2095 1101 IQUIQUE 11 2 15 48 Q F O E P J K A
2135 1101 IQUIQUE 11 3 12 47 T I L B S H M C
2150 1101 IQUIQUE 11 3 27 54 R G N D Q
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
42 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Tabla N°11: Ejemplo “Selección del Informante Kish – Paso iii”
Nº Línea Nombre de Pila Edad en Años Cumplidos
Parentesco Informante Kish
1 Emilio 53 Jefe de Hogar 1
2 Amelia 51 Esposa 6
3 Eduardo 20 Hijo 4
4 Eliana 65 Madre 5
5 José 52 Jefe de Hogar 2
6 Rita 50 Esposa 7
7 Mario 28 Hijo 3
8 Angelina 24 Hija 8
9 Alejandro 2 Nieto -
Paso iv):
Como resultado de la enumeración del paso anterior hemos determinado que existen 8
potenciales informantes en la vivienda.
Tabla N°12: Ejemplo “Selección del Informante Kish – Paso iv”
Paso v)
En color gris se destaca la fila que coincide con la letra Kish asignada a la vivienda a encuestar de
este ejemplo.
Nº Línea Nombre de Pila Edad en Años Cumplidos
Parentesco Informante Kish
1 Emilio 53 Jefe de Hogar 1
2 Amelia 51 Esposa 6
3 Eduardo 20 Hijo 4
4 Eliana 65 Madre 5
5 José 52 Jefe de Hogar 2
6 Rita 50 Esposa 7
7 Mario 28 Hijo 3
8 Angelina 24 Hija 8
9 Alejandro 2 Nieto -
Máximo valor registrado en la enumeración
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
43 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Tabla N°13: Ejemplo “Selección del Informante Kish – Paso v” (Tabla de Kish)
Tabla Aleatoria Si el número de personas de 15 o más años en la vivienda es:
1 2 3 4 5 6 7 8 9 10 11 12 o más
Selecciónese a la persona de 15 o más años con el número:
A 1 1 1 1 1 1 1 1 1 1 1 1
B 1 1 1 1 1 1 1 1 1 1 1 2
C 1 1 1 1 1 1 1 1 2 2 2 2
D 1 1 1 1 1 2 2 2 2 2 2 3
E 1 1 1 1 2 2 2 2 3 3 3 3
F 1 1 1 2 2 2 2 3 3 3 4 4
G 1 1 1 2 2 2 3 3 3 4 4 5
H 1 1 2 2 2 3 3 3 4 4 5 5
I 1 1 2 2 3 3 3 4 4 5 5 6
J 1 1 2 2 3 3 4 4 5 5 6 6
K 1 2 2 3 3 4 4 5 5 6 6 7
L 1 2 2 3 3 4 5 5 6 6 7 7
M 1 2 2 3 4 4 5 6 6 7 7 8
N 1 2 3 3 4 5 5 6 7 7 8 8
O 1 2 3 3 4 5 6 6 7 8 8 9
P 1 2 3 4 4 5 6 7 7 8 9 10
Q 1 2 3 4 5 5 6 7 8 9 10 10
R 1 2 3 4 5 6 7 8 8 9 10 11
S 1 2 3 4 5 6 7 8 9 10 11 11
T 1 2 3 4 5 6 7 8 9 10 11 12
Paso vi):
En color gris se destaca la columna de la tabla que coincide con el número de potenciales
informantes en la vivienda, es decir, 8.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
44 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Tabla N°14: Ejemplo “Selección del Informante Kish – Paso vi” (Tabla de Kish)
Tabla Aleatoria Si el número de personas de 15 o más años en la vivienda es:
1 2 3 4 5 6 7 8
9 10 11 12 o más
Selecciónese a la persona de 15 o más años con el número:
A 1 1 1 1 1 1 1 1 1 1 1 1
B 1 1 1 1 1 1 1 1 1 1 1 2
C 1 1 1 1 1 1 1 1 2 2 2 2
D 1 1 1 1 1 2 2 2 2 2 2 3
E 1 1 1 1 2 2 2 2 3 3 3 3
F 1 1 1 2 2 2 2 3 3 3 4 4
G 1 1 1 2 2 2 3 3 3 4 4 5
H 1 1 2 2 2 3 3 3 4 4 5 5
I 1 1 2 2 3 3 3 4 4 5 5 6
J 1 1 2 2 3 3 4 4 5 5 6 6
K 1 2 2 3 3 4 4 5 5 6 6 7
L 1 2 2 3 3 4 5 5 6 6 7 7
M 1 2 2 3 4 4 5 6 6 7 7 8
N 1 2 3 3 4 5 5 6 7 7 8 8
O 1 2 3 3 4 5 6 6 7 8 8 9
P 1 2 3 4 4 5 6 7 7 8 9 10
Q 1 2 3 4 5 5 6 7 8 9 10 10
R 1 2 3 4 5 6 7 8 8 9 10 11
S 1 2 3 4 5 6 7 8 9 10 11 11
T 1 2 3 4 5 6 7 8 9 10 11 12
Paso vii):
La celda que está en el cruce de la fila y columna, de la letra Kish y número potencial de
informantes, respectivamente, es la celda que aparece destacada en celeste, en la Tabla N°15:
N° Total de Potenciales Informantes.
Informe diseño metodológico muestral - Encuesta Nacional Urbana de Seguridad Ciudadana
45 Departamento de Investigación y Desarrollo – Instituto Nacional de Estadísticas
Tabla N°15: Ejemplo “Selección del Informante Kish – Paso vii: Identificación del número Kish” (Tabla de
Kish)
Tabla Aleatoria Si el número de personas de 15 o más años en la vivienda es:
1 2 3 4 5 6 7 8 9 10 11 12 o más
Selecciónese a la persona de 15 o más años con el número:
A 1 1 1 1 1 1 1 1 1 1 1 1
B 1 1 1 1 1 1 1 1 1 1 1 2
C 1 1 1 1 1 1 1 1 2 2 2 2
D 1 1 1 1 1 2 2 2 2 2 2 3
E 1 1 1 1 2 2 2 2 3 3 3 3
F 1 1 1 2 2 2 2 3 3 3 4 4
G 1 1 1 2 2 2 3 3 3 4 4 5
H 1 1 2 2 2 3 3 3 4 4 5 5
I 1 1 2 2 3 3 3 4 4 5 5 6
J 1 1 2 2 3 3 4 4 5 5 6 6
K 1 2 2 3 3 4 4 5 5 6 6 7
L 1 2 2 3 3 4 5 5 6 6 7 7
M 1 2 2 3 4 4 5 6 6 7 7 8
N 1 2 3 3 4 5 5 6 7 7 8 8
O 1 2 3 3 4 5 6 6 7 8 8 9
P 1 2 3 4 4 5 6 7 7 8 9 10
Q 1 2 3 4 5 5 6 7 8 9 10 10
R 1 2 3 4 5 6 7 8 8 9 10 11
S 1 2 3 4 5 6 7 8 9 10 11 11
T 1 2 3 4 5 6 7 8 9 10 11 12
Esto quiere decir que, la persona que se debe elegir como informante Kish es Mario, etiquetado
como número tres en la columna “Informante Kish”, de 28 años de edad, hijo de uno de los jefes
de hogar que habita la vivienda a encuestar nº 2, de la manzana nº 17 de la comuna de Iquique.
Tabla N°16: Ejemplo “Selección del Informante Kish - Paso vii: Identificación del informante Kish”
Nº Línea Nombre de Pila Edad en Años Cumplidos
Parentesco Informante Kish
1 Emilio 53 Jefe de Hogar 1
2 Amelia 51 Esposa 6
3 Eduardo 20 Hijo 4
4 Eliana 65 Madre 5
5 José 52 Jefe de Hogar 2
6 Rita 50 Esposa 7
7 Mario 28 Hijo 3
8 Angelina 24 Hija 8
9 Alejandro 2 Nieto -