mÉtodos de imputaciÓn y consistencia en el censo 2001 instituto nacional de estadistica republica...

16
M M É É TODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL TODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA REPUBLICA BOLIVARIANA DE VENEZUELA

Upload: adelita-cardozo

Post on 06-Feb-2015

20 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

MMÉÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN TODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001EL CENSO 2001

INSTITUTO NACIONAL DE ESTADISTICAINSTITUTO NACIONAL DE ESTADISTICAREPUBLICA BOLIVARIANA DE VENEZUELAREPUBLICA BOLIVARIANA DE VENEZUELA

Page 2: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

OBJETIVOSOBJETIVOS

El proceso de imputación y consistencia de datos tiene como objetivo corregir los errores por la mala declaración de respuestas y asignar algún valor válido en aquellas variables que fueron omitidas.

Page 3: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

ETAPASETAPAS

Primera etapa: Pre-validación de los datos, que consiste, en asegurar la consistencia de cada uno de los registros de la base de datos; es decir que cada hogar estuviera asignado a una vivienda familiar, y que cada persona estuviera asignado a un hogar censal o a una colectividad. Adicionalmente, se examinó la validez de algunas variables que por su importancia, no se permitía ausencia de información

Segunda etapa: Correspondió a la validación del resto de las variables correspondientes a los registros de vivienda, de hogares y de personas.

Page 4: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

MMÉÉ TODOS UTILIZADOS TODOS UTILIZADOS

Deductiva Estática: La mayor parte de los algoritmos de asignación se realizaron utilizando este método. Consiste en deducir los valores perdidos de combinaciones de variables no perdidas del mismo caso. Ejemplo: Si no existe información en sexo, pero existe respuesta en “total de hijos e hijas” igual a (00-99) o “ninguno”, asignar “mujer” (2) en sexo. Otro ejemplo, es el siguiente: Si el número de “hijos e hijas nacidos vivos” es menor o igual a edad de la madre menos 11 y menor o igual a 25 aceptar esta información.

Page 5: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´MMÉÉ TODOS UTILIZADOS TODOS UTILIZADOS

Imputación Deductiva Dinámica: De acuerdo a los valores de una o más variables se fija un valor que se obtiene de otras variables en el mismo Censo que se actualizan constantemente. Este método también es conocido en la literatura especializada como Hot Desk o Matrices Dinámicas y puede presentar diversas modalidades que varían de acuerdo en la forma en que se ordenan y seleccionan los registros donantes. Ejemplo: “Si es mujer con parentesco código 3 a 9 y tiene declaración de hijos nacidos vivos, asigne por hot deck la edad según la edad de la mujer anterior con igual parentesco e igual número de hijos nacidos vivos”

Page 6: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´ALGUNOS RESULTADOSALGUNOS RESULTADOS

% DE CASOS IMPUTADO VARIABLE SEXO 3.68VARIABLE EDAE 0.56

Page 7: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´PROPUESTA PARA LA CONSISTENCIA E PROPUESTA PARA LA CONSISTENCIA E

IMPUTACIIMPUTACIÓÓN DEL CENSO 2010N DEL CENSO 2010

La importancia de la consistencia e imputación de datos para poder difundir una información censal coherente y consistente; pero sin estar sobrefijada, obliga a que deba revisarse con antelación la metodología empleada para este proceso

Page 8: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´REVISIÒN DE LA IMPUTACIREVISIÒN DE LA IMPUTACIÓÓN 2001N 2001

Etapa 1: Revisión de las reglas empleadas

en la imputación deductiva estática aplicada en el Censo 2001. Revisión de su validez y pertinencia

Page 9: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓ N 2001 N 2001

Total de hijosnacidos Vivos 12 13 14 15 16 17 18 19

0 230.181 215.174 215.656 216.055 199.119 185.756 171.361 142.9801 480 756 2.090 6.701 14.794 25.829 38.012 44.7462 - 97 306 559 1.682 4.625 10.287 15.7243 - - 73 153 209 533 1.548 3.2474 - - - 64 117 102 263 5595 - - - - 35 65 79 996 - - - - - 29 46 317 - - - - - - 137 182

Número total de hijos nacidos vivos en mújeres entre 12 y 19 añosEdad en años

Fuente: INE. Procesamiento especial de la base de datos censales

Page 10: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

Page 11: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

Etapa 2: Revisión de la imputación

deductiva y estática aplicada en el Censo 2001 . Revisión de % de aciertos en la imputación

Page 12: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´PROPUESTA PARA SELECCIONAR MPROPUESTA PARA SELECCIONAR MÉÉTODOS Y TODOS Y

VARIABLESVARIABLES

a) Obtener una muestra de la base de datos censales, en la que no exista omisión

Page 13: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

b) Simular sobre esta muestra, el patrón de

datos perdidos de la base original.

Page 14: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

c) Imputar aplicando diferentes técnicas y

distintas variables

Page 15: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

Métodos deductivosMedia / ModaHot Deck secuencialAleatoriaRegresiónVecino más cercanoModelos de series de tiempo

Page 16: MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

d) Evaluar los resultadas y seleccionar las

variables y técnicas de imputación a utilizar.