mÉtodos de imputaciÓn y consistencia en el censo 2001 instituto nacional de estadistica republica...

Post on 06-Feb-2015

21 Views

Category:

Documents

4 Downloads

Preview:

Click to see full reader

TRANSCRIPT

MMÉÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN TODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001EL CENSO 2001

INSTITUTO NACIONAL DE ESTADISTICAINSTITUTO NACIONAL DE ESTADISTICAREPUBLICA BOLIVARIANA DE VENEZUELAREPUBLICA BOLIVARIANA DE VENEZUELA

OBJETIVOSOBJETIVOS

El proceso de imputación y consistencia de datos tiene como objetivo corregir los errores por la mala declaración de respuestas y asignar algún valor válido en aquellas variables que fueron omitidas.

ETAPASETAPAS

Primera etapa: Pre-validación de los datos, que consiste, en asegurar la consistencia de cada uno de los registros de la base de datos; es decir que cada hogar estuviera asignado a una vivienda familiar, y que cada persona estuviera asignado a un hogar censal o a una colectividad. Adicionalmente, se examinó la validez de algunas variables que por su importancia, no se permitía ausencia de información

Segunda etapa: Correspondió a la validación del resto de las variables correspondientes a los registros de vivienda, de hogares y de personas.

MMÉÉ TODOS UTILIZADOS TODOS UTILIZADOS

Deductiva Estática: La mayor parte de los algoritmos de asignación se realizaron utilizando este método. Consiste en deducir los valores perdidos de combinaciones de variables no perdidas del mismo caso. Ejemplo: Si no existe información en sexo, pero existe respuesta en “total de hijos e hijas” igual a (00-99) o “ninguno”, asignar “mujer” (2) en sexo. Otro ejemplo, es el siguiente: Si el número de “hijos e hijas nacidos vivos” es menor o igual a edad de la madre menos 11 y menor o igual a 25 aceptar esta información.

´MMÉÉ TODOS UTILIZADOS TODOS UTILIZADOS

Imputación Deductiva Dinámica: De acuerdo a los valores de una o más variables se fija un valor que se obtiene de otras variables en el mismo Censo que se actualizan constantemente. Este método también es conocido en la literatura especializada como Hot Desk o Matrices Dinámicas y puede presentar diversas modalidades que varían de acuerdo en la forma en que se ordenan y seleccionan los registros donantes. Ejemplo: “Si es mujer con parentesco código 3 a 9 y tiene declaración de hijos nacidos vivos, asigne por hot deck la edad según la edad de la mujer anterior con igual parentesco e igual número de hijos nacidos vivos”

´ALGUNOS RESULTADOSALGUNOS RESULTADOS

% DE CASOS IMPUTADO VARIABLE SEXO 3.68VARIABLE EDAE 0.56

´PROPUESTA PARA LA CONSISTENCIA E PROPUESTA PARA LA CONSISTENCIA E

IMPUTACIIMPUTACIÓÓN DEL CENSO 2010N DEL CENSO 2010

La importancia de la consistencia e imputación de datos para poder difundir una información censal coherente y consistente; pero sin estar sobrefijada, obliga a que deba revisarse con antelación la metodología empleada para este proceso

´REVISIÒN DE LA IMPUTACIREVISIÒN DE LA IMPUTACIÓÓN 2001N 2001

Etapa 1: Revisión de las reglas empleadas

en la imputación deductiva estática aplicada en el Censo 2001. Revisión de su validez y pertinencia

REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓ N 2001 N 2001

Total de hijosnacidos Vivos 12 13 14 15 16 17 18 19

0 230.181 215.174 215.656 216.055 199.119 185.756 171.361 142.9801 480 756 2.090 6.701 14.794 25.829 38.012 44.7462 - 97 306 559 1.682 4.625 10.287 15.7243 - - 73 153 209 533 1.548 3.2474 - - - 64 117 102 263 5595 - - - - 35 65 79 996 - - - - - 29 46 317 - - - - - - 137 182

Número total de hijos nacidos vivos en mújeres entre 12 y 19 añosEdad en años

Fuente: INE. Procesamiento especial de la base de datos censales

REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

Etapa 2: Revisión de la imputación

deductiva y estática aplicada en el Censo 2001 . Revisión de % de aciertos en la imputación

´PROPUESTA PARA SELECCIONAR MPROPUESTA PARA SELECCIONAR MÉÉTODOS Y TODOS Y

VARIABLESVARIABLES

a) Obtener una muestra de la base de datos censales, en la que no exista omisión

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

b) Simular sobre esta muestra, el patrón de

datos perdidos de la base original.

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

c) Imputar aplicando diferentes técnicas y

distintas variables

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

Métodos deductivosMedia / ModaHot Deck secuencialAleatoriaRegresiónVecino más cercanoModelos de series de tiempo

´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001

d) Evaluar los resultadas y seleccionar las

variables y técnicas de imputación a utilizar.

top related