inicioeio.usc.es/pub/mte/descargas/postersfinmaster/poster_409.pdfcreated date 11/3/2009 1:09:47 pm

1
Estimación en áreas pequeñas: el ingreso medio mensual por hogar en las comarcas gallegas. Proyecto Fin de Máster en Técnicas Estadísticas. Santiago de Compostela, 17 de Julio de 2009. Autor Directores Roberto Domínguez Gómez María José Lombardía Cortiña a Wenceslao González Manteiga Introducción Un área es considerada como área pequeña cuando la muestra en el área no es suficientemente grande para conseguir estimaciones directas fiables. Ejemplos de áreas pequeñas pueden ser áreas geográficas (estados, provincias, municipios, comarcas, distritos escolares), grupos socio-demográficos (grupos específicos por edad-sexo-raza) y otras subpoblaciones como un conjunto de firmas de empresas. Un modo de afrontar el problema en áreas pequeñas es aumentar el tamaño muestral. Sin embargo, un aumento de tamaño de muestra lleva, entre otras cosas, a un aumento en el coste del estudio, una mayor carga de respuesta a los informantes y mayores errores ajenos al muestreo, lo que, en general, se trata de evitar. Otra alternativa es utilizar técnicas más complejas, asistidas y basadas en modelos. Las estimaciones basadas en el modelo están siendo de gran interés en los últimos años por sus buenos resultados. La inclusión de efectos aleatorios de área en el modelo es común en la estimación para áreas pequeñas. Estos efectos recogen la variación en las áreas que no está explicada por las variables auxiliares. El objetivo en este trabajo es la estimación del ingreso medio mensual por hogar en las 53 comarcas de Galicia, en este caso las áreas pequeñas son las comarcas. La muestra disponible proviene de la Encuesta de Condiciones de Vida de las familias (ECV) del año 2005. El tamaño muestral varía desde 16 hogares en la comarca de Muros hasta 864 hogares en la comarca de Vigo con un total de 6304 hogares muestrales. Para compensar la falta de información muestral se va a utilizar información auxiliar disponible de la Agencia Estatal de la Administración Tributaria (AEAT). Estimación basada en el modelo Modelo Fay-Herriot: El modelo se construye a partir de la información auxiliar disponible de la AEAT. La información está disponible solamente a nivel de comarca y por lo tanto la estimación se basa en el siguiente modelo de área (Fay and Herriot, 1979): b Y HT d = β 0 + X d β 1 + u d + ε d , d =1,...,D Este modelo asume que los efectos aleatorios de área u d son independientes e idéntica- mente distribuidos según u d N (02 u ) y los errores de muestreo ε d son independientes y distribuidos según ε d N (02 d ), con u d independientes de ε d . También se asume que la varianza σ 2 u de los efectos aleatorios es desconocida y que las varianzas σ 2 d = s 2 d /n d de los errores muestrales son conocidas, siendo s 2 d y n d la cuasivarianza muestral de la variable objetivo y el tamaño muestral en la comarca d, respectivamente. Además, como covariable X d se toma la renta media anual declarada por individuo en la comarca d (datos del IRPF). Basándose en este modelo, se define el estimador Fay-Herriot: b Y FH d = ˆ β 0 + X d ˆ β 1 u d , d =1,...,D Los parámetros se estiman por máxima verosimilitud restringida (REML). Para más detalle, véase Rao (2003). Estimación basada en el diseño Estimador Horvitz-Thompson: b Y HT d = s d ω j y j s d ω j , d =1,...,D donde s d es la muestra perteneciente a la comarca d, y j el ingreso mensual del hogar j y ω j el peso muestral asignado al hogar j . Estimador postestratificado sintético: b Y POST,S d = 1 M d H X h=1 M dh b Y HT h , d =1,...,D denotando por h los postestratos relevantes, M d el total poblacional de las personas en la comarca d y M dh el total poblacional de las personas que pertenecen a la intersección de la comarca d con el estrato h. Además definimos b Y HT h como el estimador de Horvitz- Thompson de la media mensual en el estrato h. Estimador compuesto: b Y COMP,P d = γ d b Y HT d + (1 - γ d ) b Y POST,S d , d =1,...,D donde γ d son pesos dependientes del tamaño muestral en la comarca d, definidos como: γ d = 1 si c M HT d δM d c M HT d δM d en caso contrario con c M HT d la estimación de Horvitz-Thompson del total de las personas M d en la comarca d. Para el parámetro δ se pueden tomar distintos valores, δ ∈{1, 3/2, 2} (Eustat, 2008). Aplicación a datos reales Se aplican los estimadores Horvitz-Thompson (HT), compuesto (COMP2) y Fay-Herriot (FH) con su coeficiente de variación estimado (CV) para cada comarca. Es necesario destacar que los resultados presentados no se pueden considerar como estadística oficial. Las comarcas están ordenadas según su tamaño muestral. Existen diferencias entre los dis- tintos estimadores del ingreso medio mensual. Por ejemplo, se observa una diferencia de 400 euros en la comarca de Os Ancares. Para estas comarcas se toma el estimador con menor CV. En cuanto al CV se ve que el estimador Fay-Herriot obtiene los mejores resultados, sobre todo para las comarcas con menor tamaño muestral. Por ejemplo, se observa una diferencia de hasta 30% en el CV para la comarca de Allariz-Maceda a favor del estimador Fay-Herriot. A continuación se representa geográficamente la estimación Fay-Herriot del ingreso medio mensual por hogar: No se dispone de datos muestrales para las comarcas pintadas en color rojo. Referencias Eustat (2008). Estimación de áreas pequeñas en la encuesta de población en relación con la actividad de la C.A. de Euskadi. Eustat. Fay, R. E. and Herriot, R. A. (1979). Estimates of income for small places: An application of James-Stein procedures to census data. Journal of the American Statistical Association, 74, 269-277. Rao, J. N. K. (2003). Small Area Estimation. Wiley,New York. Conclusión Analizando los resultados obtenidos se puede concluir que el estimador Fay-Herriot basado en el modelo es un serio competidor de los estimadores clásicos basados en el diseño.

Upload: others

Post on 04-Sep-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Inicioeio.usc.es/pub/mte/descargas/PostersFinMaster/Poster_409.pdfCreated Date 11/3/2009 1:09:47 PM

Estimaciónenáreaspequeñas: el ingresomediomensualporhogaren lascomarcasgallegas.

Proyecto Fin de Máster en Técnicas Estadísticas. Santiago de Compostela, 17 de Julio de 2009.

Autor DirectoresRoberto Domínguez Gómez María José Lombardía Cortiñaa Wenceslao González Manteiga

IntroducciónUn área es considerada como área pequeña cuando la muestra en el área no es suficientementegrande para conseguir estimaciones directas fiables. Ejemplos de áreas pequeñas puedenser áreas geográficas (estados, provincias, municipios, comarcas, distritos escolares), grupossocio-demográficos (grupos específicos por edad-sexo-raza) y otras subpoblaciones como unconjunto de firmas de empresas.

Un modo de afrontar el problema en áreas pequeñas es aumentar el tamaño muestral.Sin embargo, un aumento de tamaño de muestra lleva, entre otras cosas, a un aumento en elcoste del estudio, una mayor carga de respuesta a los informantes y mayores errores ajenosal muestreo, lo que, en general, se trata de evitar. Otra alternativa es utilizar técnicas máscomplejas, asistidas y basadas en modelos. Las estimaciones basadas en el modelo estánsiendo de gran interés en los últimos años por sus buenos resultados. La inclusión de efectosaleatorios de área en el modelo es común en la estimación para áreas pequeñas. Estos efectosrecogen la variación en las áreas que no está explicada por las variables auxiliares.

El objetivo en este trabajo es la estimación del ingreso medio mensual por hogar en las53 comarcas de Galicia, en este caso las áreas pequeñas son las comarcas. La muestradisponible proviene de la Encuesta de Condiciones de Vida de las familias (ECV) del año2005. El tamaño muestral varía desde 16 hogares en la comarca de Muros hasta 864 hogaresen la comarca de Vigo con un total de 6304 hogares muestrales. Para compensar la falta deinformación muestral se va a utilizar información auxiliar disponible de la Agencia Estatal dela Administración Tributaria (AEAT).

Estimación basada en el modelo• Modelo Fay-Herriot:

El modelo se construye a partir de la información auxiliar disponible de la AEAT. Lainformación está disponible solamente a nivel de comarca y por lo tanto la estimación sebasa en el siguiente modelo de área (Fay and Herriot, 1979):

YHT

d = β0 +Xdβ1 + ud + εd, d = 1, . . . , D

Este modelo asume que los efectos aleatorios de área ud son independientes e idéntica-mente distribuidos según ud ∼ N(0, σ2

u) y los errores de muestreo εd son independientes ydistribuidos según εd ∼ N(0, σ2

d), con ud independientes de εd.

También se asume que la varianza σ2u de los efectos aleatorios es desconocida y que

las varianzas σ2d = s2d/nd de los errores muestrales son conocidas, siendo s2d y nd la

cuasivarianza muestral de la variable objetivo y el tamaño muestral en la comarca d,respectivamente.

Además, como covariable Xd se toma la renta media anual declarada por individuoen la comarca d (datos del IRPF).

Basándose en este modelo, se define el estimador Fay-Herriot:

YFH

d = β0 +Xdβ1 + ud, d = 1, . . . , D

Los parámetros se estiman por máxima verosimilitud restringida (REML). Para más detalle,véase Rao (2003).

Estimación basada en el diseño• Estimador Horvitz-Thompson:

YHT

d =

∑sdωjyj∑

sdωj

, d = 1, . . . , D

donde sd es la muestra perteneciente a la comarca d, yj el ingreso mensual del hogar j y ωj

el peso muestral asignado al hogar j.

• Estimador postestratificado sintético:

YPOST,S

d =1Md

H∑h=1

MdhYHT

h , d = 1, . . . , D

denotando por h los postestratos relevantes, Md el total poblacional de las personas enla comarca d y Mdh el total poblacional de las personas que pertenecen a la intersección

de la comarca d con el estrato h. Además definimos YHT

h como el estimador de Horvitz-Thompson de la media mensual en el estrato h.

• Estimador compuesto:

YCOMP,P

d = γdYHT

d + (1− γd)YPOST,S

d , d = 1, . . . , D

donde γd son pesos dependientes del tamaño muestral en la comarca d, definidos como:

γd =

1 si MHTd ≥ δMd

MHTd

δMden caso contrario

con MHTd la estimación de Horvitz-Thompson del total de las personas Md en la comarca d.

Para el parámetro δ se pueden tomar distintos valores, δ ∈ {1, 3/2, 2} (Eustat, 2008).

Aplicación a datos realesSe aplican los estimadores Horvitz-Thompson (HT), compuesto (COMP2) y Fay-Herriot (FH)con su coeficiente de variación estimado (CV) para cada comarca. Es necesario destacar quelos resultados presentados no se pueden considerar como estadística oficial.

Las comarcas están ordenadas según su tamaño muestral. Existen diferencias entre los dis-tintos estimadores del ingreso medio mensual. Por ejemplo, se observa una diferencia de 400euros en la comarca de Os Ancares. Para estas comarcas se toma el estimador con menor CV.

En cuanto al CV se ve que el estimador Fay-Herriot obtiene los mejores resultados, sobre todopara las comarcas con menor tamaño muestral. Por ejemplo, se observa una diferencia dehasta 30% en el CV para la comarca de Allariz-Maceda a favor del estimador Fay-Herriot.

A continuación se representa geográficamente la estimación Fay-Herriot del ingresomedio mensual por hogar:

No se dispone de datos muestrales para las comarcas pintadas en color rojo.

Referencias• Eustat (2008). Estimación de áreas pequeñas en la encuesta de población en relación con la actividad

de la C.A. de Euskadi. Eustat.• Fay, R. E. and Herriot, R. A. (1979). Estimates of income for small places: An application of James-Stein

procedures to census data. Journal of the American Statistical Association, 74, 269-277.• Rao, J. N. K. (2003). Small Area Estimation. Wiley, New York.

ConclusiónAnalizando los resultados obtenidos se puede concluir que el estimador Fay-Herriot basadoen el modelo es un serio competidor de los estimadores clásicos basados en el diseño.

1