para seguir la evolución en el tiempo de fenómenos...

58
309 Indicadores sintéticos para seguir la evolución en el tiempo de fenómenos multidimensionales: una propuesta metodológica Víctor Alfredo Bustos y de la Tijera* Se presenta un procedimiento para calcular indicadores compuestos a partir de series de tiempo. Su uso se ejemplifica aplicando un procedimiento de maximización de varianzas. Se muestra que al romper con restricciones difíciles de explicar y de sostener sobre los valores de algunos de los coeficientes, es posible obtener explicaciones aún mejores en algún sentido explícito a costa de una mayor complejidad del procedimiento de cálculo. Palabras clave: series de tiempo, índices compuestos, componentes principales, indicadores cíclicos, ponderaciones óptimas. I. Objetivo Proponer una metodología para el cálculo de un indicador compuesto, basado en la determinación de ponderacio- nes óptimas, en el sentido de un criterio explícito, que permita realizar comparaciones de una misma realidad en distintos momentos, con particular énfasis en el estudio del ciclo económico. * Instituto Nacional de Estadística y Geografía (INEGI), Héroe de Nacozari Sur Núm. 2301, Puerta 8, Segundo Nivel, Fracc. Jardines del Parque, Aguascalientes, Ags., CP 20276. Correo electrónico: [email protected] INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 3, septiembre-diciembre 2009

Upload: trinhminh

Post on 21-Oct-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

309

Indicadores sintéticos para seguir la evolución en el

tiempo de fenómenos multidimensionales:

una propuesta metodológicaVíctor Alfredo Bustos y de la Tijera*

Se presenta un procedimiento para calcular indicadores compuestos a partir de series de tiempo. Su uso se ejemplifica aplicando un procedimiento de maximización de varianzas.

Se muestra que al romper con restricciones difíciles de explicar y de sostener sobre los valores de algunos de los coeficientes, es posible obtener

explicaciones aún mejores en algún sentido explícito a costa de una mayor complejidad del procedimiento de cálculo.

Palabras clave: series de tiempo, índices compuestos, componentes principales, indicadores cíclicos, ponderaciones óptimas.

I. Objetivo

Proponer una metodología para el cálculo de un indicador compuesto, basado en la determinación de ponderacio-nes óptimas, en el sentido de un criterio explícito, que permita realizar comparaciones de una misma realidad en distintos momentos, con particular énfasis en el estudio del ciclo económico.

* Instituto Nacional de Estadística y Geografía (INEGI), Héroe de Nacozari Sur Núm. 2301, Puerta 8, Segundo Nivel, Fracc. Jardines del Parque, Aguascalientes, Ags., CP 20276. Correo electrónico: [email protected]

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 2: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

310

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

En otras palabras, se busca encontrar un conjunto de coeficientestal que, si representa un con-

junto de n indicadores económicos y sociales que evolucionan concomitan-temente en el tiempo (series de tiempo), su resumen (en forma de índice):

calculado usando tal conjunto de coeficientes, es tal que denominada la función criterio, alcanza su valor máximo.

Las virtudes y limitaciones de la metodología propuesta serán discutidas con base en su aplicación a un conjunto de indicadores económicos para obte-ner un indicador compuesto para el estudio del ciclo económico. La diferen-cia con los existentes, que parecen priorizar el ciclo de producción, consiste en establecer cuándo se dan las condiciones en que se puede hablar del inicio de una crisis o de una recuperación de carácter más integral.

II. Antecedentes

Con el fin de aprender de la mejor manera su realidad inmediata, aun-que ello se refiera a lo sideral, el ser humano ha desarrollado sistemas de clasificación que facilitan la organización de las cosas sobre las que le interesa conocer. Esta actividad tiene que ver con lo que es parecido o igual y, en consecuencia, con las comparaciones. Con frecuencia, di-chas comparaciones tienen lugar en el espacio, por ejemplo, buscando ubicar la posición relativa o absoluta de dos países, entidades federativas o regiones en un mismo momento; o en el tiempo, en el que lo relevante es la situación que guarda la misma unidad, comúnmente geográfica, o agregado de unidades en dos momentos diferentes. Ejemplificaremos la aplicación estadística de un par de estos procedimientos desarrollados con fines comparativos en las secciones subsecuentes de esta sección, iniciando con un par de las metodologías que tienen que ver con com-

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 3: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

311

paraciones contemporáneas, para proceder después a discutir algunas desarrolladas para realizar comparaciones a lo largo del tiempo.

a. Comparaciones contemporáneas

i. Índice de desarrollo humano (IDH)Es una medición por país, elaborada por el Programa de las Naciones Uni-das para el Desarrollo (PNUD). Se basa en un indicador social estadístico compuesto por tres parámetros:

• Vida larga y saludable (medida según la esperanza de vida al nacer).

• Educación (medida por la tasa de alfabetización de adultos y la tasa bruta combinada de matriculación en educación prima-ria, secundaria y superior, así como los años de duración de la educación obligatoria).

• Nivel de vida digno (medido por el PIB per cápita PPA en dólares).

Ello ya que se concibe1 al desarrollo humano como al:

“…proceso por el que una sociedad mejora las condiciones de vida de sus ciudadanos a través de un incremento de los bienes con los que puede cubrir sus necesidades básicas y complementarias, y de la creación de un entorno en el que se respeten los derechos humanos de todos ellos.

“Es la cantidad de opciones que tiene un ser humano en su propio me-dio, para ser o hacer lo que él desea ser o hacer. A mayor cantidad de opciones mayor desarrollo humano, a menor cantidad de opciones, menor desarrollo humano. El Desarrollo Humano podría definirse también como una forma de medir la calidad de vida del ente humano en el medio en que se desenvuel-ve, y una variable fundamental para la calificación de un país o región...”

1 http://es.wikipedia.org/wiki/%C3%8Dndice_de_desarrollo_humano

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 4: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

312

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

El IDH es simplemente el promedio de tres índices generales2:

• Esperanza de vida al nacer: • Índice de educación: , donde • Índice de alfabetismo adulto: • Índice bruto de asistencia: • Producto interno bruto per cápita:

El PNUD3 establece en el primer reporte publicado que el “…índice pue-de ser visto como una aproximación para la captura de múltiples dimensiones de las elecciones humanas. Tiene también las desventajas de las medidas del ingreso. Sus promedios nacionales ocultan la distribución local y entre regio-nes. Además aún ha de ser desarrollada alguna medida de libertad humana…”; señala, asimismo, que “…el índice (…) puede ser refinado a medida que más aspectos de la opción y del desarrollo humanos sean cuantificados…”.

2 En la construcción del IDH se usa la siguiente fórmula para la normalización; es decir, para transformar una variable en bruto (por ejemplo, x) en un índice sin unidades, que toma valores entre 0 y 1:

donde min (x) y max (x) son los valores mínimos y máximos que la variable x puede tomar, respectivamente.3 United Nations Development Programme (UNDP). New York, Oxford, Oxford University Press, 1990,

p.1, en : http://hdr.undp.org/en/media/hdr_1990_en_overview.pdf

Rango País IDH

Valores para el 200� Cambio respecto al 2005

1 Islandia 0.9�� +0.001

2 Noruega 0.9�� +0.001

3 Canadá 0.9�� +0.002

4 Australia 0.9�5 +0.002

5 Irlanda 0.9�0 +0.002

40 Chile 0.��4 +0.003

4� Argentina 0.��0 +0.00�

4� Uruguay 0.�59 +0.005

4� Cuba 0.�55 +0.01�

50 Costa Rica 0.�4� +0.004

51 México 0.�42 +0.005

Tabla 1Lista de algunos países por su valor del IDH en el 200�

Fuente: http://en.wikipedia.org/wiki/List_of_countries_by_Human_Development_Index

IAA= TAA- O100-O

PIBpc=LN(PIBpc) - LN(100)

IBA= TAE- O100-O

LN(40 000) - LN(100)

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 5: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

313

Limitaciones técnicas

Ausencia de un criterio explícito de optimalidad No debemos olvidar que una de las virtudes de este índice es la simplicidad; es decir, parece buscarse que sea fácilmente entendido y calculado; en otras pala-bras, que lo entiendan todos. Tal vez, por esta razón, los coeficientes son iguales a 1/3, se supone que básicamente porque se hace uso de tres dimensiones y porque no se pretende ponderar alguna de ellas en detrimento de las otras. El resumen del primer reporte publicado por el PNUD4 señalaba que el índice “…mide el logro pro-medio en un país en las tres dimensiones básicas del desarrollo humano…” sin plantearse otras fórmulas para conseguir este fin.5 Sin embargo, cualquier cosa que sea lo que el índice mide, cabe preguntarse si estará mejor o peor medido si se hace uso de otros valores para los coeficientes, por ejemplo (1/4,1/4,1/2), y entonces determinar la dirección a seguir para lograr la mejor medición posible. En otras palabras, ¿se puede hacer algo para mejorar su desempeño? Hay expe-riencias que buscan incorporar medidas de desigualdad (heterogeneidad) para corregir limitaciones de los promedios (por ejemplo, PIB per cápita) o calidad en los servicios, pero ninguna en cuanto a la determinación de los coeficientes.

ii. Índice de marginación del Consejo Nacional de Población (CONAPO)En la publicación Índice absoluto de marginación, 1990-20006 se lee:

“La marginación es un fenómeno estructural que se origina en la mo-dalidad, estilo o patrón histórico de desarrollo; se expresa, por un lado, en la dificultad para propagar el progreso técnico en el conjunto de la estructura productiva y en las regiones del país, y por otro, en la exclusión de grupos sociales del proceso de desarrollo y del disfrute de sus beneficios.

4 Ibíd. “The human development index (HDI) is a composite index that measures the average achievements in a country in three basic dimensions of human development: a long and healthy life; access to knowledge; and a decent standard of living”, en: http://hdr.undp.org/en/media/hdr_1990_en_overview.pdf

5 Ibíd., p. 104, “Any synthetic index combines diverse indicators. Weighting can be equal or determined by such data-driven statistical techniques as factor analysis. Weights have a statistical interpretation, but they cannot be explained either by daily experience or by the relative importance of the indicators”.

6 CONAPO. Índice absoluto de marginación, 1990-2000. México, DF, 2004, en: http://www.conapo.gob.mx/index.php?option=com_content&view=article&id=300&Itemid=194

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 6: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

314

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

“El Índice de Marginación es una medida-resumen que permite di-ferenciar entidades federativas y municipios según el impacto global de las carencias que padece la población, como resultado de la falta de acce-so a la educación, la residencia en viviendas inadecuadas, la percepción de ingresos monetarios insuficientes y las relacionadas con la residencia en localidades pequeñas.”

La aplicación será ejemplificada con la aplicación que el propio CONAPO hiciera con datos del II Conteo de Población, 2005, para la determinación de los niveles de marginación de las áreas geoestadísticas básicas (AGEB) urbanas.7

Objetivo

Producir un indicador para evaluar impacto global de las carencias.

Objetivos secundarios

1. Reducir la dimensionalidad original sin perder información sobre la dispersión de los datos en los indicadores, y sobre sus interrelaciones.2. Establecer una ordenación entre las unidades de observación (AGEB urbanas).

A partir de 10 indicadores socioeconómicos se construye una medida resumen. Con este propósito se recurre al análisis de componentes principa-les (“método matemático que transforma un conjunto de variables -o indi-cadores- en uno nuevo donde, con un número menor de variables, se puede reelaborar una interpretación más sencilla del fenómeno original”8).

Diez indicadores socioeconómicos.9 Porcentaje (en el AGEB, en este caso) de:

1. Población de 6 a 14 años que no asiste a la escuela.2. Población de 15 años o más sin secundaria completa.

7 CONAPO. Índice de marginación urbana 2005. México, 2009. http://www.conapo.gob.mx/index php? option=com_content&view=article&id=331&Itemid=15

8 Ibíd.9 INEGI. II Conteo de Población y Vivienda 2005.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 7: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

315

3. Población sin derechohabiencia a los servicios de salud.4. Hijos fallecidos de las mujeres de 15 a 49 años.5. Viviendas particulares sin agua entubada dentro de la vivienda.6. Viviendas particulares sin drenaje conectado a la red pública o

fosa séptica.7. Viviendas particulares sin excusado con conexión de agua.8. Viviendas particulares con pisos de tierra.9. Viviendas particulares con algún nivel de hacinamiento.10. Viviendas particulares sin refrigerador.

Criterio de optimalidadLa solución óptima está dada por aquella medida resumen (índice compuesto calculado como combinación lineal de los 10 índices simples) cuya varianza, como medida de heterogeneidad, es máxima. En otras palabras, por la pri-mer componente principal.

SoluciónLos coeficientes del indicador compuesto quedan dados por las entradas del vector característico asociado al máximo valor propio de la matriz de corre-laciones entre los índice simples.

OrdenaciónA partir de los valores de la primera componente principal. A manera de ejemplo, en la tabla 2 se muestra el resultado numérico para la función cri-terio en la aplicación referida a la marginación urbana, 2005. Se observa que el valor del mayor valor propio o característico (también conocido como ei-genvalor) de la matriz de correlaciones para el ejemplo, representa casi 60% de la suma de todos los valores propios. A partir del segundo más grande, el valor de cada uno de los restantes valores propios nunca es mayor a 10% de la mencionada suma, por lo que es claro que la contribución individual más importante es, con mucho, precisamente la del mayor eigenvalor.

Es ésta una situación que se presenta, por lo general, cuando los indica-dores utilizados muestran grados más o menos fuertes de asociación como en este caso; y es por ello que los autores del procedimiento consideran adecuada la reducción de dimensionalidad resultante de basar sus posteriores afirma-

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 8: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

31�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

ciones en únicamente un indicador: el asociado con el mayor valor propio; es decir, de pasar a considerar sólo la dimensión referida a éste en lugar de las 10 originales.

Tabla 2

Valores propios de la matriz de correlaciones y porcentaje de varianza explicada a nivel AGEB urbana, 2005

Componente principal Valores propios

Total % de varianza % de varianza acumulada

1 �.1�395 �1.�3950 �1.�3950

2 0.921�� 9.21��4 �0.�5�23

3 0.�3920 �.39202 ��.25025

4 0.5�101 5.�100� �3.0�032

5 0.45159 4.515�9 ��.5��21

� 0.3�34� 3.�3455 91.410��

� 0.315�3 3.15�34 94.5�910

� 0.24034 2.40341 9�.9�251

9 0.193�4 1.93�41 9�.91092

10 0.10�91 1.0�90� 100.00000

Suma 10.00000 100.00000

Limitaciones técnicas

• Si se busca el índice que haga más evidente la heterogeneidad entre las unidades seleccionadas, ¿porqué usar la matriz de corre-lación en la que las 10 dimensiones han sido transformadas para ser igualmente heterogéneas?, ¿no era suficiente con trabajar todo a nivel de porcentajes? De este modo se permite que algunos por-centajes muestren mayor heterogeneidad y, en consecuencia, ten-gan mayor influencia en la determinación del indicador en vista de su más alta capacidad de discriminación entre las unidades y no por el simple hecho de estar medidas en unidades diferentes, razón por la que yo supongo que se prefirió trabajar con las co-rrelaciones.

• La variabilidad total toma un valor igual al número de índices usados en el ejercicio, en vista del uso de la matriz de correlaciones

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 9: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

31�

en lugar de la de covarianzas. Es poco claro lo que este concepto mide y, en consecuencia, lo que debe entenderse por afirmaciones del tipo explica el x% de la variabilidad total.

• A pesar de lo anterior, es necesario responder a la siguiente inte-rrogante: cuando la mayor raíz explica sólo 60% de la variabilidad total, ¿qué tan bien ordenadas quedan las unidades? La pregunta es relevante en vista del segundo objetivo específico planteado. La respuesta parece quedar dada en los siguientes términos: a medi-da que es mayor la diferencia entre los valores del índice para dos unidades cualesquiera, mayor es también la probabilidad de que estén bien ordenados. En otras palabras, el orden que se obtiene es imperfecto en vista de la incertidumbre ignorada por el proce-dimiento, casi 40% en el ejercicio para datos del 2005.

• La pregunta se torna menos relevante en el momento en que las unidades son clasificadas en cinco grupos (de muy alta, alta, me-dia, baja y muy baja marginación), a partir de los valores del ín-dice (primer componente principal). Esta clasificación es tam-bién imperfecta debido a que el índice en el que se basa ignora la naturaleza multidimensional del fenómeno y, en consecuencia, vuelve iguales a los desiguales (por ejemplo, al asignar igual valor a dos realidades enfrentadas por ubicarse en lados diametralmente opuestos del eje definido por el índice). Sin embargo, podría me-jorarse usando más de una de las componentes principales y algún método multivariado de clasificación sencillo, como k-medias.

iii. OCDE: manual para la construcción de indicadores compuestosCon el fin de reunir en una sola fuente experiencias sobre indicadores como los comentados en secciones anteriores, la Organización para la Cooperación y el Desarrollo Económicos (OCDE) elaboró la Guía para la construcción y uso de indi-cadores compuestos.10 Su objetivo es el de “…proveer una guía para la construcción y uso de indicadores compuestos, para hacedores de política, académicos, los me-dios y otros interesados…”; contiene lineamientos técnicos para ayudar a quienes construyen indicadores compuestos para mejorar la calidad de sus productos.

10 OCDE. Handbook on Constructing Composite Indicators: methodology and user guide. Paris, France, 2008, en: http://browse.oecdbookshop.org/oecd/pdfs/browseit/3008251E.PDF

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 10: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

31�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

El manual se concentra en indicadores que comparan y ordenan países de acuerdo con su desempeño en algún área. La información se organiza a lo largo de 10 pasos en la construcción de los índices:

Paso 1. Desarrollo de un marco teórico.Paso 2. Selección de variables. Paso 3. Análisis multivariado. Paso 4. Imputación de datos faltantes.Paso 5. Normalización de los datos.Paso 6. Ponderación y agregación. Paso 7. Robustez y sensitividad.Paso 8. Vínculos con otras variables.Paso 9. De regreso a los detalles.Paso 10. Presentación y diseminación.

Por considerarla de interés general, en la tabla 3 se reproducen los pros y contras de los indicadores compuestos (o sintéticos).

Por supuesto, los autores tienen claro que el trabajo técnico y metodo-lógico relacionado con la construcción de indicadores compuestos sigue en progreso y, en consecuencia, se hacen eco de algunas observaciones y co-mentarios recibidos, en la sección Qué sigue. Durante el proceso de revisión del manual se sugirió añadir o tratar con mayor detalle algunos temas. En particular:

• La dimensión temporal y las observaciones longitudinales.• Criterios para decidir cuándo un indicador es apropiado.• Métodos de normalización y su relación con cuestiones de me-

dición.• Relación entre la práctica en IC y la teoría de medición tradi-

cional desarrollada en psicometría y, en particular, la relación entreindicadores de causa y efecto, y las herramientas estadísti-cas sugeridas en el manual.

• Discusión más detallada y aplicación de modelos de ecuacio-nes estructurales y del análisis bayesiano para el desarrollo de indicadores compuestos.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 11: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

319

b. Comparaciones a lo largo del tiempo

i. Números índice

Problema básico de los números índice¿Cómo agregar información microeconómica que involucra posiblemente millones de precios y de cantidades para formar un conjunto mucho más pequeño de variables sobre precios y cantidades? En otras palabras, se busca formar una buena síntesis a partir de la reducción de la dimensión del proble-ma. Por supuesto, en la anterior afirmación se hace necesario definir qué es lo que se entiende por buena síntesis.

En la literatura es posible encontrar definiciones como la siguiente: un número índice es una medida estadística que permite estudiar las f luctuacio-nes o variaciones de una magnitud o de más de una en relación con el tiem-po o el espacio. Los índices más habituales son los que realizan las compa-

Pros Contras

Pueden resumir realidades complejas, por su carácter multidimensional, en apoyo a los tomadores de decisiones.

Pueden producir señales confusas si son deficientemente elaborados o mal interpretados.

Son más fáciles de interpretar que dilucidar una tendencia a partir de indicadores separados.

Pueden dar lugar a conclusiones políticas simplistas.

Se puede evaluar el progreso de los países a lo largo del tiempo en relación con asuntos complejos.

Pueden ser mal utilizados, por ejemplo, para apoyar políticas deseadas si su proceso de construcción no es transparente y/o adolece de principios estadísticos o conceptuales sólidos.

Reduce el tamaño visible de un conjunto de indicadores o incluye más información dentro de los límites existentes (de almacenamiento).

La selección de ponderaciones o de indicadores puede ser blanco de cuestionamientos políticos.

Ubica el tema del desempeño de los países en el centro de la arena política.

Pueden disfrazar deficiencias serias en algunas dimensiones e incrementar la dificultad para encontrar acciones correctivas.

Facilita la tarea de ordenar países en temas complejos en un ejercicio de comparación (benchmarking).

Pueden conducir a políticas inadecuadas si no se consideran algunas dimensiones de desempeño que no son fáciles de medir.

Facilita la comunicación con un público general (i.e., ciudadanos, medios, etc.) y promueve la rendición de cuentas.

Pros y contras de los indicadores compuestosTabla 3

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 12: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

320

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

raciones en el tiempo, por lo que, como veremos más adelante, los números índices son, en realidad, series temporales11 ; o como “…Un número índice es una cifra económica que permite la comparación de precios o cantidades con un valor estándar o base…12 ”.

Permiten a los economistas representar datos complejos en términos fá-

cilmente entendibles.

En Economía, por lo general, los números índice son series de tiempo que resumen la evolución de un grupo de variables relacionadas. Sin embar-go, en otros casos, los números índice pueden comparar áreas geográficas en un mismo momento en el tiempo.

El número índice mejor conocido es el índice de precios al consumidor (IPC), que mide los cambios en los precios al menudeo pagados por los con-sumidores. Los índices mejor conocidos para este fin son los de Paasche, de Laspeyres y el de Fisher.

El índice Paasche tiene la expresión:

siendo IPP el índice de precios; p0i y q0i , los precios y cantidades del artículo i en el periodo inicial o periodo base; y P1i y , q1i los mismos en el periodo posterior que se está analizando.

Se podría resumir de esta manera:

PreciosNuevos x CantidadesNuevas

PreciosViejos x CantidadesNuevas

11 http://es.wikipedia.org/wiki/N%C3%BAmero_%C3%ADndice12 http://en.wikipedia.org/wiki/Index_number

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 13: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

321

El índice Laspeyres se calcula mediante la fórmula siguiente:

Se podría resumir de este modo:

PreciosNuevos x CantidadesViejas

PreciosViejos x CantidadesViejas

El índice de Laspeyres sobrevalora la inflación, en tanto que el de Paas-che la subestima, ya que ninguno toma en cuenta el hecho de que los consu-midores reaccionan a los cambios en los precios, modificando las cantidades que compran.

El índice de Fisher se calcula como la media geométrica de IPP y IPL :

No hay garantía de que en éste se compensen tanto la sobre- como la sub- estimación de la inflación.

En resumen, ya que se busca medir el cambio de los precios a lo largo del tiempo, las cantidades, iguales para ambos periodos comparados, hacen las veces de coeficientes de los precios, a los que la fórmula permite variar:

Limitaciones técnicas

Aunque estos índices fueron introducidos para aportar una medición global de la evolución de los precios relativos, no hay forma de medir sus imperfec-ciones al compararlos con la realidad. En otras palabras, no hay un criterio de verosimilitud y, menos aún, de optimalidad.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 14: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

322

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

ii. Sistemas de indicadores cíclicos

Historia de los indicadores en Estados Unidos de América (EE.UU.) y en MéxicoLa historia del estudio de sistemas de indicadores cíclicos y del desarrollo de indicadores compuestos tiene sus orígenes más destacados hacia el primer cuarto del siglo pasado con el trabajo de Persons (1919,1) y el método de des-composición de series de tiempo en sus componentes de tendencia, de ciclo, de estacionalidad e irregular. A partir de dicho enfoque, Persons (1919,2) publicó el mismo año el trabajo The Index of General Business Conditions. Con un enfoque diferente, durante la década de los 30 del siglo pasado, W. C. Mi-tchell y A. F. Burns, en el National Bureau of Economic Research (NBER) de EE.UU., iniciaron un trabajo pionero que partió de la elaboración de una lista de indicadores del ciclo económico. Trabajo subsecuente fue llevado a cabo por Geoffrey H. Moore, junto con Charlotte Boschan, Gerhard Bry, Julius Shishkin y Victor Zarnowitz.

Durante finales de la década de los 50 y principios de los 60 se desarro-lló un intenso trabajo metodológico para la elaboración de indicadores com-puestos de indicadores de diversa naturaleza. En 1961 se inició la publicación de Business Cycle Developments (BCD) por el Buró del Censo, a cargo de J. Shiskin; en ella se resumen 80 series e índices de producción industrial para EE.UU. y sus siete socios comerciales más importantes. Dicho reporte fue rebautizado como Business Conditions Digest, en 1968.

A partir de 1972, la elaboración de los indicadores cíclicos quedó a cargo del Bureau of Economic Analysis (BEA). Hacia principios de 1994 nació la versión mexicana, siguiendo la metodología del BEA. En 1995, The Confe-rence Board (TCB) se hizo cargo oficialmente en EE.UU. de la elaboración y difusión de los índices atrasado, coincidente y adelantado. En el 2001, a través del Business Cycle Indicators Handbook13, TCB actualizó la metodología usada. En el 2008, la OCDE, que desarrolló su sistema de indicadores adelantados en la década de los 70, publicó OECD system of composite leading indicators, don-

13 http://www.conference-board.org/pdf_free/economics/bci/BCI-Handbook.pdf

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 15: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

323

de actualizó su metodología para la construcción de indicadores compuestos adelantados con base en la conceptualización de una serie de tiempo debida a Persons y en metodologías de descomposición más recientes.14

El propósito de contar con un sistema de indicadores cíclicos puede ser planteado como conocer anticipadamente las fases futuras del ciclo económico para actuar (o dejar de hacerlo) con oportunidad y minimizar los potenciales efectos adversos para personas y empresas.

El indicador adelantado ideal está constituido por una serie de tiempo cuyas crestas y valles tienen magnitudes similares, absolutas o porcentuales, y anteceden un número fijo de periodos a las crestas y valles de aquellas otras series que, en conjunto, resumen la evolución general del ciclo económico.

La figura 1 ilustra esta situación: la serie cuya gráfica se muestra con una línea delgada correspondería al indicador adelantado pues lo que le ocurre en términos de puntos de giro (también conocidos como puntos de corte), o de crestas o de valles, le ocurre también a la serie representada por la línea gruesa un número fijo de periodos posteriores.

14 OCDE. OECD system of composite leading indicators. París, 2008, en: http://www.oecd.org/d taoecd/26/39/41629509.pdf

Figura 1Indicador adelantado ideal

130

120

110

100

90

�0

�0

�01 1� 31 4� �1 �� 91 10� 121 13� 151 1�� 1�1 19�

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 16: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

324

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

Sistema de Indicadores Compuestos: Coincidente y Adelantado (SICCA) del INEGI15

En el sitio de INEGI en Internet16 se especifica que:

“…la metodología del sistema de indicadores compuestos: coincidente y adelantado se basa en la desarrollada originalmente por el National Bureau of Economic Research (NBER) y consiste en analizar un gran número de series mensuales (referentes a indicadores de los diversos mercados del país, como el productivo, financiero y laboral), para detectar las que tienen un buen comportamiento cíclico y clasificarlas según sus picos y valles (puntos de giro) en adelantadas, coincidentes o rezagadas en relación con las respec-tivas fechas de un ciclo de referencia, que representa la evolución de la acti-vidad económica.”

Por su parte, en la publicación INEGI (2009) se lee que:

“…el SICCA incorpora información de diversos mercados del país que permiten anticipar la posible trayectoria de la economía nacional.

“Se seleccionan las series que mejor se desempeñan de acuerdo con los siguientes criterios:

– Significancia económica: qué tan importante es la serie en el contexto de la actividad económica global.

– Confiable desde el punto de vista estadístico: qué tan re-presentativa es la serie del proceso o variable económica en cuestión, si tiene buena cobertura, etcétera.

– La consistencia de sus puntos de giro en adelantarse, coin-cidir o retrasarse en los ciclos históricos.

15 INEGI. Sistema de Indicadores Compuestos: Coincidente y Adelantado. Cifras a julio del 2009. Aguascalientes, México, en: http://www.inegi.org.mx/prod_serv/contenidos/espanol/bvinegi/productos/derivada/coyun-tura/sicca/sicca.pdf

16 http://www.inegi.org.mx/est/contenidos/espanol/proyectos/metadatos/derivada/imrc_42asp?s=est&c=1488.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 17: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

325

– Oportunidad: la disponibilidad de los datos una vez con-cluido el periodo de referencia y la frecuencia con que se reporta.

– Suavidad de las series: que las series no contengan mucha variabilidad.”

De esta manera, el indicador coincidente se compone a partir de in-formación del mercado de bienes y servicios, y del laboral, al estar basado en las siguientes cinco series:

• Producto interno bruto mensual. • Índice de volumen físico de la actividad industrial. • Índice de las ventas netas al por menor en los establecimien-

tos comerciales.• Número de asegurados permanentes del IMSS.• Tasa de ocupación parcial y desocupación.

Por su parte, el indicador adelantado se forma a partir de informa-ción financiera y del sector real. En particular, a partir de las siguientes seis series:

• Tipo de cambio real.• Índice de la Bolsa Mexicana de Valores.• Tasa de interés interbancaria de equilibrio.• Precio del petróleo crudo mexicano de exportación. • Número de horas trabajadas en la industria manufacturera.• Índice del volumen físico de la producción de la construcción.

El procedimiento para la actualización de los indicadores compuestos puede ser resumido como sigue:

• Paso 1. Cálculo de cambios porcentuales de un mes al si-guiente para cada una de las series componentes.

• Paso 2. Las series de cambios son ajustadas (ponderadas), tomando en cuenta su variabilidad, para hacer semejante la volatilidad de cada componente.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 18: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

32�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

• Paso 3. Con base en el nivel del índice para el mes previo, se usa la suma de las contribuciones individuales como cambio por-centual simétrico para calcular el nivel actualizado del índice.

Limitaciones técnicas

Criterio de optimalidadLos enfoques alternativos comentados en este trabajo no hacen explícito nin-gún criterio o función objetivo cuyo valor se busque optimizar. Por lo anterior, se hace imposible comparar el resultado de introducir cambios metodológicos o cuantitativos. Tal vez por ello se ha dejado de trabajar en la búsqueda de mejores ponderaciones, a manera de lo que intentaba el BEA a través de reuniones pe-riódicas de expertos que discutían largamente sobre los coeficientes que pon-derarían la participación de cada una de las series componentes para el siguien-te periodo. En este contexto, la solución actual de ponderar las componentes sólo con base en su variabilidad (o en la volatilidad de sus cambios porcentuales mensuales) para simplemente sumar (o promediar) uno u otro resultados sin ponderarlos de manera diferencial resulta de lo más sensato.

Lo anterior no resuelve, sin embargo, la determinación de la ganancia obtenida al modificar una componente o aún de reemplazar una componente por otra, como por ejemplo se sugiere en Moore (1990)17 al considerar la ac-tualización del índice para mejorar su desempeño. Son frecuentes las frases se parece a, se comporta igual que, etcétera.

III. Planteamiento general de la propuesta

En general, la metodología para el cálculo de indicadores cíclicos compuestos ha cambiado poco desde la década de los 30 del siglo pasado. Es así que Moore (1990, p. 11), al tocar el tema de las ponderaciones, señala que “…sería deseable la inclusión de resultados de los procedimientos modernos para el análisis de series de tiempo (en el plan de ponderaciones)…”; por ejemplo y sin ir muy lejos,

17 Moore, G. H. Leading Indicators for the 1990s. Illinois, U.S.A., Dow Jones-Irwin, Homewood, 1990.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 19: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

32�

en TCB (2005) el término correlación18 se usa sólo cuatro veces, dos en un par de gráficas y dos más en el texto que se refiere a las mismas. La presente sección busca atender la inquietud expresada en la cita anterior de Moore (1990).

a. Objetivo

Aprovechando la frecuente producción de información económica y los mo-delos para la evolución en el tiempo de los fenómenos cubiertos por ella, proponer una metodología para el cálculo de un indicador compuesto para el estudio del ciclo económico, basado en la determinación de ponderaciones óptimas, en el sentido de un criterio explícito.

b. Forma de la solución

es decir, eliminando la restricción: cij=0, j≠0, con lo que se espera que mejore el desempeño del indicador. Vale la pena destacar que la anterior forma de la solución buscada no excluye su aplicación a transformaciones de las series componentes, como podrían ser sus cambios porcentuales mensuales.

IV. Método incremental para llegar a la solución

A nuestro juicio, el procedimiento queda mejor descrito cuando, en un prin-cipio, se aplica una versión limitada a los datos en cuestión, comentándose los resultados y sus limitaciones. Se procede, entonces, a discutir su genera-

18 “Moreover, the months at which the two series reach cyclical peaks and troughs are identical (…) month-to-month movements in the unadjusted composite indexes are more pronounced, the correlations between the Coincident Index and each version of the Leading Index remain virtually identical. Most telling, as you look at this chart, nowhere can you find a time across these four decades of business cycle history where your forecast would differ. Chart 8 makes the same comparison for the Lagging Index (…) the peak and trough dates are identical, as well as the correlations between the Coincident Index and the ratio.”

La tercera y última mención se da en otro contexto: “Historical Notes: The CPI system was initiated by the Federal government (…) The Conference Board developed a separate cost-of-living index. The co-rrelation between the BLS’s and The Conference Board’s CPI was very high.”

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 20: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

32�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

lización para tomar en cuenta una estructura de correlación diferente y más rica desde dos perspectivas alternativas y complementarias: el dominio del tiempo y el de las frecuencias.

En el segundo caso, se logra plantear el problema de manera completa, pero se establece la dificultad matemática para encontrar su solución. A tra-vés del último se muestra la existencia de una ruta indirecta que permite una aproximación satisfactoria a la solución del problema planteado. Ya que se bus-ca destacar los cambios ocurridos por la realidad que se observa a través de una serie de indicadores, se plantea hacer uso de la técnica de componentes princi-pales, así como de su adecuación al contexto de series de tiempo multivariadas. En consecuencia, la descripción del método tendrá lugar en forma incremen-tal: componentes principales (1) en presencia de observaciones multivariadas independientes y con iguales primeros y segundos momentos; (2) en presencia de series de tiempo multivariadas donde la independencia entre observaciones no puede más ser sostenida; y (3) en presencia de las transformadas de Fourier de las observaciones originales que respeta, pues permite también su cálculo, la nueva estructura de dependencia entre las observaciones.

a. Componentes principales en presencia de observaciones independientes

El problema de las componentes principales puede ser planteado como sigue: Sea X un vector de variables aleatorias con matriz de covarianzas ∑. Se busca determinar al indicador que haga más evidente la heterogeneidad entre in-dividuos de la población. En otras palabras, y en vista del supuesto i.i.d., se busca el vector columna que es solución de:

La solución está dada por el vector característico de ∑ asociado con el mayor valor característico. El valor máximo que la varianza del índice puede alcanzar coincide con el del máximo valor característico, ya que:

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 21: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

329

Además es posible resolver n-1 problemas asociados planteados como:

Se buscan los vectores columna , i=2,...,n, que son solución de:

Para cada problema, la solución es el vector asociado con el i-ésimo mayor valor característico de ∑. La varianza del indicador correspondiente coincide con el valor de éste.

Instrumentación

• A partir de k≥n realizaciones independientes de X ;• Se obtiene que estima a la matriz ;• Se calcula A , la matriz ortonormal cuyas columnas son los vectores

característicos o propios de ;• Se calculan los correspondientes valores característicos.

Ya que , se tiene que ; es decir, que la suma de las varianzas de las entradas coincide con la suma de las varianzas de las componentes principales.

Ejemplo numérico

Haciendo uso del paquete estadístico Minitab, lo anterior se aplicó a la in-formación correspondiente al periodo enero de 1980 a junio del 2009, para 72 series de indicadores obtenidas de la siguiente manera:

• Uniendo segmentos de series históricas semejantes provenientes de proyectos estadísticos que han cambiado metodológicamente, pero poco o nada en lo conceptual;

• cuyos posibles patrones estacionales han sido atenuados con el fín de evitar la presencia de correlaciones espurias (ver anexo estadístico);

• con igual año base, con fínes de estandarización; y

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 22: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

330

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

• calculados a partir de valores deflactados usando un índice de pre-cios apropiado, cuando son expresados en alguna moneda.

• Temas:

– Producción industrial.– Manufacturas.– Empleo.– Precios e inflación.– Exportaciones e importaciones. – Finanzas públicas.– Actividad bancaria y bursátil.– Algunos indicadores de Estados Unidos de América.

La tabla 4 y la correspondiente figura 2 resumen el resultado de este ejercicio. A partir de ellas es posible alcanzar algunas conclusiones:

• Salvo por el hecho de que este ejercicio numérico se basa sólo en la ma-

triz de covarianzas contemporáneas (por lo que la suma a explicar en este caso asciende a 519 369 en lugar de 72, que es el número de com-ponentes), el procedimiento usado es el mismo en el que CONAPO basa el desarrollo de su índice de marginación. En consecuencia, es de llamar la atención que la mayor raíz característica alcance un valor equivalente a 75.90% de la suma total de varianzas; como se recordará, una cifra ligeramente superior a 60% fue considerada adecuada en el ejercicio para medir la marginación urbana en el 2005. En consecuen-cia, este resultado debe ser considerado como muy satisfactorio.

• De la misma manera, el resultado hace evidente la muy importan-te redundancia entre los valores contemporáneos de las series usadas cuando se las juzga a través de las correlaciones que todas ellas exhiben. Tal redundancia podría llevarnos a pensar que es escaso el margen de mejora, en términos del criterio de optimalidad elegido, en la cons-trucción de nuevos indicadores compuestos.

• Sin embargo, a pesar de la referida redundancia, el 100% de la suma de varianzas no se alcanza después de considerar hasta 24 componentes principales, hasta un lugar decimal.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 23: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

331

(∑=519 3�9)

Valor

propio 394 3�5 �9 �25 24 905 5 030 3 432 3 343

Proporción �5.90% 15.40% 4.�0% 1.00% 0.�0% 0.�0%

Cumulativo �5.90% 91.30% 9�.10% 9�.10% 9�.�0% 9�.40%

Valor

propio 2 00� 1 1�3 913 �02 5�4 559

Proporción 0.40% 0.20% 0.20% 0.20% 0.10% 0.10%

Cumulativo 9�.�0% 99.00% 99.20% 99.30% 99.40% 99.50%

Valor

propio 425 2�� 2�2 222 1�� 15�

Proporción 0.10% 0.10% 0.10% 0.00% 0.00% 0.00%

Cumulativo 99.�0% 99.�0% 99.�0% 99.�0% 99.�0% 99.�0%

Valor

propio 122 105 93 �1 �3 �1

Proporción 0.00% 0.00% 0.00% 0.00% 0.00% 0.00%

Cumulativo 99.90% 99.90% 99.90% 99.90% 99.90% 99.90%

Valores propios de la matriz de covarianzasTabla 4

Figura 2Valores característicos para �2 series

400 000

300 000

200 000

100 000

0

10 20 30 40 50 �0 �0

Número de la componente principal

Eig

enva

lor

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 24: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

332

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

• La figura 3 muestra la gráfica de las primeras dos compo-nentes principales, así como la del indicador coincidente del SICCA, que ha sido re-escalado para fines de comparación. Las gráficas para las dos primeras muestran una importante semejanza a lo largo de la primera parte del periodo de observación, misma que implicaría un valor alto para la correlación contemporánea. Por ello llama, asimismo, la atención el valor de 0.005 alcanzado por la correlación contemporánea entre las dos primeras componentes principales.

• Sin embargo, ello parece haber sido conseguido mediante la parti-ción del periodo de observación en dos intervalos: desde enero de 1980 hasta junio de 1996, en el que el valor de la correlación alcanza 0.931; y otro, desde julio de 1996 hasta junio de 2009, en el que el valor del coeficiente de correlación es igual a -0.880 (ver figura 4).

• Finalmente, cabe señalar que por la manera en que fue construida, la anterior solución aún satisface por lo que no repre-senta la solución óptima que buscamos.

160140120100

80604020

0

ene-

80en

e-81

ene-

82en

e-83

ene-

84en

e-85

ene-

86en

e-87

ene-

88en

e-89

ene-

90en

e-91

ene-

92en

e-93

ene-

94en

e-95

ene-

96en

e-97

ene-

98en

e-99

ene-

00en

e-01

ene-

02en

e-03

ene-

04en

e-05

ene-

06en

e-07

ene-

08en

e-09

PC1_HD PC2_HD Coincidente (INEGI)

Figura 3Primeras dos componentes principales bajo i.i.d.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 25: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

333

a. Componentes principales en el dominio del tiempo

En general, una serie de tiempo no se concibe como una sucesión de variables aleatorias independientes. Por ejemplo, para elaborar un pronóstico a par-tir de datos ordenados en el tiempo, no parece ser una buena idea empezar desordenándolos.

Lo anterior se debe a que sus valores sucesivos exhiben una asociación o correlación: valores grandes son, en general, seguidos por valores igualmente grandes o mayores, y viceversa. Se dice que la serie está correlacionada con-sigo misma al estarlo con su propio pasado y futuro o, lo que es lo mismo, autocorrelacionada.

En presencia de dos o más series de tiempo que evolucionan conjun-tamente en el tiempo, es posible ver que, además de la asociación consigo misma, existe una correlación de los valores de una de las series con los con-temporáneos, los pasados y los futuros de las otras series.

Figura 4Correlaciones cruzadas entre las dos primeras

componentes principales

1.2

1

0.8

0.6

0.4

0.20

-0.2

-0.4

-0.6

-0.8

-1

-28 -25 -22 -19 -16 -13 -7-10 -4 -1 2 5 8 11 1714 20 23 26

1980-2009 Hasta 06/96 Desde 07/96

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 26: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

334

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

La figura 5 ilustra, mediante flechas, este hecho. Por una parte, a lo largo del eje horizontal del tiempo, se tienen las correlaciones de los valores de la serie con su pasado y su futuro. Por otro lado, cabe esperar que valores contemporáneos de series diferentes exhiban algún grado de asociación; de ahí las f lechas verticales. Finalmente, y ya que las influencias entre series di-ferentes podrían presentarse con algún tipo de rezago, se incluyen también flechas diagonales que representan este hecho.

Ilustración de correlaciones entre diferentes series a lo largo del tiempo

Una expresión general para representar estas influencias queda dada por:

Un supuesto simplificador es el de que los anteriores momentos no va-rían con el paso del tiempo:

Los segundos momentos del vector de series de tiempo pueden ser resu-midos en matrices de covarianzas contemporáneas y a rezagos de un periodo, de dos periodos, etc.; es decir:

Figura 5

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 27: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

335

Cabe entonces preguntar, ¿cómo debe replantearse el problema del análi-sis de componentes principales? Nótese que el método de componentes princi-pales bajo i.i.d. sólo tomó en cuenta las correlaciones contemporáneas; es decir, ignoró las correlaciones de las series con su propio pasado y futuro, así como con los valores pasados, contemporáneos y futuros de las series restantes.

Propuesta: encontrar n series índices, combinaciones lineales de valores presentes, pasados y futuros de las series originales, que están correlaciona-das con sus valores pasados y futuros, pero cuyas correlaciones cruzadas son cero; es decir, un nuevo conjunto de índices { } tales que cada una de las series está correlacionada sólo consigo misma, tanto con-temporáneamente como a lo largo del tiempo. La situación se ilustra en la figura 6 que debe ser contrastada con la situación ilustrada por la figura 5.

Ilustración del comportamiento de los segundos momentos entre las series de componentes principales a lo largo del tiempo

Lo anterior requiere que todas y cada una de las matrices de covarian-zas de los índices resultantes, i. e., sean diagonales y, en consecuencia, simultáneamente diagonalizadas por la transformación que se aplique. Desafortunadamente, el problema sólo parece tener solución bajo condiciones muy estrictas que es difícil encontrar en la práctica. En otras palabras, aun cuando el planteamiento del problema es el correcto, no se dis-pone de las herramientas que permitan encontrar una solución satisfactoria. Por esta razón, será necesario recurrir a lo que parece ser una buena aproxi-mación en la mayoría de los casos.

Figura �

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 28: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

33�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

b. Componentes principales en el dominio de las frecuencias

Representación espectral

Sea Xt un vector de procesos estacionarios; existe un proceso estocástico v(λ), -π ≤ λ ≤ π , cuyos incrementos son independientes, tal que:

es decir, la llamada representación espectral del proceso lo expresa como una agregación de funciones sinoidales, y en consecuencia periódicas, con coeficientes estocásticos. Las matrices ∑ pueden ser tam-bién expresadas en términos de los segundos momentos de , según la expresión:

Las expresiones anteriores sugieren que en lugar de intentar directa-mente la diagonalización simultánea de varias matrices de segundos momen-tos, es posible seguir un camino indirecto que nos conducirá a una buena aproximación:

• Para cada una de las series componentes Xt, calcule la trans-formada de Fourier en las frecuencias armónicas.

• Usando los valores de las transformadas , calcule los periodogramas simples y cruzados.

• Si lo desea, para obtener un estimador consistente de las densi-dades espectrales simples y cruzadas, suavice con alguna ven-tana los periodogramas.

• Para cada una de las frecuencias armónicas, forme las matrices hermitianas19 , j=1, +1, de densidades espectrales.

19 Una matriz hermitiana es el equivalente complejo de una matriz simétrica: se debe tener que la matriz cuyas entradas toman valores complejos resultado de conjugar sus entradas y de transponerla, es igual a la matriz original.

∑ π

πλ

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 29: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

33�

• Encuentre los vectores característicos de cada una de las ma-trices anteriores y forme las matrices cu-yas columnas los contienen.

• Calcule los vectores de transformadas cuyas entradas serán no correlaciona-

das ya que sus matrices de covarianzas serán diagonales.

• Aplique la transformada inversa de Fourier a los vectores de transformadas para obtener las series de índices compuestos cuyas correlaciones cruzadas serán pequeñas, lo que resulta de la siguiente expresión cuando las matrices espectrales son to-das diagonales:

Esquemáticamente, los pasos anteriores pueden ser resumidos como sigue:

La función matricial C(λ) tiene una buena aproximación como un filtro lineal de la siguiente manera:

Las matrices C de coeficientes en esta expresión contienen los coeficien-tes a partir de los cuales se calcularán el índice deseado y otros más, hasta un total de n, de la siguiente forma:

λπΣπ

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 30: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

33�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

V. Aplicación

• Periodograma suavizado. En general, el periodograma de una serie resulta ser un estimador deficiente del valor de la densidad espectral para cada una de las frecuencias de interés. Es por ello que se han planteado diversas formas de mejorar el resultado de la estimación. La más socorrida y que se presta para su aplicación también a las den-sidades espectrales cruzadas consiste en promediar valores sucesivos del periodograma simple o cruzado a través de lo que se denomina una ventana espectral, que hace las veces del sintonizador en un apa-rato de radio, para una frecuencia determinada. El resultado es lo que se conoce como un periodograma suavizado.

• Mediante la aplicación de un procedimiento tal, se consigue que las matrices de densidades espectrales estimadas alcancen un rango ma-yor a 1; el periodograma no suavizado adolece de tal deficiencia.

• A partir de una serie de rutinas desarrolladas ex profeso se aplicó el procedimiento descrito párrafos arriba a las mismas 72 series usadas para la aplicación de componentes principales. Los resultados que-dan resumidos en la tabla 5, así como en las figuras 7 a 10.

• Lo primero que salta a la vista es que el valor de la varianza de la primera componente principal equivale a 93.49% de la suma de las va-rianzas de todas las series. Dicho valor junto con los correspondientes a la segunda y a la tercera componentes principales suman 100% de la mencionada suma.

• En otras palabras, la reducción de dimensionalidad, motivación im-portante de la técnica de componentes principales, encuentra uno de sus ejemplos más claros en este caso de gran redundancia entre las series usadas, en el que se pasa de 72 indicadores iniciales a sólo tres componentes.

(∑=519 3�9)Varianzas 4�5 53� 31 2�� 2 54� 0.00 0.00 0.00

Proporción 93.49% �.02% 0.49% 0.00% 0.00% 0.00%

Cumulativo 93.49% 99.51% 100.00% 100.00% 100.00% 100.00%

Tabla 5Varianzas de las componentes principales

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 31: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

339

Figura �Varianzas de los �2 componentes principales

(espectro suavizado)

Figura �Primeras dos componentes principales

600 000

500 000

400 000

300 000

200 000

100 000

01 11 21 31 41 51 61 71

4000350030002500200015001000

5000

mar

-�0

ene-

�2

ene-

�4

ene-

��

ene-

��

ene-

90

ene-

92

ene-

94

ene-

9�

ene-

9�

ene-

00

ene-

02

ene-

04

e ne-

0�

ene-

0�

1a CP 2a CP

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 32: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

340

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

• A partir de la figura 8 ya no es posible distinguir periodos de gran coincidencia entre ambas componentes. En todo caso, la mayor co-incidencia entre las dos series se encuentra en el hecho de que ambas exhiben una caída desde enero del 2008 y hasta junio del 2009.

• Por lo que toca a las correlaciones cruzadas entre ambas componen-tes, y no sólo a la contemporánea, se tiene que el valor absoluto de la más grande no alcanza 0.2, lo que en el caso i. i. d. se acercaba a 0.4. Por su parte, la correlación contemporánea es igual a -0.037, cuyo valor absoluto es mayor que la del caso i.i.d. En otras palabras, las matrices de covarianzas a rezagos relativamente grandes no se alejan mucho de la diagonalidad, el ideal planteado.

• Finalmente, la primera componente muestra algunas similitudes con el indicador coincidente del SICCA, pero no un acuerdo to-tal. De hecho, es posible apreciar algunas crestas o valles presentes en una, pero ausentes en la otra. Por supuesto, no era de esperar total coincidencia, pues entre las 72 series hay algunas que serían clasificadas como atrasadas, otras que lo serían como coincidentes y aún otras, como adelantadas. En otras palabras, no sería de es-perar que el indicador obtenido fuese clasificado en alguna de las anteriores clases.

Figura 9

Correlaciones cruzadas entre las primeras dos componentesprincipales y su comparación con el caso i.i.d.

10.80.60.40.2

0-0.2-0.4-0.6-0.8

-1

-28 -21 -14 -7 0

CS IID

7 14 21 28

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 33: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

341

Periodograma sin suavizar

El propósito de la propuesta no consiste en encontrar estimadores adecua-dos de las cantidades espectrales. Más aún, ni siquiera queda claro que lo requiera; en particular, cuando los conjuntos de series a los que será aplicada muestran en general alta redundancia.

Por otro lado, en ausencia de suavizamiento, todas las matrices de den-sidades espectrales tendrán rango deficiente; de hecho, su rango será siem-pre igual a uno. De forma consecuente, siempre que los sistemas hayan sido adecuadamente programados, se obtendrá sólo una componente principal y ésta explicará 100% de la suma de las varianzas de las series originales.

No queda claro que esta sea una propiedad deseable ni que no lo sea. Sin embargo, la función criterio alcanza su valor máximo bajo estas circunstan-cias. Por esta razón, mostramos enseguida el resultado de aplicar la metodo-logía descrita al mismo conjunto de series para este caso.

Tanto la tabla 6 como la figura 11 hacen evidente lo que ya se había señalado en cuanto al número de componentes principales que es razonable esperar bajo las circunstancias.

Figura 10Primer componente principal

140120100

�0�04020

0

1a CP Promedio móvil Coincidente resc. (INEGI)

ene-

�0

ene-

�2

ene-

�4

ene-

��

ene-

��

ene-

90

ene-

92

ene-

94

e ne-

9�

ene-

9�

ene-

00

ene-

02

ene-

04

e ne-

0�

ene-

0�

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 34: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

342

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

• Por su parte, la comparación entre dicha componente principal y el indicador coincidente del SICCA muestra aún menos coincidencias.

(∑=519 3�9)

Varianzas 519 3�9 1.��E-24 9.92E-2� 1.1�E-25 3.9�E-2� 3.24E-25

Proporción 100.00% 0.00% 0.00% 0.00% 0.00% 0.00%

Cumulativo 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%

Tabla �

Varianzas de las componentes principales(espectro sin suavizar)

Figura 11Varianzas de �2 componentes principales

(espectro sin suavizar)

Figura 12 Primera (y única) componente principal

600 000

500 000

400 000

300 000

200 000

100 000

01 11 21 31 41 51 61 71

120

100

�0

�0

40

20

0

ene-

�0

ene-

�2

ene-

�4

ene-

��

ene-

��

ene-

90

ene-

92

ene-

94

ene-

9�

ene-

9�

ene-

00

ene-

02

ene-

04

ene-

0�

ene-

0�

1aCP Promedio móvil Coincidente resc. (INEGI)

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 35: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

343

Figura 13Indicadores coincidentes, 19 en total

Limitaciones técnicas

• Como ya se mencionó, ninguno de los anteriores resulta en un in-dicador compuesto coincidente ya que en su cálculo intervienen indicadores simples adelantados, coincidentes y rezagados respecto al ciclo de producción. Si se desea, puede repetirse el procedimiento usando sólo indicadores coincidentes. Un ejemplo, basado en el perio-dograma sin suavizar, se muestra en las figuras 13, 14 y 15. En pri-mer lugar se muestran 19 series consideradas coincidentes: el índice del volumen físico de la actividad industrial (IVFAI) y 18 más que muestran una muy alta correlación contemporánea con él.

Figura 14 Primera componente principal coincidente

a partir de periodograma suavizado

400350300250200150100

500

ene-�0ene-�2

ene-�4ene-��

ene-��ene-90

ene-92ene-94

ene-9�ene-9�

ene-00

ene-02

ene-04

ene-0�

ene-0�

IVFAI

impor

otramanf

maqnac

manufac

prodmet

exportot

const

prodhot

prodht

paimpedi

valventas

minomet

expornp

minero

bolsa

prodper

quimpet

inver

ene-

�0

ene-

�2

ene-

�4

ene-

��

ene-

��

ene-

90

ene-

92

ene-

94

e ne-

9�

ene-

9�

ene-

00

ene-

02

ene-

04

ene-

0�

ene-

0�

200

150

100

50

0

-50

Promedio móvil Coincidente resc. (INEGI)

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 36: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

344

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

• El resultado obtenido a partir del periodograma sin suavizar es óptimo ya que explica 100% de la suma de varianzas de los indi-cadores componentes. También, es único en razón de que todas las matrices de periodogramas simples y cruzados tienen, en este caso, siempre rango igual a 1; el suavizamiento se usa para mejorar las propiedades en la estimación de densidades espectrales, lo que no es nuestro propósito en este trabajo.

VI. Conclusiones

El ciclo económico, como quiera que se le defina, tiene manifestaciones di-versas a través de sus consecuencias sobre múltiples fenómenos de carácter económico y social. Su caracterización mediante un conjunto poco numeroso de índices plantea aún retos que exigen la incorporación de nuevas herra-mientas analíticas o la adaptación de las existentes.

En este primer acercamiento se ha pretendido ilustrar, con ejemplos, li-mitaciones y deficiencias a las que conducen algunas metodologías en uso.

Figura 15 Primera componente principal coincidente

a partir de periodograma sin suavizar

1�01�0140120100

�0�0

Promedio móvil Coincidente resc. (INEGI)

4020

0-20

ene-

�0

ene-

�2

ene-

�4

ene-

��

ene-

��

ene-

90

ene-

92

ene-

94

e ne-

9�

ene-

9�

ene-

00

ene-

02

ene-

04

ene-

0�

ene-

0�

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 37: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

345

Asimismo, mostrar la existencia de alternativas de mejora que, aunque no resulten en desarrollos sencillos, sugieren formas alternativas de proceder:

• Definir el criterio a optimizar.• Aplicarlo al problema.• Encontrar la solución adecuada.

En general, una conclusión importante es que no sólo hay que fortale-cer la producción de información cruda sino, también, el desarrollo de he-rramientas analíticas que potencien el análisis de la información que ya se produce. Dichos desarrollos deben tener como objetivo el transformar la in-formación en conocimiento.

Cuando el problema es multivariado se requiere, por supuesto, del uso de técnicas multivariadas lo que no quiere decir la repetida aplicación de téc-nicas uni- o bi-variadas a todas y cada una de las parejas de datos o, en este caso, de series. Más aún, dichas técnicas multivariadas han sido, en general, desarrolladas para uso con observaciones independientes, por lo cual habrá que adaptarlas a otras estructuras de datos: evolución del ciclo económico a lo largo del tiempo; o usar lo desarrollado para esta estructura aunque haya que seleccionar entre opciones diversas: excesivo suavizamiento del periodo-grama lleva de vuelta al caso i.i.d.; o desarrollar nuevos métodos.

Anexo estadístico

• Cada una de las siguientes 72 series fue expresada como un índice con un año base común. Para ello:

– Cuando en el periodo 1980-2009 tuvo lugar un ajuste del pro-yecto que da lugar a la serie (cambio metodológico: empleo, cambio de año base: precios, etc.), fue necesario unir los tra-mos de cada serie.

– Las expresadas en moneda fueron previamente deflactadas.– Las influencias estacionales fueron reducidas.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 38: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

34�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

Series usadas con mnemónico:

1. Producto interno bruto Trimestral: PIB2. Formación bruta de capital fijo:

a. Total: inver b. Maquinaria y equipo nacional: maqnac c. Maquinaria y equipo importado: maqimp

3. Índice de volumen físico de la actividad industrial:a. Total: IVFAIb. Minería: minero c. Electricidad, agua y suministro de gas por ductos al consumi-

dor final: prodelec d. Construcción: const

4. Tasa de desocupación abierta: TDA5. Tasa neta de participación: parti 6. Base monetaria: basemon 7. Multiplicador: multi 8. Oferta monetaria:

a. M1b. M2c. M4

9. Reserva internacional: reserva10. Índice de volumen físico de la producción manufacturera

a. Total: manufac b. Alimentos, bebidas y tabaco: albetab c. Productos textiles y de vestir: textvest d. Industria de la madera: madyprod e. Industria del papel y conexas: paimpedi f. Químicos y productos derivados del petróleo y del carbón:

quimpet g. Productos a base de minerales no metálicos: minomet h. Industrias metálicas básicas: metbas i. Productos metálicos: prodmet j. Otras industrias manufactureras: otramanf

11. Personal ocupado: a. Total: permanuf

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 39: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

34�

b. Obreros: obreroc. Empleados: emple

12. Horas trabajadas:a. Total: hhombre b. Obrero: hobrero c. Empleado: hemple

13. Remuneraciones:a. Totales: remunet b. Salarios: salart c. Sueldos: sueldt d. Prestaciones sociales: prestt

14. Valor de producción de los productos elaborados: valprod 15. Valor de ventas de los productos elaborados: valventas16. Remuneraciones medias reales por persona ocupada:

a. Total: remmxper b. Salarios: salarm c. Sueldos: sueldm d. Prestaciones sociales: prestm

17. Índice de remuneraciones medias reales por hora hombre trabaja- da: remmxhora

18. Productividad:a. Por hora trabajada: prodht b. Por hora obrero trabajada: prodhot c. Por persona: prodper

19. Número promedio de horas obrero trabajadas: horasxo 20. Tasa Libor (3 meses): libor21. Tasa Prime: prime22. Exportaciones: exportot 23. Exportaciones petroleras: exporp 24. Costo laboral unitario: costolu 25. Costo porcentual promedio de captación en moneda nacional

(CPP): cpp 26. Índice de precios y cotizaciones nominal de la Bolsa Mexicana de

Valores: bolsa27. Índice nacional de precios al consumidor (mensual): inpc 28. Índice nacional de precios productor: inpp

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 40: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

34�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

29. Índice del costo de edificación de la vivienda de interés social (INCEVIS): icedif

30. Tasa anual de inflación (mensual): infla31. Finanzas públicas:

a. Gasto total del gobierno federal: gastob. Ingreso total del gobierno federal: ingrec. Ingreso tributario: ingtri d. Impuesto sobre la renta: impren e. Déficit directo: defi

32. Estados Unidos de América:a. Índices de la producción industrial: usaivf b. Tasas de desocupación: usades c. Índice de precios al consumidor: usaipc d. Oferta monetaria M2: usam2

33. Exportaciones no petroleras: expornp 34. Importaciones: impor 35. Saldo FOB: balcom 36. Saldo de la cuenta corriente: saldocc 37. Precio promedio del barril de petróleo mexicano: petroleo 38. Dólar interbancario (venta): ticam

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 41: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

Integración y presentación de estadística

sectorial con apoyo de tecnologías de información y comunicación

Jael Pérez Sánchez*

y Julio Gaspar Rivera**

A través de la construcción del Sistema de Integración de Información Estadística Estatal y Municipal (SIIEEM), se propone una reingeniería a los procesos actuales de recopilación, integración y presentación de la estadística sectorial con apoyo

de las tecnologías de información y comunicación (TIC)1 como un medio para cumplir lo que la Ley del Sistema Nacional de

Información Estadística y Geográfica (LSNIEG) demanda al Instituto Nacional de Estadística y

Geografía (INEGI) a este respecto.

* Jefe de Departamento de la Muestra Censal en la Dirección General de Estadísticas Sociodemográficas del INEGI. Teléfono: (449) 910 5300, ext. 5889; correo electrónico: [email protected]

** Profesional Ejecutivo de Servicios Especializados del Departamento de Estadística Derivada en la Dirección Regional Centro Norte del INEGI. Teléfono: (444) 834 1836; correo electrónico: [email protected]

1 Son las herramientas computacionales e informáticas que procesan, almacenan, sintetizan, recuperan y presentan información representada de la forma más va-riada. www.dcyc.ipn.mx/dcyc/quesonlastics.aspx

Palabras clave: TIC, estadística sectorial, LSNIEG, integración de información estadística.

349 INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 42: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

350

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

Introducción

Las tecnologías de información y comuni-cación son, hoy en día, el ancla en que se soportan muchas mejoras de los procesos de comunicación de la información; basan su beneficio en el aprovechamiento de las infraestructuras disponibles de comunica-ción y en la adecuada definición de los ca-nales y procesos de validación, transmisión y resguardo de información.

En la actualidad, en los proyectos de integración de estadística sectorial, regio-nal, estatal y municipal es posible identifi-car una veta importante de múltiples áreas de oportunidad para la inclusión de las TIC como elemento de mejora en los requerimientos de recopilación, integración, revisión y presentación de información estadística.

Esta visión de atender las áreas de oportunidad a través de las TIC se ha concebido en un entorno global, soportándolo en un nuevo proceso de-nominado Sistema de Integración de Información Estadística Estatal y Mu-nicipal (SIIEEM).

Los proyectos de integración de estadística sectorial, estatal y muni-cipal mantienen procesos de integración, revisión y conservación de datos donde la tecnología ha venido integrándose poco a poco y de una manera no planeada, dando soluciones parciales que satisfacen, igualmente, necesida-des específicas que, en la integración de todo el proceso, se encuentran con grandes obstáculos derivados, precisamente, de la interacción de diferentes áreas, las cuales disponen tanto de variadas apreciaciones sobre la aplicación de la tecnología como de infraestructuras y soluciones informáticas para sus necesidades particulares; así, el esfuerzo de aplicación tecnológica ha cons-truido una paradoja dentro de este proyecto: a más implementaciones infor-máticas, más esfuerzo humano y menos oportunidad, para obtener el mismo producto.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 43: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

351

El proceso señalado tiene, de acuerdo con esta perspectiva, impor-tantes áreas de oportunidad:

• Enorme cantidad de grupos residuales y pérdida de in-formación. Por ejemplo, en las entidades federativas con un gran número de municipios (como Oaxaca, con más de 500), sólo se presenta la información de los más importan-tes para la variable en estudio y el resto se agrupa en un residual.

• Corte en series históricas. No existe un control para asegurar la continuidad en la recopilación de todas las variables.

• Ausencia de metadatos. Esto provoca errores en la recopi-lación y presentación de la información.

• No existe desglose municipal de todas las variables. Aun cuando se señale la disponibilidad de la información muni-cipal, ésta no se integra por no requerirlo el formato tipo.

• Productos limitados. Documento impreso con informa-ción para un solo año y entidad federativa; la versión di-gital se tiene en el portal institucional una vez impreso el documento.

• Largo el tiempo promedio del ciclo del proyecto. La reco-pilación inicia en febrero de cada año integrando informa-ción del ciclo anterior; se publica a partir de julio y hasta enero del siguiente año.

• Producto muy costoso. Se invierte una gran cantidad de recursos humanos en las diferentes etapas de integración, revisión y publicación de la información, redundando per-sonal con actividades de revisión, lo que no agrega valor y sí eleva el costo del producto.

Por ello, se plantea una propuesta de reingeniería a todo el proceso de los proyectos de integración de estadística sectorial, estatal y munici-pal, la cual contempla las nuevas necesidades (hoy no atendidas del todo) que reclama la condición del INEGI de órgano autónomo regido por la LSNIEG; de este reclamo se rescata la necesidad inmediata de atender la integración, validación y conservación de estadística de relevancia,

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 44: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

352

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

procurando incurrir en el menor de los gastos a las unidades del Estado que participan como informantes para estos proyectos sectoriales.

Atender estas necesidades manifiestas en la LSNIEG lleva a revisar, dentro de las TIC, los elementos adecuados para cumplir, de una manera eficaz y eficiente, los nuevos requerimientos; dentro de esta revisión se ha encontrado una tecnología de información que contempla desde una inte-gración de información automatizada hasta su validación y conservación en repositorios de datos, lo que permite consolidar datos en información y así promover, a través de su consulta, la consolidación del conocimiento; el mo-delo de tecnología de información que se considera el más adecuado es el Business Intelligence.

Su adopción ha llevado a plasmarlo dentro de un nuevo proceso de tra-bajo basado en la implementación del SIIEEM, que permita en forma mo-dular:

• Recopilar e integrar de manera automática los datos desde los repositorios donde reside la información origen.

• Validar y contextualizar la información a través de un repo-sitorio de datos-metadatos y rutinas de validación ya docu-mentadas por medio de notas metodológicas de los proyectos actuales de integración de estadísticas regionales.

• Conservar la información en repositorios de datos sectoriales.• Disponer de series de datos de estadísticas sectoriales en bases

de datos que permitan su análisis histórico y comparabilidad conceptual de una misma variable entre diferentes entidades y municipios, lo cual se logra con la implementación del sis-tema de consulta denominado en esta propuesta como Banco de Información Sectorial (BIS).2

Planteadas tanto las necesidades detectadas como las soluciones, ense-guida se presenta cada elemento ya señalado.

2 Con esta sección se atenderá una necesidad manifiesta por los usuarios y por la misma dinámica.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 45: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

353

¿Qué es Business Intelligence?3

Es una tecnología de información con implementaciones exitosas dentro de las aplicaciones de gestión del conoci-miento. Se compone de todas las activi-dades relacionadas con la organización y entrega de información, así como de análisis del negocio (incluye minería de datos, administración del conocimien-to, aplicaciones analíticas, sistemas de reportes y, sobre todo, Datawarehousing y modelado multidimensional).

Día a día se tiene más conciencia de cómo las TIC se constituyen en una herramienta que permite facilitar la conservación, almacenamiento, or-ganización y categorización del conocimiento pero, principalmente, acelerar la velocidad de transferencia y personalización.

Las funciones más importantes de esta tecnología son:

• Capturar conocimiento de diversas fuentes.• Depurar, consolidar, elaborar y almacenar.• Proveer acceso al conocimiento.

Arquitectura de una solución de Business Intelligence

La arquitectura que se presenta (ver figura 1) obedece a una solución que pasa de diversos orígenes de datos hacia una transformación y validación de los mismos, lo cual permite, una vez concretada esta fase, residir la información en un repositorio de datos que consolida series históricas de información, en-

3 Concepto referido a la capacidad de acceder, analizar y compartir información de manera autónoma. Cuando no sólo se limita al interior de la empresa sino que se amplía con Internet a clientes, socios y proveedores se denomina e-Business Intelligence. http://www.a1empresarial.com/diccionariodemarketing.html

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 46: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

354

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

cuadre conceptual de la misma y enriquecimiento del dato a través de meta-datos de la información. El repositorio dispone de capas de datos organizadas en diferentes esquemas que hacen posible su explotación por medio de dife-rentes productos, como: reportes, gráficas y consultas de datos que permiten su análisis y posterior consolidación en un producto de Business Intelligence, lo cual se podría definir como el elemento con el que se podrá extraer infor-mación de los datos y conocimiento de la información (ver figura 2).

Figura 1

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 47: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

355

¿Qué estipula la Ley del Sistema Nacional de Información Estadística y Geográfica al INEGI como órgano autónomo?

Es vital tener claro el entorno bajo el cual vive su autonomía el INEGI y más para quien desee implementar mejoras a los procesos o proponer nue-vos productos tratando de acercarse más a la misión y visión institucionales, razón por la cual se agrega este apartado, asegurando que la propuesta aquí presentada se apega de forma rigurosa a las nuevas responsabilidades y atri-buciones que brinda la LSNIEG al Instituto autónomo.

Figura 2

Conocimiento

BusinessIntelligence

BusinessOperation

Información

Datos

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 48: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

35�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

Son de rescatar las siguientes disposiciones de la Ley:

“ARTÍCULO 4.- El Sistema Nacional de Información Estadísti-ca y Geográfica tendrá como objetivos: I. Producir Información; II. Difundir oportunamente la Información a través de mecanismos que faciliten su consulta; III. Promover el conocimiento y uso de la Información, y IV. Conservar la Información.

(…)“ARTÍCULO 39.- El Instituto realizará las acciones tendien-tes a lograr, que los Informantes del Sistema incurran en los menores costos posibles en la entrega de la información que les solicite.

(…)“ARTÍCULO 9�.- El Instituto deberá conservar la Información de Interés Nacional que elaboren el propio Instituto y las Unidades, en términos de lo dispuesto en esta Ley y en las disposiciones de carác-ter general que al efecto emita.

Cuando una Unidad desaparezca o se desincorpore, el Instituto deberá conservar la Información generada por la misma.”

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 49: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

35�

De los artículos de la LSNIEG mencionados, se detecta un espíritu de mejora permanente en el quehacer institucional, enfocado en la atención a las necesidades de los usuarios y una consideración explícita a los informantes respecto al costo de cumplir con los requerimientos de la información.

El SIIEEM contempla la atención de estas disposiciones de la LSNIEG, apoyándose, sobre todo, en las nuevas corrientes de las TIC dentro de las cuales se identifica como un esquema muy propicio para atender estos requerimientos de la LSNIEG el Business Intelligence; la propuesta que se presenta está basada en esta modalidad de las TIC y atiende de una manera innovadora los nuevos requerimientos de la LSNIEG.

Sistema de Integración de Información Estadística Estatal y Municipal

Propósito

Elaborar un sistema que permita mejorar la recopilación, integración, revi-sión, presentación y conservación de la información estadística sectorial, es-tatal y municipal que generan las unidades del Estado, con lo cual se puedan crear más y mejores productos que den satisfacción a las necesidades de los usuarios y a las de revisión e integración de información a bajo costo para los informantes, así como para la concentración de información que con-fiere la LSNIEG al Instituto.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 50: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

35�

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

Alcance

El SIIEEM permitirá recopilar la información estadística de manera remota a través de consultas directas a los Datawarehouse de las unidades del Estado (aquellas que los tengan), o por medio de selección de variables de sus bases de datos. La información recopilada será organizada y administrada en un repositorio de datos regional del Instituto.

Representa un salto cualitativo importante en materia de integración, revisión, conservación y presentación de información estadística sectorial para el Sistema Nacional de Información Estadística y Geográfica. Permi-tirá a usuarios principiantes y expertos consultar, manipular, visualizar y explotar grandes cantidades de datos con desglose a nivel municipal.

Solución para la problemática de integración y presentación de la estadística sectorial

El SIIEEM —como proceso nuevo de trabajo— permitirá, por un lado, su-perar las áreas de oportunidad referentes a la revisión y validación de infor-mación estadística generada por las unidades de Estado, así como la necesi-dad de tener el Banco de Información Sectorial estatal y municipal como una nueva medida de conservación y consulta de la información.

El Sistema estará integrado por tres módulos:

1. De recopilación de información. Tendrá como objetivo extraer la in-formación de interés para el proyecto de cada una de las unidades del Estado. La extracción contempla los datos y los metadatos de cada una de las variables. Debido al grado de avance en las tecnologías de la información de las unidades del Estado, la recopilación debe con-templar las siguientes modalidades:

• Extracción vía Datawarehouse. Se hará de manera remota, con permiso previo de la fuente para acceder a su Datawarehouse.

• Extracción vía base de datos. La unidad del Estado podrá su-bir las variables de interés vía web en un esquema de base de

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 51: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

359

datos o, de forma alternativa, personal deberá recuperar local-mente dicha información y subirla al sitio diseñado para tal fin.

• Tercera opción, no deseable. Para las unidades del Estado que no tengan su información organizada en un esquema de base de datos, personal de las coordinaciones estatales del Instituto deberá darse a la tarea de organizar la información en un es-quema de base de datos.

2. De integración. Su objetivo será organizar la información en una gran base de datos, agrupando cada una de las variables de acuerdo con sectores económicos. También, tendrá la función de verificar la inte-gridad de cada una de las variables inventariadas para cada entidad año con año y la significancia conceptual de la variable (metadato).

Dentro de este módulo, será muy importante la etapa de vali-dación automatizada de la información recopilada de las unidades del Estado, rescatando relaciones analíticas de información que se han consolidado en los actuales proyectos de integración; considerando, además, algoritmos de validación histórica del dato, lo cual permitirá que, sin un alto costo de recursos humanos ni tiempo, se logre validar toda la información integrada de las unidades del Estado.

3. De presentación de información. Su función principal estará orienta-da a presentar una ruta de salida a la información recopilada; estará organizado de la siguiente forma:

• Generación de síntesis estatal de información sectrial. Es un submódulo de uso interno y su principal función estribará en generar un resumen sectorial del estado seleccionado. El for-mato de presentación tendrá similitud con el producto deno-minado Anuario estadístico estatal actual, la diferencia estará en que la información presentada será una selección de variables. Este producto ofrecerá al usuario una visión panorámica de la entidad federativa.

Banco de Información Sectorial

La salida principal del SIIEEM será el BIS, el cual será un sistema de con-sulta en línea disponible en la página web del INEGI en el que se podrán

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 52: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

3�0

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

consultar las variables según sectores de la economía, con desagregación a nivel estatal, municipal y la posibilidad de presentar series históricas de la información concentrada.

Este banco presentará las siguientes características principales:

• Será alimentado a través de la explotación de bases remotas de cada unidad del Estado.

• Permitirá hacer consultas a una variable seleccionada y podrá aco-tarla para periodos específicos y desgloses geográficos a nivel enti-dad y municipio.

• A partir de las variables, podrán hacerse cruces de información para generar nuevas variables de interés para el usuario.

• Tendrá un módulo que permitirá generar diversas formas de vi-sualizar los datos en gráficos unidimensionales (histogramas, box plots), gráficos bidimensionales (xy plots) y gráficos multidimensio-nales (pairs plot, barchart, trelisplot).

• La información podrá referenciarse geográficamente (bajo una pla-taforma de IRIS en su versión web) y permitirá elaborar mapas temáticos con diferentes algoritmos de agrupamiento, como k-me-dias, agrupamiento jerárquico, etcétera.

El BIS contempla la implementación de un repositorio de datos secto-riales y regionales el cual dispondrá de consultas en línea de la información ya consolidada en el repositorio sectorial y regional.

El módulo de consultas dispondrá de series históricas de información; su principal innovación será la georreferenciación.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 53: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

3�1

Salidaspropuestas delBIS

Se presentan, a manera de ejemplo, las principales salidas consideradas dentro del BIS, las cuales son producto de ejercicios de explotación de una base de datos regional integrada con el fin de poder validar las premisas es-tablecidas en este proyecto y han resultado valiosas para determinar la viabi-lidad técnica de la explotación de información del repositorio diseñado (ver figuras 3, 4 y 5).

Figura 3Banco de Información Sectorial

Consulta de una variableSECTOR: SaludVARIABLES: CONSULTAS EXTERNASCLASIFICACIÓN: SEGURIDAD SOCIALSUBCLASIFICACIÓN: IMSSGUANAJUATO

MUNICIPIO 2003 2004 2005 200�

ESTADO 4 �12 410 4 500 5�� 4 3�2 �2� 4 512 �1�

Abasolo 1� 539 1� �4� 1� 155 14 302

Acámbaro �1 �25 �9 �2� �3 �14 �9 �1�

Apaseo el Alto 11 2�4 10 214 �2 232 5� 412

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 54: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

3�2

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

Figura 4

Gráfico univariado

Gráfico multivariado:Consultas externas en Guanajuato 2003-200�

2003

2004

2005

200�

0 1000000 2000000 0 1000000

0

100

0000

0

100

0000

0

100

0000

0 1000000 0 1000000 2000000

S I I E E M MÓDULO DE CONSULTA

CONSULTA EXTERNAS

4 700 0004 600 0004 500 0004 400 0004 300 0004 200 000

ENTIDAD: GUANAJUATOSECTOR: SALUDCLASIFICACIÓN: SEGURIDAD SOCIALVARIABLE: CONSULTAS EXTERNASSUBCLASIFICACIÓN: IMSS

Sum

aDeC

_E2

003

Sum

aDeC

_E2

004

Sum

aDeC

_E2

005

Sum

aDeC

_E2

006

SIIEEM. Ejemplo de salida de consulta (BIS)

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 55: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

3�3

Georreferanciación

Figura 5SIIEEM. Ejemplo de salida de consulta (BIS)

Consulta: cálculo de una variable

SECTOR: SaludCLASIFICACIÓN: SEGURIDAD SOCIALSUBCLASIFICACIÓN: IMSS

POBLACIÓN USUARIA CONSULTAS EXTERNASCONSULTAS EXTERNAS/

POBLACIÓN USUARIA

MUNICIPIO 2003 2004 2005 200� 2003 2004 2005 200� 2003 2004 2005 200�

ESTADO 1 477 954 1 514 976 1 565 955 4 612 410 4 500 588 4 382 727 4 382 727 3.12 2.97 2.80

Abasolo 6 926 8 711 12 406 18 539 16 646 18 155 14 302 2.68 1.91 1.15

Acámbaro 21 410 23 105 17 904 81 625 79 528 83 714 79 717 3.81 3.45 4.45

Apaseo el Alto 5 889 6 239 16 292 11 264 10 214 62 232 58 412 1.91 1.64 3.59

Apaseo el Grande

16 784 19 226 0 56 644 55 986 0 0 3.37 2.91 *Error

Atarjea 0 0 171 112 0 0 513 528 504 215 *Error *Error 2.95

Celaya 153 344 151 998 11 691 504 361 495 044 24 037 22 943 3.29 3.26 1.96

Comonfort 9 783 10 024 0 28 138 23 602 0 0 2.88 2.35 *Error

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 56: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

3�4

Vol. 2, núm. 3Boletín del Sistema Nacional de Información Estadística y Geográfica

Beneficios

El SIIEEM será de utilidad en lo siguiente:

1. Debido a que la información se recopilaría en un esquema de bases de datos, no existiría ningún problema para captar in-formación de todas las variables de interés nacional para todos los municipios de cada entidad federativa; de esta forma, se evitaría perder información.

2. El SIIEEM permitiría atender nuevas obligaciones que la LSNIEG confiere al Instituto respecto a la conservación, re-visión y difusión de información de interés nacional.

3. El Sistema reportaría para un año determinado qué variables no presentan información; con ello, se consolidarían series históri-cas de variables consistentes conceptualmente en el tiempo.

4. Al momento de recopilar y presentar la información, cada va-riable tendrá asociado su metadato validado por la propia uni-dad del Estado, de tal forma que tanto los proveedores de la información como los usuarios sabrán exactamente qué está presentando la variable.

5. Con esta forma de trabajo se evitan procesos con altos costos de tiempo y recursos que, de por sí, agregan muchas veces errores inherentes a su actividad, como: captura de cuadros, estimación de indicadores para gráficos o edición de docu-mentos. Así, se espera tener disponible para los usuarios in-formación con mayor oportunidad y calidad.

Otras fuentes

Sinnexus, Business Intelligence + Informática estratégica. “¿Por qué Business Intelligence?”, en: Sinnexus. http://www.sinnexus.com/business_inte-lligence/index.aspx, octubre del 2009.

“Gestión del rendimiento empresarial e inteligencia de negocio de Oracle”, en: Oracle España. http://www.oracle.com/global/es/products/solutio-ns/business_intelligence/index.html, octubre del 2009.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 57: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

3�5

Ley del Sistema Nacional de Información Estadística y Geográfica. http://www.snieg.mx/contenidos/espanol/normatividad/marcojuridico/LS-NIEG.pdf, octubre del 2009.

Tecnologías de la información y la comunicación. http://www.dcyc.ipn.mx/dcyc/quesonlastics.aspx, octubre del 2009.

Inteligencia empresarial. http://es.wikipedia.org/wiki/Inteligencia_empresa-rial, octubre del 2009.

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009

Page 58: para seguir la evolución en el tiempo de fenómenos ...internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/... · a 1/3, se supone que básicamente porque se hace uso

Se permite la reproducción total o parcial del material incluido en el Boletín sujeto a citar la fuente.Esta publicación consta de 2 000 ejemplares y se terminó de imprimir en abril del 2010.Disponible en: http://www.inegi.org.mx

INEGI. B

olet

ín

de

los S

iste

mas N

acio

nale

s E

stad

ístic

o y

de In

form

ació

n G

eogr

áfic

a V

ol. 2, N

úm 3,

sept

iem

bre-

dici

embr

e 2009