una estrategia de pronÓstico para el pib tesina …
Post on 20-Nov-2021
7 Views
Preview:
TRANSCRIPT
CENTRO DE INVESTIGACIÓN Y DOCENCIA ECONÓMICAS, A.C.
UNA ESTRATEGIA DE PRONÓSTICO PARA EL PIB
TESINA
QUE PARA OBTENER EL TÍTULO DE
LICENCIADO EN POLÍTICAS PÚBLICAS
PRESENTA
JOSÉ SANTIAGO CASTILLO VARGAS
DIRECTOR DE LA TESINA: DRA. DANIELA MOCTEZUMA Y DR. DANIEL VENTOSA
AGUASCALIENTES, AGS. SEPTIEMBRE, 2017
Resumen
En este trabajo se presenta una comparación de pronósticos del PIB con Modelos Autoregre-sivos de Media Móviles (ARMA) y Métodos de aprendizaje computacional. Para el pronósticodel PIB se propone una estrategia: realizar una trasformación Box-Cox de los datos, una de-sestacionalización con filtro X-12 ARIMA, pruebas de raíz unitaria y quiebre estructural. Laestrategia de pronóstico presentada en esta tesina mejora los modelos ARMA y proporciona elmejor pronóstico para el PIB. Sin embargo, no mejora los pronósticos de los modelos SVR.
Palabras clave: Modelos Autoregresivos de Media Móviles, Máquinas de Soporte Vectorial,filtro X-12, transformación Box-Cox, Pruebas de raíz unitaria, Quiebre estructural.Clasificación JEL:C52
Contenido
1 Introducción 1
2 Revisión de Literatura 4
2.1 Teorías sobre la estabilización . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Teorías alternativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 Competencias de pronósticos y funciones de perdida . . . . . . . . . . . . . . 6
3 El caso mexicano 8
3.1 Importancia de las proyecciones en México . . . . . . . . . . . . . . . . . . . 8
3.2 Características de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.3 Variables habituales en los modelos predictivos del PIB . . . . . . . . . . . . . 9
3.4 Estimación a la mexicana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4 Los datos 12
5 Metodología 17
5.1 Transformación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.2 Desestacionalidad de las series . . . . . . . . . . . . . . . . . . . . . . . . . . 19
5.3 Estimación del quiebre estructural . . . . . . . . . . . . . . . . . . . . . . . . 20
5.4 Pruebas de estacionariedad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
5.5 Estimación del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5.5.1 Modelos Autoregresivos con Medias Móviles . . . . . . . . . . . . . . 22
i
5.5.2 Support Vector Regression (SVR) y Kernel Ridge Regression (KRR) . 23
6 Resultados 25
6.1 Modelos Autoregresivos con Medias Móviles . . . . . . . . . . . . . . . . . . 25
6.1.1 Aproximación con modelos ARMA . . . . . . . . . . . . . . . . . . . 26
6.1.2 Aproximación con modelos ARMAX . . . . . . . . . . . . . . . . . . 27
6.1.3 Aproximación con modelos que utilizan la trasformación Box-Cox, el
filtro X − 12 y el ajuste de quiebre estructural de Bai y Perron . . . . . 27
6.2 Métodos de aprendizaje computacional . . . . . . . . . . . . . . . . . . . . . . 29
6.2.1 Aproximación con SVR radiales . . . . . . . . . . . . . . . . . . . . . 29
6.2.2 Aproximación con modelos KRR . . . . . . . . . . . . . . . . . . . . 31
6.3 Comparación de pronósticos intramuestrales y extramuestrales . . . . . . . . . 33
7 Implicaciones de Política Pública 40
8 Conclusiones 42
Referencias 44
ii
Lista de figuras
4.1 Gráficas temporales del PIB-IGAE . . . . . . . . . . . . . . . . . . . . . . . . 14
4.2 Gráficas temporales del PIB-INPC subyacente . . . . . . . . . . . . . . . . . . 14
4.3 Gráficas temporales del PIB-IPC . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4 Gráficas de las primeras diferencias del PIB-Precio del petróleo . . . . . . . . . 16
4.5 Gráficas de las primeras diferencias del PIB-Tipo de cambio . . . . . . . . . . 16
5.1 Optimización de la trasformación Box-Cox . . . . . . . . . . . . . . . . . . . 18
5.2 Filtro X-12 ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
5.3 Quiebre estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
5.4 Muestreo y trasformación de los datos de los métodos de aprendizaje computa-
cional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.5 Support Vector Regression y Kernel Ridge Regression . . . . . . . . . . . . . 24
6.1 Estimación intramuestral del PIB . . . . . . . . . . . . . . . . . . . . . . . . . 28
6.2 Curva de aprendizaje de los modelos que usan datos originales . . . . . . . . . 30
6.3 Curva de aprendizaje de los modelos que usan datos tratados . . . . . . . . . . 30
6.4 Curva de aprendizaje de los modelos que usan primeras diferencias . . . . . . . 31
6.5 Curva de aprendizaje de los mejores tres modelos . . . . . . . . . . . . . . . . 32
6.6 Estimación intramuestral del PIB con modelos KRR . . . . . . . . . . . . . . . 32
6.7 Pronóstico ARMAX intra y extra-muestral . . . . . . . . . . . . . . . . . . . . 33
6.8 PIB original con respecto al pronóstico intramuestral de KRR . . . . . . . . . . 34
6.9 PIB con respecto al pronóstico intramuestral ARMAX con datos tratados . . . 35
iii
6.10 Pronóstico ARMAX extramuestral . . . . . . . . . . . . . . . . . . . . . . . . 36
6.11 Pronóstico KRR extramuestral . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6.12 PIB con respecto al pronóstico extramuestral ARMAX con datos tratados . . . 37
6.13 PIB con respecto al pronóstico extramuestral KRR con datos originales . . . . 38
iv
Lista de tablas
4.1 Resumen de los Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
6.1 Resumen de modelos ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
6.2 Resumen de modelos ARMAX . . . . . . . . . . . . . . . . . . . . . . . . . . 27
6.3 Modelo ARMAX con tratamiento de cambio estructural . . . . . . . . . . . . . 28
6.4 Ajuste Mínimo Cuadrático de los pronósticos intramuestrales . . . . . . . . . 35
6.5 Ajuste Mínimo Cuadrático de los pronósticos extramuestrales . . . . . . . . . 38
v
Capítulo 1
Introducción
Las predicciones del comportamiento del PIB o Ingreso Nacional 1 se han realizado con mode-
los comúnmente utilizados en macroeconomía, Elguézabal (2004b). Estos modelos se centran
en la relación causal de Ingreso-Gasto sin tomar en cuenta los cambios estructurales del com-
portamiento del PIB, Singh y Sahni (1984). De tal forma, las predicciones sobre el PIB tienen
que modificarse constantemente.
Por citar un ejemplo, considerando la previsión del Banco de México (Banxico) del 19 de
noviembre de 2014 hasta el primer trimestre del 2017, ya se han realizado cuatro ajustes. El
pronóstico original consideraba un rango de crecimiento de 3.2 a 4.2 por ciento. Durante el año
2015 se realizaron los primeros dos ajustes: el primero fue el 18 de febrero donde el rango de
crecimiento disminuyo quedando en 2.9 a 3.9 por ciento y el segundo se realizó el 19 de mayo
quedando en 2.5 a 3.5 por ciento. Durante el 2016 se realizó una modificación el 3 de marzo,
el nuevo ajuste dejo el pronóstico de crecimiento en 2 a 3 puntos porcentuales. Por último, el
primero de marzo del 2017 Banxico redujo su expectativa de crecimiento a un rango de 1.3 a
2.3 por ciento, Capistrán y López-Moctezuma (2010).
Los estudios sobre la estimación del ingreso nacional muestran diversas estrategias respecto
a la forma de predicción. Para fines prácticos de esta tesis, estos estudios son clasificados en dos
categorías: i) las teorías que intentan estabilizar los movimientos estocásticos y ii) las teorías
1Sin distinción para efectos de esta tesina
1
que proveen alternativas al modelo de los movimientos estocásticos. En la primera categoría
se encuentran los modelos de estimación que se concentran en la reducción de incertidumbre
provocada por el quiebre estructural y raíz unitaria. En la segunda categoría se encuentran
los modelos que parten de la estandarización del error estocástico para aumentar la capacidad
predictiva. Mejor dicho, los modelos que transforman los datos en múltiples dimensiones con el
objetivo de encontrar una solución global que minimice el error en la predicción.
El objetivo de esta tesina es evaluar los modelos de predicción del PIB a través de las nuevas
aportaciones en macro-econometría y aprendizaje computacional sobre el estudio del compor-
tamiento estocástico. La pregunta que guía esta tesis es ¿la estandarización del error estocástico
mejorará la predicción del PIB? Para responder a la pregunta anterior se realiza una compara-
ción de dos tipos de modelos: 1) los modelos que se concentran en el tratamiento de quiebre
estructural y raíz unitaria y 2) los modelos que estandarizan el error estocástico a través de la
trasformación de los datos en hiperplanos. En concreto, se modelará el comportamiento del PIB
de México con datos comprendidos de 1994 hasta 2016. Para esto, se utilizan tres modelos de
series de tiempo y dos modelos de máquinas de soporte vectorial (SVM por sus siglas en ingles)
para predecir el comportamiento del PIB. Posteriormente se utilizan funciones de pérdida para
evaluar la capacidad predictiva de los modelos.
Este trabajo es relevante en el ámbito público y privado. En lo que concierne a la relevancia
del sector público destacan tres ejemplos: primero, el presupuesto de egresos de la federación,
segundo, la ley de ingresos y tercero, la oferta de dinero del Banxico.
Primero, los pronósticos son relevantes en la Ley de Ingresos de la Federación porque me-
diante la diferencia entre la estimación del PIB y el presupuesto de Egresos aprobado por la Cá-
mara de Diputados se determina el monto de deuda pública, Amparán y Palacio (2003). Tener
estimaciones más precisas permitirá reducir los costos financieros sobre la deuda. Según la
SHCP en Hernández Veleros (2011), el costo financiero por un sobreendeudamiento constituye
hasta un 0.9 porciento del PIB (aproximadamente 120 mil millones de pesos).
Segundo, los pronósticos son relevantes para el presupuesto de Egresos principalmente por
2
dos razones. Por un lado, los pronósticos del PIB ayudan a realizar escenarios sobre las prin-
cipales variables macroeconómicas del año siguiente como la inflación, la tasa de interés, el
crecimiento económico y el precio del petróleo, Elguézabal (2004b). Por otro lado, se realiza
una jerarquía de las políticas públicas y el mondo a designar con base en las estimaciones del
PIB. Inclusive, pronósticos del PIB son utilizados para ajustar el monto correspondiente a los
programas y proyectos vigentes, de La Federación y del presupuesto de las asignaciones (2015).
Tercero, mejorar las predicciones del PIB tiene implicaciones en la evaluación de reformas
estructurales en materia económica y en la efectividad de las políticas públicas. Mas especí-
ficamente, la capacidad de predecir el PIB tiene implicaciones directas en política monetaria,
Gutiérrez Lara (2015). Las variaciones en el PIB determinan la oferta de dinero en la economía.
Por lo tanto, una predicción más precisa sobre las variaciones del PIB podría aumentar la efec-
tividad de la política monetaria, y consecuentemente, ayudar a mantener un mejor control sobre
la estabilidad económica del país.
Los resultados de este trabajo son dos: 1) la estrategia de pronóstico que se propone en esta
tesis mejora las estimaciones de los modelos autoregresivos de medias móviles y 2) los modelos
que utilizan la estandarización del error estocástico, SVR, funcionan mejor con la variación
entre las observaciones.
Esta tesina se divide en seis secciones: la primera sección es una introducción al problema;
la segunda sección realiza una revisión de la literatura sobre los modelos para predecir el ingreso
nacional; en la tercera sección se describen los modelos utilizados en México; la cuarta sección
explica las variables utilizadas; en la quinta sección se describe la metodología de predicción
utilizada; en la sexta sección se evalúan los modelos utilizados para la predicción del PIB; en la
séptima y octava sección se describen las implicaciones sobre política pública y conclusiones,
respectivamente.
3
Capítulo 2
Revisión de Literatura
Los estudios sobre la estimación de series de tiempo son muy diversos respecto a la forma de
predecir. En esta tesis, los estudios que proponen distintas formas de estimación son clasificados
en dos grandes categorías: i) las teorías que intentan estabilizar los movimientos estocásticos, y
ii) las teorías que proveen alternativas al modelo de los movimientos estocásticos.
2.1 Teorías sobre la estabilización
Las teorías que estabilizan los movimientos estocásticos primordialmente están documentadas
en los estudios de Singh y Sahni (1984), Enders (2004) y Hamilton (1994). En estos estudios,
los modelos de estimación se concentran en la reducción de incertidumbre provocada por el
quiebre estructural y la raíz unitaria, conocen los cambios estructurales y analizan las raíces de
la serie.
En concreto, las estimaciones de los modelos resuelven problemas como estacionariedad y
ergodicidad de la serie, Box y Jenkins (1976). No obstante, es difícil modelar cuando la serie
tiene combinaciones de cambios estructurales. El problema de estos modelos es que la capacidad
predictiva se limita a un periodo de tiempo limitado, Cowpertwait y Metcalfe (2009). Además,
la modelación de la volatilidad ocasiona sesgos en las predicciones o aumenta el intervalo de
confianza, Sargan y Bhargava (1983). En suma, los modelos utilizados en esta categoría suelen
4
tener deficiencias con los cambios estructurales de las series de tiempo.
2.2 Teorías alternativas
Entre las teorías que proveen alternativas al modelo de movimientos estocásticos, principal-
mente, se encuentran los estudios que matematizan la parte estocástica de los modelos y los
modelos que aumentan la dimensión de los datos en búsqueda de una solución global que min-
imice el error.
Por un lado, los estudios de Revuz y Yor (1999) y Kleinert (2004) proponen la matemati-
zación del error estocástico para reducir la parte estocástica de los modelos. En otras palabras,
buscan una función matemática como unidad de medida de los errores estocásticos. Este tipo de
modelos se concentra en la series con alta volatilidad y choques estocásticos. Estos modelos le
dan mayor preponderancia al estudio de la parte estocástica cuando no hay variables conocidas
que puedan ser utilizadas en el modelo.
Sin embargo, la metodología que emana de estos modelos es complicada. El número de ob-
servaciones necesario para implementar estos modelos suele ser mayor a los modelos comunes,
Cowpertwait y Metcalfe (2009). En suma, los costos por aprender estas técnicas son altos y no
hay incentivos para su utilización.
Por otro lado, estudios de Cao (2003), Qiu, Suganthan, y Amaratunga (2017), Rüping (2001),
Thissen, Van Brakel, De Weijer, Melssen, y Buydens (2003) proponen las máquinas de soporte
vectorial (SVM por sus siglas en inglés) para analizar datos de serie temporal. Las máquinas de
soporte vectorial están basados en el trabajo de Vapnik y Vapnik (1998) sobre la teoría del apren-
dizaje estadístico. Estos modelos transforman los datos en múltiples dimensiones en búsqueda
de una representación más simple de ellos. Después, proponen distintos modelos que minimizan
una función de pérdida. En general, solamente hay una solución global que minimiza la fun-
ción de pérdida y las máquinas de soporte vectorial encuentran la solución que minimiza dicha
función.
5
Los Support Vector Regresion (SVR) pueden encontrar relaciones no lineales entre los datos
y estabilizan los comportamientos erráticos de las series no ergódicas, Welling (2013). Específi-
camente, este tipo de modelos pueden ofrecer una alternativa a los problemas de no estacionar-
iedad y volatilidad de la serie. No obstante, es común el problema de sobreajuste del modelo,
Cao (2003). Esto pasa cuando el modelo parece ajustarse demasiado bien a los pronósticos
dentro de la muestra pero no pasa lo mismo con los pronósticos fuera de la muestra.
2.3 Competencias de pronósticos y funciones de perdida
En otro orden de ideas, la elección de ciertos modelos para pronosticar una serie suele ser com-
plementaria. Los modelos de predicción pueden integrar varias estrategias de predicción con
el único fin de reducir la incertidumbre en sus pronósticos. Con este objetivo, los expertos
en competencias de pronósticos como Makridakis et al. (1982) frecuentemente combinan las
ventajas comparativas de los modelos, aumentando la capacidad predictiva y evaluando el com-
portamiento con series particulares.
Las competencias de pronósticos contribuyen con formas innovadoras para comparar la pre-
cisión en la extrapolación, Neter, Kutner, Nachtsheim, y Wasserman (1996). Tales competencias
incentivan la investigación y nuevas formas de estudiar el comportamiento de los modelos. Las
formas más usuales para comparar son las funciones de pérdida.
La contribución particular de este trabajo se concentra en la utilización de ambas categorías
para desarrollar un modelo de predicción de PIB. El desarrollo de un modelo de predicción que
combine las dos categorías es innovador en dos sentidos. Primero, hay un ahorro de tiempo
considerable desde el desarrollo del modelo hasta la predicción. Segundo, los modelos pueden
realizarse de forma independiente y combinarse en el momento de predecir. La contribución
general de esta tesina se enfoca en la explicación de ciertos procesos y conceptos para influen-
ciar la utilización de los modelos alternativos del movimiento estocástico. Incluso, analizar el
comportamiento de los nuevos modelos en la predicción de series reales.
6
La evaluación de los modelos se realizará tomando en cuenta los métodos de comparación
utilizados en las competencias de pronósticos. El estudio empírico del comportamiento de los
modelos propicia a una mejor utilización de las ventajas comparativas. En conclusión, la hipóte-
sis que guía este trabajo es que los modelos combinados que utilizan diversas estrategias para el
tratamiento del error estocástico tienden a tener mayor capacidad de predicción, comparado con
los modelos que no lo utilizan.
7
Capítulo 3
El caso mexicano
3.1 Importancia de las proyecciones en México
La medición del ingreso nacional es esencial para el análisis macroeconómico y la toma de
decisiones, Elizondo (2012). En concreto, el Producto Interno Bruto es uno de los indicadores
económicos más importantes de las cuentas nacionales y de la economía, debido a que representa
una medida amplia de la actividad económica y proporciona señales de la dirección general de
la actividad económica agregada, Elguezabal (1995).
3.2 Características de los datos
El PIB es influenciado por múltiples factores económicos y exógenos a la economía, Ize y Salas
(1983). Por un lado, entre los factores económicos se encuentran las reestructuras fiscales,
reformas políticas, políticas públicas y política monetaria. Por otro lado, entre los factores
exógenos se encuentran los desastres naturales, enfermedades epidémicas, amenazas de guerra,
entre otros.
Los datos del PIB son publicados cada trimestre. Sin embargo, la frecuencia de los datos
trae problemas en la estimación, Elguezabal (1995). Por un lado, la frecuencia de los datos no
permite conocer el estado de la economía entre los periodos trimestrales. Por otro lado, la fre-
8
cuencia del PIB limita los modelos econométricos que pueden ser utilizados para la predicción.
No obstante, en búsqueda de solucionar el problema se realizan algunas estrategias de carác-
ter metodológico. Una muy obvia consiste en modificar la frecuencia2 de las variables que
pueden explicar el PIB, Elguézabal (2004a). También, la utilización de otras variables para pre-
decir los periodos entre cada trimestre, Elguézabal (2004b). Incluso, cambiar la frecuencia del
PIB (trimestral a mensual) mediante distintos métodos, Elizondo (2012).
3.3 Variables habituales en los modelos predictivos del PIB
Los modelos utilizados por los responsables de la política económica (Banxico) consideran fre-
cuentemente dos variables para la aproximación del PIB, Elizondo (2012). La primera variable a
considerar es el Indicador Global de la Actividad Económica (IGAE) . El IGAE es información
preliminar sujeta a datos auto reportados de empresas y organismos públicos. Este indicador
permite conocer y dar seguimiento a la evolución del sector real de la economía, en el corto
plazo. Aunque no incluye toda la información de las actividades económicas contenidas en el
PIB, la utilidad del IGAE es determinar la tendencia de la actividad económica a corto plazo.
La segunda variable a considerar es el Índice Nacional de Precios al Consumidor (INPC).
Hay evidencia del impacto del INPC sobre variables económicas reales, Elguézabal (2004a).
Específicamente, el índice permite conocer ciertos impactos temporales en la economía nacional.
Por ejemplo, la inflación puede generar expectativa sobre el cambio de tendencia de la economía.
En consecuencia, el INPC es una variable determinante en la estimación del PIB.
3.4 Estimación a la mexicana
Actualmente, en México, se utilizan diversas metodologías para el tratamiento del PIB, los méto-
dos comúnmente utilizados pueden enmarcarse en tres categorías 3: 1) Los modelos derivados
2La estimación determinística y el método de Denton son los métodos para cambiar la frecuencia de los datos.Más adelante se explica la intuición de estos métodos.
3Véase en Elizondo (2012)
9
del método de Denton, 2) los modelos derivados del filtro de Kalman y 3) la especificación de
cambios estructurales múltiples. A continuación se explica cada categoría.
Primero, el método de Denton construye el PIB a partir de otra variable relacionada. Este
método constituye una alternativa formal para la proyección de datos de baja frecuencia uti-
lizando una serie de alta frecuencia. Es decir, se obtiene un algoritmo a través de los datos
mensuales de una variable relacionada con el PIB (puede ser IGAE o precio del petróleo, entre
otras) y a partir de ahí, se realizan las estimaciones trimestrales subsecuentes del PIB.
Metodológicamente, el método de Denton combina las series de alta frecuencia relacionadas
con el PIB y una serie que minimiza el residual (la diferencia entre la observación real y la
predicción). No obstante, esta aproximación es solo intuitiva pues sirve para marcar una tenden-
cia a corto plazo sin importar que los estimadores cumplan algún supuesto.
Segundo, los modelos que se derivan del filtro de Kalman utilizan la misma variable a estimar
y un conjunto de variables relacionadas con la ella. Elaboran un estimador recursivo basado en
la estimación de un sistema estocástico con las variables relacionadas y observables. El filtro de
Kalman combina toda la información observada en un periodo determinado y el conocimiento
previo del sistema. En otras palabras, utiliza la información histórica de la serie del PIB y la
información histórica de otras variables relacionadas con el PIB (puede ser IGAE, inflación o
precio del petróleo) para predecir una observación contemporánea o futura.
Tercero, la especificación de cambios estructurales múltiples fragmenta la serie histórica del
PIB para darle un tratamiento específico. Mejor dicho, divide la serie de tiempo en periodos
que aproximadamente tienen las mismas propiedades estadísticas para crear un modelo local
adecuado. Este tipo de modelos contempla los choques exógenos y su utilización es la más
frecuente para predecir variables como el PIB.
A partir de la descripción anterior, se destacan dos problemas. El primer problema proviene
de los modelos derivados del método de Denton, mientras que el segundo problema es resul-
tado de los modelos derivados del filtro de Kalman y la especificación de cambios estructurales
múltiples, Ize y Salas (1983).
10
El principal problema de los modelos que se derivan del método de Denton es que la fre-
cuencia de los datos suele aumentar el ruido en la serie de nuestra variable de interés, Elguézabal
(2004a). Mejor dicho, los intervalos de confianza de este tipo de modelos suele ser más amplios
y la predicción es menos precisa que los modelos de las otras dos categorías.
El problema de los otros dos modelos reside en la capacidad explicativa de las variables uti-
lizadas. Los modelos econométricos suelen utilizar otras variables para extrapolar el valor del
PIB, sin embargo, la información de las variables explicativas no es suficiente para poder ex-
plicar totalmente el comportamiento del PIB, Elguézabal (2004b). En otras palabras, tendríamos
que incluir una gran cantidad de variables que explican relativamente poco sobre PIB pero son
necesarias para aumentar la precisión de la estimación. En otros términos, los modelos no son
parsimoniosos y suele ser complicado tener actualizadas todas las variables explicativas. De tal
forma, la elaboración de estos modelos suele ser compleja y costosa en términos de tiempo.
En este sentido, este trabajo plantea una nueva metodología basada en la combinación de
diversos modelos econométricos. En concreto, la propuesta de este trabajo es demostrar la
combinación de estimadores que modelan los cambios estructurales, estrategias que optimizan
la correlación entre las variables y métodos para estimar y limpiar el error estocástico, suele
comportarse mejor que los modelos descritos con anterioridad.
11
Capítulo 4
Los datos
Se utilizaron siete series de tiempo para las estimaciones del PIB a precios constantes. Las series
de tiempo utilizadas tienen una frecuencia trimestral o mensual. Para empezar, los datos longi-
tudinales del PIB son los únicos que tienen una frecuencia trimestral y son desestacionalizados4
para el periodo de marzo de 1993 a enero 2017. Estos datos, con el año base en el 2003, están
conformados por 97 observaciones y fueron obtenidos del INEGI.
Entre las series de tiempo que tienen datos mensuales se encuentran: 1) Índice Nacional
de Precios al Consumidor (INPC), 2) Indicador Global de la Actividad Económica (IGAE), 3)
Tipo de cambio (peso-dólar), 4) Precio del petróleo y 5) el Índice de Precios y Cotizaciones. A
continuación se detallará los pormenores de cada una de ellas.
Se utilizaron dos series de INPC: datos originales y subyacentes5 . Los datos del INPC
registran el precio de la canasta básica a través del tiempo, es decir, miden la inflación. Estos
datos tienen una frecuencia mensual para el periodo 1993 a 2017, lo que corresponde a 312
observaciones para cada serie. El año base para ambas series es el año 2003 y los datos fueron
obtenidos del INEGI.
El IGAE provee información básica sobre la actividad económica y no incluye todas las
actividades como lo hace el PIB. Sin embargo, provee información preliminar para indicar la
4En las series desestacionalizadas se remueve a influencia de los factores estacionales y periódicos. La influenciade los factores estacionales suele dificultar el pronóstico de una serie económica.
5Los datos del INPC subyacente no incluyen los bienes temporales.
12
dirección de la actividad económica del país. Los datos del IGAE tienen una frecuencia mensual
desde 1994 hasta 2016. Las 279 observaciones fueron obtenidas del INEGI.
El tipo de cambio y el precio del petróleo representan la influencia del comercio internacional
en la economía nacional. Ambas series tienen una frecuencia mensual desde el año 2003 al 2017,
con 322 y 319 observaciones, respectivamente. Los datos de ambas series fueron obtenidos del
banco de datos del Banco de México.
Por último, el IPC representa la valoración del mercado de las principales empresas en el
país. Tal indicador provee información acerca de las expectativas sobre el mercado mexicano
y las oportunidades de inversión. Este índice tiene una frecuencia mensual y se utilizan en la
estimación de datos desde 1993 hasta 2017, correspondiente a 321 observaciones. Los datos
sobre el IPC fueron obtenidos del Banco de México. La tabla 4.1 resume las características
importantes sobre los datos a utilizados:
Datos Frecuencia Numero de FuenteObservaciones
PIB* Trimestral 97 INEGIINPC(subyacente) Mensual 312 INEGIINPC Mensual 312 INEGIIGAE Mensual 279 INEGITipo de cambio Mensual 322 BanxicoPrecio del Petróleo Mensual 319 BanxicoIPC Mensual 321 Banxico
Tabla 4.1: Resumen de los Datos
Para ver la relación entre las variables, se presenta las Figuras 4.1, 4.2 y 4.3 en donde se
observa el comportamiento del PIB desestacionalizado comparado con el IGAE, el IPC y con
el INPC subyacente. La figura superior muestra que el IGAE es un buen pronosticador; es fácil
identificar que el IGAE tiene la misma dirección que los movimientos del PIB. La Figura 4.2
muestra que el INPC subyacente tiene la misma tendencia que el PIB. Asi mismo, la Figura 4.3
muestra que el IPC converge en la misma dirección que el producto interno bruto. La relación
gráfica entre las variables que se representa en la figuras es un indicio de que las variables IGAE
13
e INPC pueden ser utilizadas para el pronostico del PIB.
Figura 4.1: Gráficas temporales del PIB-IGAE
7
8
9
10
11
12
13
14
15
1995 2000 2005 2010 2015 0.6
0.7
0.8
0.9
1
1.1
1.2
Mill
ones
de
peso
s
Mill
ones
de
peso
s
Años
PIB (izquierda)IGAE (derecha)
Figura 4.2: Gráficas temporales del PIB-INPC subyacente
7
8
9
10
11
12
13
14
15
1990 1995 2000 2005 2010 2015 0
0.2
0.4
0.6
0.8
1
1.2
Mill
ones
de
pes
os
Mill
ones
de
pes
os
Años
PIB (izquierda)INPC subyacente (derecha)
14
Figura 4.3: Gráficas temporales del PIB-IPC
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
50000
1990 1995 2000 2005 2010 2015 7
8
9
10
11
12
13
14
15
Mill
ones
de
pes
os
Años
IPC (izquierda)PIB (derecha)
En la Figura 4.4 y 4.5 se realizaron primeras diferencias6 en las series para mostrar mejor
las relaciones entre variables PIB con el precio del petróleo y PIB con el tipo de cambio. La
gráfica superior muestra que la primera diferencia del precio del petróleo está relacionada con
la primera diferencia del PIB. Lo mismo pasa con la primera diferencia del tipo de cambio con
la primera diferencia del PIB. En suma, la relación del PIB con el petróleo y el tipo de cambio
es menos identificable que la relación del PIB con el IGAE y el INPC.
En resumen, se tendrán siete series temporales para realizar modelos de estimación del PIB.
Seis series tienen frecuencia mensual: 1) Índice Nacional de Precios al Consumidor (INPC), 2)
INPC subyacente, 3) Indicador Global de la Actividad Económica (IGAE), 4) Tipo de cambio
(peso-dólar), 5) Precio del petróleo y 6) el Índice de Precios y Cotizaciones. Además, una serie
con frecuencia trimestral: PIB. Los datos históricos del PIB son utilizados para predecir su
comportamiento en el futuro mediante una especificación autoregresiva7.
6La primera diferencia de una serie es necesaria para quitar la tendencia. La diferencia es el resultado del valorpresente menos el valor pasado. Es decir, ∆PIB = PIBt − PIBt−1.
7La función de autocorrelación encuentra patrones repetitivos dentro de una serie para proyectar los patrones enel futuro.
15
Figura 4.4: Gráficas de las primeras diferencias del PIB-Precio del petróleo
-0.6
-0.4
-0.2
0
0.2
0.4
1990 1995 2000 2005 2010 2015-60
-40
-20
0
20
40
Mill
ones
de
peso
s
Dol
ares
por
bar
ril
Años
PIB (izquierda)Precio del Petróleo (derecha)
Figura 4.5: Gráficas de las primeras diferencias del PIB-Tipo de cambio
-0.6
-0.4
-0.2
0
0.2
0.4
1990 1995 2000 2005 2010 2015
-1
0
1
2
3
4
5
Mill
ones
de
peso
s
Peso
s po
r do
lar
Años
PIB (izquierda)Tipo de cambio (derecha)
16
Capítulo 5
Metodología
En esta sección, se describe el procedimiento econométrico utilizado para la predicción del PIB.
Para predecir el PIB trimestral se utilizó una combinación de estrategias para pronósticos: 1)
Trasformaciones de variables Box y Cox (1964); 2) Desestacionalización de las series con un
filtro X12 ARIMA de Bureau (2002); 3) Tratamiento de cambios estructurales con la prueba
Bai y Perron (1998) y 4) Pruebas de estacionariedad de la serie.
Posteriormente, se utilizaron dos tipos de modelos: 1) Modelos econométrico auto regresivo
con medias móviles y con variables exógenas (ARMAX por sus siglas en ingles) y 2) Modelos de
aprendizaje computacional. A continuación se explica cada estrategia y cada modelo utilizado.
Para comenzar la explicación, es importante destacar que para cada una de las series, de-
scritas en la sección anterior, se realizaron las cuatro estrategias de pronósticos. Sin embargo,
se ejemplifica cada estrategia únicamente con el tratamiento de la variable dependiente PIB. La
finalidad de las cuatro estrategias es optimizar el modelo ARMAX e incrementar la capacidad
predictiva del modelo.
5.1 Transformación de variables
En primer lugar, se realizó una trasformación Box y Cox (1964) de cada variable explicativa.
Esta trasformación tiene el objetivo de mejorar la correlación entre las variables al garantizar el
17
cumplimiento de todos los supuestos del modelo lineal. Es decir, que las variables explicativas
tengan una varianza homogénea y su distribución de probabilidad se parezca a una distribución
normal.
Figura 5.1: Optimización de la trasformación Box-Cox
Las trasformaciones Box-Cox están dadas por:
Y (λ) =
(Y λ−1)
(λ×GMλ−1) cuando λ 6= 0
GM(ln(Y )) cuando λ = 0
Donde: GM = (Y1Y2Y3 . . . Yn)1/n
Donde se elige una lambda que minimice la diferencia de la distribución de los datos al
18
compararla con una distribución normal. Esta lambda se estima con un modelo de máxima
verosimilitud y se selecciona la lambda que acerque la distribución de los datos a una normal.
La Figura 5.1 muestra la elección de la lambda óptima para la variable PIB, donde se mini-
miza la varianza de la distribución de la variable exógena en comparación con una distribución
normal. Esta transformación mejora la correlación entre el PIB y las otras variables. En conse-
cuencia, mejora la predicción del PIB.
5.2 Desestacionalidad de las series
El filtro X-12 ARIMA desarrollado por Yule’s y Yule’s (n.d.) para efectuar la desestacional-
ización de la serie, supone que está compuesta por:
Xt = TCt + Et+ It
Dónde:
Xt = serie original
TCt = componente tendencia-ciclo
Et = componente estacional
It = componente irregular
Los métodos de promedios móviles presuponen que tanto la tendencia como la estacionali-
dad tienen comportamientos dinámicos con el paso del tiempo. En consecuencia, la tendencia y
el componente estacional, en un punto determinado del tiempo, se estima como promedio de las
observaciones previas y futuras.
La desestacionalización elimina el componente estacional y el componente de tendencia-
ciclo con el objetivo de eliminar la influencia de factores exógenos como: variaciones climáticas
estacionales, convenciones sociales o reglas administrativas (como las vacaciones). La deses-
tacionalidad elimina la irregularidad de la variable para dejar limpio el efecto de la variable
PIB.
19
Figura 5.2: Filtro X-12 ARIMA
7
8
9
10
11
12
13
14
15
16
1995 2000 2005 2010 2015
Mill
ones
de
peso
s
Años
PIBPIB despues del filtro(X-12 ARIMA)
La Figura numero 5.2 muestra la desestacionalización del PIB trimestral. En la gráfica supe-
rior se muestra la gráfica del PIB antes del proceso de desestacionalización y en la línea azul se
muestra la misma gráfica del PIB después del tratamiento de desestacionalización con el filtro
X-12 ARIMA.
5.3 Estimación del quiebre estructural
Un cambio estructural existe cuando hay un cambio inesperado en una serie de tiempo. Los
cambios estructurales pueden ser un cambio en la constante o un cambio en la tendencia. La es-
timación de quiebres estructurales de Bai y Perron (1998) recolecta varias muestras de la serie,
introduce un cambio estructural y estima un modelo lineal de mínimos cuadrados. Posterior-
mente, la prueba indica el punto en el tiempo donde la suma de los residuales al cuadrado es
mínima.
La Figura 5.3 muestra el tratamiento de quiebre estructural de la variable PIB. Como puede
observarse, la línea azul representa las distintas tendencias a lo largo de la serie. Los saltos
20
de la línea azul representan los quiebres estructurales de la serie. Mediante esta estimación
de cambios de constante y tendencia podemos definir mejor los cambios abruptos del PIB. Se
encontró que la variable PIB tiene tres quiebres estructurales. Las fechas son: 1995:1, 2007:4 y
2009:1.
Figura 5.3: Quiebre estructural
150
200
250
300
350
400
450
500
1995 2000 2005 2010 2015
Mile
s de
mill
ones
de
peso
s
Años
PIBLinea de tendencia
1995/1
2007/4
2009/11°quiebre:
2° quiebre:
3° quiebre:
5.4 Pruebas de estacionariedad
Al correr una regresión es importante la estacionariedad8 de la variable dependiente y la vari-
able independiente. La estacionariedad de la serie afecta las propiedades estadísticas de los esti-
madores. De tal forma, que una regresión con una que emplea variables no estacionarias puede
generar inferencia sin sentido (lo que se conoce habitualmente como regresión espuria), Granger
y Newbold (1974). Por lo consiguiente, antes de incluir las variables en el modelo econométrico
es necesario investigar individualmente la estacionariedad de cada serie de tiempo. En este8Estacionariedad en covarianzas se define como: sea {Y }∞t=−∞ un proceso aleatorio. Si ni sus medias ni
sus auto covarianzas (µt ni γjt∀j = 1, 2, . . . ) dependen del instante t entonces el proceso es estacionario encovarianzas.
21
proceso se hicieron cuatro pruebas de estacionalidad: 1) prueba de Dickey y Fuller (1979), 2)
prueba Dickey-Fuller GLS , 3) prueba Phillips y Perron (1988) y 4) coeficiente de integración
fraccional de Whittle (1951).
5.5 Estimación del modelo
Después de realizar las cuatro estrategias, se utilizaron dos tipos de modelos para la predicción
de la variable dependiente: Modelos autoregresivos con medias móviles y máquinas de soporte
vectorial.
La variable dependiente es el PIB trimestral. Mientras que las variables independientes son:
1) Índice Nacional de Precios al Consumidor (INPC), 2) INPC subyacente, 3) Indicador Global
de la Actividad Económica (IGAE), 4) Tipo de cambio (peso-dólar), 5) Precio del petróleo y
6) el Índice de Precios y Cotizaciones. A continuación se explican las características de cada
modelo en cuestión.
5.5.1 Modelos Autoregresivos con Medias Móviles
El modelo ARMAX (p, q, b) se refiere al modelo con p términos autoregresivos, q medias
móviles y b variables exógenas. El modelo ARMAX tiene los mismos principios del modelo
ARMA: se ponderan los rezagos que se correlacionan con la observación contemporánea AR
(p) y también se ponderan los residuales que se correlacionan con el error contemporáneo MA
(q). Adicionalmente, se incluye la correlación lineal de la combinación de variables exógenas
(d).
Xt = εt +
p∑i=1
φiXt−i +
q∑i=1
θiεt−i +b∑i=1
ηidt−i
Donde: η1 . . . ηb son los parámetros de las variables exógenas (dt).
22
5.5.2 Support Vector Regression (SVR) y Kernel Ridge Regression (KRR)
Los SVR y KRR se refieren a algoritmos computacionales basados en la teoría de aprendizaje.
Estos modelos realizan tres procedimientos para encontrar un modelo de clasificación parsi-
monioso: Primero, realizan una partición de los datos en regiones disconjuntas. Mediante un
algoritmo determinan el número de muestras en los datos. Segundo, el modelo realiza repre-
sentaciones de múltiples dimensiones de los datos. El objetivo es encontrar la representación
más simple de los datos para disminuir la complejidad del modelo. Tercero, el algoritmo pro-
pone una función que minimice el error entre el valor real y el valor predicho.
Figura 5.4: Muestreo y trasformación de los datos de los métodos de aprendizaje computacional
La Figura 5.4 muestra las dos primeras etapas del procedimiento de los SVR y KRR: En el
panel izquierdo se ejemplifica el muestreo de los datos y la partición de los datos en regiones
disconjuntas, mientras, el panel derecho muestra la segunda etapa donde se aumenta la dimen-
sión de los datos para encontrar un relación más simple de ellos. Finalmente, en la Figura 5.5
se muestra el ajuste de los diferentes modelos: en el panel izquierdo se muestra el ajuste de un
SVR y en el panel derecho se muestra el ajuste de un KRR.
23
Figura 5.5: Support Vector Regression y Kernel Ridge Regression
Existen múltiples tipos de SVR, o mejor dicho, existen SVR especializados en encontrar
distintas funciones en los datos: lineales, radiales, logarítmicas, exponenciales, entre otras. En
esta tesina se evalúa el comportamiento de los modelos SVR lineales, radiales y modelos no
lineales, llamados Kernel Ridge Regression (KRR), Welling (2013).
La técnica KRR propone una solución no lineal. Esta técnica parte de un espacio de entrada
no lineal y propone una solución no lineal para moverse a un espacio de características lineales.
La idea del KRR es semejante al SVR al hacer un muestreo de los datos de entrada y aumentar
la dimensión de los datos hasta encontrar un modelo idóneo. La principal diferencia entre los
modelos SVR y KRR es que los modelos SVR buscan dar ajuste a una regresión lineal mientras
que los modelos KRR amplían el catalogo de funciones a las funciones no lineales.
24
Capítulo 6
Resultados
En esta sección se describen y evalúan los resultados provenientes de dos tipos de modelos. Por
un lado están los resultados de los modelos Autoregresivos con medias móviles: 1) los modelos
que utilizan solamente el modelo ARIMA, 2) los modelos que utilizan el modelo ARMAX y 3)
los modelos que utilizan la trasformación Box-Cox, el filtroX−12 y el ajuste de quiebre estruc-
tural de Bai y Perron (2017). Por otro lado, están los resultados de los métodos de aprendizaje
computacional: 1) SVR radiales y 2) KRR.
6.1 Modelos Autoregresivos con Medias Móviles
La evaluación de los modelos de predicción se realiza tomando en cuenta dos aspectos. En
primer lugar, el tamaño del periodo9 . Se parte de la idea generalizada que los modelos a corto
plazo tienen más oportunidades de predicción que los de largo plazo. No obstante, la capacidad
para extrapolar el modelo es mejor en los modelos de largo plazo que en los modelos de corto
plazo. Por tal motivo, todos los modelos utilizan la muestra completa de los datos, Makridakis
et al. (1982).9El tamaño del periodo puede ser corto o largo plazo. Aunque son términos comparativos, se considera un
largo plazo cuando se utilizan todas las observaciones para predecir y en correspondencia, se considera corto plazocuando se utiliza solamente una muestra para la predicción. Por ejemplo: si nuestra base de datos es de 1993 hasta2016, un modelo de largo plazo utilizará este mismo periodo para predecir el año 2017. Mientras tanto, un modelode corto plazo puede utilizar solamente el año 2016 para predecir el 2017.
25
En segundo lugar, se toma en cuenta el porcentaje de error absoluto medio10 (MAPE por
sus siglas en inglés). Este porcentaje puede ser utilizado para comparar los ajustes obtenidos de
diferentes modelos. Los valores más pequeños indican un modelo de ajuste más adecuado.
6.1.1 Aproximación con modelos ARMA
Para el primer tipo de modelos se considera la representación más sencilla de un modelo ARMA
y se utiliza la misma variable del PIB rezagada para la predicción. El modelo ARMA utiliza
la serie del PIB trimestral diferenciada para eliminar la tendencia de la serie y los quiebres
estructurales. En el cuadro 6.1 se muestra un resumen de los resultados de los mejores modelos
estimados a partir de los modelos ARIMA:
Número Porcentaje Porcentaje deModelos de de error error absoluto
Observaciones medio medio
Datos tratados1) α + θ1 95 -0.098 1.11
Datos originales2) α + φ1 + φ3 + φ4 + φ6 + φ11 78 -103.35 210.19
Tabla 6.1: Resumen de modelos ARMA
El cuadro 6.1 muestra que el modelo con mejor ajuste es el modelo que usa los datos con el
tratamiento de la función Box Cox y el filtro X-12 ARIMA. Con base en el criterio del mínimo
porcentaje de error absoluto medio y el porcentaje de error medio podemos observar que la
utilización de datos tratados mejora la estimación de la serie dentro de la muestra.
10El error porcentual absoluto medio es un indicador del desempeño del pronóstico. El MAPE mide el tamañodel error absoluto en términos porcentuales. La fórmula del MAPE es: [(
∑| (Yt − yt)Yt |) /n]× 100 donde Yt es
igual al valor real, es igual al valor ajustado y n es igual al número de observaciones.
26
6.1.2 Aproximación con modelos ARMAX
Para el segundo tipo de modelos se considera la representación más sencilla de los modelos
ARMAX. Para predecir el PIB trimestral los modelos ARMAX utilizan cinco series de tiempo
adicionales: 1) Índice Nacional de Precios al Consumidor (INPC), 2) Indicador Global de la
Actividad Económica (IGAE), 3) Tipo de cambio (peso-dólar), 4) Precio del petróleo y 5) el
Índice de Precios y Cotizaciones. En el cuadro 6.2 se muestra un resumen de los tres modelos
ARMAX con el mejor ajuste.
Número Porcentaje Porcentaje deModelos de de error error absoluto
Observaciones medio medio
Datos tratados3) α + θ1 + θ2 94 0.054962 0.67042+∆Tipodecambio+ ∆IPC + ∆IGAE
Datos originales4) α + θ1 + θ2 94 -4.1821 133.73+∆Tipodecambio+ ∆IPC + ∆IGAE
Tabla 6.2: Resumen de modelos ARMAX
El cuadro 6.2 muestra que el modelo con mejor ajuste ocurre cuando se utilizan los datos
tratados. Según el mínimo porcentaje de error absoluto y el porcentaje de error medio, los mod-
elos ARMAX con datos tratos son mejores para la estimación del PIB. Es importante destacar
que todos los modelos estimados con el modelo ARMAX utilizan más datos y en general tienen
un mejor ajuste que los modelos de largo plazo ARMA.
6.1.3 Aproximación con modelos que utilizan la trasformación Box-Cox,
el filtro X − 12 y el ajuste de quiebre estructural de Bai y Perron
Para el tercer tipo de modelos se considera el modelo ARMAX y el ajuste de quiebre estructural
del PIB. Es importante destacar que tiene la misma especificación que el modelo ARMAX con
los datos tratados de la clasificación anterior con la única diferencia que se estima los quiebres
27
estructurales. En el cuadro 6.3 se muestra que mejora la estimación del PIB. Según los criterios
de Porcentaje de error Medio y el porcentaje de error absoluto medio podemos decir que este
modelo es el mejor de los modelos presentados en este trabajo. La Figura 6.1.3 muestra el
pronóstico dentro de la muestra realizado con el modelo. Se puede observar que la línea de
predicción se asemeja a la variable observada.
Número Porcentaje Porcentaje deModelo de de error error absoluto
Observaciones medio medio
Datos tratados5) α + θ1 + θ2 + ∆Tipodecambio 94 0.015425 0.6519+∆IPC + ∆IGAE + SB∗
Tabla 6.3: Modelo ARMAX con tratamiento de cambio estructural
Figura 6.1: Estimación intramuestral del PIB
40
60
80
100
120
140
160
180
200
1995 2000 2005 2010 2015
Billo
nes
de p
esos
Años
PIB observadoPIB estimado (intramuestral)
28
6.2 Métodos de aprendizaje computacional
La evaluación de este tipo de modelos se realiza utilizando las curvas de aprendizaje. Las curvas
de aprendizaje relacionan el tamaño de la muestra que el modelo utiliza para el entrenamiento y
el error absoluto medio del modelo.
Se parte de la idea que entre mayor sea el tamaño de la muestra mayor será la capacidad de
predicción. No obstante, es conveniente usar las curvas de aprendizaje porque pueden mostrar
el problema de ajuste en el modelo. Es decir, que el modelo no mejora la predicción aunque
aumente la muestra para entrenamiento, por el contrario, la predicción empeora. Además, las
curvas de aprendizaje puede mostrar gráficamente cuan mejor es un modelo respecto a otro. Por
este motivo, estos gráficos brindan la mejor alternativa en el momento de comparar distintos
modelos SVR y KRR.
6.2.1 Aproximación con SVR radiales
Debido a las características cíclicas del PIB, el modelo radial es quien mejor predice el compor-
tamiento del PIB comparado con el modelo lineal y polinomial. Los SVR radiales funcionan
mejor con los datos originales. Los datos originales son los que tiene mayor varianza y es
evidente el componente cíclico porque los datos no han sido desestacionalizados.
Con base en la curva de aprendizaje 6.2 y 6.3 podemos apreciar que no hay diferencia entre
mayor sea el porcentaje de los datos que el modelo utiliza para el entrenamiento. Es decir, que
el modelo SVR radial suele comportarme mejor que los modelos KRR cuando la muestra de
entrenamiento es pequeña (menos del 15 porciento de los datos).
Además, el modelo SVR radial funciona mejor cuidando los principios de ergodicidad y
estacionariedad de las series. Al utilizar las primeras diferencias de los datos se eliminó la
tendencia y la sospecha de caminata aleatoria de la serie. Es importante destacar que las pruebas
de estacionariedad dan prueba de la utilización de las primeras diferencias. Inclusive, la Figura
6.1 es evidencia que el modelo SVR radial funciona mejor con la primera diferencia de los datos
29
Figura 6.2: Curva de aprendizaje de los modelos que usan datos originales
Figura 6.3: Curva de aprendizaje de los modelos que usan datos tratados
originales.
30
6.2.2 Aproximación con modelos KRR
Los modelos KRR resultaron ser los mejores con los datos originales, los tratados y las primeras
diferencias. Este tipo de modelos amplia el catálogo de funciones lineales y no lineales que los
modelos SVR, por tal motivo, resulta esperado que mejoren los pronósticos al encontrar más
relaciones entre las variables.
Figura 6.4: Curva de aprendizaje de los modelos que usan primeras diferencias
Los modelos KRR mejoran con el aumento de la muestra de datos para entrenamiento. El
aumento en el ajuste del modelo aumenta exponencialmente después del 10 porciento del por-
centaje de datos para el entrenamiento. Esto nos puede dar una idea del funcionamiento y de
la utilización de estos modelos para predecir. En otras palabras, los modelos KRR son ideales
cuando tenemos un mayor número de observaciones.
Al igual que los modelos SVR radiales, el modelo KRR funciona mejor cuidando los princi-
pios de ergodicidad y estacionaridad de la serie. La Figura 6.5 da evidencia del sobreajuste del
modelo KRR con los datos originales (línea amarilla).
No obstante, el modelo KRR con los datos originales es el mejor modelo para pronóstico
31
Figura 6.5: Curva de aprendizaje de los mejores tres modelos
Figura 6.6: Estimación intramuestral del PIB con modelos KRR
7
8
9
10
11
12
13
14
15
16
1995 2000 2005 2010 2015
Mill
ones
de
peso
s
Años
PIB (sin desestacionalizar)KRR (primeras diferencias)
KRR (datos originales)
del PIB intramuestral. La Figura 6.6 es prueba del mejor ajuste entre los modelos. Como puede
observarse, los modelos KRR persiguen la misma tendencia que los movimientos del PIB, sin
32
embargo, hay un sesgo en el modelo que utiliza las primeras diferencias. Esto puede deberse a
la perdida de la tendencia al momento de diferenciar la serie.
6.3 Comparación de pronósticos intramuestrales y extramues-
trales
Figura 6.7: Pronóstico ARMAX intra y extra-muestral
100
120
140
160
180
200
220
2000 2002 2004 2006 2008 2010 2012 2014 2016
Billo
nes
de p
esos
Años
PIBPredicción
Intervalo de 95 por ciento
Predicción intramuestral
Predicción extramuestral
En este apartado se muestran los resultados de los pronósticos intramuestrales y extramues-
trales del mejor modelo ARMAX y el mejor modelo SVR. Los modelos ARMAX se evaluaron
con el porcentaje de error medio y el porcentaje de error absoluto medio. Mientras, los modelos
SVR se evaluaron con el coeficiente de determinación (R2). Además, el modelo ARMAX utiliza
datos tratados con la trasformación Box-Cox y el filtro X-12 ARIMA, mientras, el modelo SVR
utiliza los datos originales. Por tal motivo, la comparación de los modelos se realizó utilizando
el gráfico XY (o línea de 45 grados) para observar la relación lineal entre las dos variables.
Mejor dicho, se utiliza la línea de 45 grados para observar el ajuste del PIB observada y el PIB
33
estimada.
Figura 6.8: PIB original con respecto al pronóstico intramuestral de KRR
7
8
9
10
11
12
13
14
15
16
8 9 10 11 12 13 14
PIB
orig
inal
(M
dp)
KRR con datos originales (Mdp)
PIB ObservadoPIB Estimado
La línea de 45 grados puede mostrar visualmente el ajuste del modelo a los datos. Mientras
más alineados estén los datos observados (cruces rojas) a los datos estimados (línea recta) indica
que el modelo es un buen estimador. Es más, se puede realizar una estimación de mínimos
cuadrados ordinarios entre los datos observados y los datos estimados para saber el coeficiente
de determinación del modelo. Todo esto con el objetivo de realizar la comparación entre dos
tipos de modelos que utilizan diferentes formas de medir el ajuste y diferentes datos.
Pronósticos intramuestrales
Los pronósticos intramuestrales se realizaron utilizando los datos de 1993 a 2015. Estos datos
corresponden al 95 por ciento de la muestra. Las Figuras 6.6 y 6.1 muestran el ajuste de los
modelos. Mientras, las Figuras 6.7 y 6.8 muestran de una manera más simple el ajuste de
los modelos KRR y el modelo ARMAX. Visualmente podemos comparar en la línea de 45
grados que el ajuste ARMAX es mejor que el ajuste del modelo KRR porque las observaciones
34
Figura 6.9: PIB con respecto al pronóstico intramuestral ARMAX con datos tratados
40
60
80
100
120
140
160
180
200
220
60 80 100 120 140 160 180 200
PIB
con
dato
s tr
atad
os (
Bdp)
ARMAX con datos tratados (Bdp)
PIB ObservadoPIB Estimado
se alinean mejor en el modelo ARMAX. En el cuadro 6.4 se muestra el ajuste de mínimos
cuadrados de la línea diagonal con las observaciones del PIB. En resumen, las gráficas y el
cuadro indican que el mejor ajuste es el del modelo ARMAX.
NúmeroModelos de Coeficiente R2
observaciones
Datos tratados5)α + θ1 + θ2 + ∆Tipodecambio 91 .999984*** .999627+∆IPC + ∆IGAE + SB∗
Datos originales6)KRR 91 1.0049*** .993341kernel = lineal, α = .1
Tabla 6.4: Ajuste Mínimo Cuadrático de los pronósticos intramuestrales
35
Figura 6.10: Pronóstico ARMAX extramuestral
140
150
160
170
180
190
200
210
220
2011 2012 2013 2014 2015 2016
Billo
nes
de p
esos
Años
PIB estimadaPIB obsevada
Pronósticos extramuestrales
Los pronósticos extramuestrales se realizaron utilizando el 70 por ciento de los datos para el
entrenamiento del modelo y se utilizó el resto para probar el ajuste. Como puede observarse
en la gráfica 6.9, la predicción extramuestral corresponde al primer trimestre del 2010 hasta el
cuarto trimestre del 2016. Las gráficas 6.10 y 6.11 muestran el pronóstico del PIB extramuestral
utilizando los modelos ARMAX y KRR, respectivamente.
Además, las figuras 6.12 y 6.13 muestran gráficamente el ajuste de ambos modelos de man-
era más simple. Podemos observar que visualmente el ajuste del modelo ARMAX es mejor
que el ajuste del modelo KRR. El cuadro 6.5 indica el mismo resultado, según el coeficiente de
determinación.
Ventajas y desventajas
La estrategia de pronóstico está adaptada para los modelos ARMA, la estrategia se encarga de
optimizar la correlación entre las variables, limpiar los movimientos estacionales y los compo-
36
Figura 6.11: Pronóstico KRR extramuestral
12
12.5
13
13.5
14
14.5
15
15.5
2011 2012 2013 2014 2015 2016
Mill
ones
de
peso
s
Años
PIB observado PIB estimado
Figura 6.12: PIB con respecto al pronóstico extramuestral ARMAX con datos tratados
140
150
160
170
180
190
200
210
220
150 160 170 180 190 200
PIB
obse
rvad
a Bd
p
PIB estimada Bdp
PIB observada PIB estimada
nentes estocásticos de la serie. Por tal motivo, es esperado que sea útil para los modelos ARMA
y no lo sea para los modelos SVR.
37
Figura 6.13: PIB con respecto al pronóstico extramuestral KRR con datos originales
12
12.5
13
13.5
14
14.5
15
15.5
12.5 13 13.5 14 14.5
PIB
obse
rvad
a M
dp
PIB estimada Mdp
PIB observadaPIB estimada
NúmeroModelos de Coeficiente R2
observaciones
Datos tratados7)α + θ1 + IGAE + INPCsub 27 .93286*** .9979+∆IPC1 + SB∗
Datos originales8)KRR 27 1.02145*** .90017kernel = lineal, α = .1
Tabla 6.5: Ajuste Mínimo Cuadrático de los pronósticos extramuestrales
La construcción del mejor modelo presentado en esta tesis se realizó usando la metodología
Box-Jenkins y se realizaron aproximadamente 70 modelos para encontrar el modelo óptimo.
Este procedimiento tomo alrededor de 2 horas para cada modelo.
La construcción y el ajuste de los modelos ARMAX mejoran con el aumento de observa-
ciones. La estrategia de pronóstico tomo aproximadamente 8 horas para cada serie. El proceso
de construcción es artesanal. Es decir, es necesario tener práctica y conocimientos previos para
38
poder modelar.
La estrategia de pronóstico permite encontrar patrones en los movimientos de la serie que no
son esenciales para la construcción de un modelo ARMA. En este sentido, la estrategia divide
la serie en varios componentes que pueden ser tratados de una manera más especializada.
Los modelos SVR constituyen un buen pronóstico instantáneo de una serie de tiempo. En
particular los modelos KRR constituyen un mejor indicio que los modelos ARMA sin la es-
trategia de pronóstico. Estos modelos se nutren de la varianza de la serie y en consecuencia, la
estrategia de pronostico no mejora los resultados del pronóstico.
La construcción y ajuste de los modelos KRR toma alrededor de media hora. El modelo
se auto ajusta a partir de una línea de comando. En este caso el pronóstico del modelo KRR
solamente utilizo el 35 por ciento de los datos. En otra palabras, este tipo de modelos es útil en
muestras pequeñas.
39
Capítulo 7
Implicaciones de Política Pública
La metodología propuesta en este trabajo establece guías de apoyo para mejorar los pronósticos.
También, mejora la interpretación y conocimiento de los movimientos que son complejos en la
series de tiempo. En esencia, reduce la incertidumbre y respalda las decisiones de los hacedores
de política pública.
Esta metodología es parte de un herramental para el diseño, construcción y evaluación de
políticas públicas. Proporciona un estimado cuantitativo de la importancia de los movimientos
estocásticos, los movimientos estacionales y los cambios en la tendencia natural de la serie. Ya
que, es posible establecer la proporción y la influencia de diversos efectos en el comportamiento
de las series. Esto es, se puede obtener un conocimiento más amplio de todos los efectos en
lugar de establecerlos como un ruido blanco.
Con base en los resultados obtenidos en este trabajo, las implicaciones directas que tiene la
metodología propuesta en este documento son cuatro. En primer lugar, la metodología puede
ser utilizada para otros datos de series de tiempo. Estas series pueden ser tan generales como
específicas. Por ejemplo, población, clima, temperatura, nivel del mar, flujos de efectivo, ventas,
entre otras.
En segundo lugar, es posible realizar estimaciones sobre el impacto de ciertas políticas públi-
cas. Es decir, mediante el estudio del quiebre estructural podemos saber el impacto de ciertas
40
reformas, cambios o creación de políticas públicas. En este sentido, el cambio estructural puede
mostrar cambios de una variable que representa un problema tratado con una política pública,
puede mostrar la evolución del problema y el efecto de diversas soluciones.
En tercer lugar, tener mejores mediciones puede mejorar el análisis de los problemas sociales
y contribuir al desarrollo de soluciones. Inclusive, puede mejorar la toma de decisiones por parte
de los hacedores de políticas y los diseñadores de programas sociales. Por ejemplo, se pueden
realizar estimaciones intramuestrales y extramuestrales para tomar decisiones sobre la viabilidad
de proyectos o sobre el comportamiento de variables con tendencia.
41
Capítulo 8
Conclusiones
En este documento se realizaron diferentes estimaciones del PIB trimestral dentro de la muestra
utilizando dos tipos de modelos. Primero, los Modelos Autorregresivos de medias móviles:
1) modelos ARMA, 2) modelos ARMAX y 3) modelos ARMAX con estimación de quiebres
estructurales. Segundo, Métodos de aprendizaje computacional: 1) SVR Radial y 2) KRR.
Además, para las estimaciones se utilizaron dos tipos de datos: datos trimestrales originales y
datos trimestrales tratados con la función de transformación Box Cox y el filtro X − − − 12
ARIMA.
Por un lado, el propósito de utilizar dos tipos de datos fue mostrar los beneficios de la es-
trategia de predicción que aquí se presenta. La utilización de la trasformación Box-Cox permite
optimizar la correlación entre las variables. Mientras tanto, el filtro X − 12 ARIMA permite
estimar el componente cíclico de las series y limpiar el error estocástico. Por otro lado, se uti-
lizaron datos trimestrales para no cambiar la frecuencia de los datos del PIB y aumentar el ruido
en la serie.
De las diferentes estimaciones del PIB dentro de la muestra, se encontró que la mejor aprox-
imación se obtuvo con modelos ARMAX que utiliza el ajuste de quiebre estructural de Bai y
Perron y los datos tratados con la trasformación Box-Cox y el filtro X − 12. La forma de eval-
uar los modelos fue comparando dos diferentes medidas de error: el porcentaje de error absoluto
42
medio, r2 y el error absoluto medio.
Cabe destacar que no fue posible evaluar la propuesta de estimación aquí presentada con la
metodología utilizada por el Banco de México para la predicción del PIB. La razón es que la
metodología del banco central está restringida al público.
43
Referencias
Amparán, J. P. G., y Palacio, Y. V. (2003). “Manual sobre la clasificación económica del gasto
público.” Programa de Presupuesto y Gasto Público. Centro de Investigación y Docencia
Económica. CIDE, AC.
Bai, J., y Perron, P. (1998). “Estimating and testing linear models with multiple structural
changes.” Econometrica, 47–78.
Box, G. E., y Cox, D. R. (1964). “An analysis of transformations.” Journal of the Royal
Statistical Society. Series B (Methodological), 211–252.
Box, G. E., y Jenkins, G. M. (1976). “Time series analysis, rev. ed.” Holden, Oakland.
Bureau, U. C. (2002). X12 arima reference manual (Tech. Rep.).
Cao, L. (2003). “Support vector machines experts for time series forecasting.” Neurocomputing,
51, 321–339.
Capistrán, C., y López-Moctezuma, G. (2010). “Las expectativas macroeconómicas de los
especialistas. una evaluación de pronósticos de corto plazo en méxico.” El trimestre
económico, 77(306), 275–312.
Cowpertwait, P. S., y Metcalfe, A. V. (2009). Introductory time series with r. Springer Science
& Business Media.
de La Federación, D. O., y del presupuesto de las asignaciones. (2015). “Presupuesto de egresos
de la federación para el ejercicio fiscal 2015.”
Dickey, D. A., y Fuller, W. A. (1979). “Distribution of the estimators for autoregressive time
series with a unit root.” Journal of the American statistical association, 74(366a), 427–
44
431.
Elguezabal, A. P.-L. (1995). Un modelo de cointegracion para pronosticar el pib de mexico.
Banco de Mexico.
Elguézabal, A. P. L. (2004a). An econometric forecast model of private investment in mexico
(Tech. Rep.). Banco de México.
Elguézabal, A. P. L. (2004b). “Un modelo de pronósticos de la formación bruta de capital
privada de méxico.”
Elizondo, R. (2012). Estimaciones del pib mensual basadas en el igae (Tech. Rep.). Working
Papers, Banco de México.
Enders, W. (2004). “Applied econometric time series, by walter.” Technometrics, 46(2), 264.
Granger, C. W., y Newbold, P. (1974). “Spurious regressions in econometrics.” Journal of
econometrics, 2(2), 111–120.
Gutiérrez Lara, A. A. (2015). “Gasto público y presupuesto base cero en méxico.” El Cotidi-
ano(192).
Hamilton, J. D. (1994). Time series analysis (Vol. 2). Princeton university press Princeton.
Hernández Veleros, Z. S. (2011). “Finanzas públicas y crecimiento económico en los años
2003-2010: endeudamiento estatal y crisis económica.”.
Ize, A., y Salas, J. (1983). El comportamiento macroeconómico de la economía mexicana entre
1961 y 1981: especificaciones, alternativas y pruebas de hipótesis (No. 53). Banco de
México, Subdirección de Investigación Económica.
Kleinert, H. (2004). “Option pricing for non-gaussian price fluctuations.” Physica A: Statistical
Mechanics and its Applications, 338(1), 151–159.
Makridakis, S., Andersen, A., Carbone, R., Fildes, R., Hibon, M., Lewandowski, R., . . . Win-
kler, R. (1982). “The accuracy of extrapolation (time series) methods: Results of a
forecasting competition.” Journal of forecasting, 1(2), 111–153.
Neter, J., Kutner, M. H., Nachtsheim, C. J., y Wasserman, W. (1996). Applied linear statistical
models (Vol. 4). Irwin Chicago.
45
Phillips, P. C., y Perron, P. (1988). “Testing for a unit root in time series regression.” Biometrika,
75(2), 335–346.
Qiu, X., Suganthan, P., y Amaratunga, G. A. (2017). “Short-term electricity price forecasting
with empirical mode decomposition based ensemble kernel machines.” Procedia Com-
puter Science, 108, 1308–1317.
Revuz, D., y Yor, M. (1999). Continuous martingales and brownian motion, vol. 293 of
grundlehren der mathematischen wissenschaften [fundamental principles of mathemat-
ical sciences]. Springer-Verlag, Berlin.
Rüping, S. (2001). Svm kernels for time series analysis (Tech. Rep.). Technical Report, SFB
475: Komplexitätsreduktion in Multivariaten Datenstrukturen, Universität Dortmund.
Sargan, J. D., y Bhargava, A. (1983). “Testing residuals from least squares regression for being
generated by the gaussian random walk.” Econometrica: Journal of the Econometric
Society, 153–174.
Singh, B., y Sahni, B. S. (1984). “Causality between public expenditure and national income.”
The Review of economics and Statistics, 630–644.
Thissen, U., Van Brakel, R., De Weijer, A., Melssen, W., y Buydens, L. (2003). “Using support
vector machines for time series prediction.” Chemometrics and intelligent laboratory
systems, 69(1), 35–49.
Vapnik, V. N., y Vapnik, V. (1998). Statistical learning theory (Vol. 1). Wiley New York.
Welling, M. (2013). “Kernel ridge regression.” Max Welling’s Classnotes in Machine Learning,
1–3.
Whittle, P. (1951). “Hypothesis testing in time series analysis-hafner.” New York, 1951.–136 p.
Yule’s, I., y Yule’s, K. (n.d.). “X-12-arima.”
46
top related