2
PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 20 08/2009
Práctica 4
Planteamiento y objetivos de la práctica
En la presente práctica se propone la modelización univariante por medio del
enfoque de Box-Jenkins de tres series temporales con características distintas. En
cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin
de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que
considere más importantes en cada ejemplo y dejar los pasos omitidos para que los
cubran los alumnos después por su cuenta.
Con la presente práctica se intenta que el alumno aprenda a construir
modelos ARIMA univariantes para una serie temporal por medio del enfoque de
Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas
hasta elaborar el posible modelo generador de los datos. De forma sintética los
pasos a realizar son los siguientes:
• Especificación inicial
• Estimación
• Chequeo o validación
• Utilización del modelo 1
En la etapa de especificación inicial se deberá determinar el orden de
integración de la serie temporal, es decir cual es el número y naturaleza (regular o
estacional, incluyendo trimestral, mensual, etc.) de diferencias que se requerirán
para convertir en estacionaria a la variable objeto de análisis, Zt (d,s).
Zt = (1-B)d (1-Bs ) D
1 El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas) estacionarias, impredecibilidad, para basar sobre él la extracción de señales como el componente estacional, etc.
3
Donde: d es el número de diferencias regulares y D es el número de diferencias de
tipo estacional y habitualmente D = 0 ó 1 y habitualmente 0 ≤ d+D ≤ 2.
Para ello se utiliza tanto el análisis gráfico de la serie, que nos revela
determinadas características de la misma, como sus correlogramas simple y parcial
y los tests de raíces unitarias. En esta práctica nos centramos en el test de raíces
unitarias de Dickey y Fuller aumentado (ADF o DF simplemente).
Una vez decidido el orden d y D, es decir el número de raíces unitarias que
tiene la serie temporal, habrá que decidir el orden del polinomio autorregresivo (p) y
el de medias móviles (q) para lo cual utilizamos como principales instrumentos el
correlograma simple y el parcial de la serie. Los criterios generales que deben
servir de guía para determinar el orden p del polinomio autorregresivo y el orden q
del polinomio medias móviles se recogen en las estructuras de los correlogramas
simple (FAC) y parcial (FAP) y que para los casos más sencillos se han visto en las
clases teóricas. Un resumen de las características de la estructura del correlograma
simple y del parcial se recoge en el esquema adjunto.
Características teóricas de la FAC y de la FAP de l os procesos estacionarios Procesos FAC FAP
AR (p) Decrecimiento rápido hacia
cero sin llegar a anularse
P primeras autocorrelaciones
distintas de cero y el resto
ceros
MA (p) q primeras autocorrelaciones
significativas y el resto ceros
Decrecimiento rápido hacia
cero sin llegar a anularse
ARMA (p, q) Decrecimiento rápido hacia
cero sin llegar a anularse
Decrecimiento rápido hacia
cero sin llegar a anularse
Debe quedar claro que la identificación es siempre tentativa por lo que se
deben sugerir varios modelos como posibles procesos generadores de datos. Una
vez que se han sugerido uno o varios modelos se procede a su estimación,
4
usualmente por máxima verosimilitud aunque en Eviews este método no está
implementado. Posteriormente se debe realizar el chequeo ó validación del modelo
y escoger el que parezca más adecuado para la utilización del modelo. Algunos de
los criterios de validación del modelo más importantes incluyen el análisis de la
autocorrelación y de valores atípicos de los residuos, la significatividad de los
parámetros estimados del modelo (así como sus correlaciones), las condiciones de
estacionariedad e invertibilidad y distintos criterios de ajuste (como el error estándar
de la regresión, el de Akaike o el de Scharwz).
En esta práctica se realiza la modelización de tres series temporales de
datos reales y características distintas. El primer caso se refiere al volumen de
ventas anual de una empresa en términos reales, el segundo analiza el Índice de
empleo de un determinado país con frecuencia trimestral y en el último se modeliza
una serie de frecuencia mensual y con estacionalidad, las ventas de cigarros puros
de una empresa tabaquera.
Ejemplo1. Ventas anuales de una empresa
La serie que se modeliza se refiere a las ventas en términos reales de una
determinada empresa dedicada a la producción de cosméticos. Su periodicidad es
anual y el tamaño muestral abarca 51 observaciones que comprenden el periodo
1949-1999; dada su frecuencia anual, esta serie no tendrá componente estacional.
El primer paso que debemos dar para elaborar el modelo univariante de las series
es crear en Eviews el workfile con frecuencia anual y tamaño muestral indicado e
importamos los datos, tal y como hemos hecho en las prácticas anteriores. La
variable la denominamos ventas
Una vez cargados los datos debemos verificar si la serie temporal es
estacionaria y, en caso de que no lo sea, realizar las transformaciones pertinentes
hasta convertirla en estacionaria. Para ello en primer lugar graficamos la serie
ventas, gráfico que se muestra a continuación.
5
Las instrucciones en Eviews para obtener el gráfico de la serie son:
Quik/Graph /ventas/Line Graph
500
600
700
800
900
1000
1100
1200
50 55 60 65 70 75 80 85 90 95
VENTAS
Evolución de las ventas
Se observa que tiene una tendencia creciente muy acentuada, lo que es un
claro signo de que la serie no es estacionaria en media, además ese crecimiento
muestras signos de regularidad por lo que la varianza aparentemente exhibe cierto
grado de estabilidad y no es del todo preciso tomar logaritmos.
En segundo lugar obtenemos los correlogramas
Instrucciones en Eviews para obtener los correlogramas de ventas
Quick/Series Statistics/Correlogram/ventas
También de forma alternativa en el objeto serie (ventas)
View/Correlogram
6
El correlograma simple de ventas (AC) confirma la sospecha anterior sobre la no
estacionariedad de la variable ventas al mostrar un decrecimiento muy lento.
Adicionalmente llevamos a cabo el test de raíces unitarias de DF.
Instrucciones en Eviews para el test DF:
Quick/Series Statistics/unit root/ventas
Null Hypothesis: VENTAS has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=10)
t-Statistic Prob.* Augmented Dickey-Fuller test statistic -0.906450 0.7780
Test critical values: 1% level -3.571310 5% level -2.922449 10% level -2.599224 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(VENTAS) Method: Least Squares Date: 04/11/06 Time: 17:42 Sample (adjusted): 1951 1999 Included observations: 49 after adjustments
7
Variable Coefficient Std. Error t-Statistic Prob. VENTAS(-1) -0.001026 0.001132 -0.906450 0.3694
D(VENTAS(-1)) 0.577317 0.111009 5.200645 0.0000 C 5.282546 1.831241 2.884682 0.0059 R-squared 0.454475 Mean dependent var 10.49688
Adjusted R-squared 0.430757 S.D. dependent var 1.402848 S.E. of regression 1.058424 Akaike info criterion 3.010708 Sum squared resid 51.53198 Schwarz criterion 3.126534 Log likelihood -70.76235 F-statistic 19.16125 Durbin-Watson stat 2.399094 Prob(F-statistic) 0.000001
El Valor del estadístico t (-0.906) es inferior a los valores críticos de la distribución
DF por lo que no se puede rechazar la hipótesis de la existencia de una raíz unitaria
y, por tanto, la serie ventas no es estacionaria.
Como un primer paso para eliminar la tendencia y convertir la serie en estacionaria
se prueba con el ajuste de una tendencia lineal determinista a la serie ventas .
Para ello, se ajusta una tendencia determinista a la variable ventas del tipo:
ventas = c + ββββ t + εεεεt
Cuya estimación se presenta a continuación
Instrucciones en Eviews para la estimación de la tendencia determinista:
Quick /estimate equation
Y en la ventana de la ecuación que se abre escribir: ventas c @trend+1
El resultado de la estimación es:
Dependent Variable: VENTAS Method: Least Squares Date: 04/09/06 Time: 19:17 Sample: 1949 1999 Included observations: 51
Variable Coefficient Std. Error t-Statistic Prob. C 605.9019 1.299179 466.3730 0.0000
@TREND+1 10.39500 0.043483 239.0563 0.0000
8
R-squared 0.999143 Mean dependent var 876.1719
Adjusted R-squared 0.999126 S.D. dependent var 154.5990 S.E. of regression 4.570939 Akaike info criterion 5.915740 Sum squared resid 1023.781 Schwarz criterion 5.991498 Log likelihood -148.8514 F-statistic 57147.92 Durbin-Watson stat 0.109129 Prob(F-statistic) 0.000000
-16
-12
-8
-4
0
4
8
12
50 55 60 65 70 75 80 85 90 95
VENTAS Residuals
Analizando esos resultados podemos observar que la estimación de los
residuos presenta un estadístico Durban-Watson próximo a cero, lo que es
indicativo de una fuerte autocorrelación de primer orden y de la existencia una raíz
unitaria y que, por lo tanto, no cumplen las condiciones para que sean ruido
blanco. El gráfico de los residuos la serie ventas también muestra esos problemas y
nos indica que los residuos se han mantenido por encima y/o por debajo de la
media durante un periodo demasiado largo. Por lo tanto, el ajuste con tendencia
determinista no es adecuado puesto que olvida determinadas propiedades
importantes de la serie
Dado que el procedimiento anterior no es el adecuado, la tendencia es tipo
estocástica y utilizamos a continuación el procedimiento de la diferenciación para
9
convertir a la serie en estacionaria. Tomamos la primera diferencia en la serie
ventas para lo que generamos la serie de Dventas =ventas-ventas(-1) , es decir,
transformamos la serie de acuerdo con la siguiente expresión:
Zt =(1-B)ventas
La representación gráfica de la serie transformada y sus correspondientes
correlogramas se muestran a continuación.
7
8
9
10
11
12
13
14
15
50 55 60 65 70 75 80 85 90 95
DVENTAS
Primera diferencia de la serie ventas
10
Tanto el gráfico de la serie Dventas como su correlograma indican que la
primera diferencia de la serie puede ser estacionaria puesto que oscila en torno a
su nivel medio y el correlograma tiende a cero con cierta rapidez. No obstante, se
completa este análisis con el test DFA de raíces unitarias que se muestra a
continuación
Test de D-F Aumentado de Dventas
Null Hypothesis: DVENTAS has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=10)
t-Statistic Prob.* Augmented Dickey-Fuller test statistic -3.777505 0.0057
Test critical values: 1% level -3.571310 5% level -2.922449 10% level -2.599224 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(DVENTAS) Method: Least Squares Date: 04/11/06 Time: 21:55 Sample (adjusted): 1951 1999 Included observations: 49 after adjustments
Variable Coefficient Std. Error t-Statistic Prob. DVENTAS(-1) -0.381068 0.100878 -3.777505 0.0004
C 3.942637 1.078866 3.654428 0.0006 R-squared 0.232898 Mean dependent var -0.092714
Adjusted R-squared 0.216577 S.D. dependent var 1.193536 S.E. of regression 1.056413 Akaike info criterion 2.987596 Sum squared resid 52.45244 Schwarz criterion 3.064813 Log likelihood -71.19611 F-statistic 14.26955 Durbin-Watson stat 2.473364 Prob(F-statistic) 0.000445
El test DFA rechaza la hipótesis nula de una raíz unitaria en Dventas puesto
que el valor del estadístico t (3,78) supera el valor de los puntos críticos de la
11
distribución DFA. Este resultado corrobora la estacionariedad de la serie Dventas
que indican el gráfico y el correlograma de la serie
Por lo tanto, de estos resultados la transformación que convertiría a la serie
en estacionaria sería:
Zt = (1-B) ventas o ventas ∼∼∼∼I (1)
Una vez decidido el grado de integración de la serie, es decir, el número de raíces
unitarias que tiene, se debe determinar cuales son los posibles procesos ARMA
que generan la serie.
El análisis de los correlograma de la serie Dventas nos dice que el modelo más
claro que puede generar la serie es un AR(2), puesto que el correlograma simple
tiende a cero con cierta rapidez y el parcial se anula después del segundo retardo.
También se puede sugerir como un modelo alternativo, aunque no tan
rotundamente como en el caso anterior, un MA(3) puesto que el correlograma
simple se anula después del tercero o cuarto retardo. Por otro lado, de la
observación del gráfico de la serie que consideramos estacionaria, D(ventas,1), se
observa que su media es distinta de cero, por lo que procede en principio la
inclusión de un término independiente.
Los modelos sugeridos son:
1.1) ARIMA(2,1,0) : (1- φφφφ1B- φφφφ2B2 ) (1-B) ventas = C+a t
1.2) ARIMA(0,1,3) : (1-B) ventas = C+ (1+ θθθθ1B+ θθθθ2B2+ θθθθ3B3)at
Un análisis más detallado de la estructura del correlograma podría sugerir algún
modelo adicional pero de momento nos quedamos con los propuestos.
Estimación
12
Una vez especificados varios modelos alternativos como posibles generadores de
la serie se debe proceder a la estimación de los mismos. Para ello en Eviews se
deben dar las siguientes instrucciones para estimar los modelos sugeridos.
Modelo 1.1: Quick/Estimate Equation/ LS d(ventas,1) c ar(1) ar (2)
Modelo 1.2: Quick/Estimate Equation/ LS d(ventas,1) c ma(1) ma (2) ma(3)
Los resultados de la estimación de estos modelos se presentan a continuación:
Estimación Modelo1.1
Dependent Variable: DVENTAS Method: Least Squares Date: 04/09/06 Time: 19:10 Sample (adjusted): 1952 1999 Included observations: 48 after adjustments Convergence achieved after 3 iterations
Variable Coefficient Std. Error t-Statistic Prob. C 10.11214 0.616994 16.38936 0.0000
AR(1) 0.368149 0.135783 2.711310 0.0095 AR(2) 0.388732 0.127968 3.037719 0.0040
R-squared 0.525916 Mean dependent var 10.45896
Adjusted R-squared 0.504846 S.D. dependent var 1.392085 S.E. of regression 0.979571 Akaike info criterion 2.857057 Sum squared resid 43.18014 Schwarz criterion 2.974007 Log likelihood -65.56936 F-statistic 24.95999 Durbin-Watson stat 1.991277 Prob(F-statistic) 0.000000
Inverted AR Roots .83 -.47
Estimación modelo 1.2
Dependent Variable: DVENTAS Method: Least Squares Date: 04/09/06 Time: 19:02 Sample (adjusted): 1950 1999 Included observations: 50 after adjustments Convergence achieved after 13 iterations Backcast: 1946 1948
Variable Coefficient Std. Error t-Statistic Prob.
13
C 10.43083 0.392970 26.54353 0.0000
MA(1) 0.497157 0.101433 4.901323 0.0000 MA(2) 0.564666 0.097743 5.777057 0.0000 MA(3) 0.632436 0.086339 7.324991 0.0000
R-squared 0.557023 Mean dependent var 10.57670
Adjusted R-squared 0.528133 S.D. dependent var 1.498800 S.E. of regression 1.029564 Akaike info criterion 2.972767 Sum squared resid 48.76011 Schwarz criterion 3.125729 Log likelihood -70.31917 F-statistic 19.28094 Durbin-Watson stat 2.161780 Prob(F-statistic) 0.000000
Inverted MA Roots .15-.88i .15+.88i -.79
Una vez estimados los modelos especificados se debe validar dichas estimaciones,
es decir, se debe contrastar la adecuación del modelo a los datos, por medio de
una batería de tests estadísticos y econométricos vistos en clase y que se
encuentran en Eviews en el objeto ecuación.
Validación o chequeo
En la etapa de validación se presentan tres bloques de análisis: Un primero
referente a los resultados de la estimación, un segundo centrado en el análisis de
los residuos y, finalmente, un tercero dedicado a la comparación de modelos
alternativos.
• Análisis de la estimación.-
Referente a la significatividad individual de los coeficientes por medio del
estadístico t de student pone de relieve que todos los coeficientes del modelo 1 son
altamente significativos y también lo son los del modelo 2.
En cuanto a las condiciones de estacionariedad e invertibilidad de los modelos
estimados, todas las raíces de los polinomios de retardos caen fuera de circulo de
radio unidad, ver cuadros anteriores de estimaciones, debe tenerse en cuenta que
Eviews muestra la inversa de las raíces, por lo que esas inversas caen todas dentro
del circulo de radio unidad.
14
De la observación de los resultados de la estimación se deduce que el modelo 1.1
presenta un error estándar (0,979), ligeramente más bajo que el del modelo 1.2
(1,029) y tanto el estadístico de Akaike como el criterio de Schwarz son inferiores
en el primer modelo, 2,857 y 2,974, frente a 2,973 y 3,126
En esta etapa también se suele analizar las correlaciones entre los coeficientes
estimados para verificar la posible existencia de multicolinealidad en el modelo. La
existencia de multicolinealidad indica una falta de precisión en las estimaciones
obtenidas y una cierta inestabilidad de los coeficientes estimados. Para obtener las
correlaciones entre los coeficientes se acude su matriz de correlaciones que
proporciona Eviews, para ello nos situamos en la ecuación estimada y marcamos lo
siguiente:
View/Correlation Matrix
La ejecución de esta instrucción muestra la matriz de coeficientes de la
ecuación estimada. Para el modelo 1.1 se tiene:
Matriz de correlaciones del modelo 1
C AR(1) AR(2) C 0.380682 -0.005342 -0.015880
AR(1) -0.005342 0.018437 -0.011620 AR(2) -0.015880 -0.011620 0.016376
Se observa que esa matriz presenta unas correlaciones muy bajas por lo que no
muestra indicios de multicolinealidad. Para el modelo 1.2 se puede verificar de la
misma forma que tampoco presentan problemas de multicolinealidad.
Análisis de los residuos.
El siguiente paso dentro del proceso de validación es el análisis de los
residuos de ambos modelos. Para ello en el objeto ecuación de Eviews se ofrecen
varios contrastes pero nos limitamos al contraste de que los residuos sean ruido
blanco, inspeccionando el correlograma de residuos, el estadístico Q de Box-
15
Pierce y el gráfico de residuos. Para ello, en Eviews una vez dentro del objeto
ecuación
Instrucciones: View/ Residual Tests/Correlogram-Q-Statistics
Los resultados para el modelo1.1 se presentan en la tabla adjunta y se puede
contemplar que las autocorrelaciones de los residuos no son significativas y entran
dentro de las bandas de confianza, lo que indica que no son distintas de cero. Por
su parte, el estadístico Q no muestra indicios de autocorrelación global de los
residuos, puesto que el valor de Q estimado para los diferentes ordenes de
autocorrelación que se muestran en la tabla adjunta es siempre inferior al punto
crítico de la χ2 con los correspondientes grados de libertad y niveles de significación
estándar utilizados en el trabajo empírico, lo que nos lleva a rechazar ampliamente
la hipótesis nula de autocorrelación global de los residuos.
Correlograma de los residuos del modelo 1
Instrucciones Eviews para el gráfico de residuos: View/Actual, Fitted, residuals
16
-3
-2
-1
0
1
2
6
8
10
12
14
16
55 60 65 70 75 80 85 90 95
Residual Actual Fitted
El gráfico de los residuos también apoya la ausencia de autocorrelación residual,
puesto que la gran mayoría de los residuos entran dentro de las bandas de
confianza, con excepción del correspondiente al año 1962. Por lo tanto, también
muestra claramente que los residuos son ruido blanco.
De la misma forma que el análisis llevado a cabo para el modelo 1.1 se
puede entrar en el objeto ecuación del modelo 1.2 y verificar que sus residuos son
ruido blanco.
Comparación de modelos alternativos.
Del análisis que se acaba de realizar en los dos apartados anteriores se
deduce que el modelo 1.1 supera el conjunto de pruebas estadísticas para validar
sus estimaciones. Aunque el análisis de residuos es satisfactorio para ambos
modelos, el modelo 1.1 presenta una menor varianza residual y un menor Akaike y
Schwarz, por lo que es preferible al 1.2.
17
Por lo tanto, el crecimiento anual de las ventas de la empresa, ∆∆∆∆ventas , que
es la variable modelizada viene explicada de forma satisfactoria por un modelo
sencillo ARIMA(2,1,0).
3. Ejemplo 2. El Índice de Empleo de un determinado país
La serie a modelizar es el índice de empleo de un determinado país, la serie
está corregida de estacionalidad y tiene frecuencia trimestral. El periodo muestral
abarca 1962:1 1993:4. Una vez creado el WorKfile y establecido el periodo
muestral, se cargan los datos tal y como se ha hecho en el ejemplo anterior. La
serie la denominamos empleo en el Workfile
El primer paso en la modelización de la serie es su representación gráfica. Para ello
en Eviews, la instrucción es:
Quick/ Graph/ Graph Line/empleo
El resultado es el gráfico adjunto 1a en el que se puede contemplar como la serie
empleo muestra una tendencia creciente en los primeros 20 años y después y
muestra un marcado comportamiento cíclico en los 10 años últimos. La serie no
parece mostrar cambios en la varianza ante desplazamientos del tiempo, lo que se
puede comprobar tomando logaritmos en la serie y representando gráficamente esa
serie, vemos que los gráficos de ambas series son similares, por lo que
trabajaremos con la serie original. Para ello, en Eviews
GENR Lempleo =LOG(empleo)
y para su representación gráfica:
Quick/ Graph/ Graph Line/ empleo
Grafico 1 a Gráfico 1b
18
80
85
90
95
100
105
110
115
1965 1970 1975 1980 1985 1990
EMPLEO
4.40
4.45
4.50
4.55
4.60
4.65
4.70
4.75
1965 1970 1975 1980 1985 1990
LEMPLEO
También se muestra a continuación el correlograma de la serie empleo
En Eviews una vez dentro del objeto serie empleo
View/Correlogram
El correlograma confirma un elevado grado de dependencia de las observaciones
de la serie empleo y su no estacionariedad en media por el lento decrecimiento de la
FAC.
19
Se realiza también el test de DFA de raíces unitarias, cuyos resultados se presentan
a continuación. Para ello, en Eviews:
Quick/ SERIES STATISTIC/ Unit root / empleo
Test D-F aumentado de la serie empleo
Null Hypothesis: EMPLEO has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=12)
t-Statistic Prob.* Augmented Dickey-Fuller test statistic -2.205738 0.2054
Test critical values: 1% level -3.482879 5% level -2.884477 10% level -2.579080 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(EMPLEO) Method: Least Squares Date: 04/19/08 Time: 21:29 Sample (adjusted): 1962Q3 1993Q4 Included observations: 126 after adjustments
Variable Coefficient Std. Error t-Statistic Prob. EMPLEO(-1) -0.039278 0.017807 -2.205738 0.0293
D(EMPLEO(-1)) 0.478736 0.078727 6.080986 0.0000 C 3.982081 1.807249 2.203394 0.0294 R-squared 0.243969 Mean dependent var 0.014150
Adjusted R-squared 0.231676 S.D. dependent var 1.662605 S.E. of regression 1.457341 Akaike info criterion 3.614626 Sum squared resid 261.2326 Schwarz criterion 3.682156 Log likelihood -224.7214 F-statistic 19.84590 Durbin-Watson stat 2.064222 Prob(F-statistic) 0.000000
El test DFA no rechaza la hipótesis nula de la existencia de una raíz unitaria en
empleo puesto que el valor del estadístico t (-2.205) es notablemente inferior a los
valores críticos de la distribución DFA
20
Si ajustamos una tendencia temporal lineal simple de tipo determinista a la serie
empleo (como hicimos en el capítulo 1 del programa de la asignatura y práctica 1 y
en la modelización de la serie ventas que acabamos de realizar, y restamos de
empleo la línea ajustada, podremos comprobar que ese no es un procedimiento
correcto para convertir a la serie en estacionaria, ya que los residuos tenderán a
estar por encima y por debajo de la media durante períodos seguidos demasiado
largos (se deja al alumno que lo compruebe). Por lo tanto, es claro que esa
tendencia no es determinista sino estocástica y debemos proceder con
diferenciaciones para eliminar esa tendencia.
Comenzamos tomando una primera diferencia regular en la serie empleo , cuyo
gráfico se muestra a continuación así como su correlograma.
Instrucciones en Eviews:
Genr DEMPLEO =D(EMPLEO,1)
Quick/Graph/Line Graph/DEMPLEO
Quick/Series Statistic/Correlogram
-6
-4
-2
0
2
4
6
8
1965 1970 1975 1980 1985 1990
D(EMPLEO,1)
21
El gráfico de DEMPLEO muestra que la serie podría ser estacionaria y también en
ese sentido apunta el correlograma al mostrar un decaimiento con cierta rapidez. No
obstante, se realiza también el test de DFA, cuyos resultados se muestran a
continuación, y corrobora también la no existencia de una raíz unitaria en la serie
DEMPLEO y que, por tanto, esa transformación convierte a la serie en estacionaria.
Test DFA de la serie DEMPLEO
Null Hypothesis: D(EMPLEO,1) has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=12)
t-Statistic Prob.* Augmented Dickey-Fuller test statistic -6.751657 0.0000
Test critical values: 1% level -3.482879 5% level -2.884477 10% level -2.579080 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(EMPLEO,2) Method: Least Squares Date: 04/19/08 Time: 21:28 Sample (adjusted): 1962Q3 1993Q4 Included observations: 126 after adjustments
22
Variable Coefficient Std. Error t-Statistic Prob. D(EMPLEO(-1),1) -0.537417 0.079598 -6.751657 0.0000
C 0.006063 0.131846 0.045988 0.9634 R-squared 0.268803 Mean dependent var -0.003332
Adjusted R-squared 0.262906 S.D. dependent var 1.723714 S.E. of regression 1.479881 Akaike info criterion 3.637545 Sum squared resid 271.5657 Schwarz criterion 3.682566 Log likelihood -227.1654 F-statistic 45.58488 Durbin-Watson stat 2.029454 Prob(F-statistic) 0.000000
Por lo tanto la serie EMPLEO tiene una raíz unitaria y la primera diferencia convierte
a dicha serie en estacionaria, eliminado su tendencia. La serie es del tipo:
Zt =(1-B)EMPLEO o EMPLEO ∼∼∼∼I(1)
Es decir, es integrada de orden 1
Determinado el grado de diferenciación ó de raíces unitarias, pasamos a
especificar el orden de los polinomios AR y MA. Del análisis de los correlogramas
de la serie DEMPLEO se deduce que en la FAC existen 2 ó tres coeficientes que
son distintos de cero y después todos son cero, mientras que en la FAP solo existe
un coeficiente significativo (que no es cero) el primero, y después tienden
rápidamente a cero (o “muy” rápidamente en este caso, ya que los coeficientes
segundo y siguientes están todos dentro de las bandas de no significación). Esto
sugiere que la serie (DEMPLEO) podría haber sido generada por modelos con
estructura MA hasta orden 2 o estructura AR(1). Los modelos que vamos a
considerar en esta práctica son ARIMA (1,1,0), ARIMA(1;1,2) y ARIMA(2,1,1).
Por otro lado, de la observación del gráfico de la serie DEMPLEO se deduce
que la media de la serie aparentemente es cero por lo que debe no debe incluirse el
término constante en los modelos especificados
Los modelos tentativos serian por tanto:
2.1. ARIMA(1,1,0) o (1- φφφφ1 B)(1-B)EMPLEO = a t
23
2.2. ARIMA(1,1,2) ) o (1- φφφφ1 B )(1-B)EMPLEO= (1+ θθθθ1B+θθθθ2B2)at
2.3. ARIMA(2,1,1) ) o (1- φφφφ1 B- φφφφ2 B2) (1-B)EMPLEO= (1+ θθθθ1B) a t
Estimación
La estimación de los modelos anteriores en Eviews se hace por medio de las
siguientes instrucciones:
Quick/ Estimate Equation/ LS EMPLEO ar(1)
Quick/ Estimate Equation/ LS EMPLEO ar(1) ma(1) m a(2)
Quick/ Estimate Equation/ LS EMPLEO ar(1) ar(2) ma (1)
Los resultados de la estimación de estos modelos se presentan a continuación:
Estimacion modelo 2.1
Dependent Variable: D(EMPLEO,1) Method: Least Squares Date: 04/21/08 Time: 00:48 Sample (adjusted): 1962Q3 1993Q4 Included observations: 126 after adjustments Convergence achieved after 2 iterations
Variable Coefficient Std. Error t-Statistic Prob. AR(1) 0.462622 0.079275 5.835666 0.0000 R-squared 0.214051 Mean dependent var 0.014150
Adjusted R-squared 0.214051 S.D. dependent var 1.662605 S.E. of regression 1.473962 Akaike info criterion 3.621689 Sum squared resid 271.5704 Schwarz criterion 3.644200 Log likelihood -227.1664 Durbin-Watson stat 2.029500
Inverted AR Roots .46
Estimacion modelo 2.2
Dependent Variable: D(EMPLEO,1) Method: Least Squares Date: 04/21/08 Time: 01:37 Sample (adjusted): 1962Q3 1993Q4
24
Included observations: 126 after adjustments Convergence achieved after 8 iterations Backcast: 1961Q3 1961Q4
Variable Coefficient Std. Error t-Statistic Prob. AR(1) 0.515070 0.312357 1.648981 0.1017
MA(1) -0.070881 0.324334 -0.218544 0.8274 MA(2) 0.008407 0.170031 0.049446 0.9606
R-squared 0.215272 Mean dependent var 0.014150
Adjusted R-squared 0.202513 S.D. dependent var 1.662605 S.E. of regression 1.484742 Akaike info criterion 3.651880 Sum squared resid 271.1483 Schwarz criterion 3.719411 Log likelihood -227.0684 Durbin-Watson stat 1.992157
Inverted AR Roots .52
Inverted MA Roots .04+.08i .04-.08i
Estimacion modelo 2.3
Dependent Variable: D(EMPLEO,1) Method: Least Squares Date: 04/21/08 Time: 01:12 Sample (adjusted): 1962Q4 1993Q4 Included observations: 125 after adjustments Convergence achieved after 19 iterations Backcast: 1961Q4
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.459695 0.094065 -4.886990 0.0000
AR(2) 0.426099 0.082802 5.145983 0.0000 MA(1) 0.956981 0.046168 20.72805 0.0000
R-squared 0.239708 Mean dependent var 0.002497
Adjusted R-squared 0.227244 S.D. dependent var 1.664120 S.E. of regression 1.462870 Akaike info criterion 3.622385 Sum squared resid 261.0787 Schwarz criterion 3.690265 Log likelihood -223.3991 Durbin-Watson stat 2.031913
Inverted AR Roots .46 -.92
Inverted MA Roots -.96
Validación
25
En cuanto al modelo 2.1, todos los coeficientes son individualmente significativos
según el contraste de la t de student y el ajuste es globalmente aceptable. También
son altamente significativos los coeficientes del modelo 2.3. Sin embargo en el
modelo 2.2 los coeficientes de los de los parámetros MA no son significativos por lo
que el modelo es rechazable. Todos los modelos cumplen las condiciones de
estacionariedad y de invertibilidad puesto que tanto las raíces de los polinomios
autorregresivos como los de media móvil caen fuera del círculo de radio unidad,
aunque en el modelo 2.3 haya una raíz cercana a la unidad en el polinomio
autorregresivo y otra en el polinomio de medias móviles. A su vez, las matrices de
correlaciones de los coeficientes de estos modelos no muestran signos de
multicolinealidad
Desde el punto de vista del error estándar de los modelos estimados el 2.1 es el
que presenta un valor menor (1,4739) seguido del 2.3, aunque muy cerca (1,4628).
Desde el punto de vista del criterio de Akaike, tanto el modelo 2.1 como el 2.3
presentan el mismo valor (3,622)
El análisis de los residuos de los dos modelos seleccionados a través de sus
correspondientes correlogramas, el estadístico Q y sus gráficos de residuos, que se
presentan a continuación, nos indica que ambos cumplen las condiciones para ser
considerados como ruido blanco. No obstante, el modelo 2.3 puede ser mejor desde
el punto de vista del error estándar de la ecuación. Ambos modelos presentan
residuos atípicos en la observación 87:1 y en la 92:1 y la raíz del polinomio media
móvil roza la unidad, lo que puede estar indicando sobrediferenciación. Se deja al
alumno que pruebe con la serie original EMPLEO, sin diferenciación, y corrija la
serie de atípicos y pruebe con especificaciones alternativas.
Correlograma de los residuos del modelo 2.1
26
Grafico de residuos del modelo 2.1
-4
0
4
8
-8
-4
0
4
8
1965 1970 1975 1980 1985 1990
Residual Actual Fitted
Correlograma de los residuos del modelo 2.3
27
Grafico de residuos del modelo 2.3
-4
0
4
8
-8
-4
0
4
8
1965 1970 1975 1980 1985 1990
Residual Actual Fitted
4. Ejemplo 3. Ventas de cigarros puros de una empre sa tabaquera
La serie a modelizar es el volumen de ventas mensual de puros de una
empresa tabaquera para el periodo muestral 1989:01 1996:12. El objetivo que se
28
persigue con este ejercicio es que el alumno aprenda a construir un modelo
univariante de una serie de frecuencia mensual que tiene una marcada tendencia y
estacionalidad.
Una vez creado el fichero de trabajo en Eviews para esa frecuencia y periodo
muestral, de la misma forma como se ha realizado en los dos ejercicios anteriores,
se realiza la representación gráfica de la serie objeto de análisis. La serie se
denomina puros
Instrucciones: Quick/Graph/ puros/Line graph
200
300
400
500
600
700
800
1989 1990 1991 1992 1993 1994 1995 1996
PUROS
Ventas de puros de una empresa tabaquera
Este gráfico es indicativo de una serie en la que el nivel disminuye con el
tiempo y muestra, por tanto, una tendencia decreciente. La media no se mantiene
constante y disminuye con el tiempo y la serie muy probablemente no será
estacionaria en media, por lo que necesitará una diferencia regular. También se
observa un marcado patrón estacional con picos en octubre y valores bajos en
29
diciembre. La varianza es visualmente un tanto mayor al principio de la muestra
(año 1989) que al final, años 1995 y 1996, pero en el resto de los años parece muy
uniforme.
Tomamos logaritmos en la serie puros y realizamos su representación gráfica. Para
ello en Eviews:
GENR Lpuros= log(puros)
Quick/Graph/ Lpuros/Line graph
5.4
5.6
5.8
6.0
6.2
6.4
6.6
1989 1990 1991 1992 1993 1994 1995 1996
LPUROS
Evolución logaritmica de las ventas de puros
Este gráfico del logaritmo de la variable carga (Lpuros ) es muy similar al
anterior y la varianza parece estable, por lo que en adelante decidimos trabajar con
la transformación logarítmica o sin ella es indiferente, por lo que decidimos trabajar
con la métrica original.
30
Como hemos visto en los dos ejemplos anteriores el correlograma es un
instrumento útil para verificar la estacionariedad de la serie. A continuación se
presentan los correlogramas.
Instrucciones: Una vez en el objeto serie puros, View/ Correlogram
El correlograma de la serie puros decae lentamente, tanto en la parte regular
(1,2,3,etc) como en la estacional (12,24,36,etc), por lo que confirma la no
estacionariedad apuntada anteriormente. Pasamos, en primer lugar, a corregir la no
estacionariedad en la parte regular tomando una diferencia de orden 1 y
representamos el gráfico de esa serie transformada y su correspondiente
correlograma.
Instrucciones Eviews: Genr dpuros=D(puros,1)
Quick/Graph/dpuros/Line graph
Quick/series statistic/correlogram/dpuros
31
-250
-200
-150
-100
-50
0
50
100
150
1990 1991 1992 1993 1994 1995 1996
DPUROS
Según la gráfica de la primera diferencia regular, d(puros,1), la transformación
parece que ha eliminado la tendencia regular pero persiste una cierta la tendencia
estacional. El análisis del correlograma indica que, si bien se ha corregido la no
estacionariedad de la parte regular, persiste la no estacionariedad en el componente
32
estacional, al ser significativos en el correlograma simple los retardos 12, 24 y
también podría serlo el de 36, por lo que se debe tomar una diferencia de tipo
estacional junto con la regular.
Instrucciones: Genr dd12puros=d(puros,1,12)
Quick/Graph/Line Graph/dd12puros
Quick/series statistic/correlogram/dd12puros
-150
-100
-50
0
50
100
150
1990 1991 1992 1993 1994 1995 1996
DD12PUROS
El gráfico de dd12puros muestra una clara estacionariedad en media y el
correlograma de esta variable que se muestra a continuación parece que no ofrece
dudas sobre la estacionariedad.
33
No obstante, se elabora el test de DFA para la serie dd12puros para verificar si
esta transformación es estacionaria
Test DFA de la serie dd12puros
Null Hypothesis: DD12PUROS has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=11)
t-Statistic Prob.* Augmented Dickey-Fuller test statistic -12.63026 0.0001
Test critical values: 1% level -3.513344 5% level -2.897678 10% level -2.586103 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(DD12PUROS) Method: Least Squares Date: 04/13/08 Time: 14:33 Sample (adjusted): 1990M04 1996M12 Included observations: 81 after adjustments
34
Variable Coefficient Std. Error t-Statistic Prob. DD12PUROS(-1) -2.275417 0.180156 -12.63026 0.0000
D(DD12PUROS(-1)) 0.447603 0.101841 4.395103 0.0000 C -0.630273 4.413679 -0.142800 0.8868 R-squared 0.828732 Mean dependent var -0.086420
Adjusted R-squared 0.824341 S.D. dependent var 94.75286 S.E. of regression 39.71255 Akaike info criterion 10.23755 Sum squared resid 123012.8 Schwarz criterion 10.32623 Log likelihood -411.6206 F-statistic 188.7137 Durbin-Watson stat 2.110029 Prob(F-statistic) 0.000000
Los resultados del test DFA son concluyentes sobre la estacionariedad de la serie
dd12lcarga, el estadístico t (-12.630) supera ampliamente los valores críticos de la
distribución ADF, lo que confirma la estacionariedad de esta transformación ya
adelantada por el análisis gráfico y el del correlograma.
A la vista de los resultados anteriores, la transformación que se sugiere es:
Zt =(1-B) (1-B 12)puros
Para finalizar la etapa de especificación inicial debemos determinar cuales son los
modelos estacionales multiplicativos ARMA (p,q) Χ ARMA(P,Q)S que pueden
generar la serie.
Del análisis del correlograma de la serie dd12puros se deduce que el proceso
generador de datos puede tener un componente media móvil regular de orden 1
MA(1), puesto que en el correlograma simple después del primer coeficiente
significativo el resto son ceros, y otro estacional de orden MA(1)12 , puesto que
después del coeficiente de orden 12 significativo el resto son ceros, es decir un
ARMA (0,1)(0,1)12.
3.1. ARIMA(0,1,1)××××(0,1,1)12 o (1-B)(1-B12)puros= (1+ θθθθ1B)(1+θθθθ12B12)at
Estimación del modelo 3.1
35
Dependent Variable: DD12PUROS Method: Least Squares Date: 04/13/08 Time: 18:09 Sample (adjusted): 1990M02 1996M12 Included observations: 83 after adjustments Convergence achieved after 14 iterations Backcast: 1987M12 1988M12
Variable Coefficient Std. Error t-Statistic Prob. MA(1) -0.677779 0.066918 -10.12847 0.0000
SMA(12) -0.867044 0.034549 -25.09612 0.0000 R-squared 0.662434 Mean dependent var -0.481928
Adjusted R-squared 0.658267 S.D. dependent var 52.83531 S.E. of regression 30.88643 Akaike info criterion 9.722312 Sum squared resid 77271.69 Schwarz criterion 9.780597 Log likelihood -401.4760 Durbin-Watson stat 2.546859
Inverted MA Roots .99 .86-.49i .86+.49i .68 .49-.86i .49+.86i .00+.99i -.00-.99i -.49-.86i -.49+.86i -.86+.49i -.86-.49i -.99
Grafico residuos del modelo 3.1
-80
-40
0
40
80
1990 1991 1992 1993 1994 1995 1996
DD12PUROS Residuals
36
Correlograma residuos del modelo 3.1
3.2. ARIMA(2,1,0)××××(0,1,1)12 ,, (1- φφφφ1B-φφφφ2B2) (1-B)(1-B12) puros= (1+ θθθθ12B12)at
Dependent Variable: D(PUROS,1,12) Method: Least Squares Date: 04/10/06 Time: 02:01 Sample (adjusted): 1990M04 1996M12 Included observations: 81 after adjustments Convergence achieved after 7 iterations Backcast: 1988M01 1988M12
Variable Coefficient Std. Error t-Statistic Prob.
3.1. AR(1) -0.952059 0.096127 -9.904132 0.0000
AR(2) -0.562088 0.095416 -5.890927 0.0000 MA(12) -0.903840 0.022752 -39.72502 0.0000
R-squared 0.732067 Mean dependent var -0.148148
Adjusted R-squared 0.725197 S.D. dependent var 53.43293 S.E. of regression 28.01044 Akaike info criterion 9.539365 Sum squared resid 61197.62 Schwarz criterion 9.628049 Log likelihood -383.3443 Durbin-Watson stat 2.068255
Inverted AR Roots -.48-.58i -.48+.58i
Inverted MA Roots .99 .86-.50i .86+.50i .50-.86i .50+.86i .00+.99i -.00-.99i -.50+.86i
37
-.50-.86i -.86+.50i -.86-.50i -.99
Validación El modelo 3.1 presenta todos su coeficientes significativos, según el t ratio, la matriz de coeficientes que se puede consultar en la ventana de la ecuación no proporciona coeficientes de correlación elevados por lo que no presentan signos de multicolinealidad. Analizando los correlogramas de los residuos se observa que todos los coeficientes de autocorrelación no son distintos de cero ya que entran dentro de las bandas de confianza. El gráfico de residuos también indica que los residuos son ruido blanco. El modelo, en principio, parece válido pero presenta alguna raíz de la media móvil próxima a la unidad lo que puede indicar sobrediferenciación. No obstante, la identificación del grado de diferenciación a través del análisis gráfico, los correlogramas de la serie y el test DFA de raíces unitarias se decantaban por una raíz de tipo regular y otra estacional. El modelo 3.2 también tiene todos los coeficientes significativos, los residuos que se pueden consultar en la ventana de la ecuación son ruido blanco a través de la observación del gráfico de los residuos y de su correlograma. Este modelo tiene también una raíz de la media móvil próxima a la unidad, sin embargo, tiene un Akaike inferior al 3.1 y también un error estándar de la ecuación menor por lo que será preferido al 3.1. La mejora del modelo puede venir por corregir algunos residuos atípicos que pueden distorsionar el análisis y la especificación.