n°10 serie apuntes de clase octubre de 2017...laserie apuntes de clase tiene por objetivo difundir...
TRANSCRIPT
Serie Apuntes de Clase N°10
Octubre de 2017
SERIES DE TIEMPO
UNIVARIANTE EN STATA
14
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Universidad del Perú, DECANA DE AMÉRICA)
FACULTAD DE CIENCIAS ECONÓMICAS
ESCUELA ACADÉMICO PROFESIONAL DE ECONOMÍA
Rafael Bustamante Romaní
La Serie Apuntes de Clase tiene por objetivo difundir los
materiales de enseñanza generados por los docentes que
tienen a su cargo el desarrollo de las asignaturas que
forman parte del Plan de Estudios de la Escuela
Académico-Profesional de Economía de la Facultad de
Ciencias Económicas de la Universidad Nacional Mayor de
San Marcos. Estos documentos buscan proporcionar a los
estudiantes la explicación de algunos temas específicos
que son abordados en su formación universitaria.
Escuela Académico Profesional de Economía.
Facultad de Ciencias Económicas.
Universidad Nacional Mayor de San Marcos.
Calle Germán Amézaga N° 375.
Ciudad Universitaria, Lima 1. Perú.
Teléfono 619-7000. Anexo 2208.
http://economia.unmsm.edu.pe/escuela/econ.htm
La Serie Apuntes de Clase Omega Beta Gamma tiene por objetivo difundir los materiales de enseñanza generados por los docentes que tienen a su cargo el desarrollo de las asignaturas que forman parte de los Planes de Estudios de las Escuelas Académico-Profesionales de la Facultad de Ciencias Económicas de la Universidad Nacional Mayor de San Marcos. Estos documentos buscan proporcionar a los estudiantes la explicación de algunos temas específicos que son abordados en su formación universitaria.
Encargados de la serie:
Bustamante Romaní, Rafael. Cisneros García, Juan Manuel. [email protected] [email protected]
Facultad de Ciencias Económicas. Universidad Nacional Mayor de San Marcos.
Calle Germán Amézaga N° 375. Ciudad Universitaria, Lima 1. Perú.
La Serie Apuntes de Clase ΩΒΓ es promovida y
desarrollada por un colectivo de docentes del Departamento de Economía de la Universidad Nacional Mayor de San Marcos. El contenido de cada publicación es íntegramente responsabilidad de cada autor, no representa necesariamente los puntos de vista de los integrantes del colectivo, ni de la Universidad.
http://www.financeybusiness.com
Series de tiempo Univariante en Stata 14.0
Rafael Bustamante
(Versión Preliminar)
Resumen
Este trabajo pretende explicar las características estadísticas de las series de tiempo, así el comando
necesario para la aplicación de Modelos de Series de Tiempo en el paquete STATA 14. Asimismo
se sigue la metodología de Box and Jenkins, para determinar el modelo de serie de tiempo que
ajusta a la evolución de los datos. Para ello se explica didácticamente cuales son los comando que
se utilizan en estada para esta metodología a usar. Este curso tiene por objetivo lograr un análisis
estadístico y econométrico de series de tiempo univariadas, determinar el proceso estadístico que
sigue una serie de tiempo, y a partir de la estimación del modelo realizar pronósticos que sean
relevante para tomar decisiones de negocios, política fiscal, monetaria etc.
Palabras Claves: Serie temporal. Proceso estocástico. ARIMA, Estacionariedad,
Stata
Clasificación JEL: C2, C25
Estudios de doctorado en Economía con mención en los Recursos Naturales, Universidad Nacional
Autónoma de México y UNMSM. MBA Gerencial (c), CENTRUM Pontificia Universidad Católica del Perú. Maestría en Economía con mención en Finanzas, Universidad Nacional Mayor de San Marcos. B. Sc. Economía, UNMSM. Profesor Auxiliar del Departamento de Economía de la UNMSM. Investigador asociado al Instituto de Investigaciones FCE - UNMSM. Contacto: [email protected]
Contenido
1. Introducción ..................................................................................................................... 1
2. Formato de tiempo en Stata ........................................................................................... 1
3. Operadores de rezagos de series de tiempo ............................................................... 6
3.1 Operador de rezagos ................................................................................................. 6
3.2 Operador Forward ..................................................................................................... 8
4. Metodología Box Jenkins (BJ) aplicada al caso de selección y estimación de un
modelo ARMA. .................................................................................................................... 9
4.1 Fase de identificación .............................................................................................. 11
4.2 Quiebre estructural: el test de Zivot ...................................................................... 13
5. Fase de estimación ......................................................................................................... 24
6. Fase de verificación y diagnóstico ............................................................................... 26
7. Pronósticos ...................................................................................................................... 27
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 1
1. Introducción
Este curso tiene por objetivo lograr un análisis estadístico y econométrico de series
de tiempo univariadas, determinar el proceso estadístico que sigue una serie de
tiempo, y a partir de la estimación del modelo realizar pronósticos que sean
relevante para tomar decisiones de negocios, política fiscal, monetaria etc.
Las series de tiempo tienen que ser estacionarias para practicar los procedimientos
habituales pues tienen las propiedades estadísticas adecuadas. Básicamente esto
requiere que la media y varianzas y covarianzas de los datos de series de tiempo
sean valores constantes en el período de tiempo en el que se observan. Por ejemplo,
la media y la varianza del PIB en el tercer trimestre de 1973 no pueden ser
diferentes de las del cuarto trimestre de 2006. Los métodos para hacer frente a este
problema han proporcionado un rico campo de investigación para la econometría
en los últimos años y varias técnicas econométricas se han desarrollado a partir de
aquí. Una de las primeras herramientas de diagnóstico utilizados es un simple
gráfico de series temporales de los datos. Una el comportamiento de unas series de
tiempo económico revelará problemas potenciales con los datos y sugerirá
maneras de proceder estadísticamente. El comportamiento gráficos de las series de
tiempo son fáciles de generar en Stata y algunos nueva procedimientos se
estudiarán más adelante en este manual (Vásquez, 2010).
2. Formato del tiempo en Stata
Por definición los datos tienen una frecuencia temporal, la que puede ser mensual,
trimestral, anual, etc. Lo primero que debemos hacer es indicarle a STATA que
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní
2
estaremos trabajando en formato de serie de tiempo lo que se hace a través del
comando tsset.
Sin embargo, previo a esto debemos tener en nuestra base de datos una variable
que indique la temporalidad o frecuencia de los datos. Por ejemplo, en la base de
datos credito_mensual.dta podemos ver las primeras 10 observaciones:
Vamos a importar los datos a partir del Excel, para ello mostramos el siguiente
procedimiento en STATA1.
Figura Nº1
1 Se puede acceder a la base de datos en el siguiente link
https://drive.google.com/open?id=0B4B7bhYQMcKmczJoN3h6a0h0TlU
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 3
Figura Nº2
Procedemos a abrir la data y mostramos las 10 primeras series con los siguientes
comandos
cd "C:\Users\FINANCE.BUSINESS\Desktop\datos para stata"
use credito_mensual.dta
list if _n<=10
Esto nos muestra el siguiente cuadro en la ventana de resultados.
Figura Nº 3
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 4
Vemos que la fecha está en un formato string no propio para desarrollar estos
modelos de series de tiempo. Por lo tanto procedemos a generar la variable date,
que empiece en el mes de enero del 1992.
generate date = ym(1992,12) +_n-1
format date %tm
El comando format permite darle el format de fecha a la variable date, el cual está
en un formato numérico no reconocible para nosotros (Vásquez, 2010).
Finalmente si digitamos list if _n<=10.
Figura Nº 4
10. 4533.8045
9. 4200.0574
8. 3759.6947
7. 3636.1286
6. 3399.3914
5. 3245.0357
4. 3048.757
3. 2761.5437
2. 2652.5527
1. 2608.5396
cred
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 5
Para datos con otras frecuencias se deben utilizar los siguientes comandos:
Diaria
g fecha=mdy(mes,dia,año)
format fecha %td
Semanal
g fecha=yw(año,semana)
format fecha %tw
Mensual
g fecha=ym(año,mes)
format fecha %tm
Trimestral
g fecha=yq(año,trimestre)
format fecha %tq
Semestral
g fecha=yh(año,semestre)
format fecha %th
10. 4533.8045 1993m9
9. 4200.0574 1993m8
8. 3759.6947 1993m7
7. 3636.1286 1993m6
6. 3399.3914 1993m5
5. 3245.0357 1993m4
4. 3048.757 1993m3
3. 2761.5437 1993m2
2. 2652.5527 1993m1
1. 2608.5396 1992m12
cred date
. list if _n<=10
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 6
Entonces, una vez creada una variable única que contenga la frecuencia de los
datos, en nuestro ejemplo la variable fecha, debemos indicarle a STATA que
trabajaremos con formato de datos en series de tiempo:
Figura Nº5
3. Operadores de rezagos de series de tiempo
Debido a que las series tiempo tienen por naturaleza un orden temporal, con
frecuencia no sólo nos interesa o queremos hacer referencia al valor de la serie en
el momento t, sino por ejemplo al valor rezagado de la serie (t-1), o la serie en
diferencia (valor en t menos el valor en t-1), etc. STATA posee operadores de series
de tiempo que nos ayudan a obtener dichos valores de manera mucho más fácil
que crearlos de manera manual.
3.1 Operador de rezagos
En series de tiempo se define el operador de rezago L tal que:
1
2
1 2( )
t t
t t t
LX X
L X L X X
Por ejemplo, si queremos crear una variable que contenga el primer rezago de la
variable cred.
delta: 1 month
time variable: date, 1992m12 to 2016m8
. tsset date
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 7
generate credlag1=L.cred
list date credlag1 if _n<=10
Figura Nº6
De manera análoga, podemos generar una variable con el segundo rezago de la
variable cred a través del siguiente comando:
generate credlag2=L2.cred
list date credlag2 if _n<=10
Figura Nº 7
10. 1993m9 4200.058
9. 1993m8 3759.695
8. 1993m7 3636.129
7. 1993m6 3399.391
6. 1993m5 3245.036
5. 1993m4 3048.757
4. 1993m3 2761.544
3. 1993m2 2652.553
2. 1993m1 2608.54
1. 1992m12 .
date credlag1
. list date credlag1 if _n<=10
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 8
3.2 Operador Forward
También podemos ocupar el operador F para adelantar datos, es decir, generar una
variable con las observaciones en t+1:
10. 1993m9 3759.695
9. 1993m8 3636.129
8. 1993m7 3399.391
7. 1993m6 3245.036
6. 1993m5 3048.757
5. 1993m4 2761.544
4. 1993m3 2652.553
3. 1993m2 2608.54
2. 1993m1 .
1. 1992m12 .
date credlag2
. list date credlag2 if _n<=10
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní
9
4. Metodología Box Jenkins (BJ) aplicada al caso de selección y
estimación de un modelo ARMA.
Los modelos autorregresivos (AR), de media móvil (MA) y autorregresivos de
media móvil (ARMA) se caracterizan por incorporar en la explicación futura de la
variable dependiente su propio comportamiento pasado. Esta forma de modelar la
conducta de una serie de datos temporales hace viable, en su forma más simple en
modelos univariados, la generación de pronósticos sin emplear información
adicional proveniente de otros regresores. En las secciones siguientes se sigue la
metodología de BOX y JENKINS (1976)2 para estimar y pronosticar modelos
univariados de serie de tiempo a través de Stata. En particular se hará uso de la
información mensual de inflación contenida en la base de datos PBI_Mensual.dta.
Vamos a listar las diez primeras series, para ello digitamos en la ventana de
comandos de Stata:
list if _n<=10
Vamos a crear la variable mensual, para poder dar contexto de serie temporal a la
serie PBI.
2 En el análisis de series de tiempo, la metodología de Box-Jenkins, nombrada así en honor a los estadísticos George Box
y Gwilym Jenkins,1 se aplica a los modelos autorregresivos de media móvil ARMA o a los modelos autorregresivos integrados de media móvil (ARIMA) para encontrar el mejor ajuste de una serie temporal de valores, a fin de que los pronósticos sean más acertados.
10. 83.28746
9. 86.51057
8. 84.09447
7. 78.63546
6. 74.09743
5. 75.91327
4. 78.00974
3. 75.57254
2. 77.59892
1. 73.86784
PBI
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 10
generate mensual = ym(2003,01) +_n-1
La variable “mensual” tiene un formato numérico general que corresponde al
número de meses desde el 2003. Sin embargo a la variable fecha se le puede dar
un formato numérico mensual así:
format mensual %tm
list if _n<=10
Designando la variable que representa al tiempo y con la cual podemos configurar
al programa Stata para que este “entienda” que se encuentra trabajando con series
temporales.
Antes de estimar cualquier modelo de serie de tiempo es necesario que Stata
reconozca la variable que representa el tiempo (en nuestro ejemplo, la variable
mensual). Este paso se logra a través del comando tsset así:
tsset mensual, monthly
La opción monthly indica la periodicidad mensual de la variable de tiempo
“mensual”.
BOX and JENKINS difundieron una metodología en tres fases para identificar,
estimar y validar modelos de serie de tiempo univariada y generar pronósticos. A
continuación se seguirán estos pasos para obtener un modelo de pronóstico tipo
ARMA para el PBI mensual.
delta: 1 month
time variable: mensual, 2003m1 to 2015m9
. tsset mensual, monthly
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 11
4.1 Fase de identificación
La primera aproximación a los datos es gráfica. Al graficar la variable a pronosticar
respecto al tiempo se puede obtener información sobre posibles “outliers”, valores
perdidos “missing values” o cambios estructurales en la serie de datos. Así mismo,
si la variable a pronosticar no es estacionaria o es integrado de orden (1), podrán
observarse tendencias pronunciadas o comportamientos sin media y/o varianza
constante a través del tiempo. Con el comando tsline es posible efectuar esta
primera constatación así:
Para esta oportunidad vamos a trabajar con el índice del PBI mensual, elaborado
por el Banco Central de Reserva.
Grafiquemos la serie en estudio:
tsline PBI
Figura Nº 8
80
100
120
140
160
180
Índic
e d
el P
BI re
al
2002m1 2004m1 2006m1 2008m1 2010m1 2012m1 2014m1 2016m1mensual
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 12
Vemos que la serie tiene estacionalidad, por lo tanto lo corregimos usando algún
tipo de Filtro. En nuestro caso usaremos el filtro de suavizamiento exponencial
para extraer el componente estacional de la serie3.
Esta técnica se basa en la atenuación de los valores de la serie de tiempo,
obteniendo el promedio de estos de manera exponencial; es decir, los datos se
ponderan dando un mayor peso a las observaciones más recientes y uno menor a
las más antiguas. Al peso para ponderar la observación más reciente se le da el
valor α, la observación inmediata anterior se pondera con un peso de a 1
, a
la siguiente observación inmediata anterior se le da un peso de ponderación de a
2
1 y así sucesivamente hasta completar el número de valores observados en
la serie de tiempo a tomar en cuenta para realizar la atenuación, es decir, para
calcular el promedio ponderado. La estimación o pronóstico será el valor obtenido
del cálculo del promedio.
Por lo que la expresión para realizar el cálculo de la suavización exponencial
simple es:
2
1 1 1 ( 1)(1 ) (1 ) ... (1 )n
t t t t t nP Y Y Y Y
Donde
tY : Valor de la serie en el período “t”.
1tP : Pronóstico o predicción para el período “t+1”.
tP : Pronóstico o predicción en el período “t”.
α : Factor de suavización, ( 10≤α≤)
En STATA para realizar la desestacionalizaciòn, digitamos el siguiente comando
tssmooth exponential PBISA = PBI
Le estamos diciendo a STATA que suavice la serie “eliminado” esos puntos
estacionales y a que esa serie la denomina PBISA.
3 Cabe mencionar que muchas veces el componente estacional, anda “escondido” en la serie, por eso siempre es bueno aplicar la gráfica
en la serie en primeras diferencias para poder observarlo.
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 13
Figura Nº 9
Como se puede observar la serie sigue presentando ese comportamiento estacional
4.2 Quiebre estructural: el test de Zivot
El tema de la existencia de raíces unitarias en series de datos económicos ha
recibido especial atención en la literatura de las últimas tres décadas, en particular
a partir del estudio de Nelson y Plosser (1982), en el que se argumenta que choques
actuales tienen un efecto permanente en el nivel de largo plazo de la mayoría de
8010
012
014
016
0
parm
s(0.
3856
) =
PB
I
2002m1 2004m1 2006m1 2008m1 2010m1 2012m1 2014m1 2016m1mensual
4.4
4.6
4.8
55.2
LN
PB
ISA
2003m7 2007m1 2010m7 2014m1 2017m7mensual
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 14
series macroeconómicas y financieras. Estudios posteriores debatieron esa visión,
proponiendo que la respuesta de largo plazo a los choques actuales depende del
tamaño relativo de los choques temporales y de los choques permanentes4 . Como
es de esperar, una buena parte de los estudios publicados desde entonces se ha
ocupado de desarrollar métodos de prueba para determinar la presencia de raíces
unitarias. Las pruebas de raíz unitaria fueron desarrolladas por Dickey y Fuller
(1979, 1981), que se encuentran entre las herramientas más utilizadas en el trabajo
aplicado de series temporales. Se fundan en una hipótesis nula que no considera
cambios estructurales de ningún tipo en la serie de tiempo en estudio. Así pues, en
presencia de quiebres estructurales la inferencia realizada a partir de estas pruebas
podría perder validez. Uno de los primeros estudios en tomar en cuenta la
posibilidad de cambios estructurales a la hora de realizar pruebas de raíz unitaria
fue el de Perron (1989), que desarrolló una versión modificada de la prueba
Dickey-Fuller que incluye un quiebre estructural exógeno, es decir, conocido a
priori. Trabajos posteriores modificaron ese procedimiento para estimar
endógenamente el punto de quiebre. Actualmente, las pruebas de raíz unitaria que
permiten la estimación endógena del punto de quiebre son frecuentemente
utilizadas, por ejemplo la prueba de t mínimo desarrollada por Zivot y Andrews
(1992) y la prueba de Perron (1997). Sin embargo, en estos dos últimos métodos se
deriva el estadístico de prueba partiendo de una hipótesis nula de raíz unitaria sin
cambios estructurales. Por consiguiente, la hipótesis alternativa relevante en esos
casos no es “estacionariedad con cambios estructurales” sino “presencia de
cambios estructurales”, lo cual incluye la posibilidad de raíz unitaria con quiebres
estructurales. Así pues, en esas pruebas el rechazo de la hipótesis nula no
necesariamente excluye la existencia de raíz unitaria propiamente, sino que podría
indicar rechazo de una raíz unitaria sin quiebres. Es importante, por consiguiente,
disponer de métodos de prueba que excluyan rechazos de la hipótesis nula de raíz
unitaria debidos a la presencia de cambios estructurales.
Muchas veces las series económicas presentan un cambio brusco en su
comportamiento ya sea este cambio en la pendiente de la serie o el nivel de la serie.
A estos dos casos se les llama quiebre en pendiente y quiebre en tendencia.
Este test trata de verificar la hipótesis nula de presencia de raíz unitaria solamente.
Esto contrasta con el test de Perron y Volgensang en que la nula es la presencia de
raíz unitaria más un quiebre estructural. Este test es más general, dado que el
4
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 15
anterior sólo se refería a la presencia de raíz unitaria o no, pero siempre con la
presencia de un quiebre estructural.
Así estos autores plantean los siguientes modelos a estimar para tres casos
distintos de hipótesis alternativas que plantean quiebre en niveles (A), quiebres en
tendencia (B) y quiebres en tendencia y niveles (C). Para cada una de estas
alternativas proponen calculas las siguientes regresiones:
Ahora estudiamos el problema de quiebre estructural.
Figura Nº 10
Extraído de las notas de clase del profesor Carlos Casas: “Econometría Moderna”
En ambos tests se acepta la Hipótesis Nula si el t de α del periodo Tb es mayor que
el valor de tablas (o menor en valor absoluto). La hipótesis nula se rechaza si es
que el t estadístico de α del período Tb es menor al de tablas (o mayor en valor
absoluto).
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 16
Para el test de Zivot y Andrews se presentan los siguientes valores de tablas que
se refieren a la selección de k bajo el método 2 de Perron y Volgensang (Casas
Tragadora, 2000).
En Stata tenemos implementado el paquete en archivo denominado
zandrews.ado. Para proceder a instalarlo digitamos el siguiente comando:
scc install zandrews
Si no es posible buscarlo manualmente con el comando,
findit zandrews
La lógica del test es la siguiente:
H0: La serie presenta raíz unitaria
H1: La serie es estacionaria con quiebre y no presenta raíz unitaria
Digitamos el siguiente comando.
zandrews PBISA, graph
zandrews PBISA, break(trend)
zandrews PBISA, break(both) trim(0.10)
zandrews PBISA, lagmethod(BIC)
Figura Nº 11
-2.5
-2
-1.5
-1
-.5
Bre
akpoin
t t-
sta
tistics
2003m7 2007m1 2010m7 2014m1 2017m7mensual
Min breakpoint at 2014m1
Zivot-Andrews test for LNPBISA, 2005m12-2015m6
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 17
Se observa que el t – statistic = -3.090 es mayor al valor critico -4.42, por lo tanto se
rechaza la hipótesis nula de raíz unitaria sin quiebre. Seguidamente sometemos
a la serie a la prueba de raíz unitaria, para ello usamos el comando.
Seguidamente para confirmar lo visto por el test de Zivot, presentamos el test de
raíces unitarias, del Dickey Fuller Aumentado. Para ello procedemos manualmente
con el siguiente procedimiento en la ventana de comandos:
Figura Nº 12
.
Critical values: 1%: -5.34 5%: -4.80 10%: -4.58
Minimum t-statistic -2.509 at 2014m1 (obs 125)
Lag selection via BIC: lags of D.LNPBISA included = 2
Allowing for break in intercept
Zivot-Andrews unit root test for LNPBISA
. zandrews LNPBISA, lagmethod(BIC)
Critical values: 1%: -5.57 5%: -5.08 10%: -4.82
Minimum t-statistic -3.123 at 2012m5 (obs 105)
Lag selection via TTest: lags of D.LNPBISA included = 2
Allowing for break in both intercept and trend
Zivot-Andrews unit root test for LNPBISA
. zandrews LNPBISA, break(both) trim(0.10)
Critical values: 1%: -4.93 5%: -4.42 10%: -4.11
Minimum t-statistic -3.090 at 2012m7 (obs 107)
Lag selection via TTest: lags of D.LNPBISA included = 2
Allowing for break in trend
Zivot-Andrews unit root test for LNPBISA
. zandrews LNPBISA, break(trend)
Critical values: 1%: -5.34 5%: -4.80 10%: -4.58
Minimum t-statistic -2.509 at 2014m1 (obs 125)
Lag selection via TTest: lags of D.LNPBISA included = 2
Allowing for break in intercept
Zivot-Andrews unit root test for LNPBISA
. zandrews LNPBISA, graph
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 18
Luego nos sale un cuadro de dialogo donde procedemos a darle check a mostrar
regresión del test.
Figura Nº 13
En términos de comandos digitaríamos lo siguiente:
Figura Nº 14
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 19
.
_cons .0553936 .0205826 2.69 0.008 .0147449 .0960422
L2D. -.1813549 .0724774 -2.50 0.013 -.3244907 -.0382191
LD. -.5368119 .0728326 -7.37 0.000 -.6806492 -.3929747
L1. -.0099937 .0043034 -2.32 0.021 -.0184925 -.0014948
LNPBISA
D.LNPBISA Coef. Std. Err. t P>|t| [95% Conf. Interval]
p-value for Z(t) = 0.0107
Z(t) -2.322 -2.350 -1.654 -1.287
Statistic Value Value Value
Test 1% Critical 5% Critical 10% Critical
Z(t) has t-distribution
Augmented Dickey-Fuller test for unit root Number of obs = 164
. dfuller LNPBISA, drift regress lags(2)
_cons .0663459 .0207201 3.20 0.002 .0254218 .10727
L3D. .014415 .0732768 0.20 0.844 -.1303135 .1591435
L2D. -.1878132 .0826443 -2.27 0.024 -.3510432 -.0245831
LD. -.6102156 .0767368 -7.95 0.000 -.7617778 -.4586533
L1. -.0121809 .0043089 -2.83 0.005 -.0206914 -.0036705
LNPBISA
D.LNPBISA Coef. Std. Err. t P>|t| [95% Conf. Interval]
p-value for Z(t) = 0.0027
Z(t) -2.827 -2.350 -1.655 -1.287
Statistic Value Value Value
Test 1% Critical 5% Critical 10% Critical
Z(t) has t-distribution
Augmented Dickey-Fuller test for unit root Number of obs = 163
. dfuller LNPBISA, drift regress lags(3)
_cons .0578392 .0214371 2.70 0.008 .0154949 .1001836
L4D. -.0176391 .0729568 -0.24 0.809 -.1617497 .1264715
L3D. .0202842 .0846328 0.24 0.811 -.1468899 .1874583
L2D. -.1245935 .0906425 -1.37 0.171 -.3036384 .0544515
LD. -.5771337 .0783939 -7.36 0.000 -.7319842 -.4222832
L1. -.0105081 .0044287 -2.37 0.019 -.019256 -.0017603
LNPBISA
D.LNPBISA Coef. Std. Err. t P>|t| [95% Conf. Interval]
p-value for Z(t) = 0.0094
Z(t) -2.373 -2.350 -1.655 -1.287
Statistic Value Value Value
Test 1% Critical 5% Critical 10% Critical
Z(t) has t-distribution
Augmented Dickey-Fuller test for unit root Number of obs = 162
. dfuller LNPBISA, drift regress lags(4)
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 20
Se observa que se acepta la hipótesis nula de raíz unitaria, al 5% de nivel de
significancia, dado que el Test Statistic en valor absoluto es menor al Critical Value
en valor absoluto en el modelo final que es con dos rezagos y sin tendencia
determinística .
También podemos usar el dfgls test que consiste en una mejora del Dickey Fuller
en términos de potencia para incrementar la probabilidad de no cometer el Error
del tipo II.
Se observa que la serie está rechazando la hipótesis de raíz unitaria
Figura Nº 15
El test de ADF GLS es un test más potente para detectar la presencia de raíz unitaria
dentro de entornos de quiebre estructural o incorrelación de los residuos del
modelo que plantea el test. Como se puede observar según el SC y el MAIC, el
rezago adecuado es de uno. Según esta información vemos que el valor crítico al
5% de nivel de significancia (-2.951) es mayor en valor absoluto que el valor DF-
GLS test, con lo cual se concluye que la hipótesis nula de raíz unitaria es aceptada.
A continuación sometemos la serie al test de Phillips Perron
Min MAIC = -8.82377 at lag 2 with RMSE .0119328
Min SC = -8.783053 at lag 1 with RMSE .011999
Opt Lag (Ng-Perron seq t) = 1 with RMSE .011999
1 -0.963 -3.500 -2.951 -2.661
2 -0.792 -3.500 -2.942 -2.653
3 -0.934 -3.500 -2.932 -2.644
4 -0.956 -3.500 -2.921 -2.635
[lags] Test Statistic Value Value Value
DF-GLS tau 1% Critical 5% Critical 10% Critical
DF-GLS for LNPBISA Number of obs = 162
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 21
Aquí vemos que con distintos rezagos se acepta la hipótesis nula de raíz unitaria
Identificamos que la serie PBI es raíz unitaria o integrada de orden uno.
Procedemos a aplicarle la primera diferencia
generate DLNPBISA = D.PBISA
Luego procedemos a identificar la naturaleza del proceso generador de datos (en
nuestro ejemplo, el PBI). Para llevar a cabo esta tarea se suele recurrir a las
funciones de autocorrelación (para identificar el componente de media móvil MA
del modelo) y autocorrelación parcial (para identificar el orden la parte
.
_cons 24.23139 3.352219 7.23 0.000 17.61202 30.85077
_trend .1762759 .0239981 7.35 0.000 .1288886 .2236632
L1. .6759354 .0446977 15.12 0.000 .5876743 .7641966
PBISA
PBISA Coef. Std. Err. t P>|t| [95% Conf. Interval]
MacKinnon approximate p-value for Z(t) = 0.0000
Z(t) -7.252 -4.018 -3.441 -3.141
Z(rho) -54.596 -27.840 -20.964 -17.720
Statistic Value Value Value
Test 1% Critical 5% Critical 10% Critical
Interpolated Dickey-Fuller
Newey-West lags = 4
Phillips-Perron test for unit root Number of obs = 166
. pperron PBISA, trend regress
-.05
0
.05
DLN
PB
ISA
2003m7 2007m1 2010m7 2014m1 2017m7mensual
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 22
autorregresiva AR del modelo). En Stata ambas funciones se pueden graficar con
los comandos ac y pac respectivamente así:
ac DLNPBISA
Figura Nº 16
Vemos que como los primeros “bastoncitos” están dentro de las bandas de
confianza , sin embargo por “precaución” vamos a coger el primer valor del FAP,
dado que está en el limite de las bandas de confianza. Bajo este concepto hay un
posible esquema MA(1) como proceso generador de la data.
pac LNPBISA
Como bien sabemos la función de autocorrelacion parcial nos describe el
comportamiento del componente autorregresivo AR (p).
-0.4
0-0
.20
0.0
00.2
0
Auto
corr
ela
tions o
f D
LN
PB
ISA
0 10 20 30 40Lag
Bartlett's formula for MA(q) 95% confidence bands
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 23
Figura Nº 17
Posibles esquemas ARMA(p=1,q=1)
-0.6
0-0
.40
-0.2
00.0
00.2
0
Part
ial auto
corr
ela
tions o
f D
LN
PB
ISA
0 10 20 30 40Lag
95% Confidence bands [se = 1/sqrt(n)]
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 24
5. Fase de estimación
Las funciones de autocorrelación y autocorrelación parcial sugieren varios
procesos ARMA factibles para la inflación. La selección de los modelos debe tener
en cuenta los criterios de parsimonia (menor parametrización posible)
estacionariedad e invertibilidad de la variable dependiente y bondad de ajuste del
modelo. A continuación se presenta uno de los posibles procesos ARMA para la
PBI. El comando para estimarlos en Stata es arima y a través de las opciones
ar(número de los rezagos de la variable dependiente separados por comas)
ma(número de los rezagos separados por comas) se puede especificar el
componente autorregresivo y de media móvil ARIMA(7,0,1). Para ello digitamos
el siguiente comando
arima DLNPBISA , ar(1) ma(1)
En la gráfica vemos que todos los coeficientes son significativos, pero tendríamos
que buscar estimaciones más simples y más parsimoniosas si es que lo hubiere,
para tener un mejor modelo para la etapa del pronóstico.
.
confidence interval is truncated at zero.
Note: The test of the variance against zero is one sided, and the two-sided
/sigma .0130545 .0005285 24.70 0.000 .0120186 .0140904
L1. -.2929833 .1251787 -2.34 0.019 -.538329 -.0476376
ma
L1. -.2641006 .1195684 -2.21 0.027 -.4984503 -.0297509
ar
ARMA
_cons .0043911 .000586 7.49 0.000 .0032425 .0055397
DLNPBISA
DLNPBISA Coef. Std. Err. z P>|z| [95% Conf. Interval]
OPG
Log likelihood = 484.512 Prob > chi2 = 0.0000
Wald chi2(2) = 94.53
Sample: 2003m10 - 2017m7 Number of obs = 166
ARIMA regression
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 25
A través del comando estat ic se puede obtener el criterio de información de Akaike
(AIC) y el criterio bayesiano de Schwartz (BIC) los cuales son las dos medidas más
comunes de bondad de ajuste. Cuanto más pequeño es el valor de los estadísticos
(AIC) y (BIC) mejor ajuste tiene el modelo. Estos criterios se pueden emplear para
seleccionar el modelo más apropiado de un conjunto de posibles modelos.
estat ic
Ahora vamos a comparar el modelo con un ARMA( 2,1).
arima DLNPBISA , ar(1,2) ma(1)
Note: N=Obs used in calculating BIC; see [R] BIC note.
. 166 . 484.512 4 -961.0239 -948.576
Model Obs ll(null) ll(model) df AIC BIC
Akaike's information criterion and Bayesian information criterion
confidence interval is truncated at zero.
Note: The test of the variance against zero is one sided, and the two-sided
/sigma .0130172 .0005369 24.24 0.000 .0119648 .0140695
L1. .8459529 .1204212 7.02 0.000 .6099317 1.081974
ma
L2. -.4959684 .0611584 -8.11 0.000 -.6158366 -.3761001
L1. -1.350318 .111168 -12.15 0.000 -1.568203 -1.132433
ar
ARMA
_cons .0043697 .0006643 6.58 0.000 .0030678 .0056717
DLNPBISA
DLNPBISA Coef. Std. Err. z P>|z| [95% Conf. Interval]
OPG
Log likelihood = 484.9347 Prob > chi2 = 0.0000
Wald chi2(3) = 317.55
Sample: 2003m10 - 2017m7 Number of obs = 166
ARIMA regression
Note: N=Obs used in calculating BIC; see [R] BIC note.
. 166 . 484.9347 5 -959.8693 -944.3094
Model Obs ll(null) ll(model) df AIC BIC
Akaike's information criterion and Bayesian information criterion
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 26
Vemos que el segundo modelo tiene un mayor AIC= -959.86 >-961.02. Por lo tanto
el mejor modelo es el primero. La regla es probar con todas las posibilidades y
quedarse con el mejor modelo en términos de AIC5.
6. Fase de verificación y diagnóstico
Es muy importante que los residuales del modelo estimado no estén serialmente
correlacionados. Cualquier evidencia de correlación serial implicaría movimientos
sistemáticos en la variable dependiente que no han sido tenidos en cuenta por los
coeficientes incluidos en el modelo ARMA. Para chequear correlación en los
residuales se pueden construir las funciones de autocorrelación y autocorrelación
parcial para los residuales. A través del comando predict seguido de la opción res
se podrá estimar los residuales así:
predict residual, res
ac res
pac res
5 Para Muestras grandes mayores a 30 es recomendable usar el Bayesiando Schawartz BIC.
-0.2
0-0
.10
0.0
00.1
00.2
0
Auto
corr
ela
tions o
f re
sid
ual
0 10 20 30 40Lag
Bartlett's formula for MA(q) 95% confidence bands
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 27
En una prueba más general, se puede constatar si los residuales son “ruido blanco”,
en otras palabras, tienen media cero, varianza constante y no están serialmente
correlacionados. A través del comando wntestq realizar esta prueba así:
wntestq residual
El test de Portmanteau nos dice que el modelo estimado tiene problemas de
autocorrelacion serial de los residuos. Se tiene que volver a revisar el modelo
buscando alternativas de solución para corregir en modelo del problema de
autocorrelación de los residuos. Es necesario que el modelo final no tenga
problemas de autocorrelacion ni heterocedasticidad. Una alternativa es hacer la
metodología B&J aplicando al logaritmo neperiano del PBI.
7. Pronósticos
Dado que el objetivo del documento es servir de un manual para la estimación de
modelos ARIMA, procedemos a obviar este detalle y pasamos a la fase de
pronósticos.
Finalmente, se puede emplear el modelo para hacer pronósticos. El pronóstico se
puede hacer tantos periodos hacia delante como horizonte temporal tenga la
-0.2
0-0
.10
0.0
00.1
00.2
0
Part
ial auto
corr
ela
tions o
f re
sid
ual
0 10 20 30 40Lag
95% Confidence bands [se = 1/sqrt(n)]
end of do-file
.
Prob > chi2(40) = 0.7465
Portmanteau (Q) statistic = 33.7478
Portmanteau test for white noise
. wntestq residual
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 28
variable de tiempo “fecha” la cual está definida entre el mes 1 de 2001 y el mes 12
de 2006, mientras que se tiene dato mensual de inflación hasta el mes 5 de 2006. A
través del comando predict seguido de la opción xb, se podrá pronosticar la
inflación para los siguientes 7 meses así:
predict DLNPBIPRED, xb
Finalmente, a través del comando tsline es posible visualizar los valores
observados y
pronosticados de la inflación hasta octubre de 2015.
twoway (tsline DLNPBIPRED, lcolor(blue)) (tsline DLNPBISA, lcolor(red))
Una forma gráfica de observar la calidad de ajuste del modelo es mediante las
gráficas del pronóstico vs la serie original.
1 0 1
1 1 0 1
(1 ) (1 L)
(LN )(1 ) (1 L)
t t
t t t
DLNPBISA L
PBISA LNPBISA L
-.0
5
0
.05
2003m7 2007m1 2010m7 2014m1 2017m7mensual
xb prediction, one-step DLNPBISA
Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM
Modelos de Series de Tiempo en Stata.
Rafael Bustamante Romaní 29
De esta ecuación tenemos que despejar tLNPBISA y obtener una nueva ecuación:
1 1 0 1(LN , , , )t tLNPBI f PBI
Reemplazando los parámetros por los coeficientes estimados y reemplazados los
valores de los rezagos del PBI se pueden obtener los pronósticos solicitados.
Referencias
Colin Cameron , A., & Trivedi, P. (2005). Microeconometrics: Methods and
Applications. (C. U. Press, Ed.) New York.
Casas Tragadora, C. (2000). Econometría Moderna. Lima: Universidad del Pacífico.
Greene, W. (1997). Análisis Econometrico (Tercera ed.). Prentice Hall.
Vásquez, J. (2010). Introducción a Series de Tiempo Univariadas usando STATA.
Obtenido de
http://1948f70508a693849b622441e0d31b1f.proxysheep.com/doc/132366426/Series-
de-Tiempo-Univariadas-en-STATA-2010-pdf