n°10 serie apuntes de clase octubre de 2017...laserie apuntes de clase tiene por objetivo difundir...

Serie Apuntes de Clase N°10

Octubre de 2017

SERIES DE TIEMPO

UNIVARIANTE EN STATA

14

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Universidad del Perú, DECANA DE AMÉRICA)

FACULTAD DE CIENCIAS ECONÓMICAS

ESCUELA ACADÉMICO PROFESIONAL DE ECONOMÍA

Rafael Bustamante Romaní

La Serie Apuntes de Clase tiene por objetivo difundir los

materiales de enseñanza generados por los docentes que

tienen a su cargo el desarrollo de las asignaturas que

forman parte del Plan de Estudios de la Escuela

Académico-Profesional de Economía de la Facultad de

Ciencias Económicas de la Universidad Nacional Mayor de

San Marcos. Estos documentos buscan proporcionar a los

estudiantes la explicación de algunos temas específicos

que son abordados en su formación universitaria.

Escuela Académico Profesional de Economía.

Facultad de Ciencias Económicas.

Universidad Nacional Mayor de San Marcos.

Calle Germán Amézaga N° 375.

Ciudad Universitaria, Lima 1. Perú.

Teléfono 619-7000. Anexo 2208.

[email protected]

http://economia.unmsm.edu.pe/escuela/econ.htm

mailto:[email protected]

http://economia.unmsm.edu.pe/escuela/econ.htm

La Serie Apuntes de Clase Omega Beta Gamma tiene por objetivo difundir los materiales de enseñanza generados por los docentes que tienen a su cargo el desarrollo de las asignaturas que forman parte de los Planes de Estudios de las Escuelas Académico-Profesionales de la Facultad de Ciencias Económicas de la Universidad Nacional Mayor de San Marcos. Estos documentos buscan proporcionar a los estudiantes la explicación de algunos temas específicos que son abordados en su formación universitaria.

Encargados de la serie:

Bustamante Romaní, Rafael. Cisneros García, Juan Manuel. [email protected] [email protected]

Facultad de Ciencias Económicas. Universidad Nacional Mayor de San Marcos.

Calle Germán Amézaga N° 375. Ciudad Universitaria, Lima 1. Perú.

La Serie Apuntes de Clase ΩΒΓ es promovida y

desarrollada por un colectivo de docentes del Departamento de Economía de la Universidad Nacional Mayor de San Marcos. El contenido de cada publicación es íntegramente responsabilidad de cada autor, no representa necesariamente los puntos de vista de los integrantes del colectivo, ni de la Universidad.

http://www.financeybusiness.com



http://www.financeybusiness.com/

Series de tiempo Univariante en Stata 14.0

Rafael Bustamante

(Versión Preliminar)

Resumen

Este trabajo pretende explicar las características estadísticas de las series de tiempo, así el comando

necesario para la aplicación de Modelos de Series de Tiempo en el paquete STATA 14. Asimismo

se sigue la metodología de Box and Jenkins, para determinar el modelo de serie de tiempo que

ajusta a la evolución de los datos. Para ello se explica didácticamente cuales son los comando que

se utilizan en estada para esta metodología a usar. Este curso tiene por objetivo lograr un análisis

estadístico y econométrico de series de tiempo univariadas, determinar el proceso estadístico que

sigue una serie de tiempo, y a partir de la estimación del modelo realizar pronósticos que sean

relevante para tomar decisiones de negocios, política fiscal, monetaria etc.

Palabras Claves: Serie temporal. Proceso estocástico. ARIMA, Estacionariedad,

Stata

Clasificación JEL: C2, C25

Estudios de doctorado en Economía con mención en los Recursos Naturales, Universidad Nacional

Autónoma de México y UNMSM. MBA Gerencial (c), CENTRUM Pontificia Universidad Católica del Perú. Maestría en Economía con mención en Finanzas, Universidad Nacional Mayor de San Marcos. B. Sc. Economía, UNMSM. Profesor Auxiliar del Departamento de Economía de la UNMSM. Investigador asociado al Instituto de Investigaciones FCE - UNMSM. Contacto: [email protected]


Contenido

1. Introducción ..................................................................................................................... 1

2. Formato de tiempo en Stata ........................................................................................... 1

3. Operadores de rezagos de series de tiempo ............................................................... 6

3.1 Operador de rezagos ................................................................................................. 6

3.2 Operador Forward ..................................................................................................... 8

4. Metodología Box Jenkins (BJ) aplicada al caso de selección y estimación de un

modelo ARMA. .................................................................................................................... 9

4.1 Fase de identificación .............................................................................................. 11

4.2 Quiebre estructural: el test de Zivot ...................................................................... 13

5. Fase de estimación ......................................................................................................... 24

6. Fase de verificación y diagnóstico ............................................................................... 26

7. Pronósticos ...................................................................................................................... 27

Serie Apuntes de Clase. N°7. Septiembre de 2014. EAPE / FCE / UNMSM

Modelos de Series de Tiempo en Stata.

Rafael Bustamante Romaní 1

1. Introducción

Este curso tiene por objetivo lograr un análisis estadístico y econométrico de series

de tiempo univariadas, determinar el proceso estadístico que sigue una serie de

tiempo, y a partir de la estimación del modelo realizar pronósticos que sean

relevante para tomar decisiones de negocios, política fiscal, monetaria etc.

Las series de tiempo tienen que ser estacionarias para practicar los procedimientos

habituales pues tienen las propiedades estadísticas adecuadas. Básicamente esto

requiere que la media y varianzas y covarianzas de los datos de series de tiempo

sean valores constantes en el período de tiempo en el que se observan. Por ejemplo,

la media y la varianza del PIB en el tercer trimestre de 1973 no pueden ser

diferentes de las del cuarto trimestre de 2006. Los métodos para hacer frente a este

problema han proporcionado un rico campo de investigación para la econometría

en los últimos años y varias técnicas econométricas se han desarrollado a partir de

aquí. Una de las primeras herramientas de diagnóstico utilizados es un simple

gráfico de series temporales de los datos. Una el comportamiento de unas series de

tiempo económico revelará problemas potenciales con los datos y sugerirá

maneras de proceder estadísticamente. El comportamiento gráficos de las series de

tiempo son fáciles de generar en Stata y algunos nueva procedimientos se

estudiarán más adelante en este manual (Vásquez, 2010).

2. Formato del tiempo en Stata

Por definición los datos tienen una frecuencia temporal, la que puede ser mensual,

trimestral, anual, etc. Lo primero que debemos hacer es indicarle a STATA que




2

estaremos trabajando en formato de serie de tiempo lo que se hace a través del

comando tsset.

Sin embargo, previo a esto debemos tener en nuestra base de datos una variable

que indique la temporalidad o frecuencia de los datos. Por ejemplo, en la base de

datos credito_mensual.dta podemos ver las primeras 10 observaciones:

Vamos a importar los datos a partir del Excel, para ello mostramos el siguiente

procedimiento en STATA1.

Figura Nº1

1 Se puede acceder a la base de datos en el siguiente link

https://drive.google.com/open?id=0B4B7bhYQMcKmczJoN3h6a0h0TlU

https://drive.google.com/open?id=0B4B7bhYQMcKmczJoN3h6a0h0TlU




Figura Nº2

Procedemos a abrir la data y mostramos las 10 primeras series con los siguientes

comandos

cd "C:\Users\FINANCE.BUSINESS\Desktop\datos para stata"

use credito_mensual.dta

list if _n<=10

Esto nos muestra el siguiente cuadro en la ventana de resultados.

Figura Nº 3




Vemos que la fecha está en un formato string no propio para desarrollar estos

modelos de series de tiempo. Por lo tanto procedemos a generar la variable date,

que empiece en el mes de enero del 1992.

generate date = ym(1992,12) +_n-1

format date %tm

El comando format permite darle el format de fecha a la variable date, el cual está

en un formato numérico no reconocible para nosotros (Vásquez, 2010).

Finalmente si digitamos list if _n<=10.

Figura Nº 4

10. 4533.8045

9. 4200.0574

8. 3759.6947

7. 3636.1286

6. 3399.3914

5. 3245.0357

4. 3048.757

3. 2761.5437

2. 2652.5527

1. 2608.5396

cred




Para datos con otras frecuencias se deben utilizar los siguientes comandos:

Diaria

g fecha=mdy(mes,dia,año)

format fecha %td

Semanal

g fecha=yw(año,semana)

format fecha %tw

Mensual

g fecha=ym(año,mes)

format fecha %tm

Trimestral

g fecha=yq(año,trimestre)

format fecha %tq

Semestral

g fecha=yh(año,semestre)

format fecha %th

10. 4533.8045 1993m9

9. 4200.0574 1993m8

8. 3759.6947 1993m7

7. 3636.1286 1993m6

6. 3399.3914 1993m5

5. 3245.0357 1993m4

4. 3048.757 1993m3

3. 2761.5437 1993m2

2. 2652.5527 1993m1

1. 2608.5396 1992m12

cred date

. list if _n<=10




Entonces, una vez creada una variable única que contenga la frecuencia de los

datos, en nuestro ejemplo la variable fecha, debemos indicarle a STATA que

trabajaremos con formato de datos en series de tiempo:

Figura Nº5

3. Operadores de rezagos de series de tiempo

Debido a que las series tiempo tienen por naturaleza un orden temporal, con

frecuencia no sólo nos interesa o queremos hacer referencia al valor de la serie en

el momento t, sino por ejemplo al valor rezagado de la serie (t-1), o la serie en

diferencia (valor en t menos el valor en t-1), etc. STATA posee operadores de series

de tiempo que nos ayudan a obtener dichos valores de manera mucho más fácil

que crearlos de manera manual.

3.1 Operador de rezagos

En series de tiempo se define el operador de rezago L tal que:

1

2

1 2( )

t t

t t t

LX X

L X L X X

Por ejemplo, si queremos crear una variable que contenga el primer rezago de la

variable cred.

delta: 1 month

time variable: date, 1992m12 to 2016m8

. tsset date




generate credlag1=L.cred

list date credlag1 if _n<=10

Figura Nº6

De manera análoga, podemos generar una variable con el segundo rezago de la

variable cred a través del siguiente comando:

generate credlag2=L2.cred

list date credlag2 if _n<=10

Figura Nº 7

10. 1993m9 4200.058

9. 1993m8 3759.695

8. 1993m7 3636.129

7. 1993m6 3399.391

6. 1993m5 3245.036

5. 1993m4 3048.757

4. 1993m3 2761.544

3. 1993m2 2652.553

2. 1993m1 2608.54

1. 1992m12 .

date credlag1

. list date credlag1 if _n<=10




3.2 Operador Forward

También podemos ocupar el operador F para adelantar datos, es decir, generar una

variable con las observaciones en t+1:

10. 1993m9 3759.695

9. 1993m8 3636.129

8. 1993m7 3399.391

7. 1993m6 3245.036

6. 1993m5 3048.757

5. 1993m4 2761.544

4. 1993m3 2652.553

3. 1993m2 2608.54

2. 1993m1 .

1. 1992m12 .

date credlag2

. list date credlag2 if _n<=10




9

4. Metodología Box Jenkins (BJ) aplicada al caso de selección y

estimación de un modelo ARMA.

Los modelos autorregresivos (AR), de media móvil (MA) y autorregresivos de

media móvil (ARMA) se caracterizan por incorporar en la explicación futura de la

variable dependiente su propio comportamiento pasado. Esta forma de modelar la

conducta de una serie de datos temporales hace viable, en su forma más simple en

modelos univariados, la generación de pronósticos sin emplear información

adicional proveniente de otros regresores. En las secciones siguientes se sigue la

metodología de BOX y JENKINS (1976)2 para estimar y pronosticar modelos

univariados de serie de tiempo a través de Stata. En particular se hará uso de la

información mensual de inflación contenida en la base de datos PBI_Mensual.dta.

Vamos a listar las diez primeras series, para ello digitamos en la ventana de

comandos de Stata:

list if _n<=10

Vamos a crear la variable mensual, para poder dar contexto de serie temporal a la

serie PBI.

2 En el análisis de series de tiempo, la metodología de Box-Jenkins, nombrada así en honor a los estadísticos George Box

y Gwilym Jenkins,1 se aplica a los modelos autorregresivos de media móvil ARMA o a los modelos autorregresivos integrados de media móvil (ARIMA) para encontrar el mejor ajuste de una serie temporal de valores, a fin de que los pronósticos sean más acertados.

10. 83.28746

9. 86.51057

8. 84.09447

7. 78.63546

6. 74.09743

5. 75.91327

4. 78.00974

3. 75.57254

2. 77.59892

1. 73.86784

PBI




generate mensual = ym(2003,01) +_n-1

La variable “mensual” tiene un formato numérico general que corresponde al

número de meses desde el 2003. Sin embargo a la variable fecha se le puede dar

un formato numérico mensual así:

format mensual %tm

list if _n<=10

Designando la variable que representa al tiempo y con la cual podemos configurar

al programa Stata para que este “entienda” que se encuentra trabajando con series

temporales.

Antes de estimar cualquier modelo de serie de tiempo es necesario que Stata

reconozca la variable que representa el tiempo (en nuestro ejemplo, la variable

mensual). Este paso se logra a través del comando tsset así:

tsset mensual, monthly

La opción monthly indica la periodicidad mensual de la variable de tiempo

“mensual”.

BOX and JENKINS difundieron una metodología en tres fases para identificar,

estimar y validar modelos de serie de tiempo univariada y generar pronósticos. A

continuación se seguirán estos pasos para obtener un modelo de pronóstico tipo

ARMA para el PBI mensual.

delta: 1 month

time variable: mensual, 2003m1 to 2015m9

. tsset mensual, monthly




4.1 Fase de identificación

La primera aproximación a los datos es gráfica. Al graficar la variable a pronosticar

respecto al tiempo se puede obtener información sobre posibles “outliers”, valores

perdidos “missing values” o cambios estructurales en la serie de datos. Así mismo,

si la variable a pronosticar no es estacionaria o es integrado de orden (1), podrán

observarse tendencias pronunciadas o comportamientos sin media y/o varianza

constante a través del tiempo. Con el comando tsline es posible efectuar esta

primera constatación así:

Para esta oportunidad vamos a trabajar con el índice del PBI mensual, elaborado

por el Banco Central de Reserva.

Grafiquemos la serie en estudio:

tsline PBI

Figura Nº 8

80

100

120

140

160

180

Índic

e d

el P

BI re

al

2002m1 2004m1 2006m1 2008m1 2010m1 2012m1 2014m1 2016m1mensual




Vemos que la serie tiene estacionalidad, por lo tanto lo corregimos usando algún

tipo de Filtro. En nuestro caso usaremos el filtro de suavizamiento exponencial

para extraer el componente estacional de la serie3.

Esta técnica se basa en la atenuación de los valores de la serie de tiempo,

obteniendo el promedio de estos de manera exponencial; es decir, los datos se

ponderan dando un mayor peso a las observaciones más recientes y uno menor a

las más antiguas. Al peso para ponderar la observación más reciente se le da el

valor α, la observación inmediata anterior se pondera con un peso de a 1

, a

la siguiente observación inmediata anterior se le da un peso de ponderación de a

2

1 y así sucesivamente hasta completar el número de valores observados en

la serie de tiempo a tomar en cuenta para realizar la atenuación, es decir, para

calcular el promedio ponderado. La estimación o pronóstico será el valor obtenido

del cálculo del promedio.

Por lo que la expresión para realizar el cálculo de la suavización exponencial

simple es:

2

1 1 1 ( 1)(1 ) (1 ) ... (1 )n

t t t t t nP Y Y Y Y

Donde

tY : Valor de la serie en el período “t”.

1tP : Pronóstico o predicción para el período “t+1”.

tP : Pronóstico o predicción en el período “t”.

α : Factor de suavización, ( 10≤α≤)

En STATA para realizar la desestacionalizaciòn, digitamos el siguiente comando

tssmooth exponential PBISA = PBI

Le estamos diciendo a STATA que suavice la serie “eliminado” esos puntos

estacionales y a que esa serie la denomina PBISA.

3 Cabe mencionar que muchas veces el componente estacional, anda “escondido” en la serie, por eso siempre es bueno aplicar la gráfica

en la serie en primeras diferencias para poder observarlo.




Figura Nº 9

Como se puede observar la serie sigue presentando ese comportamiento estacional

4.2 Quiebre estructural: el test de Zivot

El tema de la existencia de raíces unitarias en series de datos económicos ha

recibido especial atención en la literatura de las últimas tres décadas, en particular

a partir del estudio de Nelson y Plosser (1982), en el que se argumenta que choques

actuales tienen un efecto permanente en el nivel de largo plazo de la mayoría de

8010

012

014

016

0

parm

s(0.

3856

) =

PB

I

2002m1 2004m1 2006m1 2008m1 2010m1 2012m1 2014m1 2016m1mensual

4.4

4.6

4.8

55.2

LN

PB

ISA

2003m7 2007m1 2010m7 2014m1 2017m7mensual




series macroeconómicas y financieras. Estudios posteriores debatieron esa visión,

proponiendo que la respuesta de largo plazo a los choques actuales depende del

tamaño relativo de los choques temporales y de los choques permanentes4 . Como

es de esperar, una buena parte de los estudios publicados desde entonces se ha

ocupado de desarrollar métodos de prueba para determinar la presencia de raíces

unitarias. Las pruebas de raíz unitaria fueron desarrolladas por Dickey y Fuller

(1979, 1981), que se encuentran entre las herramientas más utilizadas en el trabajo

aplicado de series temporales. Se fundan en una hipótesis nula que no considera

cambios estructurales de ningún tipo en la serie de tiempo en estudio. Así pues, en

presencia de quiebres estructurales la inferencia realizada a partir de estas pruebas

podría perder validez. Uno de los primeros estudios en tomar en cuenta la

posibilidad de cambios estructurales a la hora de realizar pruebas de raíz unitaria

fue el de Perron (1989), que desarrolló una versión modificada de la prueba

Dickey-Fuller que incluye un quiebre estructural exógeno, es decir, conocido a

priori. Trabajos posteriores modificaron ese procedimiento para estimar

endógenamente el punto de quiebre. Actualmente, las pruebas de raíz unitaria que

permiten la estimación endógena del punto de quiebre son frecuentemente

utilizadas, por ejemplo la prueba de t mínimo desarrollada por Zivot y Andrews

(1992) y la prueba de Perron (1997). Sin embargo, en estos dos últimos métodos se

deriva el estadístico de prueba partiendo de una hipótesis nula de raíz unitaria sin

cambios estructurales. Por consiguiente, la hipótesis alternativa relevante en esos

casos no es “estacionariedad con cambios estructurales” sino “presencia de

cambios estructurales”, lo cual incluye la posibilidad de raíz unitaria con quiebres

estructurales. Así pues, en esas pruebas el rechazo de la hipótesis nula no

necesariamente excluye la existencia de raíz unitaria propiamente, sino que podría

indicar rechazo de una raíz unitaria sin quiebres. Es importante, por consiguiente,

disponer de métodos de prueba que excluyan rechazos de la hipótesis nula de raíz

unitaria debidos a la presencia de cambios estructurales.

Muchas veces las series económicas presentan un cambio brusco en su

comportamiento ya sea este cambio en la pendiente de la serie o el nivel de la serie.

A estos dos casos se les llama quiebre en pendiente y quiebre en tendencia.

Este test trata de verificar la hipótesis nula de presencia de raíz unitaria solamente.

Esto contrasta con el test de Perron y Volgensang en que la nula es la presencia de

raíz unitaria más un quiebre estructural. Este test es más general, dado que el

4




anterior sólo se refería a la presencia de raíz unitaria o no, pero siempre con la

presencia de un quiebre estructural.

Así estos autores plantean los siguientes modelos a estimar para tres casos

distintos de hipótesis alternativas que plantean quiebre en niveles (A), quiebres en

tendencia (B) y quiebres en tendencia y niveles (C). Para cada una de estas

alternativas proponen calculas las siguientes regresiones:

Ahora estudiamos el problema de quiebre estructural.

Figura Nº 10

Extraído de las notas de clase del profesor Carlos Casas: “Econometría Moderna”

En ambos tests se acepta la Hipótesis Nula si el t de α del periodo Tb es mayor que

el valor de tablas (o menor en valor absoluto). La hipótesis nula se rechaza si es

que el t estadístico de α del período Tb es menor al de tablas (o mayor en valor

absoluto).




Para el test de Zivot y Andrews se presentan los siguientes valores de tablas que

se refieren a la selección de k bajo el método 2 de Perron y Volgensang (Casas

Tragadora, 2000).

En Stata tenemos implementado el paquete en archivo denominado

zandrews.ado. Para proceder a instalarlo digitamos el siguiente comando:

scc install zandrews

Si no es posible buscarlo manualmente con el comando,

findit zandrews

La lógica del test es la siguiente:

H0: La serie presenta raíz unitaria

H1: La serie es estacionaria con quiebre y no presenta raíz unitaria

Digitamos el siguiente comando.

zandrews PBISA, graph

zandrews PBISA, break(trend)

zandrews PBISA, break(both) trim(0.10)

zandrews PBISA, lagmethod(BIC)

Figura Nº 11

-2.5

-2

-1.5

-1

-.5

Bre

akpoin

t t-

sta

tistics

2003m7 2007m1 2010m7 2014m1 2017m7mensual

Min breakpoint at 2014m1

Zivot-Andrews test for LNPBISA, 2005m12-2015m6




Se observa que el t – statistic = -3.090 es mayor al valor critico -4.42, por lo tanto se

rechaza la hipótesis nula de raíz unitaria sin quiebre. Seguidamente sometemos

a la serie a la prueba de raíz unitaria, para ello usamos el comando.

Seguidamente para confirmar lo visto por el test de Zivot, presentamos el test de

raíces unitarias, del Dickey Fuller Aumentado. Para ello procedemos manualmente

con el siguiente procedimiento en la ventana de comandos:

Figura Nº 12

.

Critical values: 1%: -5.34 5%: -4.80 10%: -4.58

Minimum t-statistic -2.509 at 2014m1 (obs 125)

Lag selection via BIC: lags of D.LNPBISA included = 2

Allowing for break in intercept

Zivot-Andrews unit root test for LNPBISA

. zandrews LNPBISA, lagmethod(BIC)

Critical values: 1%: -5.57 5%: -5.08 10%: -4.82


Lag selection via TTest: lags of D.LNPBISA included = 2

Allowing for break in both intercept and trend


. zandrews LNPBISA, break(both) trim(0.10)

Critical values: 1%: -4.93 5%: -4.42 10%: -4.11



Allowing for break in trend


. zandrews LNPBISA, break(trend)

Critical values: 1%: -5.34 5%: -4.80 10%: -4.58



Allowing for break in intercept


. zandrews LNPBISA, graph




Luego nos sale un cuadro de dialogo donde procedemos a darle check a mostrar

regresión del test.

Figura Nº 13

En términos de comandos digitaríamos lo siguiente:

Figura Nº 14




.

_cons .0553936 .0205826 2.69 0.008 .0147449 .0960422

L2D. -.1813549 .0724774 -2.50 0.013 -.3244907 -.0382191

LD. -.5368119 .0728326 -7.37 0.000 -.6806492 -.3929747

L1. -.0099937 .0043034 -2.32 0.021 -.0184925 -.0014948

LNPBISA

D.LNPBISA Coef. Std. Err. t P>|t| [95% Conf. Interval]

p-value for Z(t) = 0.0107

Z(t) -2.322 -2.350 -1.654 -1.287

Statistic Value Value Value

Test 1% Critical 5% Critical 10% Critical

Z(t) has t-distribution

Augmented Dickey-Fuller test for unit root Number of obs = 164

. dfuller LNPBISA, drift regress lags(2)

_cons .0663459 .0207201 3.20 0.002 .0254218 .10727

L3D. .014415 .0732768 0.20 0.844 -.1303135 .1591435

L2D. -.1878132 .0826443 -2.27 0.024 -.3510432 -.0245831

LD. -.6102156 .0767368 -7.95 0.000 -.7617778 -.4586533

L1. -.0121809 .0043089 -2.83 0.005 -.0206914 -.0036705

LNPBISA



Z(t) -2.827 -2.350 -1.655 -1.287






_cons .0578392 .0214371 2.70 0.008 .0154949 .1001836

L4D. -.0176391 .0729568 -0.24 0.809 -.1617497 .1264715

L3D. .0202842 .0846328 0.24 0.811 -.1468899 .1874583

L2D. -.1245935 .0906425 -1.37 0.171 -.3036384 .0544515

LD. -.5771337 .0783939 -7.36 0.000 -.7319842 -.4222832

L1. -.0105081 .0044287 -2.37 0.019 -.019256 -.0017603

LNPBISA



Z(t) -2.373 -2.350 -1.655 -1.287









Se observa que se acepta la hipótesis nula de raíz unitaria, al 5% de nivel de

significancia, dado que el Test Statistic en valor absoluto es menor al Critical Value

en valor absoluto en el modelo final que es con dos rezagos y sin tendencia

determinística .

También podemos usar el dfgls test que consiste en una mejora del Dickey Fuller

en términos de potencia para incrementar la probabilidad de no cometer el Error

del tipo II.

Se observa que la serie está rechazando la hipótesis de raíz unitaria

Figura Nº 15

El test de ADF GLS es un test más potente para detectar la presencia de raíz unitaria

dentro de entornos de quiebre estructural o incorrelación de los residuos del

modelo que plantea el test. Como se puede observar según el SC y el MAIC, el

rezago adecuado es de uno. Según esta información vemos que el valor crítico al

5% de nivel de significancia (-2.951) es mayor en valor absoluto que el valor DF-

GLS test, con lo cual se concluye que la hipótesis nula de raíz unitaria es aceptada.

A continuación sometemos la serie al test de Phillips Perron

Min MAIC = -8.82377 at lag 2 with RMSE .0119328

Min SC = -8.783053 at lag 1 with RMSE .011999

Opt Lag (Ng-Perron seq t) = 1 with RMSE .011999

1 -0.963 -3.500 -2.951 -2.661

2 -0.792 -3.500 -2.942 -2.653

3 -0.934 -3.500 -2.932 -2.644

4 -0.956 -3.500 -2.921 -2.635

[lags] Test Statistic Value Value Value

DF-GLS tau 1% Critical 5% Critical 10% Critical

DF-GLS for LNPBISA Number of obs = 162




Aquí vemos que con distintos rezagos se acepta la hipótesis nula de raíz unitaria

Identificamos que la serie PBI es raíz unitaria o integrada de orden uno.

Procedemos a aplicarle la primera diferencia

generate DLNPBISA = D.PBISA

Luego procedemos a identificar la naturaleza del proceso generador de datos (en

nuestro ejemplo, el PBI). Para llevar a cabo esta tarea se suele recurrir a las

funciones de autocorrelación (para identificar el componente de media móvil MA

del modelo) y autocorrelación parcial (para identificar el orden la parte

.

_cons 24.23139 3.352219 7.23 0.000 17.61202 30.85077

_trend .1762759 .0239981 7.35 0.000 .1288886 .2236632

L1. .6759354 .0446977 15.12 0.000 .5876743 .7641966

PBISA

PBISA Coef. Std. Err. t P>|t| [95% Conf. Interval]

MacKinnon approximate p-value for Z(t) = 0.0000

Z(t) -7.252 -4.018 -3.441 -3.141

Z(rho) -54.596 -27.840 -20.964 -17.720



Interpolated Dickey-Fuller

Newey-West lags = 4

Phillips-Perron test for unit root Number of obs = 166

. pperron PBISA, trend regress

-.05

0

.05

DLN

PB

ISA

2003m7 2007m1 2010m7 2014m1 2017m7mensual




autorregresiva AR del modelo). En Stata ambas funciones se pueden graficar con

los comandos ac y pac respectivamente así:

ac DLNPBISA

Figura Nº 16

Vemos que como los primeros “bastoncitos” están dentro de las bandas de

confianza , sin embargo por “precaución” vamos a coger el primer valor del FAP,

dado que está en el limite de las bandas de confianza. Bajo este concepto hay un

posible esquema MA(1) como proceso generador de la data.

pac LNPBISA

Como bien sabemos la función de autocorrelacion parcial nos describe el

comportamiento del componente autorregresivo AR (p).

-0.4

0-0

.20

0.0

00.2

0

Auto

corr

ela

tions o

f D

LN

PB

ISA

0 10 20 30 40Lag

Bartlett's formula for MA(q) 95% confidence bands




Figura Nº 17

Posibles esquemas ARMA(p=1,q=1)

-0.6

0-0

.40

-0.2

00.0

00.2

0

Part

ial auto

corr

ela

tions o

f D

LN

PB

ISA

0 10 20 30 40Lag

95% Confidence bands [se = 1/sqrt(n)]




5. Fase de estimación

Las funciones de autocorrelación y autocorrelación parcial sugieren varios

procesos ARMA factibles para la inflación. La selección de los modelos debe tener

en cuenta los criterios de parsimonia (menor parametrización posible)

estacionariedad e invertibilidad de la variable dependiente y bondad de ajuste del

modelo. A continuación se presenta uno de los posibles procesos ARMA para la

PBI. El comando para estimarlos en Stata es arima y a través de las opciones

ar(número de los rezagos de la variable dependiente separados por comas)

ma(número de los rezagos separados por comas) se puede especificar el

componente autorregresivo y de media móvil ARIMA(7,0,1). Para ello digitamos

el siguiente comando

arima DLNPBISA , ar(1) ma(1)

En la gráfica vemos que todos los coeficientes son significativos, pero tendríamos

que buscar estimaciones más simples y más parsimoniosas si es que lo hubiere,

para tener un mejor modelo para la etapa del pronóstico.

.

confidence interval is truncated at zero.

Note: The test of the variance against zero is one sided, and the two-sided

/sigma .0130545 .0005285 24.70 0.000 .0120186 .0140904

L1. -.2929833 .1251787 -2.34 0.019 -.538329 -.0476376

ma

L1. -.2641006 .1195684 -2.21 0.027 -.4984503 -.0297509

ar

ARMA

_cons .0043911 .000586 7.49 0.000 .0032425 .0055397

DLNPBISA

DLNPBISA Coef. Std. Err. z P>|z| [95% Conf. Interval]

OPG

Log likelihood = 484.512 Prob > chi2 = 0.0000

Wald chi2(2) = 94.53

Sample: 2003m10 - 2017m7 Number of obs = 166

ARIMA regression




A través del comando estat ic se puede obtener el criterio de información de Akaike

(AIC) y el criterio bayesiano de Schwartz (BIC) los cuales son las dos medidas más

comunes de bondad de ajuste. Cuanto más pequeño es el valor de los estadísticos

(AIC) y (BIC) mejor ajuste tiene el modelo. Estos criterios se pueden emplear para

seleccionar el modelo más apropiado de un conjunto de posibles modelos.

estat ic

Ahora vamos a comparar el modelo con un ARMA( 2,1).

arima DLNPBISA , ar(1,2) ma(1)

Note: N=Obs used in calculating BIC; see [R] BIC note.

. 166 . 484.512 4 -961.0239 -948.576

Model Obs ll(null) ll(model) df AIC BIC

Akaike's information criterion and Bayesian information criterion

confidence interval is truncated at zero.

Note: The test of the variance against zero is one sided, and the two-sided

/sigma .0130172 .0005369 24.24 0.000 .0119648 .0140695

L1. .8459529 .1204212 7.02 0.000 .6099317 1.081974

ma

L2. -.4959684 .0611584 -8.11 0.000 -.6158366 -.3761001

L1. -1.350318 .111168 -12.15 0.000 -1.568203 -1.132433

ar

ARMA

_cons .0043697 .0006643 6.58 0.000 .0030678 .0056717

DLNPBISA

DLNPBISA Coef. Std. Err. z P>|z| [95% Conf. Interval]

OPG

Log likelihood = 484.9347 Prob > chi2 = 0.0000

Wald chi2(3) = 317.55

Sample: 2003m10 - 2017m7 Number of obs = 166

ARIMA regression

Note: N=Obs used in calculating BIC; see [R] BIC note.

. 166 . 484.9347 5 -959.8693 -944.3094

Model Obs ll(null) ll(model) df AIC BIC

Akaike's information criterion and Bayesian information criterion




Vemos que el segundo modelo tiene un mayor AIC= -959.86 >-961.02. Por lo tanto

el mejor modelo es el primero. La regla es probar con todas las posibilidades y

quedarse con el mejor modelo en términos de AIC5.

6. Fase de verificación y diagnóstico

Es muy importante que los residuales del modelo estimado no estén serialmente

correlacionados. Cualquier evidencia de correlación serial implicaría movimientos

sistemáticos en la variable dependiente que no han sido tenidos en cuenta por los

coeficientes incluidos en el modelo ARMA. Para chequear correlación en los

residuales se pueden construir las funciones de autocorrelación y autocorrelación

parcial para los residuales. A través del comando predict seguido de la opción res

se podrá estimar los residuales así:

predict residual, res

ac res

pac res

5 Para Muestras grandes mayores a 30 es recomendable usar el Bayesiando Schawartz BIC.

-0.2

0-0

.10

0.0

00.1

00.2

0

Auto

corr

ela

tions o

f re

sid

ual

0 10 20 30 40Lag

Bartlett's formula for MA(q) 95% confidence bands




En una prueba más general, se puede constatar si los residuales son “ruido blanco”,

en otras palabras, tienen media cero, varianza constante y no están serialmente

correlacionados. A través del comando wntestq realizar esta prueba así:

wntestq residual

El test de Portmanteau nos dice que el modelo estimado tiene problemas de

autocorrelacion serial de los residuos. Se tiene que volver a revisar el modelo

buscando alternativas de solución para corregir en modelo del problema de

autocorrelación de los residuos. Es necesario que el modelo final no tenga

problemas de autocorrelacion ni heterocedasticidad. Una alternativa es hacer la

metodología B&J aplicando al logaritmo neperiano del PBI.

7. Pronósticos

Dado que el objetivo del documento es servir de un manual para la estimación de

modelos ARIMA, procedemos a obviar este detalle y pasamos a la fase de

pronósticos.

Finalmente, se puede emplear el modelo para hacer pronósticos. El pronóstico se

puede hacer tantos periodos hacia delante como horizonte temporal tenga la

-0.2

0-0

.10

0.0

00.1

00.2

0

Part

ial auto

corr

ela

tions o

f re

sid

ual

0 10 20 30 40Lag

95% Confidence bands [se = 1/sqrt(n)]

end of do-file

.

Prob > chi2(40) = 0.7465

Portmanteau (Q) statistic = 33.7478

Portmanteau test for white noise

. wntestq residual




variable de tiempo “fecha” la cual está definida entre el mes 1 de 2001 y el mes 12

de 2006, mientras que se tiene dato mensual de inflación hasta el mes 5 de 2006. A

través del comando predict seguido de la opción xb, se podrá pronosticar la

inflación para los siguientes 7 meses así:

predict DLNPBIPRED, xb

Finalmente, a través del comando tsline es posible visualizar los valores

observados y

pronosticados de la inflación hasta octubre de 2015.

twoway (tsline DLNPBIPRED, lcolor(blue)) (tsline DLNPBISA, lcolor(red))

Una forma gráfica de observar la calidad de ajuste del modelo es mediante las

gráficas del pronóstico vs la serie original.

1 0 1

1 1 0 1

(1 ) (1 L)

(LN )(1 ) (1 L)

t t

t t t

DLNPBISA L

PBISA LNPBISA L

-.0

5

0

.05

2003m7 2007m1 2010m7 2014m1 2017m7mensual

xb prediction, one-step DLNPBISA




De esta ecuación tenemos que despejar tLNPBISA y obtener una nueva ecuación:

1 1 0 1(LN , , , )t tLNPBI f PBI

Reemplazando los parámetros por los coeficientes estimados y reemplazados los

valores de los rezagos del PBI se pueden obtener los pronósticos solicitados.

Referencias

Colin Cameron , A., & Trivedi, P. (2005). Microeconometrics: Methods and

Applications. (C. U. Press, Ed.) New York.

Casas Tragadora, C. (2000). Econometría Moderna. Lima: Universidad del Pacífico.

Greene, W. (1997). Análisis Econometrico (Tercera ed.). Prentice Hall.

Vásquez, J. (2010). Introducción a Series de Tiempo Univariadas usando STATA.

Obtenido de

http://1948f70508a693849b622441e0d31b1f.proxysheep.com/doc/132366426/Series-

de-Tiempo-Univariadas-en-STATA-2010-pdf

http://1948f70508a693849b622441e0d31b1f.proxysheep.com/doc/132366426/Series-de-Tiempo-Univariadas-en-STATA-2010-pdf

http://1948f70508a693849b622441e0d31b1f.proxysheep.com/doc/132366426/Series-de-Tiempo-Univariadas-en-STATA-2010-pdf

n°10 serie apuntes de clase octubre de 2017...laserie apuntes de clase tiene por objetivo difundir...

Documents