análisis estadístico de series de tiempo - pincc€¦ · ... cuando el interés se centra en una...

21
Análisis estadístico de series de tiempo para investigación sobre cambio climático Víctor M. Guerrero Instituto Tecnológico Autónomo de México (ITAM) Red Nacional de Investigación Multidisciplinaria en Cambio Climático La Paz – BCS, noviembre de 2015

Upload: doantram

Post on 06-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

Análisis estadístico de

series de tiempo para investigación sobre

cambio climático

Víctor M. Guerrero Instituto Tecnológico Autónomo de México (ITAM)

Red Nacional de Investigación Multidisciplinaria en Cambio Climático La Paz – BCS, noviembre de 2015

Page 2: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

Índice

1. Modelos para series de tiempo

2. Suavizamiento de series y ajuste estacional

3. Análisis de intervención

4. Desagregación de series de tiempo

5. Pronósticos restringidos

2/21

Page 3: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

Modelos para series de tiempo

• Las series de tiempo son conjuntos de datos numéricos que se observan en el tiempo de manera regular (a intervalos de tiempo fijos) y en forma sistemática (con el mismo instrumento de medición). • Se pueden referir a cualquier tipo de fenómenos: económicos, demográficos, sociales, biológicos, climáticos, etc.

3/21

0

1000

2000

3000

4000

5000

6000

7000

8000

19

95

-I

19

95

-III

19

96

-I

19

96

-III

19

97

-I

19

97

-III

19

98

-I

19

98

-III

19

99

-I

19

99

-III

20

00

-I

20

00

-III

20

01

-I

20

01

-III

20

02

-I

20

02

-III

20

03

-I

20

03

-III

20

04

-I

20

04

-III

20

05

-I

20

05

-III

20

06

-I

20

06

-III

20

07

-I

20

07

-III

20

08

-I

20

08

-III

20

09

-I

20

09

-III

20

10

-I

20

10

-III

20

11

-I

20

11

-III

20

12

-I

20

12

-III

20

13

-I

20

13

-III

20

14

-I

20

14

-III

20

15

-I

Ejemplo: Remesas totales (mdp)

Page 4: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• Existen dos enfoques básicos para analizar series de tiempo. 1. Análisis de las frecuencias, responde a la pregunta de con qué periodicidad se presenta un cierto tipo de efecto, por ejemplo la estacionalidad. 2. Análisis en el dominio del tiempo, parte de las características más evidentes en los datos observados (media, varianza y estructura de asociación entre ellos).

4/21

• La construcción de modelos estadísticos para series de tiempo se realiza comúnmente en el dominio del tiempo.

• Los modelos pueden servir para: explicar y cuantificar lo ocurrido en algún momento de observación; pronosticar en un horizonte determinado; y/o construir escenarios.

Page 5: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• Las series de tiempo pueden ser: Univariadas, cuando el interés se centra en una sola variable y se analizan sus datos de manera individual, o Multivariadas (o múltiples), cuando se estudian varias series simultáneamente, para considerar sus interrelaciones .

5/21

• Los modelos estadísticos pueden ser univariados o multivariados, dependiendo del tipo de serie que se considere.

• Todo modelo está basado en supuestos, por lo que las conclusiones que surjan de un análisis basado en modelos serán válidas sólo si se cumplen los supuestos subyacentes. • La verificación de los supuestos se debe realizar con los datos observados disponibles, para los que se construyó el modelo.

Page 6: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

6/21

1998 2000 2002 2004 2006 2008 2010 2012 2014-0.02

0

0.02

0.04

0.06

DLog de Indice de Precios al Consumidor (DLCPI)

1998 2000 2002 2004 2006 2008 2010 2012 2014-0.1

-0.05

0

0.05

0.1DLog de Producto Interno Bruto (DLGDP)

1998 2000 2002 2004 2006 2008 2010 2012 2014-0.05

0

0.05

0.1

0.15DLog de Demanda Real de Dinero (DLMONB)

1998 2000 2002 2004 2006 2008 2010 2012 2014

-0.4

-0.2

0

0.2

0.4

Diff de Déficit de la Balanza Comercial / 10,000 (DTRDB)

1998 2000 2002 2004 2006 2008 2010 2012 2014

-0.2

-0.1

0

0.1

0.2

0.3DLog de Tasa de Desempleo (DLUNMP)

1998 2000 2002 2004 2006 2008 2010 2012 2014-0.02

0

0.02

0.04

0.06

DLog de Indice de Precios al Consumidor (DLCPI)

1998 2000 2002 2004 2006 2008 2010 2012 2014-0.1

-0.05

0

0.05

0.1DLog de Producto Interno Bruto (DLGDP)

1998 2000 2002 2004 2006 2008 2010 2012 2014-0.05

0

0.05

0.1

0.15DLog de Demanda Real de Dinero (DLMONB)

1998 2000 2002 2004 2006 2008 2010 2012 2014

-0.4

-0.2

0

0.2

0.4

Diff de Déficit de la Balanza Comercial / 10,000 (DTRDB)

1998 2000 2002 2004 2006 2008 2010 2012 2014

-0.2

-0.1

0

0.1

0.2

0.3DLog de Tasa de Desempleo (DLUNMP)

• Por ejemplo, las gráficas siguientes muestran los datos bivariados, del PIB y de la Tasa de Desempleo en México (expresadas en logaritmos), durante los trimestres del periodo 1996:I – 2014:IV.

• En línea negra se muestran los datos observados y en roja los estimados por un modelo.

Page 7: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

7/21

• En lugar de modelos, en ocasiones se prefiere usar técnicas o procedimientos que no dependen de supuestos o que son robustos ante la violación de los supuestos. • En tales casos, no es indispensable validar supuestos, pero el análisis no permite realizar inferencia estadística.

• Algunos procedimientos muy sencillos que se usan para pronosticar se conocen como técnicas de Suavizamiento Exponencial.

• Mientras que algunos procedimientos útiles para separar tendencias y ciclos en series de tiempo, se conocen como técnicas de filtrado.

Page 8: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• Las técnicas de ajuste estacional y de suavizamiento de datos permiten apreciar con más claridad la dinámica de las series, sin el oscurecimiento causado por efectos que típicamente carecen de importancia para el análisis.

8/21

Suavizamiento de series y ajuste estacional

7

7.5

8

8.5

9

9.5

Bill

on

es d

e p

eso

s d

e 20

03

PIB real trimestral PIB desestacionalizado

En esta gráfica se observa que la estacionalidad exagera la caída del PIB en el último trimestre de 2008.

Page 9: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

Al cancelar la irregularidad se obtiene la serie de tendencia-ciclo, en la cual se aprecian mejor los movimientos de largo plazo.

9/21

7

7.5

8

8.5

9

9.5

Bill

on

es d

e p

eso

s d

e 20

03

PIB desestacionalizado

Tendencia-ciclo del PIB

• Para cancelar la irregularidad y el ciclo, se puede usar un filtro que en esencia proporcione una estimación de la tendencia de largo plazo.

• Por ejemplo, para usar el filtro se puede plantear el objetivo de lograr un porcentaje de suavidad deseado para la tendencia.

Page 10: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• Al fijar el porcentaje de suavidad deseado en 70% para el PIB se obtiene la tendencia mostrada en la siguiente figura. A menor suavidad más cerca a los datos observados.

• Mientras que con 90% de suavidad se obtiene la figura siguiente, y al subir más la suavidad se vería con mayor claridad una tendencia lineal.

10/21

7.0

7.5

8.0

8.5

9.0

9.5

2000:01 2001:01 2002:01 2003:01 2004:01 2005:01 2006:01 2007:01 2008:01 2009:01 2010:01 2011:01

Bill

on

es d

e p

eso

s d

e 20

03

PIB desestacionalizado

Tendencia del PIB

7.0

7.5

8.0

8.5

9.0

9.5

2000:01 2001:01 2002:01 2003:01 2004:01 2005:01 2006:01 2007:01 2008:01 2009:01 2010:01 2011:01

Bill

on

es d

e p

eso

s d

e 20

03

PIB desestacionalizado

Tendencia del PIB

Page 11: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• Este tipo de análisis busca medir la influencia de un evento anormal, con fines explicativos o para evitar los posibles efectos contaminantes sobre el modelo.

11/21

Análisis de intervención

• Para realizar el análisis se requiere de un modelo que sirva como referencia para distinguir los efectos inesperados (atribuibles a intervenciones) de otros efectos que se puedan atribuir a la estructura característica del fenómeno.

• El modelo a usar debe tener estructura de dos tipos, una determinística y la otra estocástica, de manera que la intervención sólo afecte a la parte determinística.

Page 12: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• En la gráfica que sigue se observa que la crisis mundial de 2008 afectó a una variable financiera, la tasa LIBOR (London InterBank Offered Rate), que es relevante para tomar decisiones en instituciones como PEMEX, bancos y casas de bolsa. • La LIBOR se usa como referencia para las tasas de interés a corto plazo en los mercados financieros globales. Permite evaluar el costo de los préstamos sin garantía en el mercado interbancario de Londres.

12/21

0

1

2

3

4

5

6

12/2001 09/2004 06/2007 03/2010 12/2012

Tasa LIBOR de 3 meses

Page 13: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• Los efectos que se dedujeron de un análisis de intervención se aprecian en las gráficas siguientes: la primera muestra los efectos conjuntos de lo que pasó a mediados de 2007 y en septiembre de 2008; las dos de abajo muestran por separado los respectivos efectos.

13/21

-4

-3

-2

-1

0

1

oct-06 abr-07 nov-07 jun-08 dic-08 jul-09 ene-10 ago-10 feb-11

Efectos de la crisis de 2008 sobre la tasa LIBOR de 3 meses

-2

-1.5

-1

-0.5

0

0.5

abr-07 nov-07 jun-08 dic-08 jul-09

Intervención I

-2

-1

0

1

2

feb-08 jul-09 nov-10

Intervención II

Page 14: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• El problema de desagregación de datos aparece originalmente en la dimensión temporal, para estimar datos no observables con la frecuencia deseada; por ejemplo los datos mensuales de una variable que sólo existe en forma trimestral.

14/21

Desagregación de series de tiempo

• Similarmente, se pueden desagregar series univariadas en la dimensión geográfica o sectorial.

• Por ejemplo, para desagregar el PIB trimestral por entidad federativa podrían usarse variables auxiliares que reflejen la actividad económica que se realiza en cada entidad.

• Lo fundamental es que los datos desagregados satisfagan la restricción contable impuesta por el dato agregado, ya sea una suma, un promedio o un valor aislado.

Page 15: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

15/21

• Las gráficas siguientes muestran el Consumo Privado trimestral y su desagregación mensual, junto con el Índice Global de Actividad Económica (IGAE) que se usó como serie auxiliar.

4600

5200

5800

6400

7000

7600

8200

1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

2003 2004 2005 2006 2007 2008 2009

Consumo Privado IGAE

4600

5200

5800

6400

7000

7600

8200

Ene

Ab

r

Jul

Oct

Ene

Ab

r

Jul

Oct

Ene

Ab

r

Jul

Oct

Ene

Ab

r

Jul

Oct

Ene

Ab

r

Jul

Oct

Ene

Ab

r

Jul

Oct

Ene

Ab

r

Jul

Oct

.

2003 2004 2005 2006 2007 2008 2009

Consumo Privado IGAE

Page 16: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• El problema de obtener pronósticos con restricciones surge cuando se desea incorporar la mayor cantidad de información disponible, a fin de optimizar los resultados al pronosticar.

• Esto ocurre cuando hay información adicional o externa al registro histórico de la serie y que se refiere al futuro de la variable en estudio.

16/21

Pronósticos restringidos

• Si la información externa se puede expresar mediante restricciones lineales, se puede mejorar el pronóstico que surja de un modelo lineal para la serie de tiempo, ya sea univariada o multivariada.

• Se conocen familias de modelos lineales que son fáciles de usar y que cumplen con el requisito señalado.

Page 17: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

• El pronóstico puede calcularse aunque sea absurda la información adicional.

• Por ello es importante validar la compatibilidad entre el registro histórico (resumido en el modelo lineal) y la información adicional mediante una prueba estadística.

• Si no hay incompatibilidad, la combinación de las dos fuentes de información tiene sentido.

17/21

• Los pronósticos que se obtienen con esta metodología son mejores que los irrestrictos en tanto que:

(i) son más exactos ya que cumplen con la restricción, y

(ii) son más precisos porque tienen a lo más la misma variabilidad que los irrestrictos (que sólo consideran el registro histórico de la serie.

Page 18: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

(2) La información adicional se considera válida y son inválidos los pronósticos del modelo. Esto podría deberse a que durante el horizonte de pronóstico cambiará(n): a) La estructura determinística del modelo. b) La estructura estocástica del modelo. c) Los valores de los parámetros del modelo. • Cada una de estas posibilidades origina un método de análisis específico.

18/21

• De haber incompatibilidad, conviene indagar a qué se debe y se obtienen así diversas alternativas:

(1) La información adicional no es del todo válida y conviene por ello asignarle incertidumbre. Esto ocurre al usar, por ejemplo, pronósticos de un modelo anual como restricciones para los pronósticos de un modelo trimestral.

Page 19: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

19/21

• Los pronósticos restringidos pueden interpretarse como trayectorias esperadas de la(s) variable(s) en estudio para lograr alguna meta deseada que se impone como restricción.

• Al monitorear el PIB durante el año 2001, se obtuvo la gráfica que sigue con los pronósticos restringidos (---). Los irrestrictos (línea continua) generados a fines del año 2000, resultaron falsos.

Page 20: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

20/21

• El siguiente ejemplo usa un modelo multivariado para obtener pronósticos de tres variables que corresponden a la media mensual de tres estaciones meteorológicas en la Cd. De México, denominadas: E09014, E09020 y E09029.

• Se usa también información adicional proveniente del modelo japonés de clima MIROC-HIRES, para imponer restricciones que hacen que el promedio mensual de las tres series de temperatura pronosticadas, sea igual a la temperatura de gran escala obtenida con el modelo de clima.

• Las gráficas que se muestran a continuación contienen los pronósticos para el año 2020, tanto irrestrictos (izquierda) como restringidos (derecha).

Page 21: Análisis estadístico de series de tiempo - PINCC€¦ · ... cuando el interés se centra en una sola variable y se analizan sus datos de manera ... de un modelo lineal para la

21/21

0

4

8

12

16

20

24

75 80 85 90 95 00 05 10 15 20

E09014

P SR

Inf. SR

Sup. SR

0

4

8

12

16

20

24

75 80 85 90 95 00 05 10 15 20

E09014

P R

Inf. R

Sup. R

Pronósticos irrestrictos Pronósticos restringidos

4

6

8

10

12

14

16

75 80 85 90 95 00 05 10 15 20

E09020

P SR

Inf. SR

Sup. SR

4

6

8

10

12

14

16

75 80 85 90 95 00 05 10 15 20

E09020

P R

Inf. R

Sup. R

Pronósticos irrestrictos Pronósticos restringidos

2

4

6

8

10

12

14

16

18

75 80 85 90 95 00 05 10 15 20

E09029

P SR

Inf. SR

Sup. SR

2

4

6

8

10

12

14

16

18

75 80 85 90 95 00 05 10 15 20

E09029

P R

Inf. R

Sup. R

Pronósticos irrestrictos Pronósticos restringidos