un sistema dinÁmico para predecir pasajeros nacionales de la red aena de aeropuertos espaÑoles
DESCRIPTION
UN SISTEMA DINÁMICO PARA PREDECIR PASAJEROS NACIONALES DE LA RED AENA DE AEROPUERTOS ESPAÑOLES Presentación para el Laboratorio de Estadística de la Universidad del País vasco Jorge Herrera [email protected] - PowerPoint PPT PresentationTRANSCRIPT
1
UN SISTEMA DINÁMICO PARA UN SISTEMA DINÁMICO PARA PREDECIR PASAJEROS PREDECIR PASAJEROS
NACIONALES DE LA RED AENA DE NACIONALES DE LA RED AENA DE AEROPUERTOS ESPAÑOLESAEROPUERTOS ESPAÑOLES
Presentación para el Laboratorio de Presentación para el Laboratorio de Estadística de la Universidad del País vascoEstadística de la Universidad del País vasco
Jorge Herrera [email protected] Herrera [email protected]
INECO - Febrero 2.009INECO - Febrero 2.009
2
.
IntroducciónIntroducción
El problema del Cliente
Dudas principales
Método de Estimación-Predicción
Dudas principales
Ejemplo de Estimación - Predicción
Dudas principales
3
.
El Problema del El Problema del ClienteCliente 1
4
.
El Problema del El Problema del ClienteCliente
El cliente necesita predecir los pasajeros anuales de cada uno de los 43 aeropuertos españoles hasta 2025.
Hasta ahora eso se ha hecho mediante este modelo teórico:
Pasajerost=a+bPIBt+ut
Suponiendo que los aeropuertos eran independientes entre sí y que la relación era básicamente estática y dependiente del PIB español, italiano o inglés.
Este modelo incorporaba intervenciones por parte del usuario realizadas de forma deliberada en el nivel de las predicciones, en función de intuiciones o compromisos con el aeropuerto.
5
.
El Problema del El Problema del ClienteCliente
El proyecto pretende implantar una nueva metodología. Pretendemos cambiar la forma de enfocar el problema:
Consideramos que los aeropuertos están relacionados entre sí (hay evidencias muestrales).
Consideramos que esa relación es dinámica y endógena.
Las variables económicas (PIB, etc...) serán utilizadas para modificar la senda de expansión a largo plazo.
6
.
La Pregunta:La Pregunta:
¿Se pueden predecir las
series de pasajeros de una
manera más fiable y con la
utilización de, al menos, tres
variables económicas?
7
.
Sobre los Sobre los Aeropuertos EspañolesAeropuertos Españoles
17 aeropuertos de los 43 concentran el 90% de los pasajeros españoles.
Entre estos aeropuertos hay una relación origen/destino que genera y atrae gran parte del tráfico aéreo
Esto será tenido en cuenta para simplificar la modelización y dar buena respuesta.
8
.
Idea BásicaIdea Básica
La idea, por lo tanto, será tratar de simular este comportamiento basándonos en matrices origen destino (proporcionadas por el cliente), que permiten ver qué aeropuertos están conectados entre sí.
Por un lado se van a crear sistemas que predigan las cuotas de mercado de cada uno de los aeropuertos...[p1]
...Y por otro lado, se va a predecir el total de pasajeros basado en fuerzas económicas.[p2]
Aplicando la cuota [p1] en la predicción[p2], nos aseguramos:
Que el total de pasajeros esté completamente repartido (lo que hasta ahora no ocurre).
La utilización de distintas variables económicas en P2 permite eliminar problemas de grados de libertad
Que una modificación deliberada en un aeropuerto afecte al resto de los aeropuertos (tampoco ocurría, al menos, de una forma sistemática).
9
.
ObservacionesObservaciones
Nos enfrentamos, a priori, a un problema de escasez muestral. Sólo hay datos fiables desde 1994.
Los sistemas, en principio, no podrán contener más de cuatro aeropuertos.
10
.
Método de Método de Estimación- PredicciónEstimación- Predicción 2
11
.
Idea del Idea del Modelo EconométricoModelo Econométrico
Dividiremos los 17 aeropuertos en subsistemas
En cada subsistema tendremos dos grupos de Aeropuertos: A y B
El grupo A son aeropuertos influyentes en cuota de mercado (ej:Madrid-Barajas) y el grupo B menos influyentes (ej:Jerez)
Asumiremos que los aeropuertos del grupo A influyen contemporáneamente a los del grupo B pero no al revés.
Se asume la existencia de una relación de feedback entre ambos
AtAtAt
AttBt
ε(L)απ
α(L)BνA
BtBtBt
BttAt
ε(L)απ
α(L)AνB
L (0,…n) es el operador
polinómico de retardos
eit es una perturbación
aleatoria ruido blanco.
En este caso, L=(1,..n)
12
.
Modelo Modelo TeóricoTeórico
Bt
Att
B
A
t
t
BtABt
bAtAt ZL
L
B
A
L
L
)(
)(
)(
)(
2
2
0
0)(
Bt
AtitVar
Estimaremos un VAR restringido y estructural en primeras diferencias (adaptación de Treadway et al.)
Con matriz de Varianzas y Covarianzas de las perturbaciones:
En este caso, L=(1,..n)
Hipótesis de partida debido a que estimaremos explícitamente la relación estructural
Posibilidad de incluir variables macro exógenas
13
.
Método de Método de EstimaciónEstimación
Elegimos un método sencillo de estimación (siguiendo a Zellner, A):
MCO ecuación por ecuación introduciendo las restricciones estructurales y testando posibles coeficientes no relevantes.
MCG aprovechando la correlación residual contemporánea (SURE).
Las series de cuota de mercado son, en su mayoría, no estacionarias
No encontramos evidencias de cointegración (tamaños de muestra pequeños)
Estimamos el SVAR en primeras diferencias (como modelo de partida)
14
.
Método de Método de EstimaciónEstimación
[S1] Una vez estimado el VAR en cada subgrupo, se realizan las predicciones de cuota y se elige la más adecuada para cada aeropuerto.
[S2] A continuación se predicen las cuotas para el resto de aeropuertos [duda: ARIMA, datos de panel, reparto proporcional al promedio...]
[S3] Se predice el total de Pasajeros mediante un SVAR
Se aplica [S1] y [S2] en [S3]
[S4] se estiman nuevos VAR (ver en caso práctico por qué) con el objeto de derivar funciones de respuesta a impulso
[S5] se intervienen los sistemas basados en [S4] en función de posibles perturbaciones futuras (AVE, nuevas compañías)
15
.
DudasDudas
¿Qué diferencia hay en la estimación por el método (SURE) y FIML?
¿ Hasta qué punto es preocupante no tener una correlación estadísticamente nula entre residuos?
Posibles intervenciones en el modelo a posteriori modificando por el usuario las sendas de predicción de cada aeropuerto
Caso Madrid Barcelona:
Son un grupo en el que por ahora estamos considerando A= Madrid y B= Barcelona. Ambos son relevantes y no es creible al 100% la idea estructural del modelo ¿qué camino seguir?
16
.
DudasDudas
¿Qué criterio seguir para elegir los aeropuertos en el VAR?
Se busca que los subgrupos sean lo más reducidos posibles y que incorporen información válida para predecir
¿ Sería válido estimar un VAR no restringido y examinar la descomposición de varianza de
predicción?
17
.
Predicción del Predicción del Total de PasajerosTotal de Pasajeros
Para ello, estimamos un SVAR en el que el PIB es exógeno y algunas variables económicas, así como el total de Pasajeros son endógenas.
El modelo teórico es similar al anterior. Supondremos que las variables económicas afectan contemporáneamente al número de pasajeros pero no al revés.
16,6
16,8
17
17,2
17,4
17,6
17,8
18
18,2
18,4
18,6
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
PAXPredichoDV PAXPredichoDDV PAX real
18
.
Métodos de Métodos de PredicciónPredicción
Estimamos varias versiones de cada modelo (Hendry y Clements):
DV: es el modelo original en diferencias.
DV_IC : es el modelo original introduciendo intercept corrections.
DDV: es una reestimación del modelo en segundas diferencias.
19
.
DudasDudas
Debido a que la sobrediferenciación (DDV, y quizás el DV) induce autocorrelaciones grandes en los residuos, sugeriendo a veces DDV
con varios retardos, se ha decidido probar con los valores contemporáneos (si hay motivos estructurales) o un retardo como máximo, para no obtener soluciones sobreparametrizadas. ¿ es correcto?
La versión IC se obtiene estimando el modelo en t-1 y prediciendo hacia t. El error de previsión se incorpora como nuevo intercepto enla previsión hecha en t horizonte t+k. ¿Cómo saber si esa correcciónes relevante o no? Hay veces que introducir sólo algunas correciones a “ojo” y no todas las que se proponen, dan mejores resultados predictivos.
20
.
Ejemplo Práctico:Ejemplo Práctico:
Arco MediterráneoArco Mediterráneo 3
21
.
Análisis Previo Análisis Previo (I)(I)
A través de las matrices origen/destino, catalogamos los aeropuertos que comparten información útil para predecir. Hemos hecho 7 grupos que engloban a unos 17 aeropuertos.
En general, en todos los sistemas figuran los aeropuertos de Madrid y Barcelona, como nodo central de la red
Madrid y Barcelona forman un grupo único cuyas predicciones en general se usarán para el resto de sistemas
Analizaremos el arco mediterráneo (IBIZA, PALMA, BARCELONA, MADRID, VALENCIA, ALICANTE)
22
.
Análisis Previo Análisis Previo (II)(II)
Contamos con los datos de cuotas de mercado de cada aeropuerto desde 1994.
Estimaremos el modelo desde 1994 hasta 2004 y predeciremos desde 2005 hasta 2008.
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
0
0,005
0,01
0,015
0,02
0,025
0,03
0,035
0,04
PMI MAD BCN VLC(eje2) ALC(eje2) IBZ(eje2)
Predeciremos esta información
23
.
Análisis Previo Análisis Previo (II)(II) Presentamos la descomposición de Varianza del error de previsión de
un DVAR(1) sin restringir y suponiendo que todos los aeropuertos son endógenos en el sistema:
Descomposición de Varianza para IBZ
0%10%20%30%40%50%60%70%80%90%
100%
1 2 3 4 5
horizonte Previsión
VLC
PMI
IBZ
ALC
MAD
BCN
Descomposición de Varianza para PMI
0%10%20%30%40%50%60%70%80%90%
100%
1 2 3 4 5
horizonte Previsión
VLC
PMI
IBZ
ALC
MAD
BCN
Descomposición de Varianza para VLC
0%
20%
40%
60%
80%
100%
1 2 3 4 5
horizonte Previsión
VLC
PMI
IBZ
ALC
MAD
BCN
Descomposición de Varianza para ALC
0%
20%
40%
60%
80%
100%
1 2 3 4 5
horizonte Previsión
VLC
PMI
IBZ
ALC
MAD
BCN
Descomposición de Varianza para BCN
0%
20%
40%
60%
80%
100%
1 2 3 4 5
horizonte Previsión
VLC
PMI
IBZ
ALC
MAD
BCN
Descomposición de Varianza para MAD
0%
20%
40%
60%
80%
100%
1 2 3 4 5
horizonte Previsión
VLC
PMI
IBZ
ALC
MAD
BCN
Madrid y Barcelona pueden considerarse predeterminados en otro subsistema. Serán exógenos
24
Hipótesis de Hipótesis de construcción del modeloconstrucción del modelo
MADRID BARCELONA
IBIZA ALICANTE
VALENCIA PALMA
H1: Exógenos y con efecto contemporáneo
H2: Valencia tiene efecto contemporáneo (es el de mayor cuota del resto).
H3: Hay retroalimentación determinada por la descomposición de varianza (flechas verdes)
Basándonos en las descomposiciones de varianza anteriores…
25
.
DudasDudas
¿Es correcto estudiar la posible forma del sistema (descomposición de varianza del error de predicción) a través de una versión no restringida y no estructural de este? ¿cuáles son los errores más dañinos que podemos cometer?
26
.
Modelo DVARModelo DVAR
Correlaciones residuales, significativas si > l 2/n1/2l=0,55
Estimaciones SURE en azul y FIML en verde
D(Valencia) D(Palma) D(Alicante) D(Ibiza)
Constante (-0,0019) (-0,0019) (-0,0008) (-0,0008)
std 0,0006 0,0005 0,0002 0,0001
D(Valencia) 0,19 0,23
std 0,009 0,14
D(Madrid) (-0,15) (-0,15) (-0,018) 0
std 0,041 0,04 0,0019 (0)
D(Barcelona) (-0,21) (-0,20) (-0,26) (-0,28) (-0,10) (-0,11)
std 0,08 0,08 0,093 0,10 0,032 0,031
D(Barcelona(-1) 0,15 0,16
std 0,0344 0,029
D(IPI) (-0,0003) (-0,0003)
std 0,00017 0,00016
P valor AR(1) 0,36 0,25 0,22 00,25 0,15 0,13 0,12 0,40
Sobreidentificación Hansen - Sargan p valor 0,3189
Palma Ibiza Alicante ValenciaPalma 1 0,61 0,848 -0,554
Ibiza 1 0,867 -0,026
Alicante 1 -0,312
Valencia 1
DUDA: El coeficiente para el IPI está estimado negativo y significativo. Un análisis de los residuos (modelo sin IPI y con IPI) parece que añade capacidad explicativa… ¿hay alguna razón económica para que esto ocurra?
27
.
Residuos del Residuos del modelo DVARmodelo DVAR
-0,004
-0,003
-0,002
-0,001
0
0,001
0,002
0,003
0,004
1996 1997 1998 1999 2000 2001 2002 2003 2004
d_VLC d_PMI d_ALC d_IBZ
Corrigiendo este atípico la estimación de los parámetros no varía significativamente
28
.
Modelo DDVARModelo DDVAR
Correlaciones residuales, significativas si > l 2/n1/2l=0,55
Alicante Ibiza Valencia PalmaAlicante 1 0,783 0,86 0,038
Ibiza 1 0,977 -0,103
Valencia 1 0,058
Palma 1
Estimaciones SURE en azul y FIML en verde
DD(Valencia) DD(Palma) DD(Alicante) DD(Ibiza)
DD(Barcelona) (-0,17) (-0,17) (-0,11) (-0,10) (-0,19) (-0,19)
std 0,0061 0,006 0,11 0,09 0,03 0,019
DD(Barcelona(-1) (-0,16) (-0,15)
std 0,03 0,009
DD(IPI(-1)) (0,0002) (-0,0002)
std 0,00005 0,00005
P valor AR(1) 0,36 0,25 0,22 00,25 0,15 0,12
Sobreidentificación Hansen - Sargan p valor 0,8417
Los indicios de autocorrelación son lógicos
29
.
Residuos del Residuos del modelo DDVARmodelo DDVAR
-0,004-0,003-0,002
-0,0010
0,0010,0020,0030,004
0,0050,0060,007
1998 1999 2000 2001 2002 2003 2004
d_d_ALC d_d_IBZ d_d_VLC d_d_PMI
30
.
Predicción de Predicción de las cuotaslas cuotas
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
35,00%
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
MAD_DV MAD_DV_IC MAD_DDV MAD
0,00%
2,00%4,00%
6,00%
8,00%10,00%
12,00%
14,00%
16,00%18,00%
20,00%
BCN_DV BCN_DV_IC BCN_DDV BCN
Predicción en un modelo aparte
0,00%
2,00%
4,00%
6,00%
8,00%
10,00%
12,00%
PMI_DV PMI_DV_CI PMI_DDV PMI
0,00%
0,50%
1,00%
1,50%
2,00%
2,50%
3,00%
3,50%
4,00%
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
VLC_DV VLC_DV_CI VLC_DDV VLC
0,00%
0,50%
1,00%
1,50%
2,00%
2,50%
3,00%
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
ALC_DV ALC_DV_CI ALC_DDV ALC
0,00%
0,50%
1,00%
1,50%
2,00%
2,50%
3,00%
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
IBZ_Dv IBZ_DV_CI IBZ_DDV IBZ
Predicción en en el VAR en el que MAD y BCN son exógenos
31
.
Ejemplos de Ejemplos de Predicción en nivelesPredicción en niveles
Predicción “sencilla” en el que el modelo multivariante de cuotas bate a modelos rivales
0
500.000
1.000.000
1.500.000
2.000.000
2.500.000
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Ibiza Regresión IBZ_Cuotas IBZ_ARIMA Ibiza Real
0
500.000
1.000.000
1.500.000
2.000.000
2.500.000
3.000.000
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Valencia Regresión Valencia Cuotas Valencia ARIMA Valencia Real
Predicción “complicada” en el que el modelo multivariante de cuotas bate a modelos rivales
32
.
Cambios en el Cambios en el SistemaSistema
Debido a que cada aeropuerto dentro del mismo sistema requiere un VAR diferente para ser predicho...
Pero también requieren cambios futuros, debemos buscar la forma de averiguar cómo se transforma un aeropuerto ante un cambio brusco en un aeropuerto influyente.
...surgen dudas
33
.
DudasDudas
Estimamos nuevamente el VAR incluyendo todos los aeropuertos como endógenos
Supondremos que para predecir puede ser interesante tener una senda clara de Madrid y Barcelona...pero no para análisis estructural.
En el ejemplo en cuestión, estimamos un VAR en niveles y las funciones de respuesta a impulso salen más coherentes que en el VAR en primeras diferencias ¿Por qué?
34
.
Simulación Simulación
-1,40%
-1,20%
-1,00%
-0,80%
-0,60%
-0,40%
-0,20%
0,00%
2005
2007
2009
2011
2013
2015
2017
2019
2021
2023
2025
MAD BCN
-0,20%
-0,15%
-0,10%
-0,05%
0,00%
0,05%
0,10%
0,15%
0,20%
PMI VLC ALC IBZ
MAD BCN IBZ PMI ALC VLCMAD 1 (-0,017) (-0,504) (-0,054) (-0,230) (-0,556)BCN 0 1 (-0,231) (-0,599) (-0,374) -0,13IBZ 0 0 1 -1 -1 -0,50PMI 0 0 0 1 -1 (-0,062)ALC 0 0 0 0 1 1VLC 0 0 0 0 0 0
Hemos simulado un Shock en Madrid y Barcelona en el momento t=2005 de un 1% de caída conjunta.
La matriz de correlación de residuos indica que el análisis estructural fallaría en el impacto de BCN sobre PMI y en el de VLC sobre MAD
El resto de impactos estaría correctamente analizado
35
.
DudasDudas
Estas simulaciones incorporan problemas. El hecho es que una caída en cuota implica también una caída en el total de pasajeros. Por lo que :
En la simulación hay que modificar el total de pasajeros
Cambiar las cuotas previstas a partir del shock debido a que esas cuotas están hechas relativas a la anterior senda total de pasajeros
Incorporar el shock en las cuotas
¿Se puede simplificar lo anterior para poder modificar el sistema?
36
.GRACIASGRACIAS
GRACIAS
GRACIAS
GRACIASGRACIAS
GRACIAS