la información mutua como medida de asociación de la variable macroclimática oni con los caudales...

9
La información mutua como medida de asociación de la variable macroclimática ONI con los caudales medios en el departamento de Antioquia. Uber Camilo Agudelo Atehortúa [email protected] Profesor: German Poveda Jaramillo RESUMEN El presente estudio tuvo como objetivo analizar la información mutua como una medida de asociación entre el índice ONI que caracteriza el ciclo ENSO (El Niño Oscilación del Sur), y los caudales medios mensuales en el departamento de Antioquia, se estima la información mutua y se escala para así compararla con los resultados obtenidos calculando la correlación de Pearson y su significancia estadística. Los cálculos se efectuaron con una muestra de 15 series de caudales de resolución diaria, con un porcentaje de datos faltantes inferior al 15% y longitud efectiva de registros mínima de 30 años, las cuales se obtuvieron de la red de estaciones limnigráficas y limnimétricas del Instituto de Hidrología, Meteorología y Estudios Ambientales de Colombia (IDEAM). En general se observa dependencia estadística significativa de correlación (-0.5 y -0.6) de los caudales con el índice del ENSO estudiado. La estimación de la información mutua se acerca al estudio del comportamiento no lineal de los fenómenos físicos. Sin embargo no es posible asociarla con fenómenos físicos con mayor claridad según la metodología empleada. Para dar solución a la iniciativa planteada, fue necesario implementar un programa de computador, lenguaje Python. Igualmente, se elaboraron códigos en lenguaje Visual Basic para la lectura, clasificación y selección de la información facilitada por el IDEAM. 1. INTRODUCCIÓN El fenómeno El Niño-Oscilación del Sur (ENSO) es el conjunto más poderoso de variaciones atmosféricas y oceánicas en la región del océano Pacífico ecuatorial. Se manifiesta con variaciones anómalas de la presión atmosférica (Oscilación del Sur) y de la temperatura en la superficie del mar (El Niño - fase cálida o La Niña- fase fría) en el océano Pacífico [1]. En sus fases extremas provoca alteraciones en la circulación oceánica y atmosférica a escala global [2], en los cinturones tropicales y subtropicales de la tierra que favorecen e intensifican el desarrollo de precipitaciones torrenciales, lo cual produce crecidas, inundaciones, avalanchas, tormentas, así como sequías, con efectos catastróficos en más de la mitad de la circunferencia terrestre[3]. Sin embargo, el entendimiento de los caudales en los ríos sobre el departamento de Antioquia es un poco complejo debido a que son menos intermitentes por lo que reúnen todo lo que la cuenca les aporta. A lo que se suma el efecto de fenómenos de gran escala, como el mencionado anteriormente, El Niño- Oscilación del Sur [4]. En este sentido, se evaluó la asociación de las series de caudales en 15 estaciones limnigráficas y limnimétricas del IDEAM ubicadas en el departamento de Antioquia y la variabilidad del

Upload: uberkmilo6878

Post on 15-Jul-2016

23 views

Category:

Documents


0 download

TRANSCRIPT

La información mutua como medida de asociación de la variable

macroclimática ONI con los caudales medios en el departamento de Antioquia.

Uber Camilo Agudelo Atehortúa

[email protected]

Profesor: German Poveda Jaramillo

RESUMEN

El presente estudio tuvo como objetivo analizar la información mutua como una medida de asociación

entre el índice ONI que caracteriza el ciclo ENSO (El Niño Oscilación del Sur), y los caudales medios

mensuales en el departamento de Antioquia, se estima la información mutua y se escala para así

compararla con los resultados obtenidos calculando la correlación de Pearson y su significancia estadística.

Los cálculos se efectuaron con una muestra de 15 series de caudales de resolución diaria, con un

porcentaje de datos faltantes inferior al 15% y longitud efectiva de registros mínima de 30 años, las cuales

se obtuvieron de la red de estaciones limnigráficas y limnimétricas del Instituto de Hidrología,

Meteorología y Estudios Ambientales de Colombia (IDEAM). En general se observa dependencia

estadística significativa de correlación (-0.5 y -0.6) de los caudales con el índice del ENSO estudiado. La

estimación de la información mutua se acerca al estudio del comportamiento no lineal de los fenómenos

físicos. Sin embargo no es posible asociarla con fenómenos físicos con mayor claridad según la

metodología empleada.

Para dar solución a la iniciativa planteada, fue necesario implementar un programa de computador,

lenguaje Python. Igualmente, se elaboraron códigos en lenguaje Visual Basic para la lectura, clasificación

y selección de la información facilitada por el IDEAM.

1. INTRODUCCIÓN

El fenómeno El Niño-Oscilación del Sur (ENSO) es el conjunto más poderoso de variaciones atmosféricas y

oceánicas en la región del océano Pacífico ecuatorial. Se manifiesta con variaciones anómalas de la presión

atmosférica (Oscilación del Sur) y de la temperatura en la superficie del mar (El Niño - fase cálida o La Niña-

fase fría) en el océano Pacífico [1]. En sus fases extremas provoca alteraciones en la circulación oceánica y

atmosférica a escala global [2], en los cinturones tropicales y subtropicales de la tierra que favorecen e

intensifican el desarrollo de precipitaciones torrenciales, lo cual produce crecidas, inundaciones,

avalanchas, tormentas, así como sequías, con efectos catastróficos en más de la mitad de la circunferencia

terrestre[3].

Sin embargo, el entendimiento de los caudales en los ríos sobre el departamento de Antioquia es un poco

complejo debido a que son menos intermitentes por lo que reúnen todo lo que la cuenca les aporta. A lo

que se suma el efecto de fenómenos de gran escala, como el mencionado anteriormente, El Niño-

Oscilación del Sur [4]. En este sentido, se evaluó la asociación de las series de caudales en 15 estaciones

limnigráficas y limnimétricas del IDEAM ubicadas en el departamento de Antioquia y la variabilidad del

índice ONI de gran escala asociado al ciclo ENSO utilizado como predictor. Dada la gran diversidad de

índices utilizados para realizar estudios sobre el efecto en el clima derivada de los fenómenos del ciclo

ENSO en Colombia, se hace énfasis en el índice ONI ya que es el más utilizado por la comunidad científica,

a nivel mundial. Cabe recordar que la medida de asociación se realiza a través del uso de la metodología

de la información mutua descrita por Poveda [5].

2. METODOLOGÍA

Si bien es del conocimiento de todos de la influencia del ENSO sobre las componentes meteorológicas en

una región. Dicha influencia no se comporta de manera lineal ni homogénea en todas partes, razón por la

cual se hace particularmente complicado hacer predicciones climáticas a partir de un índice de predicción

ENSO en particular. En este sentido, se evaluó la información mutua y el coeficiente de correlación de

Pearson, las cuales cuantifican la dependencia no lineal y lineal, respectivamente entre dos variables.

2.1 Información mutua

La información mutua (IM) es un parámetro estadístico que cuantifica la dependencia global entre dos

variables aleatorias, es una medida de dependencia no lineal que cuantifica la reducción en la

incertidumbre de una variable aleatoria por el conocimiento de otra [5]. En teoría de la información la

incertidumbre o entropía (H) de una variable aleatoria se cuantifica con base en su función de densidad

de probabilidad, esta se estima como (Shannon, 1948) con el siguiente estimador [6]

𝐻(𝑝) = − ∑ 𝑝𝑖𝑙𝑜𝑔𝑏(𝑝𝑖)

𝑘

𝑖=1

(1)

Donde 𝑝1, 𝑝2, … , 𝑝𝑘 representa la función de densidad de probabilidades, que satisface ∑ 𝑝𝑖 = 1𝑘𝑖=1 , y 𝑝𝑖 ≥

0, ∀𝑖 para una variable aleatoria. La base b en la que se evalúa el logaritmo define las unidades de la

entropía; siendo el “bit” la unidad asociada a la base 2. El valor de (IM) entre las dos variables aleatorias

en función del tiempo de rezago 𝜏.

𝐼𝑀𝑖𝑗(𝜏) = ∑ 𝑝𝑖𝑗𝜏

𝑖𝑗

𝑙𝑜𝑔2 (𝑝𝑖𝑗

𝜏

𝑝𝑖𝜏𝑝𝑗

𝜏) (2)

En donde,

𝑝𝑖𝑗𝜏 = 𝑝(𝑋𝑡 = 𝑥𝑖 , 𝑌𝑡 + 𝜏 = 𝑦𝑖), 𝑝𝑗 = ∑ 𝑝𝑖𝑗 𝑦 𝑖 𝑝𝑖 = ∑ 𝑝𝑖𝑗 𝑗

Cuando 𝑖 = 𝑗, la ecuación anterior (2) define la función de auto información de la serie (Chapeau-

Blondeau, 2007; [5].

El valor de (IM) es una medida general de asociación entre variables que detecta tanto relaciones lineales

como no lineales, por lo que se considera un estadístico más robusto frente a los coeficientes de

correlación de Pearson o Spearman los cuales solo encuentran dependencias lineales.

Para el caso general en el que 𝑖 ≠ 𝑗, es posible definir la función de información mutua normalizada (IMN)

mediante el siguiente estimador,

𝐼𝑀𝑁𝑖𝑗(𝜏) =𝐼𝑀𝑖𝑗(𝜏)

√𝐻𝑖√𝐻𝑗

(3)

El valor de (IMN) es siempre positivo y toma valores entre [0,1], se hace nulo únicamente cuando las

variables aleatorias son independientes y 1 cuando existe asociación, el conocimiento de una de las

variables en esta caso el índice ONI nos aporta información para la otra.

Ahora bien, para cuantificar la memoria del proceso no lineal se hace necesario estimar la escala de

información normalizada descrita por Poveda [5] mediante la siguiente ecuación,

𝜑∗ = 1 + 2 ∑ 𝐼𝑀𝑁𝑖𝑗(𝜏)

𝑘

𝜏=1

(4)

2.2 Coeficiente de correlación

El coeficiente de correlación (ρ) proporciona una medida de dependencia lineal entre dos variables

aleatorias, que puede ser de tres tipos: directa, cuando los incrementos en una de las variables se

encuentran asociados con incrementos en la otra; inversa, cuando los decrementos en una de las variables

se encuentran asociados con incrementos en la otra; y nula, cuando los cambios en una de las variables

no se asocian con los cambios en la otra. El valor de (ρ) fluctúa en el intervalo [-1,1] y sus óptimos de

dependencia directa e inversa se relacionan, respectivamente, con el extremo inferior y el extremo

superior de este último. Cuando existe dependencia nula entre las variables aleatorias, el valor de es igual

a cero. El valor de entre las series de tiempo del índice ONI y las series de caudales es estimado como [5].

𝜌𝑖𝑗(𝜏) =∑ (𝑋𝑖

𝑖 − 𝜇𝑡𝑖 )(𝑋𝑡+𝜏

𝑗− 𝜇𝑡+𝜏

𝑗)𝑛−𝜏

𝑡=1

[∑ (𝑋𝑖𝑖 − 𝜇𝑡

𝑖 )2 ∑ (𝑋𝑡+𝜏𝑗

− 𝜇𝑡+𝜏𝑗

)2 𝑛−𝜏𝑡=1 𝑛−𝜏

𝑡=1 ] (5)

Donde, 𝑋𝑖𝑖 , 𝜇𝑡

𝑖 , 𝑋𝑡+𝜏𝑗

, 𝜇𝑡+𝜏𝑗

son la serie del parámetro predictor 𝑖, su valor promedio, la serie de tiempo

rezagada un valor 𝜏 en la estación 𝑗 y su promedio respectivamente.

3. DATOS Y MÉTODOS

Sobre el territorio antioqueño se ubican un total de 75 estaciones limnigráficas y limnimétricas

administradas por el Instituto de Hidrología, Meteorología y Estudios Ambientales de Colombia (IDEAM),

las cuales se han representado con triángulos color marrón en la Figura 1. Estas cuentan con registros de

caudal total diario entre los años 1966 y 2013, se conformaron las bases de datos climáticas a escala

temporal mensual, donde se efectuó la identificación de datos faltantes, para esto se tuvo como

parámetro un porcentaje de datos faltantes menor al 15% y un registro efectivo de datos de mínimo 30

años, del total de datos por estación climática; como resultado correspondieron a 15 (11.25%) del total de

las estaciones. El grupo de 15 estaciones, representadas con círculos color marrón en la Figura 1, fueron

utilizadas en este trabajo.

El índice oceánico del Niño (ONI), es calculado como la media móvil de tres puntos de la serie mensual de

anomalías de la temperatura de la superficie del océano en la Región Niño 3-4. Los valores fueron tomados

de la página web: http://www.cpc.ncep.noaa.gov/data/indices/ Cabe recordar que los valores positivos

del ONI, mayores o iguales a 0,5 por 5 meses consecutivos o más indican la ocurrencia de un evento El

NIÑO. Valores negativos del ONI, inferiores o iguales a -0,5 por 5 meses consecutivos o más indican la

ocurrencia de un evento La NIÑA [5] tomado de pal trabajo.

3.1 Correlación, y la información mutua

Para efectos del cálculo de la información mutua es necesario determinar la función de densidad de

probabilidad de los caudales, la cual se estima con su histograma de frecuencias relativas. El procedimiento

para la construcción de histogramas de frecuencias relativas requiere la agrupación de los registros de

tiempo en clases; para propósitos de cálculo, en este trabajo, se utilizaron 10 clases de igual ancho,

distribuidas entre el valor mínimo y el valor máximo de los datos. Con ello se procedió al cálculo de la

entropía, usando la Ecuación (1), para cada estación limnigráfica y limnimétrica.

El comportamiento estadístico de dependencia de ρ e IMN con respecto al vector de desplazamiento fue

cuantificado usando rezagos temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10 meses.

Tabla 1. Estaciones limnigráficas Y limnimétricas utilizadas para el análisis de datos.

ID Estación

(Código IDEAM) Cota

(msnm) Variable climática

*R Año

inicial Año final

*AR *%F *%D *Ae

0 PTE REAL

[23087150] 2083 Caudal 480 1974 2013 40 9.12 90.88 36.35

1 EL REMOLINO

[26197030] 678 Caudal 504 1972 2013 42 10.04 89.96 37.78

2 PUEBLO NUEVO

[12027050] 78 Caudal 432 1978 2013 36 11.09 88.91 32.01

3 LA GALERA [26217010]

662 Caudal 444 1977 2013 37 15.00 85.00 31.39

4 LA BODEGA [23107020]

120 Caudal 444 1976 2012 37 11.92 88.08 32.59

5 VEGACHI

[23107040] 929 Caudal 468 1975 2013 39 12.05 87.95 34.30

6 CAMPAMENTO

[26197010] 1080 Caudal 504 1972 2013 42 12.24 87.76 36.86

7 PTE IGLESIAS [26207030]

583 Caudal 408 1979 2012 34 12.54 87.46 29.74

8 APAVI

[26247030] 106 Caudal 504 1972 2013 42 12.57 87.43 36.72

9 BRISAS DEL

NECHI [27027060]

1880 Caudal 468 1975 2013 39 12.59 87.41 34.09

10 PAILANIA

[23087200] 980 Caudal 492 1973 2013 41 12.79 87.21 35.76

11 LA MASCOTA [23107030]

970 Caudal 468 1975 2013 39 13.02 86.98 33.92

12 BARRANQUILLIT

A [12017020] 33 Caudal 444 1977 2013 37 14.80 85.20 31.52

13 SONSON

[26187030] 2282 Caudal 528 1970 2013 44 14.82 85.18 37.48

14 DABEIBA 2 [11117050]

650 Caudal 456 1976 2013 38 14.86 85.14 32.35

donde, *R= Registro de datos; *AR= Años de registro; *%F= Porcentaje de datos faltantes; %D= Porcentaje

de datos disponibles; Ae= Años efectivos de registros.

Figura 1. Localización de la zona de estudio y de la red de estaciones limnigráficas y limnimétricas

administradas por el IDEAM, utilizadas en el presente trabajo.

4. Resultados

A continuación se presentas los resultados obtenidos para los parámetros estadísticos de información

mutua normalizada (IMN), correlación de Pearson (ρ) y escala de información normalizada 𝜑∗, los cuales

son representados por las figuras 2, 3 y 4 respectivamente. Es necesario resaltar que el eje Y de las gráficas

fue modificado de tal manera que se pudiese observar algún patrón, de tal manera que en el eje Y no se

representará los valores máximos y mínimos entre los cuales se mueven los parámetros estadísticos

trabajados.

La Figura 2 muestra la asociación entre los caudales en Antioquia y el índice ONI en términos de la

información mutua normalizada, como una función del vector de desplazamiento, para los rezagos

temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9, y 10 meses. De acuerdo al valor de comparación definido anteriormente

para IMN se puede inferir que las magnitudes encontradas son bajas. Es decir existe una asociación baja

entre el índice oceánico del Niño (ONI), y los caudales medios en el departamento de Antioquia, lo cual

contrasta con el estudio realizado por Poveda et, al 2002 [8]. Por lo cual se intuiría que la información

mutua, no permite definir tan claramente una dirección de máxima continuidad, como en el caso de

aquella puesta en términos de la correlación; lo que se concluye al comparar la Figura 2 con la Figura 3.

A medida que crece el intervalo de agregación, el estadístico de información mutua, comienza a capturar

relaciones no lineales, que no aparecen tan claras en los campos de correlación. Sin embargo surge una

inquietud al ver que por ejemplo para los primeros tiempos de rezago el coeficiente de Pearson (ρ) el cual

captura una dependencia lineal significativa [-0.5 y -0.6] para las estaciones Apavi (ID=8) y Puente Iglesias

(ID=7). Los valores de IMN a pesar de que captura tanto relaciones lineales como no lineales no indican

una buena asociación entre las variables de las series analizadas.

Figura 2. Información mutua normalizada entre las series de caudal y las series del índice ONI para un

rezago 𝜏

Por su parte la Figura 3 muestra la relación entre los caudales en Antioquia y el índice ONI, en términos

del coeficiente de correlación, como una función del vector de desplazamiento, para los rezagos

temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9, y 10 meses. Los valores presentan una correlación negativa significativa

para los primeros 3 meses de rezago, lo que indica que el aumento o disminución en el índice evaluado

está estrechamente relacionado a disminuciones o aumentos en los caudales. Lo cual se podría dar un

indicio de una especie de periodo de reacción o de afectación en el caudal después de presentarse la

anomalía en el océano pacifico representada por el índice ONI.

0.200.210.220.230.240.250.260.270.280.290.300.310.320.330.340.350.360.370.380.390.40

0 1 2 3 4 5 6 7 8 9 1 0

𝐼𝑀N𝑖𝑗

(𝜏)

𝜏 (MES)

INFORMACIÓN MUTUA ( IMN ) ENTRE REGISTROS DE CAUDALES E ÍNDICE ONI

8 12 4 9 6 14 3 11

10 7 0 2 1 13 5

ID ESTACIONES

Figura 3. Correlación lineal de Pearson (ρ) entre las series de caudal y las series del índice ONI para un

rezago 𝜏

La Figura 4 representa la escala de información normalizada (𝜑∗) con 10 intervalos de clase usados para

la estimación de la distribución de probabilidades de las variables estudiadas. De forma general la 𝜑∗ toma

valores entre 1.5 y 1.6 meses para los rezagos temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9, y 10 meses; lo cual es

posible observar que cada uno de dichos intervalos miden aproximadamente los mismo. Se puede

interpretar esta escala característica como la longitud necesaria del índice ONI para desarrollar un efecto

sobre los caudales en el departamento de Antioquia. En este sentido los valores de escala de información

normalizada dan cuenta de la existencia de la relación entre el índice ONI y los caudales debido a que la

escala de información normalizada permanece de manera aproximada invariable en el tiempo.

-1.00

-0.90

-0.80

-0.70

-0.60

-0.50

-0.40

-0.30

-0.20

-0.10

0.00

0.10

0.20

0.30

0 1 2 3 4 5 6 7 8 9 1 0

Ρ𝑖𝑗

(𝜏)

𝜏 (MES)

CORRELACIÓN DE PEARSON (Ρ ) ENTRE SERIES DE CAUDALES E ÍNDICE ONI

8 12 4 9 6 14 3 11

10 7 0 2 1 13 5

ID ESTACIONES

Figura 4. Escala de información normalizada entre los registros de caudales e índice ONI para un rezago 𝜏

5. Conclusiones

Los resultado de la información mutua no sólo encuentra asociaciones no lineales no detectadas por

Pearson (𝜌), pero surge un interrogante grande y es que no capte todas las asociaciones lineales captadas

por (𝜌), debido a los valores bajos observados de IMN, lo cual no daría validez al método presentado, sin

embargo esto se pude atribuir un error de cálculo a la hora de realizar los cálculos respectivos con la

formula empleada.

En términos de la información mutua, no permite definir tan claramente una dirección, como en el caso

de aquella puesta en términos de la correlación; lo que se concluye al comparar las figuras 2 y 3 mostradas

anteriormente.

Los resultados de las correlaciones, dan pie para mejorar el ajuste y la predicción del caudal mensual en

los ríos del departamento de Antioquia, ya que los valores presentados en rezagos diferentes a cero

pueden ser usados como variables predictores, lo cual podría ser una herramienta de gran importancia

para la planificación del recurso hídrico de la región.

La investigación sobre la existencia o no, de relaciones claras que permitan caracterizar la dependencia

temporal y su posible uso con propósitos de estimación y pronóstico, mediante el uso de teorías no lineales

(información mutua) a las escalas temporales adecuadas, constituye una posible línea de trabajo futuro.

1.00

1.05

1.10

1.15

1.20

1.25

1.30

1.35

1.40

1.45

1.50

1.55

1.60

1.65

1.70

1.75

1.80

1 2 3 4 5 6 7 8 9 1 0

𝜑∗ 𝑖𝑗

(𝜏)

𝜏 (MES)

ESCALA DE INFORMACIÓN NORMALIZADA ENTRE REGISTROS DE CAUDALES E ÍNDICE ONI

8 12 4 9 6 14 3 11

10 7 0 2 1 13 5

Agradecimiento

Al profesor German Poveda por despertar el interés por las ciencias de la estadística y ocurrencia de

fenómenos climáticos, por el apoyo durante el semestre 2015-2 y por sus clases magistrales que dieron pie

a entender fenómenos que eran ajenos al conocimiento de quien realiza este trabajo académico.

6. Referencias bibliográficas

[1] S.R. Kovatz, El Niño and human health. Bulletin of the World Health Organization, 2000, vol. 78, 9, 1127-

1135.

[2] C. Wang, Atmospheric circulation cells associated with the El Niño-Southern Oscillation, J. Climate,

2002, vol. 15, 399–419.

[3] OPS- Oganización panamericana de la salud. Crónicas de Desastres Fenómeno el Niño, 1997-1998.

Programa de preparativos para situaciones de emergencias y coordinación del socorro en casos de

desastre. Serie: Crónicas de Desastres, 2000, vol. 8, pp. 294.

[4] G. Poveda, J. Vélez, O. Mesa, A. Cuartas, J. Barco, R. Mantilla, J. Mejía, C. Hoyos, J. Ramírez, L. Ceballos,

M. Zuluaga, P. Arias, B. Botero, M. Montoya, J. Giraldo y D. Quevedo, «Linking Long-Term Water Balances

and Statistical Scaling to Estimate River Flows along the Drainage Networks of Colombia,» J. Hydrol. Eng.,

vol. 12, nº 1, pp. 4-13, 2007.

[5] G. Poveda, Escala de información, escala de fluctuación y entropía de las lluvias en el valle de aburrá,

Colombia, Revista de la academia Colombiana de ciencias exactas, físicas y naturales, vol. XXXIII, pp. 4-7,

2009.

[6] C. Shannon, «A mathematical theory of communication,» Bell Syst. Tech. J., vol. 27, pp. 379-423, 1948.

[7] G. Guarín and A. Ochoa, “Impacto de la Variabilidad Climática en la Producción de Banano en el Urabá

Antioqueño”. Numeral 10: Índices macroclimáticos, precipitación y producción en Urabá. M.S. thesis,

Ingeniería de Recursos Hídricos, Universidad Nacional de Colombia, 2011.

[8] Poveda et, al, 2002. Influencia De Fenómenos Macroclimáticos Sobre El Ciclo Anual De La Hidrología

Colombiana: Cuantificación Lineal, No Lineal Y Percentiles Probabilísticos.