predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de...

16
1 Predicción de la calidad del aire mediante métodos geoestadísticos funcionales JOSÉ-MARÍA MONTERO [email protected] Departamento de Economía Política y Hacienda Pública, Estadística Económica y Empresarial y Política Económica Universidad de Castilla-La Mancha Área Temática: Energía, sostenibilidad, recursos naturales y medio ambiente Resumen: La calidad del aire es uno de los problemas de que más preocupan a la ciudadanía, sobre todo en las grandes urbes. Es por ello que en las grandes ciudades las autoridades municipales han establecido sistemas de vigilancia de la contaminación atmosférica para la correcta medida de los niveles de gases y de partículas en determinados puntos de las mismas. La forma en que Geoestadística trabaja con los registros de contaminación atmosférica difiere sustancialmente de la forma en que lo hace la Econometría tradicional, pues aprovecha las dependencias espacio-temporales existentes en los procesos medioambientales para realizar predicciones kriging en localizaciones que no cuentan con estación de vigilancia o seguimiento. Sin embargo, la realización de tales predicciones necesita de una gran potencia computacional, por lo que los novedosos desarrollos teóricos de la Geoestadística espacio-temporal han girado rápidamente hacia el kriging funcional, estrategia que representa los registros temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera, y aprovecha los desarrollos (bien conocidos) del kriging meramente espacial para realizar predicciones kriging de datos funcionales (curvas). En este sentido, podría decirse que el kriging funcional predice la historia del contaminante en ubicaciones no observadas de interés. En este trabajo se aplica esta novedad metodológica al caso de las partículas en suspensión, y concretamente a las PM10, en la ciudad de Madrid, pues el nivel de las concentraciones de este peligroso contaminante todavía es más elevado de lo deseable y genera honda preocupación en la ciudadanía, autoridades medioambientales y grupos ecologistas. Palabras clave: Geostatistica, datos funcionales, kriging funcional, partículas en suspensión. Clasificación JEL: C21, C23, C55, O13, Q53.

Upload: others

Post on 11-Sep-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

1

Predicción de la calidad del aire mediante métodos geoestadísticos funcionales

JOSÉ-MARÍA MONTERO [email protected] Departamento de Economía Política y Hacienda Pública, Estadística Económica y Empresarial y Política Económica Universidad de Castilla-La Mancha Área Temática: Energía, sostenibilidad, recursos naturales y medio ambiente Resumen: La calidad del aire es uno de los problemas de que más preocupan a la ciudadanía, sobre todo en las grandes urbes. Es por ello que en las grandes ciudades las autoridades municipales han establecido sistemas de vigilancia de la contaminación atmosférica para la correcta medida de los niveles de gases y de partículas en determinados puntos de las mismas. La forma en que Geoestadística trabaja con los registros de contaminación atmosférica difiere sustancialmente de la forma en que lo hace la Econometría tradicional, pues aprovecha las dependencias espacio-temporales existentes en los procesos medioambientales para realizar predicciones kriging en localizaciones que no cuentan con estación de vigilancia o seguimiento. Sin embargo, la realización de tales predicciones necesita de una gran potencia computacional, por lo que los novedosos desarrollos teóricos de la Geoestadística espacio-temporal han girado rápidamente hacia el kriging funcional, estrategia que representa los registros temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera, y aprovecha los desarrollos (bien conocidos) del kriging meramente espacial para realizar predicciones kriging de datos funcionales (curvas). En este sentido, podría decirse que el kriging funcional predice la historia del contaminante en ubicaciones no observadas de interés. En este trabajo se aplica esta novedad metodológica al caso de las partículas en suspensión, y concretamente a las PM10, en la ciudad de Madrid, pues el nivel de las concentraciones de este peligroso contaminante todavía es más elevado de lo deseable y genera honda preocupación en la ciudadanía, autoridades medioambientales y grupos ecologistas. Palabras clave: Geostatistica, datos funcionales, kriging funcional, partículas en suspensión.

Clasificación JEL: C21, C23, C55, O13, Q53.

Page 2: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

2

1. Introducción

No hay duda alguna de que en la actualidad la calidad del aire es uno de los

problemas que más preocupan a la ciudadanía, especialmente a los ciudadanos que

viven en las grandes urbes. Obviamente, es la relación entre la calidad del aire y la salud

humana la que genera tal preocupación en las grandes aglomeraciones. En

consecuencia, se han establecido una serie de límites legales cuya superación en un

determinado número de ocasiones implica serias consecuencias para el municipio. En

esta tesitura, no resulta extraño que la medición y predicción de los niveles de los

contaminantes más peligrosos haya adquirido una notable popularidad.

Este trabajo se centra en las partículas en suspensión (conocidas comúnmente por su

acrónimo en inglés, PM), y más concretamente en aquellas cuyo diámetro es inferior a

diez micras (PM10), es decir de anchura inferior a la de un cabello humano. Y ello: a)

por ser especialmente perjudiciales para la salud humana, puesto que pueden penetrar

en las vías respiratorias y quedar fijadas en las paredes interiores de los conductos

alveolares (especialmente si son muy pequeñas), y b) porque, aunque ha habido notables

avances en el control de este peligroso contaminante, sus límites legales todavía son

superados en numerosas ocasiones en muchas de las grandes ciudades del mundo

(incluso europeas y americanas; véanse a este respecto Turoczi et al. 2012, y Pope y

Dockery 2013). Las PM son partículas microscópicas, tanto líquidas como sólidas, que

normalmente se presentan en forma de cenizas volantes, polvo, niebla, gas, etc., y que,

como su nombre indica, permanecen suspendidas en el aire durante un tiempo

determinado (que puede ser ciertamente largo en el caso de las más pequeñas) y pueden

viajar grandes distancias (dependiendo de su tamaño). Su composición y origen son

tremendamente variables, y pueden ser emitidas directamente a la atmósfera o surgir

como consecuencia de reacciones químicas entre otros contaminantes.

Las PM están consideradas como uno de los contaminantes atmosféricos más

peligrosos para la salud humana, y por ello sus niveles o concentraciones son objeto de

medición en las grandes ciudades que cuentan con redes de vigilancia. Su principal

fuente emisora (aunque varía dependiendo de las ciudades) es el tráfico rodado, pues la

mayor parte de ellas se generan en los procesos de combustión de los vehículos diesel,

Page 3: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

3

aunque surgen en todos los procesos de combustión, siendo también especialmente

importantes los de carácter industrial. Las actividades relacionadas con la construcción,

la creación de infraestructuras, la minería, la industria cementera, de cerámica y

similares también constituyen una fuente relevante de PM. Como puede apreciarse, las

actividades relacionadas con el progreso económico y social juegan un importante papel

en la emisión de PM, por lo cual uno de los retos más difíciles que hay planteados en la

actualidad es el trade-off entre la pérdida de calidad del aire por esta (y por otras) vía y

el desarrollo económico (Montero y Fernández-Avilés 2015). Pero las actividades

derivadas del progreso económico y social no son las únicas fuentes de emisión de PM;

dicha emisión también puede tener un origen natural, como es el caso de los aerosoles

marinos, la erosión y, como en el caso de España, la intrusión de polvo africano.

Concentraciones excesivas de PM afectan especialmente al aparato respiratorio y al

sistema cardiovascular de las personas. Baste señalar, a modo de ejemplo, que a)

determinados estudios llevados a cabo en Estados Unidos y Europa han puesto de

manifiesto que cada incremento de 10 μg/m3 en PM10 se traduce en, aproximadamente,

un 1% de fallecimientos adicionales (véase Montero Lorenzo et al. 2011, y las

referencias contenidas en el mismo); b) Ayres (2002) estimó que las PM contribuyen a

8.100 fallecimientos anuales en el Reino Unido; y que c) Chay y Greenstone (2003)

estimaron que una reducción de un punto porcentual en el nivel de PM llevó a una

reducción de la tasa de mortalidad infantil de un 0.35% durante el periodo 1970-80.

Estos datos, sin duda, ponen de manifiesto la importancia de su medición y predicción

en aquellas localizaciones que no disponen de estación de vigilancia. Pero las PM,

además de afectar seriamente a la salud humana, tienen otras consecuencias indeseables

(por ejemplo, también influye en la temperatura de atmósfera).

De lo anteriormente expuesto, es fácilmente entendible que la predicción de los

niveles de contaminación del aire, y especialmente de los de los contaminantes más

peligrosos para la salud humana, como las PM10, así como la detección de episodios que

superen los límites legales establecidos, constituyan tópicos de especial interés en el

campo del control de la calidad del aire.

De acuerdo con Montero Lorenzo et al. (2011), se han utilizado varias técnicas para

detectar superaciones de los umbrales legales de contaminación atmosférica, siendo los

Page 4: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

4

más populares los modelos de valores extremos, si bien también han sido ampliamente

utilizados los modelos de regresión, tanto lineales como no lineales. Los árboles de

clasificación y regresión, así como las redes neuronales también han servido a tal

propósito, si bien no con excesiva profusión. El Análisis Canónico y otras técnicas

relacionadas con los modelos lineales también han sido objeto de utilización esporádica.

Un enfoque más actual y prometedor que los anteriores, desde nuestro punto de vista,

son los modelos de volatilidad estocástica y, concretamente, aquellos que tienen en

cuenta la respuesta asimétrica de la volatilidad, hecho estilizado de las series de calidad

del aire. Los modelos con umbral, diseñados por So et al. (2002), y desarrollados

posteriormente por García y Mínguez (2009a, b) son, a nuestro juicio, especialmente

destacables. Un ejemplo de aplicación de tales modelos al caso de las PM10 puede verse

en Montero Lorenzo et al. (2011).

Sin embargo, el enfoque por el que se apuesta en este trabajo es el enfoque

geoestadístico de carácter no meramente espacial sino espacio-temporal. Y es que los

registros que se obtienen de las estaciones de seguimiento en las grandes ciudades

constituyen un conjunto de datos en formato espacio-temporal (que también puede ser

visto como un conjunto de datos panel), por lo que las dependencias espaciales y

temporales, así como la interacción espacio-tiempo deben ser tenidas en cuenta. A

diferencia del enfoque econométrico, la Geoestadística no se centra en la estimación de

los parámetros de un supuesto modelo, sino directamente en la predicción (denominada

predicción kriging), aprovechándose simplemente de las dependencias espaciales o

espacio-temporales existentes en el fenómeno objeto de estudio. No necesita, pues, de

variables explicativas, tan difíciles de obtener en el caso medioambiental, sino que se

abastece únicamente de la historia del fenómeno en los puntos en los que ha sido

medido (véanse Cressie y Wikle 2011, Sherman 2011, y Montero et al. 2015).

El uso de la Geoestadística en el estudio de la calidad del aire es relativamente nuevo

y apenas existe en el caso de las PM, sobre todo en el ámbito espacio-temporal debido a

la enorme carga computacional que exige: Pollice y Lasinio (2010), Gräler et al. (2011),

Hussain et al. (2013) y Campalani et al. (2014) son algunos de los muy escasos trabajos

sobre la cuestión.

Page 5: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

5

El reto computational del kriging espacio-temporal, denominado “the big n

problem” por Banerjee et al. (2004), sobre todo cuando el número de instantes

temporales es grande, lo cual es ciertamente habitual, se ha intentado superar con

diversos y complejos procedimientos que van desde ajustar un campo aleatorio

Gaussiano al proceso original en un laticce (con el objeto de utilizar algoritmos de

matrices dispersas) hasta utilizar métodos de interpolación espacio-temporal jerárquicos

Bayesianos, pasando por aproximar la función de covarianza utilizando combinaciones

lineales de un reducido número de funciones de base de pequeña dimensión (véanse

Banerjee et al. 2008, Hartman y Hossjer 2008, Cressie y Johannesson 2008, y Liang y

Kumar 2013). En este trabajo, se propone superar el “big n problema” del kriging

espacio-temporal desde la novedosa perspectiva de la Geoestadística funcional. El

kriging funcional, herramienta de predicción de la Geoestadística funcional, aprovecha

las dependencias espacio-temporales existentes en los registros medioambientales (en

este caso de PM10) para realizar predicciones en localizaciones e instantes temporales no

observados, e incluso para reproducir la historia del fenómeno en estudio en tales

localizaciones. Es decir, la Geoestadística funcional predice datos funcionales (curvas)

representativas de (o que se suponen generadoras de) la serie de registros de de PM10 en

localizaciones de interés que no están dotadas de estación de vigilancia.

La anterior metodología se ilustra mediante la predicción de los datos funcionales o

curvas representativas de las series de PM10 en cuatro de los lugares más emblemáticos

y transitados de Madrid, en los cuales no existe estación de seguimiento alguna. Y ello

porque “Ecologistas en Acción” viene denunciando desde hace mucho tiempo que las

estaciones de vigilancia de la red de control de la calidad del aire del municipio de

Madrid, están “sospechosamente” ubicadas en lugares que no se corresponden con los

puntos más contaminados de la ciudad. Pues bien, en este trabajo se compararán las

curvas predichas en tales cuatro puntos neurálgicos de la ciudad con las obtenidas

mediante un proceso de validación cruzada en los emplazamientos donde están ubicadas

las estaciones de seguimiento que operan en la ciudad. Bajo el supuesto de que la

volatilidad de las concentraciones diarias de PM10 es similar a lo largo de un pequeño

vecindario, “Ecologistas en Acción” tendrá razón en sus denuncias si las curvas (datos

funcionales) de PM10 predichas en los cuatro lugares no observados que se han elegido

Page 6: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

6

a tales efectos se ubican por encima de las curvas obtenidas en los emplazamientos

donde están ubicadas las estaciones de vigilancia.

Tras esta sección introductoria, este trabajo se estructura como sigue: La segunda

sección muestra los rudimentos e ideas básicas del kriging espacio-temporal y su

alternativa funcional. En la sección 3 se comentan los elevados niveles de PM todavía

existentes en la ciudad de Madrid, así como se expone la conversión de los datos de

base, procedentes de las estaciones de vigilancia, en datos funcionales susceptibles de

ser utilizados por los métodos geoestadísticos funcionales. En la sección 4 se obtienen

las predicciones funcionales de las cuatro localizaciones (no vigiladas) seleccionadas en

la ciudad de Madrid y se comprueba si es cierta o no la reivindicación de “Ecologistas

en Acción”. Finalmente, la sección 5 presenta las principales conclusiones del trabajo y

apunta algunas futuras líneas de investigación.

2. Aspectos básicos de la Geoestadística espacio-temporal y su alternativa

funcional.

Tal y como apuntan Montero et al. (2015), la Geoestadística espacio-temporal utiliza

como información de base series de observaciones observadas o registradas en ciertas

localizaciones de interés, 1 1, , , ,n nZ t Z ts s , acerca del proceso estocástico objeto

de estudio, , , ,Z t D t T s s , 2D y t , si bien puede extenderse al caso

multivariante si se dispone sobre información sobre procesos auxiliares estrechamente

correlacionados con el principal. Como se apuntó en la sección introductoria, la

Geoestadística espacio-temporal aprovecha las dependencias espacio-temporales

existentes en las observaciones del fenómeno de interés para proporcionar predicciones

en localizaciones espacio-temporales no observadas 0 0, ts , a partir de un predictor en

forma de media ponderada de las observaciones o registros del proceso de interés,

*0 0

1

, ,n

i i ii

Z t Z t

s s . La magnitud de las ponderaciones, i , dependerá de la

proximidad espacio-temporal entre los puntos observados y el punto de predicción (a

mayor proximidad mayor ponderación) y, en menor medida, de la función de

covarianza, ,i j i jC t t s s , o semivariograma, 1,

2 i j i jt t s s que se seleccione

Page 7: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

7

para representar las dependencias espacio-temporales anteriormente mencionadas.

Concretamente, las ponderaciones se obtienen como resultado de las ecuaciones de

kriging, y no son otras que las que hacen mínima la varianza del error de predicción

bajo la condición de insesgadez y para el semivariograma o función de covarianza

seleccionado.

En el caso de procesos isotrópicos e intrínsecamente estacionarios, o estacionarios de

segundo orden, el más popular en la práctica, tales ecuaciones, en términos de

semivariograma son:

0 01

1

, , , 1, ,

1

N

j i j i j i ij

N

ii

t t t t i Ns s s s

,

donde es un multiplicador de Lagrange, la media del proceso, aunque desconocida, se

supone constante y los términos semivariográficos únicamente dependen de las

distancias espacio-temporales (h, u), siendo la varianza de predicción:

2 *0 0 0 0 0 0 0

1

, , ,N

OK i i ii

V Z t Z t t t

s s s s s .

Las ecuaciones anteriores se denominan ecuaciones de kriging ordinario espacio-

temporal, pero existen varios tipos de ellas dependiendo, básicamente, del nivel de

estacionariedad que se le supone al proceso estocástico objeto de estudio (véase

Montero et al. 2015). Sin embargo, como se apuntó en el epígrafe introductorio, la

solución de las ecuaciones de kriging espacio-temporal es muy intensiva en términos

computacionales (a veces incluso prohibitiva cuando el número de instantes temporales

es elevado), lo cual, junto con la dificultad en la identificación de la función

covariográfica o semivariográfica que mejor captura las dependencias espacio-

temporales existentes en el fenómeno que se está analizando, ha desembocado en el

actual desarrollo de la alternativa funcional, que consiste reducir el problema espacio-

temporal a un problema meramente espacial, de tal manera que en cada localización

espacial los valores del proceso en los distintos instantes de tiempo considerados se

representarán por una la curva suave que se supone que los genera (un dato funcional).

Así, el problema espacio-temporal queda reducido a un problema de kriging meramente

Page 8: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

8

espacial en el que lo que se predice son curvas (datos funcionales) en localizaciones

espaciales no observadas a partir de las curvas (datos funcionales) correspondientes a

las localizaciones observadas. En consecuencia, los rudimentos de kriging meramente

espacial (bien conocidos), pueden ser utilizados para labores de predicción sin más que

sustituir en la ecuaciones de kriging las observaciones puntuales por datos funcionales

(curvas), si bien se ha de señalar que la construcción de datos funcionales, así como la

construcción de estadísticos funcionales a través de ellos, no es una tarea sencilla.

En caso de que las observaciones no se consideren libres de error de observación,

para eliminar tal error la conversión de las series de observaciones (una por localización

espacial) en datos funcionales se lleva a cabo mediante un procedimiento de suavizado

(para detalles sobre la cuestión véase Ramsey y Silverman, 2005).

A partir de un conjunto de datos funcionales disponible, χ1, χ2, ..., χn, el dato

funcional o curva correspondiente a la localización no observada de interés se predice

adaptando el predictor de kriging espacial al caso de datos funcionales: 0

*

1i

n

ii

s s ,

donde las ponderaciones i se obtienen de las ecuaciones de kriging espacial adaptadas

al caso de datos funcionales. En el caso de kriging ordinario, estas son:

0, ,

1

1

, 1, ,

1

i j i

N

j T Tj

N

ii

t dt t dt i Ns s s s

con varianza-traza de predicción:

0 0

20 0

1

N

KOF i iT Ti

Var t t dt t dt

*s ss

siendo ,i jTts s y

0,iTt dts s el valor del semivariograma-traza del proceso objeto de

estudio para distancias meramente espaciales i ih s s y 0ih s s ,

respectivamente.

3. El problema de las PM10 en la ciudad de Madrid: Creación de datos funcionales.

La aplicación práctica que se desarrolla en este trabajo se ha centrado en la ciudad de

Madrid, ciudad en la que los límites legales establecidos (o recomendados) para las

Page 9: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

9

PM10 han sido y siguen siendo superados en más ocasiones de las deseadas en algunas

partes de la misma. Pero, además, constituye una magnífica área de estudio por cuanto

la ratio de estaciones de seguimiento por habitante o kilómetro cuadrado es una de las

mejores de Europa, al menos hasta la reconfiguración de la red de vigilancia que se

llevó a cabo en 2009.

El problema de las PM10 en Madrid deriva de la intensa actividad económica y el

denso tráfico que hay en la ciudad, ciudad en la que se contabilizan 460,35 coches por

cada 1000 habitantes y un total de 1.878.237 vehículos, incluidos autobuses, taxis,

furgonetas de reparto, camiones, y motocicletas; además, son casi dos los millones de

conductores que entran y salen diariamente de la ciudad. La actividad industrial

madrileña, que se estima en el 7% del Producto Municipal Bruto, porcentaje que se

eleva al 15% en el conjunto de la región, también es una importante fuente de emisiones

de este peligroso contaminante.

Es cierto que en la última década se ha producido una significativa reducción de los

niveles de las PM10 en la ciudad (un 40%), debido a una serie de medidas propuestas

por las autoridades en materia medioambiental en los Planes de Calidad del Aire de la

Ciudad de Madrid 2006-2011 y 2011-2015, pero, también, a la crisis económica.

De acuerdo con el Departamento de Evaluación Medioambiental, Control y Calidad

del Aire de Madrid, en 2014 los valores medios anuales de PM10 y PM2.5 fueron 19 y 11

µg/m3, respectivamente, y aunque no se superaron los estándares legales en ninguna de

las estaciones de seguimiento, (un límite diario de 50 µg/m3 que no puede excederse

más de 35 veces al año; y un límite en forma de media anual de 40 µg/m3), 4 de las 12

estaciones que miden actualmente el contaminante igualaron o excedieron las

recomendaciones de la Organización Mundial de la Salud (una media anual de 20

µg/m3). Es necesario resaltar que, de acuerdo con Ballester et al. (2008), en

representación de la red APHEIS, se estima que cada año se podrían evitar 1.699

muertes prematuras en la ciudad de Madrid si la media diaria anual se redujese a 20

ug/m3.

Los datos utilizados en este trabajo han sido proporcionados por el Sistema de

Vigilancia de la Calidad del Aire del Ayuntamiento de Madrid y reflejan las medias

diarias de concentraciones de PM10 en las 21 estaciones de seguimiento operativas en el

Page 10: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

10

periodo Enero 2000- Diciembre 2009, periodo elegido porque tras la última fecha se

operó una significativa y polémica reforma en el Sistema que redujo a tan solo 12 las

estaciones en las que se registran las PM. La Figura 1 muestra tales datos de base en las

21 estaciones de seguimiento, Ei).

Figura 1. Niveles medios diarios de PM10, 2000 – 2009

La construcción de los 21 datos funcionales a partir de las series anteriores se ha

llevado a cabo utilizando un enfoque no paramétrico basado en funciones de base B-

spline. El número óptimo de nodos interiores (L) y del valor del parámetro que controla

el trade-off ajuste-penalización por rugosidad (), se ha llevado a cabo mediante un

procedimiento de validación cruzada (leave-one-out). Los valores óptimos encontrados

fueron 275L y 0 . Los 21 datos funcionales resultantes se presentan en la Figura

2.

Figura 2. Datos funcionales de niveles medios diarios de PM10, 2000 – 2009

0102030405060708090100110120130140150160170180190200

Jan‐00 Jan‐01 Jan‐02 Jan‐03 Jan‐04 Jan‐05 Jan‐06 Jan‐07 Jan‐08 Jan‐09

E1 E3 E4 E5 E6 E7 E8E9 E10 E11 E12 E13 E14 E16E18 E19 E20 E21 E22 E24 E25

Page 11: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

11

4. Predicción geoestadística funcional en puntos neurálgicos de la ciudad

A partir de los datos funcionales creados en el apartado anterior se procedió a la

construcción del semivariograma-traza empírico, al cual tras un proceso de validación

cruzada se le ajustó un se ajustó un semivariograma isotrópico exponencial (véase

Cressie 1993).

Una vez en disposición de los datos funcionales correspondientes a las 21 estaciones

de seguimiento operativas en la ciudad y del semivariograma teórico permisible que se

supone representa las dependencias espaciales existentes en los datos funcionales de

PM10, se procedió a la predicción de las curvas (2000-2009) de dicho contaminante en

la Plaza de Cibeles, la Plaza del Callao, la Plaza Carlos V (conocida como la glorieta de

Atocha), y la emblemática Puerta del Sol, lugares, como es bien sabido, transitados

diariamente por miles de personas.

En la Figura 3 y en la Tabla 1 se muestran los datos funcionales correspondientes a

las cuatro localizaciones objeto de predicción junto con aquellos correspondientes a las

21 estaciones de seguimiento, calculados estos últimos mediante un procedimiento de

validación cruzada (leave-one-out). El hecho de comparar los datos funcionales objeto

de predicción no con los datos originales registrados en las estaciones de vigilancia sino

con los datos funcionales creados a partir de ellos, se debe a que, lógicamente, los datos

originales muestran una mayor variabilidad que los datos funcionales y ambos tipos de

datos no serían comparables. De la Figura 3 y la Tabla 1 parece desprenderse la

0

10

20

30

40

50

60

70

80

90

100

110

120

130

140

150

Jan‐00 Jan‐01 Jan‐02 Jan‐03 Jan‐04 Jan‐05 Jan‐06 Jan‐07 Jan‐08 Jan‐09

E1 E3 E4 E5 E6 E7 E8 E9 E10 E11 E12

E13 E14 E16 E18 E19 E20 E21 E22 E24 E25

Page 12: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

12

veracidad de las reivindicaciones de “Ecologistas en Acción”, puesto que las curvas

predichas para la Plaza de Cibeles y la Puerta del Sol se sitúan claramente por encima

de las correspondientes a las ubicaciones donde están situadas las estaciones de

vigilancia. Además, la variabilidad subyacente a las curvas predichas para la Plaza

Carlos V y la Puerta del Sol es mucho mayor que la de las de los lugares dotados con

estación de vigilancia, lo cual implica que la probabilidad de superación de los límites

legales en ambas ubicaciones, altamente transitadas, es ciertamente muy superior a la de

los lugares donde están localizadas las estaciones de vigilancia. La variabilidad

subyacente en las curvas predichas para las plazas del Callao y de Cibeles es similar a la

de las curvas más elevadas construidas para los lugares con estación de vigilancia, lo

cual implica que el riesgo de violación de los estándares legales en ambas plazas es

también ciertamente elevado.

Figura 3. Comparación de datos funcionales kriging en las localizaciones observadas y predichas. Concentraciones medias diarias de PM10, 2000 – 2009

Tabla 1. Datos funcionales kriging de PM10: Principales estadísticos descriptivos (μg/m3)

0

10

20

30

40

50

60

70

80

90

Jan‐00 Jan‐01 Jan‐02 Jan‐03 Jan‐04 Jan‐05 Jan‐06 Jan‐07 Jan‐08 Jan‐09

E1 E3 E4 E5 E6E7 E8 E9 E10 E11E12 E13 E14 E16 E18E19 E20 E21 E22 E24E25 Plaza Cibeles Plaza Callao Plaza Carlos V Puerta del Sol

Estación de seguimiento Media

Desv.Stand. Mediana Min. Max.

Coef.Asim.

Coef. Curtosis

E1 36.07 9.51 35.24 12.51 72.93 0.41 0.20 E3 35.55 9.29 34.66 9.38 71.46 0.49 0.47 E4 32.37 8.36 31.62 7.81 59.46 0.26 -0.05 E5 33.88 8.86 33.52 8.02 61.72 0.14 -0.14 E6 33.42 8.44 32.84 9.65 65.46 0.41 0.26 E7 36.41 9.36 35.72 14.45 69 0.28 -0.22 E8 36.39 8.92 35.75 12.72 66.76 0.32 0.06

Page 13: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

13

5. Conclusiones

Dado que los datos de los contaminantes atmosféricos más peligrosos para la salud

humana se registran con estructura espacio-temporal, la Geoestadística, basándose en

las dependencias espacio-temporales existentes en dichos fenómenos, proporciona muy

buenas predicciones de la concentración de tales contaminantes en localizaciones e

instantes temporales no observados (vigilados). Sin embargo, las predicciones espacio-

temporales que proporciona la Geoestadística exigen un gran poder computacional que,

en ocasiones, cuando el número de instantes temporales observados es muy elevado,

puede incluso hacer prohibitiva dichas predicciones. Es por ello que, desde la propia

perspectiva geoestadística, se han desarrollado nuevos métodos de predicción basados

en datos funcionales y que hacen uso de las bien conocidas ecuaciones de kriging

meramente espaciales. La única diferencia con el kriging tradicional radica en que en

vez de trabajar con observaciones puntuales, o con bloques, trabaja con datos

funcionales (curvas suaves que representan la serie temporal de una localización

espacial concreta).

Dicha metodología funcional, que permite incluso la reproducción de la historia de

un fenómeno en localizaciones no observadas, ha sido puesta en funcionamiento en la

ciudad de Madrid con datos de PM10, uno de los contaminantes más peligrosos para la

salud humana que todavía sigue siendo un problema en las grandes urbes debido, sobre

todo, al tráfico rodado. Concretamente, se han realizado predicciones de datos

funcionales (2000-2009) en cuatro de los lugares más transitados de Madrid, con objeto

de comprobar si son ciertas las continuas reclamaciones de “Ecologistas en Acción”,

E9 36.95 9.63 35.84 11.13 67.3 0.28 -0.17 E10 33.83 9.02 33.28 7.06 61.51 0.30 -0.21 E11 36.62 9.23 36.16 6.37 66.65 0.14 -0.17 E12 32.58 8.75 31.96 10.88 60.86 0.26 -0.12 E13 34.60 9.33 33.83 7.80 63.74 0.17 -0.18 E14 36.02 10.28 35.40 4.30 68.65 0.31 -0.01 E16 34.34 9.14 33.87 6.59 61.42 0.12 -0.24 E18 36.05 9.83 35.26 7.43 66.26 0.21 -0.21 E19 31.68 9.29 31.43 4.75 59.56 0.22 -0.19 E20 32.74 9.26 32.4 7.92 62.65 0.11 -0.20 E21 33.85 9.71 33.03 5.98 66.6 0.43 0.31 E22 35.18 9.93 33.59 3.68 75.87 0.48 0.37 E24 33.19 9.05 33.07 7.19 60.12 0.05 0.05 E25 33.51 8.81 32.93 8.09 61.94 0.15 -0.14

Plaza Cibeles 37.59 9.76 36.78 14.36 80.58 0.55 0.60 Plaza Callao 34.19 9.61 33.68 11.00 75.15 0.41 0.24 Plaza Carlos V 36.17 11.73 35.83 1.70 80.50 0.26 0.49 Puerta del Sol 38.70 11.87 37.78 7.73 83.60 0.55 0.68

Page 14: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

14

relativas que las estaciones de seguimiento de la calidad del aire no están ubicadas en

los puntos más conflictivos de la ciudad. El resultado ha sido afirmativo, lo cual

constituye una seria preocupación para los ciudadanos madrileños. No obstante la

gravedad de los resultados obtenidos, debe quedar claro que este trabajo es tan solo una

ilustración de las de las múltiples aplicaciones que esta prometedora metodología puede

abordar.

Agradecimientos: Este4 trabajo ha sido parcialmente financiado por el Programa de Financiación de Actividades Investigadoras de Grupos de Investigación Grupo: Applied Economics and Quantitative Methods, UCLM (GI20153152).

Bibliografía

Ayres, J.G. (2002). “Chronic effects of air pollution”, Occupational and Environmental

Medicine, nº 59, p. 147–148.

Ballester, F., Medina, S., Boldo, E., Goodman, P., Neuberger, N. Íñiguez, C. y Kuenzli,

N., on behalf of the Apheis network (2008). “Reducing ambient levels of fine

particulates could substantially improve health: a mortality impact assessment for 26

European cities”, Journal of Epidemiology & Community Health, nº 62(2), p. 98-105.

Banerjee, S., Carlin, B.P. y Gelfand, A.E. (2004). Hierarchical Modeling and Analysis

for Spatial Data, Chapman & Hall/CRC, Boca Raton, Florida.

Banerjee, S., Gelfand, A.E. Finley, A.O. y and Sang, H. (2008). “Stationary process

approximation for the analysis of large spatial datasets”, Journal of the Royal Statistical

Society, Series B-Statistical Methodology, nº 70, p. 825–848.

Campalani, P., Mantovani, S. y Baumann, P. (2014). “Spatiotemporal Interactions for

Daily Mapping of PM10 with MODIS and Meteorological Data”, en E. Pardo-Igúzquiza

et al. (eds): Mathematics of Planet Earth (p. 239-243), Lecture Notes in Earth System

Sciences, Springer, Berlin.

Chay, K.Y. y Greenstone, M. (2003). “Air quality, infant mortality, and the Clean Air

Act of 1970”, NBER Working Paper No. W10053.

Cressie, N. (1993). Statistics for spatial data, Wiley, New York.

Page 15: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

15

Cressie, N. y Johannesson, G. (2008). “Fixed rank Kriging for very large spatial data

sets”, Journal of the Royal Statistical Society, Series B-Statistical Methodology, nº 70,

p. 209–226.

Cressie, N. y Wikle, C.K. (2011). Statistics for Spatio-Temporal Data, Wiley, Hoboken

(New Jersey).

García Centeno, M.C. y Mínguez Salido, R. (2009a). “Estimation of Asymmetric

Stochastic Volatility Models for Stock-Exchange Returns”, International Advances in

Economic Research, nº 15, p. 71–87.

García Centeno, M.C. y Mínguez Salido, R. (2009b). “Asymmetric Stochastic Volatility

Models and Multicriteria Decision Methods in Finance”, AESTIMATIO, the IEB

International Journal of Finance, nº 3, p. 2–23.

Gräler, B., Gerharz, L. y Pebesma, E. (2011). Spatio-temporal analysis and interpolation

of PM10 measurements in Europe, European Topic Centre on Air Pollution and Climate

Change Mitigation (ETC/ACM) Technical Paper 2011/10, The Netherlands.

Hartman, L.y Hossjer, O. (2008). “Fast kriging of large data sets with Gaussian Markov

random fields”, Computational Statistics & Data Analysis, nº 52, p. 2331–2349.

Hussain, I., Kazianka, H., Pilz, J. y Fasal, M. (2013). “Spatio-Temporal Modelling of

Particulate Matter Concentrations Including Covariates”, Science International, nº

25(1), p. 15–21.

Liang, D. y Kumar, N. (2013). “Time-space kriging to address the spatio-temporal

misalignment in the large datasets”, Atmospheric Environment, nº 72, p. 60–69.

Montero-Lorenzo, J.M., García-Centeno, M.C. y Fernández-Avilés, G. (2011). “A

Threshold Autoregressive Asymmetric Stochastic Volatility Strategy to Alert of

Violations of the Air Quality Standards”, International Journal of Environmental

Research, nº 11, p.155–177.

Montero, J.M. y Fernández-Avilés, G. (2015). "Functional kriging prediction of

pollution series: the geostatistical alternative for spatially-fixed data", Revista de

Estudios de Economía Aplicada, nº 33(1), p. 145-174.

Page 16: Predicción de la calidad del aire mediante métodos ...€¦ · temporales de cada estación de seguimiento mediante un dato funcional (una curva suave), que supuestamente los genera,

16

Montero, J.M., Fernández-Avilés, G. y Mateu, J. (2015). Spatial and Spatio-Temporal

Geostatistical Modeling and Kriging, Wiley, Chichester (U.K.).

Pollice, A. y Lasinio, G.J. (2010). “Spatiotemporal analysis of the PM10 concentration

over the Taranto area”, Environmental Monitoring and Assessment, nº 162(1–4), p.

177–190.

Pope, C.A. y Dockery, D.W. (2013). “Air pollution and life expectancy in China and

beyond”, Proceedings of the National Academy of Sciences, USA, nº 110, p. 12861-

12862.

Ramsay, J. y Silverman, B. (2005). Functional data analysis, Second edition, Springer,

New York.

Sherman, M. (2011). Spatial Statistics and Spatio-Temporal Data, Wiley, Chichester

(U.K.).

So, M.K.J., Li, W.K. y Lam, K. (2002). “A threshold stochastic volatility model”,

Journal of Forecasting, nº 21, p. 473–500.

Turóczi, B., Hoeffer, A., Tóth, Á., Kováts, N., Ács, A., Ferincz, Á., Kovacs, A. y

Gelencsér, A. (2012). “Comparative assessment of ecotoxicity of urban aerosol”,

Atmospheric Chemistry and Physics, nª 12, p. 7365-7370.