an alisis de valores extremos - universidad de granada

65
An´ alisis de Valores Extremos Modelizaci´onEspacial Autora: Adriana Medialdea Villanueva Dirigido por: Jos´ e Miguel Angulo Ib´ nez aster en Estad´ ıstica Aplicada Facultad de Ciencias. Universidad de Granada. 12 de Septiembre de 2016

Upload: others

Post on 18-Jul-2022

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: An alisis de Valores Extremos - Universidad de Granada

Analisis de ValoresExtremos

Modelizacion Espacial

Autora: Adriana Medialdea Villanueva

Dirigido por: Jose Miguel Angulo Ibanez

Master en Estadıstica Aplicada

Facultad de Ciencias. Universidad de Granada.

12 de Septiembre de 2016

Page 2: An alisis de Valores Extremos - Universidad de Granada
Page 3: An alisis de Valores Extremos - Universidad de Granada

Indice general

Resumen 5

1. Teorıa de valores extremos univariante 9

1.1. Distribucion de valores extremos generalizada . . . . . . . . . . . 9

1.2. Modelos de maximos por bloques . . . . . . . . . . . . . . . . . . 11

1.2.1. Estimacion de los parametros de la distribucion GEV . . 12

1.2.2. Niveles de retorno . . . . . . . . . . . . . . . . . . . . . . 12

1.3. Modelos de excedencias de umbrales . . . . . . . . . . . . . . . . 13

1.3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.3.2. Distribucion de Pareto generalizada . . . . . . . . . . . . 13

1.3.3. Estimacion de los parametros de la distribucion de Paretogeneralizada . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.4. Seleccion del umbral . . . . . . . . . . . . . . . . . . . . . 17

1.3.5. Niveles de retorno . . . . . . . . . . . . . . . . . . . . . . 19

1.4. Modelizacion de extremos en secuencias de datos dependientes . 20

2. Teorıa de valores extremos multivariante 23

2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2. Copulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.3. Distribucion de valores extremos multivariante . . . . . . . . . . 24

2.3.1. Caso bivariante . . . . . . . . . . . . . . . . . . . . . . . . 24

2.3.2. Extension para n variables . . . . . . . . . . . . . . . . . . 26

2.3.3. Transformaciones . . . . . . . . . . . . . . . . . . . . . . . 26

2.4. Convergencia del vector de maximos . . . . . . . . . . . . . . . . 27

2.5. Funciones de dependencia . . . . . . . . . . . . . . . . . . . . . . 28

2.6. Modelizacion y estimacion de parametros . . . . . . . . . . . . . 30

2.6.1. Caso bivariante . . . . . . . . . . . . . . . . . . . . . . . . 30

3

Page 4: An alisis de Valores Extremos - Universidad de Granada

4 INDICE GENERAL

2.6.2. Extension para n variables. Estimacion mediante copulas 31

2.7. Niveles de retorno . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.7.1. Caso bivariante . . . . . . . . . . . . . . . . . . . . . . . . 31

2.7.2. Extension para n variables. Medida de intensidad . . . . . 31

2.8. Modelos de excedencias de umbrales . . . . . . . . . . . . . . . . 32

2.8.1. Caso bivariante . . . . . . . . . . . . . . . . . . . . . . . 32

2.8.2. Extension a n variables . . . . . . . . . . . . . . . . . . . 34

3. Extremos espaciales 37

3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.2. Procesos max-estables espaciales . . . . . . . . . . . . . . . . . . 37

3.2.1. Representacion espectral de los procesos max-estables . . 38

3.2.2. Modelos max-estables . . . . . . . . . . . . . . . . . . . . 39

3.3. Medidas de dependencia para extremos espaciales . . . . . . . . . 40

3.3.1. Funcion del coeficiente extremal . . . . . . . . . . . . . . 40

3.3.2. F-madograma . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.3.3. λ-madograma . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.4. Simulacion de procesos espaciales max-estables . . . . . . . . . . 42

3.4.1. Simulaciones no condicionadas . . . . . . . . . . . . . . . 42

3.4.2. Simulaciones condicionadas . . . . . . . . . . . . . . . . . 42

3.5. Ajuste de un proceso max-estable Frechet a los datos . . . . . . . 43

3.5.1. Mınimos cuadrados . . . . . . . . . . . . . . . . . . . . . . 43

3.5.2. Maxima verosimilitud . . . . . . . . . . . . . . . . . . . . 44

3.6. Seleccion del modelo . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.6.1. Criterio de informacion de Takeuchi . . . . . . . . . . . . 44

3.6.2. Estadıstico de la tasa de verosimilitud . . . . . . . . . . . 45

4. Aplicacion con R. Extremos espaciales 47

4.1. Ajuste de la distribucion de valores extremos generalizada a losdatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.2. Transformacion de los datos a la distribucion Frechet. . . . . . . 52

4.3. Ajuste del proceso max-estable a los datos transformados. . . . . 53

4.3.1. Modelo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.3.2. Modelo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.3.3. Diagnosis y eleccion del modelo . . . . . . . . . . . . . . . 55

4.3.4. Predicciones. . . . . . . . . . . . . . . . . . . . . . . . . . 59

Page 5: An alisis de Valores Extremos - Universidad de Granada

INDICE GENERAL 5

5. Conclusion 61

Page 6: An alisis de Valores Extremos - Universidad de Granada

6 INDICE GENERAL

Page 7: An alisis de Valores Extremos - Universidad de Granada

Resumen

La Teorıa de Valores Extremos es una displicina estadstica cuyos avances fun-damentales son relativamente recientes. Esta enfocada al analisis del comporta-miento estocastico de los valores extremos de un proceso.

Con amplias aplicaciones en hidrologıa, investigacion medioambiental y me-teorologıa, seguros, aplicaciones financieras y geologıa entre otras, tiene comoobjetivo cuantificar el comportamiento de una serie de valores de un proceso,siendo estos valores mas extremos que los que usualmente se observan en el.

Esta teorıa se desarrolla a partir de los resultados de Frechet (1927), Fisher yTippett (1928) y von Mises (1936), que sientan las bases de la teorıa probabilis-tica de valores extremos unidimensional; sin embargo, su desarrollo teorico notendra lugar hasta principios de los anos 70 con la tesis dotoral de de Haan (1970)y los resultados de inferencia estadıstica desarrollados por Pickands (1975); estosresultados supusieron las primeras contribuciones a la Teorıa de Valores Extre-mos Multivariante y motivaron el desarrollo de modelos alternativos basados enexcendencias de umbrales.

En la actualidad, los avances en esta teorıa se esta centrando principalmente enel desarrollo de modelos y metodos para valores extremos de fenomenos espa-ciales y otras estructuras mas complejas.

En el presente trabajo se realiza una revision de los principales enfoques existen-tes en el analisis de valores extremos; prestando especial atencion a la dimensionespacial, junto con una aplicacion practica a datos geoestadısticos.

El primer capıtulo esta dedicado a la teorıa univariante, donde se presenta elpunto de partida de esta disciplina a partir de la condicion de valores extremos;ademas de los modelos clasicos de maximos por bloques y excedencias de umbra-les junto con las distintas distribuciones a las que dan lugar cada uno de ellos.Finalmente, se introduce la modelizacion para el caso de datos dependientes.

El tercer capıtulo esta enfocado a las distribuciones de valores extremos multiva-riantes y su aproximacion para maximos por bloques y excedecias de umbrales,prestando especial atencion a su estructura de dependencia a traves de copulas.

Page 8: An alisis de Valores Extremos - Universidad de Granada

En el cuarto capıtulo se trata la modelizacion de la dependencia tras la inclu-sion de una dimension espacial, para lo que seran fundamentales los procesosmax-estables y las distribuciones finito-dimensionales que se derivaran a travesde ellos.

Finalmente, en el capıtulo cinco se realiza una aplicacion practica con el softwareR y la herramienta SpatialExtremes.

Page 9: An alisis de Valores Extremos - Universidad de Granada

Capıtulo 1

Teorıa de valores extremosunivariante

1.1. Distribucion de valores extremos generali-zada

El modelo para el que se desarrolla la teorıa de valores extremos esta enfocadoa describir el comportamiento estadıstico de

Mn = max{X1, ..., Xn},

donde X1, ..., Xn es una secuencia de variables aleatorias independientes condistribucion comun F y Mn representa el maximo del proceso sobre n unidadesde tiempos de observacion.

La distribucion de Mn podrıa obtenerse de manera exacta a partir de la distri-bucion de las n variables, teniendo en cuenta las propiedades de independencia:

FMn(z) = Pr[Mn 6 z] = Pr[X1 6 z, ...,Xn 6 z]

= Pr[X1 6 z]× ...× Pr[Xn 6 z] = [F (z)]n.(1.1)

y derivando, se obtendrıa su funcion de densidad:

fMn(z) = n (FMn (z))n−1

f (z) . (1.2)

La funcion de distribucion anteriormente calculada converge a cero cuando n→∞ para z > z∗ y a uno para z ≤ z∗, con z∗ = sup{z : F (z) < 1}. Por lo que,para obtener una distribucion lımite no degenerada, sera necesario llevar a cabouna normalizacion.

Esta solucion, basada en el Teorema Central del Lımite, consiste en la busquedade secuencias de constantes {bn;n ≥ 1} y {an;n ≥ 1} tales que la distribucionde

9

Page 10: An alisis de Valores Extremos - Universidad de Granada

M∗n =Mn − bn

an(1.3)

converge a una distribucion no degenerada cuando n→∞, es decir,

lımn→∞

Fn (anz + bn) = G (z) . (1.4)

El rango completo de distribuciones lımite que podra seguir M∗n vendra dadopor el Teorema de Valores Extremos:

Teorema 1.1.1 Si existen sucesiones de constantes {an > 0} y {bn} tales que

P

(Mn − bn

an≥ z)→ G(z), cuando n→∞,

siendo G una funcion de distribucion no degenerada, entonces G debe pertenecera una de las siguientes familias:

i. Gumbel: G(z) = exp{− exp

[−(z−ba

)]}, −∞ < z <∞

ii. Frechet: G(z) =

{0, z 6 b

exp{−(z−ba

)−α}, z > b

iii. Weibull: G(z) =

{exp

{−[−(z−ba

)]α}, z < b

1, z ≥ b

con parametros a > 0, b y, en el caso de las familias ii y iii, α > 0.

Las anteriores distribuciones se conocen como distribuciones de valores ex-tremos y seran las unicas a las que pueda converger la variable M∗n, indepen-dientemente de como se distribuya F .

Las familias de distribuciones Frechet, Gumbel y Weibull se pueden combinaren una unica familia con funcion de distribucion

G(z) = exp

{−[1 + ξ

(z − µσ

)]−1/ξ}

(1.5)

definida en {z : 1 + ξ (z − µ) /σ > 0}, donde los parametros de localizacion,escala y forma satisfacen, respectivamente, −∞ < µ < ∞, σ > 0 y −∞ < ξ <∞. Esta familia de distribuciones se conoce como familia de distribucionesde valores extremos generalizada (GEV) (o familia de distribuciones deVon Mises).

La especificacion de ξ determinara el comportamiento de la cola de la distribu-cion, de forma que segun el valor que tome este parametro se tendra una de lassiguientes distribuciones:

Page 11: An alisis de Valores Extremos - Universidad de Granada

Gumbel si ξ = 0

Frechet si ξ > 0

Weibull si ξ < 0

De esta forma, el teorema 1.1.1 se replanteara como sigue:

Teorema 1.1.2 Si existen sucesiones de constantes {an > 0} y {bn} tales que

Pr{(Mn − bn) /an 6 z} → G(z), cuando n→∞, (1.6)

para una distribucion G no degenerada, entonces G pertenece a la familia dedistribuciones GEV,

G(z) = exp

{−[1 + ξ

(z − µσ

)]−1/ξ}. (1.7)

El concepto de max-estabilidad, que se introduce a continuacion, esta estrecha-mente relacionado con el teorema anterior.

Definicion 1.1.1 Una distribucion G se denomina max-estable si, para todon = 2, 3..., existen constantes αn > 0 y βn tales que

Gn (αnz + βn) = G (z) . (1.8)

Es decir, la propiedad de max-estabilidad la sastisfaran aquellas distribucionesen las que la operacion de tomar maximos muestrales conduzca a una distribu-cion identica, aunque con distintos parametros de localizacion y escala.

Esta propiedad se relaciona con el Teorema de Valores Extremos a partir delsiguiente resultado:

Teorema 1.1.3 Una distribucion es max-estable si y solo si es una distribucionde valores extremos generalizada.

1.2. Modelos de maximos por bloques

La familia de distribuciones GEV sera util para modelizar la distribucion de losmaximos por bloques.

El procedimiento consiste en agrupar los datos en bloques de igual tamano y,a continuacion, ajustar la distribucion GEV al conjunto de los maximos corres-pondientes a cada uno de los bloques.

El principal problema que presenta este metodo reside en la eleccion del tamanode los bloques, para la cual habra que encontrar un equilibrio entre el sesgo yla varianza.

Page 12: An alisis de Valores Extremos - Universidad de Granada

La eleccion de bloques muy pequenos conducira a una pobre aproximacion delmodelo, con lo que se aumentara el sesgo al estimar y extrapolar. Por el con-trario, la eleccion de bloques demasiado grandes aumentara la varianza de lasestimaciones.

Por cuestiones practicas, en secuencias de datos temporales mensuales, se suelentomar bloques de longitud anual, de esta manera los maximos se distribuyen demanera similar en cada uno de los bloques.

1.2.1. Estimacion de los parametros de la distribucion GEV

Sean Z1, ..., Zk v.a.i.i.d. con distribucion GEV. La funcion de log-verosimilitudpara ξ 6= 0 es

logL(µ, σ, ξ) =− k log σ − (1 + 1/ξ)

k∑i=1

log

[1 + ξ

(zi − µσ

)]

−k∑i=1

[1 + ξ

(zi − µσ

)]−1/ξ

,

con

1 + ξ

(zi − µσ

)> 0, para i = 1, ..., k, (1.9)

mientras que para el caso ξ = 0,

logL (µ, σ) = −k log σ −k∑i=1

(zi − µσ

)−

k∑i=1

exp

{−(zi − µσ

)}. (1.10)

La maximizacion de estas ecuaciones no tiene solucion analıtica; sin embargo,para un conjunto dado de datos, la maximizacion se obtiene de manera directausando algoritmos numericos de optimizacion.

1.2.2. Niveles de retorno

Se denomina niveles de retorno a los cuantiles de la distribucion de valoresextremos generalizada; se notaran como zp y se obtendran como la inversa dela funcion de distribucion GEV:

zp =

µ− σ

ξ

[1− {− log (1− p)}−ξ

], para ξ 6= 0

µ− σ log {− log (1− p)} , para ξ = 0,(1.11)

Page 13: An alisis de Valores Extremos - Universidad de Granada

de forma que zp es el nivel de retorno asociado al periodo de retorno 1/p, es decir,se espera que el nivel zp sea excedido en promedio una vez cada 1/p unidadesde tiempo. Equivalentemente, zp sera excedido en una unidad de tiempo conprobabilidad p.

La inferencia de los niveles de retorno, para una probabilidad p dada, se llevara acabo por sustitucion directa de las estimaciones de los parametros del modelo.

1.3. Modelos de excedencias de umbrales

1.3.1. Introduccion

Modelizar unicamente maximos de bloques es una aproximacion poco eficienteen el analisis de valores extremos si algunos de los bloques contienen eventosmas extremos que el resto. En este caso, sera adecuado el uso de modelos deexcedencias de umbrales.

Sea X1, X2, ... una secuencia de variables aleatorias independientes e identica-mente distribuidas con funcion de distribucion marginal F . Se considerara unevento extremo aquel que sobrepase el valor de un umbral u y se notaran lasexcendencias de este umbral como Y = X − u.

De esta forma, el comportamiento de las excedencias de X sobre el umbral uvendra dado por la probabilidad condicionada:

Pr{X > u+ y|X > u} =1− F (u+ y)

1− F (u), y > 0. (1.12)

Si se conociera la distribucion F , la distribucion de las excedencias de umbralserıa igualmente conocida; sin embargo, esto no sucede en la practica, por loque sera necesario el uso de la distribucion GEV como aproximacion.

1.3.2. Distribucion de Pareto generalizada

La distribucion de Pareto generalizada se utilizara como aproximacion para ladistribucion lımite de las excedencias de umbrales.

Teorema 1.3.1 Sea X1, X2, ... una secuencia de variables aleatorias indepen-dientes con distribucion comun F, y sea

Mn = max{X1, ..., Xn}. (1.13)

Notaremos por X a un termino arbitrario Xi de esta secuencia y se supondra queF satisface el teorema 1.1.2, es decir,

Pr{Mn 6 z} ≈ G (z) , cuando n→∞, (1.14)

donde

Page 14: An alisis de Valores Extremos - Universidad de Granada

G (z) = exp

{−[1 + ξ

(z − µσ

)]−1/ξ}

(1.15)

para µ, σ > 0 y ξ. Entonces, para un umbral u suficientemente grande, la funcionde distribucion de (X − u), condicionada a X > u, tendra la forma

H (y) =

1−

(1 +

ξy

σ

)−1/ξ

, y > 0 si ξ 6= 0

1− exp(− yσ

), y > 0 si ξ = 0,

(1.16)

estando definida en {y : y > 0 y(

1 + ξyσ

) 1ξ

> 0}, donde

σ = σ + ξ (u− µ) . (1.17)

Esta familia se denomina familia de distribuciones de Pareto generaliza-da, y viene caracterizada por los parametros de escala σ y de forma −∞ < ξ <+∞.

Segun el teorema anterior, si los maximos por bloques siguen una distribucionG, entonces la distribucion de las excedencias de umbral se encuentra dentro dela familia de distribuciones de Pareto generalizada.

El comportamiento de la distribucion de Pareto generalizada esta determinadopor el parametro ξ:

Si ξ < 0, la distribucion de los excesos tiene como lımite superior u− σ/ξ.

Si ξ ≥ 0, la distribucion no tiene lımite superior. En concreto, para el casoξ > 0 se tiene la distribucion de Pareto ordinaria.

En el caso en el que ξ = 0, la distribucion se corresponde con una exponencialde parametro 1/σ.

A partir de este punto, por simplicidad en la notacion, el parametro de escalade la distribucion de Pareto Generalizada, σ, pasara a notarse como σ.

1.3.3. Estimacion de los parametros de la distribucion dePareto generalizada

Dado un valor del umbral u y el numero de datos, k, de la muestra originalX1, ..., Xn que sobrepasan el umbral, la estimacion de los parametros σ y ξ sepuede llevar a cabo mediante diferentes metodos.

Metodo de maxima verosimilitud

El logaritmo de la funcion de verosimilitud para una muestra y1, ..., yk de varia-bles aleatorias independientes e identicamente distribuidas con distribucion dePareto generalizada viene dado por

Page 15: An alisis de Valores Extremos - Universidad de Granada

logL (σ, ξ) = −k log σ −(

1

ξ+ 1

) k∑i=1

log

(1 +

ξyiσ

), si ξ 6= 0 (1.18)

logL (σ, ξ) = −k log σ − 1

σ

k∑i=1

yi, si ξ = 0. (1.19)

Para maximizar esta funcion; en el caso en que ξ 6= 0, sera necesario llevar acabo la siguiente reparametrizacion:

(σ, ξ)→ (τ, ξ) con τ =σ

ξ,

con lo que se tiene

logL (τ, ξ) = −k log ξ + k log τ −(

1

ξ+ 1

) k∑i=1

log (1 + τyi) .

Los estimadores maximo-verosımiles τMLk,n y ξML

k,n se obtienen a partir de la ecua-cion

1

τMLk,n

(1

ξMLk,n

+ 1

)1

k

k∑i=1

yi1 + τML

k,n yi= 0,

donde

ξMLk,n =

1

k

k∑i=1

log(1 + τML

k,n yi),

Para la obtencion de las estimaciones de los parametros sera necesario utili-zar tecnicas numericas, debido a que la maximizacion de la funcion de log-verosimilitud no se puede llevar a cabo de forma analıtica.

Metodo de los momentos ponderados

Los momentos ponderados de una variable aleatoria Y con funcion de distribu-cion F se definen como

Mp,r,s = E {Y p [F (Y )]r

[1− F (Y )]s} ,

para p, r y s numeros reales. Para el caso de la distribucion de Pareto generali-zada se considerara p = 1, r = 0 y s = 0, 1, 2, ..., obteniendose

Page 16: An alisis de Valores Extremos - Universidad de Granada

M1,0,s =σ

(s+ 1) (s+ 1 + ξ), para ξ < 1, (1.20)

siendo el equivalente muestral

M1,0,s =1

k

k∑j=1

(1− j

k + 1

)syj,k.

Los estimadores de los parametros se obtienen resolviendo (1.20) para s = 0 ys = 1:

ξPWM = 2− M1,0,0

M1,0,0 − 2M1,0,1

,

σ =2M1,0,0M1,0,1

M1,0,0 − 2M1,0,1

.

La aplicacion de este metodo presenta algunos problemas. En el caso en queξ ≥ 1, los momentos no existen; y para el caso en el que ξ < 0, las estimacionespueden ser inconsistentes con los datos observados.

Metodo del percentil basico

Este metodo es valido en el caso en que ξ 6= 0; en el caso contrario, el parametroσ se podra estimar de forma eficiente mediante el metodo de maxima verosimi-litud.

Se consideraran dos estadısticos de orden, Yi,k y Yj,k, correspondientes a lamuestra Y1, ..., Yk. La funcion de distribucion acumulativa de una distribucionde Pareto generalizada, evaluada en estos estadısticos para sus correspondien-tes valores percentuales, da como resultado un sistema de ecuaciones con dosincognitas:

1− (1 + τi,jyi,k)− 1

ξi,j= pi,n, (1.21)

1− (1 + τi,jyj,k)− 1

ξi,j= pj,n, (1.22)

donde τ = ξ/σ y pi,n = in+1 .

Resolviendo este sistema, se obtiene

ξi,j =log (1 + τi,jyi,k)

− log (1− pi,n),

σi,j =ξi,jτi,j

.

Page 17: An alisis de Valores Extremos - Universidad de Granada

Los estimadores finales se obtienen calculando ξi,j y σi,j para todos los pares deestadısticos de orden Yi,k < Yj,k:

ξEPM = mediana{ξi,j ; i < j

},

σEPM = mediana {σi,j ; i < j} .

1.3.4. Seleccion del umbral

Para identificar eventos extremos se definira un umbral u; los eventos que su-peren este umbral, {xi : xi > u}, se etiquetaran como x(1), ..., x(k), y se definiranlas excedencias de umbrales yj = x(j) − u, para j = 1, ..., k.

Teniendo en cuenta el teorema (1.3.1), los valores yj se consideraran realizacio-nes independientes de una variable aletoria cuya distribucion se podra aproximarmediante la familia de Pareto generalizada.

Para la eleccion del umbral habra que tener en cuenta que una eleccion deun umbral muy bajo aumentarıa el sesgo del modelo, mientras que la eleccionde un umbral demasiado alto generarıa un numero de excedencias muy pequeno,con lo que aumentarıa su varianza.

Se dispone de dos metodos para la eleccion del umbral:

Metodo 1: Este metodo se basa en la esperanza de la distribucion de Paretogeneralizada, de forma que si Y sigue esta distribucion con parametros σ y ξ,

E(Y ) =σ

1− ξ, con ξ > 1. (1.23)

Si suponemos que la distribucion de Pareto generalizada es valida para modeli-zar las excedencias de un cierto umbral al que notaremos u0, para un terminoarbitrario X de la serie se tendra:

E (X − u0|X > u0) =σu0

1− ξ, con ξ > 1,

donde σu0 sera el parametro de escala de la distribucion de las excedencias delumbral u0. Es decir, si la distribucion de Pareto es valida para las excedenciasdel umbral u0, sera igualmente valida para cualquier umbral u > u0 medianteuna sustitucion del parametro de escala por σu. De esta forma, y teniendo encuenta (1.17) , se tiene

E (X − u|X > u) =σu

1− ξ=σu0

+ ξu

1− ξ. (1.24)

Se espera que los valores proporcionados por esta expresion varıen linealmen-te al variar u en los niveles en los que el ajuste de la distribucion de Paretogeneralizada es apropiada, lo que se traduce en el siguiente procedimiento.

Page 18: An alisis de Valores Extremos - Universidad de Granada

Se representaran los puntos{(u,

1

nu

nu∑i=1

(x(i) − u

)): u < xmax

},

donde x(1), ..., x(nu) son las observaciones que exceden u, y xmax es el maximoXi. Este grafico se denomina grafico de vida media residual.

Se tomara como umbral el valor maximo para el que el grafico muestre unatendencia lineal.

Metodo 2 Consiste en ajustar la distribucion de Pareto generalizada en unrango de umbrales y elegir el umbral adecuado segun la estabilidad de losparametros estimados.

Segun la caracterizacion de la familia de distribuciones de Pareto generalizada,si una distribucion de Pareto generalizada es util para modelizar las excedenciasde un umbral u0, las excedencias de un umbral u mas alto que el anterior tam-bien seguiran una distribucion de Pareto generalizada, siendo sus parametros deforma identicos, mientras que sus parametros de escala satisfacen la siguienterelacion:

σu = σu0 + ξ (u− u0) si ξ 6= 0. (1.25)

En el caso en que ξ = 0 se realizara la siguiente reparametrizacion:

σ∗ = σu − ξu.

Se representaran σ∗ y ξ frente a u. Las estimaciones de ambos parametrosdeberıan ser constantes por encima de u0 si u0 es un umbral valido, para excen-dencias que siguen la distribucion de Pareto generalizada.

Los intervalos de confianza para ξ se obtendran a traves de la matriz de varianzas-covarianzas V , mientras que los intervalos de confianza para σ∗ requieren el usodel siguiente resultado:

Teorema 1.3.2 (Metodo Delta). Sea θ el estimador maximo-verosımil de θcon matriz de varianzas-covarianzas Σθ. Sea ψ = h (θ) un vector de parametrosde dimension r definido como funcion de θ. Entonces,

ψ ∼ Nr(ψ;5Tθ ψΣθ 5θ ψ

),

donde 5θψ es la matriz de orden k× r de las derivadas parciales de ψ respectoθ, dada por

5θψ =

∂ψ1

∂θ1

∂ψ2

∂θ1· · · ∂ψr

∂θ1∂ψ1

∂θ2

∂ψ2

∂θ2· · · ∂ψr

∂θ2...

.... . .

...∂ψ1

∂θk

∂ψ2

∂θk· · · ∂ψr

∂θk

.

Page 19: An alisis de Valores Extremos - Universidad de Granada

Por tanto, se tendrıa que

V ar (σ∗) ≈ 5σ∗TV σ∗,

donde

5σ∗T =

[∂σ∗

∂σu,∂σ∗

∂ξ

]= [1,−u] .

1.3.5. Niveles de retorno

Se denomina niveles de retorno, xk, a los cuantiles de la distribucion de valoresextremos, con 1/k la probabilidad de que xk sea superado al menos una vez enuna unidad de tiempo.

Suponemos que las excedencias de un umbral u siguen una distribucion de Paretogeneralizada; es decir, para x > u,

Pr {X > x|X > u} =

[1 + ξ

(x− uσ

)]−1/ξ

. (1.26)

Por lo que, notando ζu = Pr [X > u], el nivel xk que se excede en promediocada k observaciones es la solucion de la ecuacion

ζu

[1 + ξ

(xk − uσ

)]−1/ξ

=1

k. (1.27)

Despejando el termino xk, se tiene que el nivel de retorno para excedencias deumbrales viene dado por:

xk =

u+σ

ξ

[(kζu)

ξ − 1]

para ξ 6= 0,

u+ σ log (kζu) para ξ = 0.(1.28)

Para realizar la estimacion de los niveles de retorno se sustituiran los parametrospor sus estimaciones maximo verosımiles.

Un concepto relacionado con los niveles de retorno es el tiempo de retorno, olos tiempos en los que se superarıa un cierto umbral; estos tiempos se definenrecursivamente como:

τ1 = mın {k : Xk > u} ,

τr = mın {k > τr−1 : Xk > u} , r > 1.

Page 20: An alisis de Valores Extremos - Universidad de Granada

1.4. Modelizacion de extremos en secuencias dedatos dependientes

Hasta ahora se ha tenido en cuenta que los datos se habıan obtenido a partirde sucesiones de variables aleatorias independendientes; sin embargo, en la ma-yorıa de casos practicos esta asuncion no es realista. En estos casos, los usualsera considerar que la serie es estacionaria.

Una serie se considerara estacionaria si su distribuciones de probabilidad se man-tienen estables a lo largo del tiempo. En este caso, las variables seran mutua-mente dependientes, pero sus propiedades estocasticas permaneceran constantesa lo largo del tiempo.

La estacionariedad se define de como:

Teorema 1.4.1 Sea X1, X2, ... una serie de tiempo. Esta serie se dice esta-cionaria si para cada conjunto de ındices 1 ≤ t1 < t2 < · · · < tm, la distri-bucion conjunta de (Xt1 , Xt2 , ..., Xtm) coincide con la distribucion conjunta de(Xt1+h, Xt2+h, ..., Xtm+h), para cualquier h.

Coles (2001) da la siguiente definicion:

Definicion 1.4.1 Una serie estacionaria X1, X2, ... satisface la condicion delos D (un) si, para todo i1 < ... < ip < ji < ... < jq con ji − ip > l, se tiene que

|P [Xi1 ≤ un, ..., Xip ≤ un, Xj1 ≤ un, ..., Xjq ≤ un]

− P [Xi1 ≤ un, ..., Xip ≤ un]P [Xj1 ≤ un, ..., Xjq ≤ un] | ≤ α (n, 1) ,

donde α (n, ln) → 0 para alguna sucesion ln de forma que lnn → 0 cuando

n→∞.

Para secuencias de variables independientes la diferencia en probabilidad ante-rior es igual a cero. En el caso en que las variables no son independientes, siestan suficientemente alejadas entre sı la diferencia en probabilidad es lo su-ficientemente cercana a cero para no tener efecto en las leyes de lımites paraextremos, lo que se resume en el siguiente teorema:

Teorema 1.4.2 Sea X1, X2, ... un proceso estacionario y sea Mn = max {X1, ..., Xn}.Entonces, si {an > 0} y {bn} son secuencias de constantes tales que

Pr {(Mn − bn) /an ≤ z} → G (z) ,

donde G es una funcion de distribucion no degenerada y la condicion D (un)se satisface con un = anz + bn para cualquier numero real z, G pertenece a lafamilia de distribuciones de valores extremos generalizada.

Este resultado implica que dada una sucesion de variables suficientemente leja-nas y dependientes entre sı (en el sentido especificado por la condicion D (un)),

Page 21: An alisis de Valores Extremos - Universidad de Granada

los valores maximos de estas series estacionarias se distribuyen segun la mismadistribucion lımite que en el caso de sucesiones de variables independientes. Sinembargo, los parametros de la distribucion se veran afectados por la dependen-cia.

Teorema 1.4.3 Sea X1, X2... un proceso estacionario y sea X∗1 , X∗2 , ... una su-

cesion de variables independientes con la misma distribucion marginal. Se defineMn = max {X1, ..., Xn} y M∗n = max {X∗1 , ..., X∗n}. Bajo condiciones adecuadasde regularidad,

Pr {(M∗n − bn) /an ≤ z} → G1 (z)

cuando n ← ∞ para sucesiones {an > 0} y {bn}, donde G1 es una funcion dedistribucion no degenerada, si y solo si

Pr {(Mn − bn) /an ≤ z} → G2 (z) ,

dondeG2 (z) = Gθ1 (z)

para una constante θ tal que 0 < θ ≤ 1.

De esta forma, si M∗n sigue una distribucion GEV de parametros (µ, σ, ξ), Mn

seguira una distribucion GEV con parametros (µ∗, σ∗, ξ) donde

µ∗ = µ− σ

ξ

(1− θ−ξ

),

σ∗ = σθξ.

Page 22: An alisis de Valores Extremos - Universidad de Granada
Page 23: An alisis de Valores Extremos - Universidad de Granada

Capıtulo 2

Teorıa de valores extremosmultivariante

2.1. Introduccion

En el estudio de extremos para dos o mas procesos, si bien cada uno de ellos pue-de ser modelizado individualmente usando tecnicas univariantes, sin embargo,tambien sera interesante estudiar las relaciones que puedan existir entre ellos.En particular, puede ocurrir que alguna combinacion de estos procesos sea demayor interes que los procesos individuales.

Sean Xi = (Xi,1, ..., Xi,p) , i ∈ {1, ..., n}, una secuencia de vectores aleatorios in-dependientes e identicamente distribuidos con funcion de distribucion conjuntaF y marginales F1, ..., Fp. El vector de maximos, que se notara como M , parael caso multivariante se define como:

Mj = maxi∈{1,...,n}

{Xi,j} ; para j = 1, ..., p,

M = {M1, ...,Mp} .

Este vector no se tiene que corresponder necesariamente con un vector observadoen la serie original.

2.2. Copulas

En esta seccion se describe uno de los procedimientos mas usados para repre-sentar la estructura de dependencia existente entre varias funciones de densidadunivariantes.

A traves las copulas, se podran analizar y estimar de forma separada las compo-nentes univariantes y la estructura de dependencia multivariante. La union de

23

Page 24: An alisis de Valores Extremos - Universidad de Granada

las diferentes estimaciones conducira a una estimacion de la funcion de densidadconjunta.

Sea X = (X1, ..., Xp) un vector aleatorio con funcion de distribucion F .

Supongamos que cada una de las variables Xj es continua con funcion de dis-tribucion marginal Fj ; entonces, aplicando una transformacion de probabilidad,Yj = Fj (Xj) tendra distribucion uniforme (0, 1).

La funcion de distribucion C del vector Y = (Y1, ..., Yp) es la copula de F . Esdecir,

C (u) = P (Y1 ≤ u1, ..., Yp ≤ up) = F(F−1

1 (u1) , ..., F−1p (up)

),

donde F−1j es la funcion cuantil de Fj .

Se podra volver a la distribucion original desde la copula mediante la transfor-macion cuantil:

F (X) = C (F1 (x1) , ..., Fp (xp)) .

2.3. Distribucion de valores extremos multiva-riante

2.3.1. Caso bivariante

Coles (2001) propone una caracterizacion asintotica de la distribucion de valoresextremos, a partir de la funcion de distribucion conjunta deM∗ = (M1/n,M2/n):

Teorema 2.3.1 Sea M∗ = (M∗1 ,M∗2 ), con (Xi1, Xi2), i = 1, ..., n, vectores

independientes con distribucion marginal Frechet. Entonces, si para n→∞

Pr {M∗1 ≥ x1,M∗2 ≥ x2}

d−→ G (x1, x2) , (2.1)

donde G es una funcion de distribucion no degenerada, se tiene que

G (x1, x2) = exp {−V (x1, x2)} , x1 > 0, x2 > 0,

donde

V (x1, x2) = 2

∫ 1

0

max

x1,

1− ωx2

)dH (ω) (2.2)

y H es una funcion de distribucion en [0, 1] que satisface la condicion∫ 1

0

ωdH (ω) = 1/2.

A diferencia del caso univariante, esta distribucion engloba a infinitas familiasde distribuciones.

Page 25: An alisis de Valores Extremos - Universidad de Granada

Ejemplo 1

Si se distribuye la masa de la fucion H en los puntos ω = 0 y ω = 1, se obtiene

V (x1, x2) = x−11 + x−1

2

y la correspondiente distribucion de valores extremos generalizada sera

G (x1, x2) = exp{−{x−1

1 + x−12

}}, x1 > 0, x2 > 0.

Esta funcion se puede factorizar en funcion de x1 y x2, por lo que ambas variablesserıan independientes.

Ejemplo 2

Si se concentra toda la masa de la funcion H en ω = 0,5, se obtiene,

G (x1, x2) = exp{−max

(x−1

1 , x−12

)}, x1 > 0, x2 > 0,

que corresponderıa al caso de variables perfectamente dependientes, X1 = X2.

La clase completa de funciones de distribucion de valores extremos bivariantese puede obtener mediante una generalizacion de las distribuciones marginales.Tomando

x1 =

[1 + ξx1

(x1 − µx1

σx1

)]1/ξx1

,

x2 =

[1 + ξx2

(x2 − µx2

σx2

)]1/ξx2

,

se obtiene

G (x1, x2) = exp {−V (x1, x2)} ,

donde la funcion V satisface (2.2) para cualquier H.

Las distribuciones marginales seran GEV con parametros(µxj , σxj , ξxj

)para

j = 1, 2.

La funcion V sera homogenea de orden -1, en el sentido de que para cualquierconstante a > 0 se tiene

V(a−1x1, a

−1x2

)=2

∫ 1

0

max

a−1x1,

1− ωa−1x2

)=2a

∫ 1

0

max

x1,

1− ωx2

)= aV (x1, x2) .

Page 26: An alisis de Valores Extremos - Universidad de Granada

2.3.2. Extension para n variables

La siguiente caracterizacion del comportamiento lımite del vector de maximosse va a desarrollar basandose en la pertenencia a un dominio de atraccion.

Sea x = (x1, ..., xp) ∈ Rd. Si Xi = (Xi,1, ..., Xi,p) , i = 1, ..., n, son vectores alea-torios independientes e identicamente distribuidos de dimension p con funcionde distribucion F , se puede considerar la existencia de secuencias (an)n y (bn)npertenecientes a Rp, con an,j > 0 y bn,j ∈ R, ∀ j = 1, ..., p, y una funcion dedistribucion G con marginales no degeneradas tales que, cuando n→∞,

Pr

{(max

i=1,...,nXi − bn

)/an 6 x

}= Fn (anx + bn)→ G (x) ,

donde G es la funcion de distribucion multivariante de valores extremos y Fpertenece al dominio de atraccion de G para el maximo.

Ejemplo 1

Se considera la funcion de distribucion normal multivariante FN , con marginalesunivariantes N (0, 1) y correlaciones EXiXj < 1,∀i, j = 1, ..., p. El dominio deatraccion sera el producto de distribuciones marginales Gumbel:

FnN (anx + bn)→ G (x) =

p∏j=1

exp{−e−xj

},

con constantes

an = (2 log n)−1/2

,

bn = bn1,

donde

bn = (2 log n)1/2 − 1/2 (log (log n) + log 2π) / (2 log n)

1/2

1 = (1, ..., 1) .

2.3.3. Transformaciones

Algunas transformaciones que seran de utilidad son las siguientes:

Transformacion de un modelo log-Gumbel en un modelo Frechet. Unavariable aleatoria Gumbel con parametros de localizacion y escala log σ y 1/αse corresponde con una distribucion Frechet con parametros de forma y escalaα y σ, respectivamente.

Transformacion de un modelo Weibull en un modelo Frechet. Unavariable aleatoria Weibull con parametros de forma y escala −α y 1/σ se corres-

Page 27: An alisis de Valores Extremos - Universidad de Granada

ponde con una distribucion Frechet con parametros de forma y escala α y σ,respectivamente.

Trasformacion cuantil. Si U es una variable aleatoria distribuida uniforme-mente en (0, 1), entonces F−1 (U) tiene funcion de distribucion F .

Transformacion de probabilidad. De forma inversa a la transformacioncuantil, si X es una variable aleatoria con funcion de distribucion continua F ,entonces F (X) tiene funcion de distribucion uniforme (0,1).

2.4. Convergencia del vector de maximos

La convergencia debil de una secuencia de vectores aleatorios implica la conver-gencia debil de cada uno de los componentes. Por lo tanto, de la misma maneraque en el caso univariante, sera razonable aplicar transformaciones a cada unode los vectores marginales y considerar la secuencia de variables aleatorias

(Mn − bn,j

an,j: j = 1, ..., p

),

para constantes de normalizacion an,j > 0 y bn,j . Cada uno de los componentes(Mn − bn,j/an, j), j = 1, ..., p, converge debilmente cuando n→∞ a una distri-bucion max-estable univariante, si se cumplen las condiciones de convergencia.

Sin embargo, la convergencia de cada una de las p componentes es estrictamen-te mas debil que la convergencia del vector conjunto de maximos. Se necesi-tara ademas establecer la estructura de dependencia de la distribucion conjuntaF de los vectores aleatorios Xi. Una manera de describir esta dependencia sera atraves de copulas:

Pr [Xi 6 x] = F (x) = C1 (F1 (x1) , ..., Fp (xp)) .

Suponiendo continuidad de las funciones marginales, la copula C1 de la funcionde distribucion F es unica y puede obtenerse como la funcion de distribucionconjunta de los vectores aleatorios (F1 (Xi1) , ..., Fp (Xip)).

La copula del vector de maximos y, por tanto, de cualquier vector creado me-diante componentes transformadas, vendra dada por

Ci (u) ={C1

(u

1/i1 , ..., u1/i

p

)}i.

Puesto que los vectores de maximos convergen en distribucion a una distribucionlımite no degenerada, la secuencia de copulas Ci tambien debe converger.

La copulas obtenidas a traves de los lımites de Ci cuando i→∞ se denominancopulas de valores extremos, esto es, una copula C es una copula de valoresextremos si existe una copula C1 tal que, cuando i→∞,

lımn→∞

{C1

(u

1/i1 , ..., u1/i

p

)}i= C (u1, ..., up) .

Page 28: An alisis de Valores Extremos - Universidad de Granada

La copula C1 forma parte del dominio de atraccion de C, al pertener esta ultimaa la clase de posibles copulas lımite.

Una copula C es max-estable si, para todo u ∈ [0, 1]d

y k = 1, 2, ...,

C (u) ={C(u

1/k1 , ..., u

1/kd

)}k.

Por tanto, la clase de copulas de valores extremos coincide con la clase de copulasmax-estables.

En resumen, las distribuciones lımite no degeneradas de vectores de maximostransformados tienen marginales de valores extremos y copulas de valores ex-tremos o max-estables. En concreto, si

Pr

p⋂j=1

{Mn,j − bn,j

an,j6 xj

} ω→G (x1, ..., xd) , n→∞,

entonces,

G (x1, ..., xd) = C (G1 (x1) , ..., Gp (xp)) .

con marginales de valores extremos G1, ..., Gp y copula de valores extremos C.

2.5. Funciones de dependencia

Se partira del lımite que caracteriza a la copula de valores extremos para, acontinuacion, tomar logaritmos y aplicar una expansion lineal. De esta forma,se llegara a la expresion equivalente

lımn→∞

n{

1− C1

(1− n−1x1, ..,1− i−1xp

)}= − logC

(e−x1 , ..., e−xp

)= ` (x) , x ∈ [0,∞)

d.

El lımite ` se conoce como funcion de dependencia de cola estable de C.

Si se considera el vector aleatorio X = (X1, ..., Xp),

1− C1 (1− x1/n, ..., 1− xp/n)

= Pr [F1 (X1) > 1− x1/n ∪ ... ∪ Fp (Xp) > 1− xp/n] = ` (x) .

Esta probabilidad hace referencia al evento en el que al menos una de las pcomponentes excede un alto percentil de su distribucion.

La copula de cola, R, introducida por Schmidt and Stadtmuler (2006), plan-tea el caso opuesto donde las p componentes exceden simultaneamente un altopercentil,

Page 29: An alisis de Valores Extremos - Universidad de Granada

lımn→∞

nPr [F1 (X1) > 1− x1/n ∩ ... ∩ Fp (Xp) > 1− xp/m]

= R (x) ,

para x ∈ [0,∞)p.

Ambas funciones, ` (x) y R (x), son homogeneas.

Se aplicara la restriccion de estas funciones al 1-sımplex

∆p−1 = {(ω1, ..., ωp) ∈ [0, 1]p

: ω1 + · · ·+ ωp = 1} .

La restriccion ∆p−1 sobre ` se denomina funcion de dependencia de Pickands.Por la propiedad de homogeneidad de `,

` (x) = (x1 + · · ·xp)D (ω1, ..., ωp) , ωj =xj

x1 + · · ·+ xp.

La funcion ` (x) hace referencia a la probabilidad de la union de los eventos{Fj (Xj) > 1− xj/n}, siendo la probabilidad de cada uno de estos eventos porseparado xj/n, con xj ≤ n; como consecuencia, las cotas elementales de ` (x)seran

max (x1/n, ..., xp/n) ≤≤ Pr [F1 (X1) > 1− x1/n ∪ · · · ∪ Fp (Xp) > 1− xp/n] ≤ x1/n+ · · ·+ xp/n.

Multiplicando por n y haciendola tender a infinito, se obtiene

max (x1, ..., xp) ≤ ` (x1, ..., xp) ≤ x1 + · · ·+ xp, x ∈ [0,∞)p.

Segun esta relacion anterior, una copula de valores extremos debera satisfacerla relacion

u1 · · ·up ≤ C (u1, ..., up) ≤ max (u1, ..., ui) .

Las cotas inferior y superior de los dos casos anteriores se corresponden, respec-tivamente, con los casos extremos de independencia y dependecia perfecta.

La copula C puede ser dada en terminos de la funcion de dependencia de colaa traves de

C (u1, ..., up) = exp {−` (− log u1, ...,− log up)} , u ∈ (0, 1]p.

En teorıa de valores extremos, a menudo es conveniente estandarizar a otrasdistribuciones distintas a la uniforme (0, 1). La tres formas mas comunes son lasdistribuciones de Frechet, de Gumbel y exponencial inversa, que se representanrespectivamente como

Page 30: An alisis de Valores Extremos - Universidad de Granada

C(e−1/x1 , ..., e−1/xp

)= exp {−` (1/x1, ..., 1/xp)} , x ∈ (0,∞)

p,

C(e−e

−x1, ..., e−e

−xp)

= exp{−`(e−x1 , ..., e−xp

)}, x ∈ Rp,

(ex1 , ..., exp) = exp {−` (−x1, ...,−xp)} , x ∈ (−∞, 0)p,

2.6. Modelizacion y estimacion de parametros

2.6.1. Caso bivariante

A partir de las series de realizaciones independientes (x1,1, x2,1) , ..., (x1,n, x2,n)se obtendra la secuencia de bloques de maximos (z1,1, z2,1) , ..., (z1,m, z2,m).

Las series de bloques de maximos se consideraran de forma independiente yse modelizaran como en el caso univariante usando la distribucion GEV, esdecir, cada zi,j sera tratada como una realizacion independiente de una variablealeatoria Zi, para cada i = 1, 2, donde

Zi ∼ GEV (µi, σi, ξi) .

A continuacion se obtendran las estimaciones de maxima verosimilitud de losparametros segun la metodologıa univariante, de forma que la variable transfor-mada

Zi =

[1 + xii

(Zi − µiσi

)]1/xii

se distribuye aproximadamente segun una distribucion Frechet estandar. Los pa-res (z1,j , z2,j) se obtienen sustituyendo en la expresion anterior las observaciones(z1,j , z2,j).

La funcion de densidad de este modelo es

g (x, y) = {Vx (x, y)Vy (x, y)− Vxy (x, y)} exp {−V (x, y)} , x > 0, y > 0,

donde Vx, Vy y Vx,y son las derivadas parciales y mixtas de V , respectivamente.

Seleccionando un modelo con parametro θ para V , y a partir de su funcion deverosimilitud

L (θ) =

m∏i=1

g (z1,i, z2,i) ,

se obtendran las estimaciones de maxima verosimilitud de θ.

Page 31: An alisis de Valores Extremos - Universidad de Granada

2.6.2. Extension para n variables. Estimacion mediantecopulas

Sean xi = (xi,1, .., xi,d), i = 1, ...k, realizaciones de una variable que sigue unadistribucion de valores extremos G con vectores de parametros de localizacion,escala y forma µ, σ, ξ, respectivamente.

A traves de la copula G se tiene la representacion

G (x) = C((Gµj ,σj ,ξj (xj)

)j6d

),

donde Gµj ,σj ,ξj es la j-esima distribucion marginal de G.

Para estimar G se deberan construir estimadores de µ, σ, ξ y C. Las estimacionesde los parametros se calcularan de forma independiente para cada funcion dedistribucion marginal Gµj ,σj ,ξj mediante maxima verosimilitud.

La estimacion de C se basara en los vectores transformados:

zi =(Gµj ,σj ,ξj (xi,j)

)j6d′

.

2.7. Niveles de retorno

2.7.1. Caso bivariante

Se denominara variable estructural a la operacion

Z = φ (Mx1,Mx2

) ,

con funcion de distribucion

Pr {Z 6 z} =

∫Az

g (x1, x2) dx1x2,

donde Az = {(x1, x2) : φ (x1, x2) 6 z}.El nivel de retorno en N unidades de tiempo de la variable estructural Z es lasolucion de

GZ (z) = 1− 1/N,

donde GZ es la funcion de distribucion de Z.

2.7.2. Extension para n variables. Medida de intensidad

Aplicando la teorıa univariante se tiene que el tiempo de retorno de la ob-servacion Xj es Yj = 1/ {1− Fj (Xj)}, con distribucion de Pareto, ya quePr [Yj > y] = Pr [Fj (Xj) > 1− 1/y] = 1/y para y 6 1.

Page 32: An alisis de Valores Extremos - Universidad de Granada

Suponiendo que la copula C1 se encuentra en el dominio de atraccion de unacopula de valores extremos con funcion de dependencia `, el vector aleatorioY = (Y1, ..., yp) satisface

t {1− C1 (1− x1/t, ..., 1− xp/t)} = t Pr

[p∪j=1{Yj > t/xj}

]= t Pr [Y/t ∈ ([0,∞]

p \ [0, 1/x])]→ ` (x) , t→∞.

En el espacio Ed = [0,∞]p \ {0}, existe una medida µ, que se conocera como

medida de intensidad, tal que

E

[n∑i=1

I (Yi/n ∈ ·)

]= nPr [Y/n ∈ ·] v→µ (·) , n→∞,

siendo lımn→∞

nE [f (Y/n)] =∫Ep f (x) dµ (x) para toda funcion f continua y aco-

tada en Ep y que se hace cero en su origen, de forma que, cuando n crece, elvector Y/n es desplazado cerca del origen, en las cercanıas donde la funcion fes cero. Por tanto, la medida de intensidad solo afecta a la cola superior de ladistribucion de Y .

La medida µ representa el numero esperado de observaciones en el suconjuntosobre el que se aplique esta medida.

La funcion ` de dependencia actua como funcion de distribucion de la medidade intensidad, de forma que

` (x) = µ ([0,∞]p \ [0, 1/x]) .

2.8. Modelos de excedencias de umbrales

La aproximacion mediante metodos de maximos por bloques presenta varios in-covenientes; en primer lugar, todos los datos excepto el maximo de cada bloqueson descartados; ademas, el vector compuesto por estos maximos no se corres-ponde con observaciones reales.

Una aproximacion mas flexible y eficiente es considerar las excedencias sobre unumbral.

2.8.1. Caso bivariante

Sean (x1,1, x1,2) , ..., (xn,1, xn,2) realizaciones independientes de un par de varia-bles aleatorias (X1, X2) con funcion de distribucion conjunta F .

Para dos umbrales ux1 y ux2 se obtendran dos funciones de probabilidad dePareto con sus correspondientes parametros para cada una de las distribucionesmarginales de F .

Mediante la siguiente transformacion,

Page 33: An alisis de Valores Extremos - Universidad de Granada

X1 = −

(log

{1− ζx1

[1 +

ξx1 (X1 − ux1)

σx1

]−1/ξx−1})−1

,

X2 = −

(log

{1− ζx2

[1 +

xix2(X2 − x2)

σx2

]−1/ξx2})−1

,

se obtiene el par(X1, X2

)con funcion de distribucion conjunta F y marginales

Frechet para X1 > ux1y X2 > ux2

. Por tanto,

F (x1, x2) ={Fn (x1, x2)

}1/n

≈ [exp {−V (x1/n, x2/n)}]−1/n

= exp {−V (x1, x2)} ,

por la propiedad de homogeneidad de V . Finalmente, dado que F (x1, x2) =F (x1, x2), se tiene que

F (x1, x2) ≈ G (x1, x2) = exp {−V (x1, x2)} , x1 > ux1 , x2 > ux2 .

La inferencia en este caso es complicada, ya que dado un par bivariante, puedeocurrir que solo uno de sus componentes supere el umbral. Para solucionar esteproblema, se definen los siguientes espacios:

R0,0 = (−∞, ux1)× (−∞, ux2) ,

R1,0 = [ux1 ,∞)× (−∞, ux2) ,

R0,1 = (−∞, ux1)× [ux2

,∞) ,

R1,1 = [ux1,∞)× [ux2

∞) ,

de forma que, por ejemplo, un punto (x1, x2) ∈ R0,1 si la componente x1 nosupera el umbral ux1

y la componente x2 supera el umbral ux2.

La inferencia del modelo aproximado podra llevarse a cabo por maxima verosimi-litud para puntos pertenecientes a la region R1,1; para puntos en otras regiones,

al no poder aplicarse F , sera necesario censurar la componente correspondienteen la funcion de verosimilitud.

Por ejemplo, si se supone que (x1, x2) ∈ R1,0, entonces, x1 > ux1pero x2 < ux2

y los datos solo proporcionaran informacion de la componente x1; de esta forma,la contribucion a la verosimilitud de este punto sera

Pr {X1 = x1, X2 ≤ ux2} =

∂F

∂x

∣∣∣∣(x1,ux2)

.

Page 34: An alisis de Valores Extremos - Universidad de Granada

Ası, para cada una de las regiones se usara la funcion de verosimilitud:

L (θ; (x1,1, x1,2) , ..., (xn,1, xn,2)) =

n∏i=1

ψ (θ; (xi,1, xi,2)) ,

donde

ψ (θ; (x1, x2)) =

∂2F

∂x1∂x2

∣∣∣∣(x1,x2)

(x1, x2) ∈ R1,1

∂F

∂x1

∣∣∣∣(x1,ux2)

(x1, x2) ∈ R1,0

∂F

∂x2

∣∣∣∣(ux1 ,x2)

(x1, x2) ∈ R0,1

F (ux1, ux2

) (x1, x2) ∈ R0,0

.

Mediante la maximizacion de la funcion de log-verosimilitud se obtendran lasestimaciones y los errores estandar de los parametros de F . De la misma formaque en el caso de maximos por bloques, la inferencia puede simplificarse llevandoa cabo estimaciones marginales para despues aplicar las transformaciones a lasvariables. De este modo, al realizar la maximizacion, la funcion de verosimilitudunicamente dependera de los parametros de V .

Se puede utilizar otro metodo alternativo si existe una variable estructural Z =φ (X1, X2); en este caso se aplicaran tecnicas univariantes de excedencias deumbrales a cada una de las series zi = φ (xi,1, xi,2).

2.8.2. Extension a n variables

Sea Xi = (Xi,1, ..., Xi,p), con i = 1, ..., n, una muestra de observaciones dedimension p, independientes e identicamente distribuidas con funcion de distri-bucion conjunta F , perteneciente al dominio de atraccion de una distribucionde valores extremos multivariante G.

Se han propuesto varios metodos de analisis de excedencias de umbrales, todosellos basados en la aproximacion de F en una region extrema definida usandolas condiciones del dominio de atraccion especificado en el siguiente teorema.

Teorema 2.8.1 Sea X un vector aleatorio de dimension p con funcion de disti-bucion F y marginales Frechet, y sea {Xi} , i = 1, ..., n, una secuencia extraıdade F. Sea tambien 1 (·) una funcion indicadora tal que 1 (z) es 1 si z ∈ C y0 en otro caso. La funcion de distribucion F pertenece al dominio de atrac-cion de una distribucion GEV multivariada con funcion de distribucion G conmarginales Frechet si y solo si

(a) lıms→∞

logF (sx)logF (s1) = logG(x)

logG(1)

(b) lıms→∞

1−F (sx)1−F (s1) = logG(x)

logG(1)

Page 35: An alisis de Valores Extremos - Universidad de Granada

(c) lıms→∞

P (X ≤ sx|X > s1) = 1− logG(1) log

(G(x)

G(mın(x,1))

)(d) El proceso puntual Nn, definido como

Nn (·) =

n∑i=1

1 (Xi/n ∈ ·) ,

converge debilmente a un proceso de Poisson no homogeneo en E = [0,∞]d\

{0} con medida de intensidad µ definida como

µ

{y ∈ E : ||y|| > r,

y

||y|| ∈ A

}=H (A)

r.

Smith et al (1997) utilizan la condicion (b) para obtener la aproximacionF (x1, ..., xp) ≈ 1 + logG (x1, ..., xp), valida en una region donde fj (xj) es cer-cana a 1 para cada xj , j = 1, ..., p. Sin embargo, este metodo presenta el in-coveniente de que cuando F es asintoticamente independiente el sesgo de laaproximacion es significativo.

Ledford y Tawn (1996) corrigen el sesgo de la aproximacion anterior usando lacondicion (a) para obtener F (x1, ..., xp) = G (x1, ..., xp), de forma que fj (xj)es cercana a 1 para cada xj , j = 1, ..., p

En ambos metodos se utiliza un modelo parametrico para G, obteniendose atraves de las aproximaciones una parametrizacion de la cola de F . Los parame-tros de los modelos se estimaran por maxima verosimilitud mediante un meca-nismo de censura. En concreto, si uj es un umbral tal que Fj (uj) es cercana a1, todas las observaciones Xi,j ≤ uj estaran censuradas a la derecha por uj ; deesta forma, la contribucion a la verosimilitud de una variable Xi es

li =∂q

∂xj1 · · · ∂xjqF (x1, ..., xp)

evaluada en (max (Xi,1, u1) , ...,max (Xi,p, up)), donde jl es el ındice de las va-riables marginales para las que Xi,jl > ujl y q es el numero de variables quecumplen la condicion. Normalmente, se consideran las Fj marginales Frechet,siendo los uj umbrales localizados en altos cuantiles de esta distribucion.

Coles y Tawn (1991) proponen otro metodo de analisis de excendencias de um-brales partiendo de la condicion (d). Para n grande, el proceso puntual Nn deesta condicion se comporta como un proceso de Poisson no homogeneo en E.Si existen un numero nA ≤ n de observaciones, X(1), ..., X(nA), pertenecien-tes a A = (0, u]

c, donde u es un vector de umbrales, la verosimilitud para la

aproximacion Poisson es

L = exp{−µ(A)} nA∏

k=1

µ(dX(k)

),

donde A = A/n y X(k) = X(k)/n. Los parametros se estimaran por maximaverosimilitud.

Page 36: An alisis de Valores Extremos - Universidad de Granada

Se puede desarrollar otro metodo alternativo de excedencias de umbrales a partirde la condicion (c) aproximando la distribucion condicional de Xi dado queXi ∈ A mediante

W (x) =1

− logG (1, α)log

(G (x, α)

G (mın (x, 1) , α)

), x > 0,

donde A = (0, u1]c

y u es un vector de umbrales.

Mediante una parametrizacion de G se obtiene un modelo parametrico para Wcuya estimacion se realizara por maxima verosimilitud.

Hasta ahora se ha considerado que la distribucion F tiene marginales Frechet;sin embargo, en la practica las distribuciones marginales Fj son desconocidas ydeberan ser estimadas. Una solucion habitual a este problema es la realizacionde una aproximacion semiparametrica, donde Fj (xj) se estima a traves de ladistribucion empırica para xj ≤ uj , y una modelizacion mediante la distribucionde Pareto generalizada para xj > uj :

Fj (xj) =

1− λj

(1 + ξj

[xj − ujσj

])−1/ξj

+

, si xj > uj

(n+ 1)−1

n∑i=1

1 (Xi,j ≤ xj) , si xj ≤ uj ,

donde λj > 0, σj > 0 y εj ∈ R son parametros desconocidos que deberan esti-marse. Mediante las transformaciones −1/ logFj (Xi,j) , i = 1, ..., n, j = 1, ..., pse obtienen las observaciones estandarizadas a escala Frechet y se pueden aplicarlos procedimientos vistos en esta seccion.

Page 37: An alisis de Valores Extremos - Universidad de Granada

Capıtulo 3

Extremos espaciales

3.1. Introduccion

En algunos casos, principalmente en el estudio de fenomenos medioambientales,se tendra una dimension espacial y el objetivo sera modelizar la dependenciaespacial entre extremos a partir de observaciones localizadas en una malla. Paraello, se usaran procesos max-estables, es decir, procesos estocasticos en los quelas distribuciones finito-dimensionales seran distribuciones de valores extremos.

Los extremos espaciales son de interes en el estudio de riesgos naturales comoolas de calor, altas precipitaciones y nevadas, inundaciones, etc.

Como ejemplo de aplicaciones del estudio de extremos espaciales, en el contextode las precipitaciones se tiene a Davidson, Padoan y Ribatet (2012), que reali-zaron una comparacion entre modelos de variables latentes y modelos basadosen procesos max-estables para un conjunto de precipitaciones estivales maximasrecogidas entre 1962-2008 en 52 localizaciones en la region de Plateau (Suiza).

En cuanto a inundaciones costeras, Coles y Tawn (1990), consideraron los nivelesmaximos de la marea en la costa Britanica, construyendo un modelo logısticobivariante para localizaciones cercanas.

3.2. Procesos max-estables espaciales

Para el caso de extremos espaciales son fundamentales los procesos max-estables,analogos infinito-dimensionales a los vectores aleatorios max-estables, definidosen la seccion anterior.

En este caso, los extremos estaran definidos en el dominio espacial R ⊂ Rd,d ≥ 1, y se supondra en el caso teorico que R es un subconjunto compactode Rd y que todos los procesos estocasticos considerados siguen patrones demuestreo continuo, aunque estas ultimas condiciones se podran relajar en lapractica.

Sea Z (r) un proceso estocastico con marginales no degeneradas definido en

37

Page 38: An alisis de Valores Extremos - Universidad de Granada

un conjunto R. Este proceso sera max-estable si todas sus distribuciones n-dimensionales satisfacen la propiedad de max-estabilidad, es decir:

Definicion 3.2.1 Un proceso estocastico {Z (r) : r ∈ R} se dice max-estable siexisten sucesiones de funciones continuas {an (r) > 0 : r ∈ R,n ≥ 1} y{bn (r) ∈ R : r ∈ R,n ≥ 1} tales que, para todo n ≥ 1,

maxi=1,...,n

Zi (r)− bn (r)

an (r): r ∈ R

d= {Z (r) : r ∈ R} ,

donde {Zi (r) : r ∈ R, i ≥ 1} es una sucesion de replicas independientes de {Z (r) : r ∈ R}.

La relevancia de los procesos max-estables en la modelizacion de extremos es-paciales estara basada en argumentos asintoticos, segun segun de Haan (1984):

Teorema 3.2.1 Sea X1 (r) , X2 (r) , ... una sucesion de replicas independientesde un proceso estocastico {Xn (r) : r ∈ R}. Si existen funciones continuas cn > 0y dn ∈ R tales que el proceso lımite {Zn (r) : r ∈ R}, definido como

maxi=1,...,n

Xi (r)− dn (r)

cn (r)→ Zn (r) , r ∈ R, n→∞,

es no degenerado, entonces, el proceso {Zn (r) : r ∈ R} es un proceso max-estable.

Una descripcion mas precisa de los procesos max-estables se puede obtener apartir de su representacion espectral.

3.2.1. Representacion espectral de los procesos max-estables

El proceso aleatorio {Z (r) : r ∈ R} sera un proceso max-estable simple si tienemarginales Frechet.

Teorema 3.2.2 (de Haan, 1984; Penrose, 1992) Cualquier proceso max-establesimple no degenerado {Z (r) : r ∈ R} definido en un conjunto compacto R ⊂ Rd,d ≥ 1, con patrones de muestreo continuos satisface

Z (r)d= max

i≥1ζifi (r) , r ∈ R,

donde {(ζi, fi) : i ≥ 1} son las coordenadas de un proceso de Poisson en (0,∞)×C con medida de intensidad ζ−2dζν (df) para alguna medida local finita ν defi-nida en el espacio de las funciones continuas no negativas C en R, tal que∫

f (r) ν (df) = 1, r ∈ R.

Page 39: An alisis de Valores Extremos - Universidad de Granada

3.2.2. Modelos max-estables

En esta seccion se van a introducir algunos modelos max-estables que seranrelevantes en el estudio de extremos espaciales.

Modelo de Smith (1990)

Smith (1990) introdujo la siguiente representacion parametrica de un procesomax-estable continuo en el tiempo:

Z (r) = maxi≥1

Xif (r, Ui) ,

donde {Xi, Ui}i≥1 es una realizacion de un proceso de Poisson definido en

(0,∞) × RU con medida de intensidad x−2dxν (du) y f (·) es una funcion dedensidad no negativa en R × RU , con integral finita respecto a una medidapositiva ν en RU .

El proceso Z (·) sera un proceso max-estable simple si imponemos la restriccion∫RU

f (r, u) ν (du) = 1.

En este proceso, que Smith (1990) interpreto en terminos de precipitaciones, Xi

y Ui son, respectivamente, el tamano y el tipo de tormenta i.

Smith (1990) definio el proceso de valores extremos gaussianos como

P (Z (r) ≤ z1, Z (r + h) ≤ z2) = exp

{− 1

z1Φ

(a (h)

2+

1

a (h)log

z2

z1

)− 1

z2Φ

(a (h)

2+

1

a (h)log

z1

z2

)}, h ∈ Rd,

donde Φ (·) es la funcion de distribucion normal estandar y a (h) =√h′Σ−1h.

Esta representacion se usara en modelos medioambientales.

Modelo de Schlather (2002)

Schlather (2002) propuso una extension del modelo de Smith (1990), sustitu-yendo la funcion determinıstica f (·) por una forma aleatoria Y (·):

Z (r) = maxi≥1

XiYi (r − Ui) ,

donde {Xi, Ui}i≥1 es una realizacion de un proceso de Poisson en (0,∞) × Rd

con medida de intensidad x−2dx × µ−1du e {Yi (·)}i≥1 son replicas indepen-

dientes de una funcion aleatoria no negativa Y (·) definida en Rd, tal que µ =E[∫RY (r) dr

]∈ (0,∞).

Schlather (2002) tambien introdujo una clase de procesos max-estables basadaen procesos estocasticos estacionarios con media finita.

Page 40: An alisis de Valores Extremos - Universidad de Granada

Sea {Xi}i≥1 una realizacion de un proceso de Poisson definido en (0,∞) con

medida de intensidad µ−1x−2dx y sean {Wi (·)}i≥1 replicas independientes de un

proceso estocastico estacionarioW (·) definido en R2 , con µ = E (max {0,W (0)}) ∈(0,∞).

El proceso estocastico Z (·) definido por

Z (r) = maxi≥1

XiWi (r)

es un proceso max-estable simple estacionario, con distribucion multivariante,para cualquier subconjunto {r1, ..., rm} de R:

P (Z (r1) ≤ z1, ..., Z (rm) ≤ zm) = exp

{−E

(sup

1≤i≤m

W (ri)

zi

)}.

Schlather (2002) propuso tomar Yi (·) como un proceso estacionario gaussianocon funcion de correlacion ρ. El proceso max-estable resultante se conoce comoproceso de extremos gaussiano y su distribucion bivariante viene dada por

P (Z (r) ≤ z1, Z (r + h) ≤ z2) = exp

{−1

2

(1

z1+

1

z2

(1 +

√1− 2 (ρ (h) + 1)

z1z2

(z1 + z2)2

)}.

3.3. Medidas de dependencia para extremos es-paciales

3.3.1. Funcion del coeficiente extremal

El coeficiente extremal se utilizara para medir la dependencia entre los extre-mos de dos vectores aleatorios (X,Y ) con distribucion de extremos bivariante ydistribucion marginal comun F (r). Este coeficiente se define por la identidad

P (max (X,Y ) ≤ x) = F θ (x) ,

donde el rango de θ sera [1, 2], siendo θ = 1 dependencia perfecta y θ = 2independencia entre los maximos.

Para un proceso max-estable Z (r), la funcion del coeficiente extremal, θ (·),viene dada por (Schlater y Tawn, 2003)

P (max (Z (r) , Z (r + h)) ≤ z) = exp {−θ (h) /z} .

Algunas propiedades de θ (·) son:

Page 41: An alisis de Valores Extremos - Universidad de Granada

1. 2− θ (·) es una funcion semi-definida positiva.

2. La funcion θ (·) no es diferenciable en 0, excepto en el caso θ (h) = 1, ∀h

3. Si Z (·) es un proceso estocastico isotropico, θ (·) solo tiene un punto dediscontinuidad en 0.

3.3.2. F-madograma

En geoestadıstica, la herramienta basica para medir la dependencia espacial esel semi-variograma, que se define como

γ (h) =1

2E[{W (r)−W (r + h)}2

], r, r + h ∈ R.

La herramienta analoga al semi-variograma para la teorıa de extremos fue defi-nida por Cooley et al. (2006) y se conoce como F -madograma:

νF (h) =1

2E [|F {Z (r + h)} − F {Z (r)} |] , r, r + h ∈ R1

donde F es la funcion de distribucion acumulativa de Z (r).

El rango de valores del F -madrograma varıa de 0 a 1/6, lo que se correspondecon dependencia completa e idependencia respectivamente.

En la practica se estimara de la siguiente forma:

νF (h) =1

2n (n+ 1)

n∑i=1

|Ri (r)−Ri (r + h) |, Ri (r) =

n∑`=1

1{Z`(r)≤Zi(r)},

donde Z1, ..., Zn son replicas independientes de un proceso max-estable Z.

3.3.3. λ-madograma

El coeficiente extremal, ası como el F -madograma, no representan de formacompleta la dependencia espacial de un campo aleatorio.

Para resolver este problema, Naveau et al. (2009) introdujo el λ-madograma,que se define como

νλ (r1, r2) =1

2E[|Fλ {Z (r1)} − F 1−λ {Z (r2)} |

], ∀λ ∈ [0, 1] .

De esta forma, mediante la variacion de λ se tendra P [Z (r1) ≤ z1, Z (r2) ≤ z2],donde z1 = λz y z2 = (1− λ) z, y de esta forma se podra explorar todo elespacio.

Page 42: An alisis de Valores Extremos - Universidad de Granada

3.4. Simulacion de procesos espaciales max-estables

Las simulaciones espaciales permiten la recuperacion de informacion en cual-quier localizacion.

Se llamaran simulaciones condicionadas aquellas que se ajustan a los datos ob-servados; en otro caso, se denominaran no condicionadas. La simulacion de lasprimeras sera especialmente util ya que se podran combinar diferentes simula-ciones condicionadas para obtener estimadores de cualquier medida de interes,como cuatiles, probabilidades de excedencia de umbrales o niveles de retorno.

3.4.1. Simulaciones no condicionadas

Los procesos max-estables se han definido basandose en infinitas replicas de unproceso estocastico; sin embargo, en la practica solo se podra obtener un numerofinito de realizaciones de un proceso. A pesar de esto existen resultados teoricosy procedimientos ad-hoc mediante los que sera posible obtener simulacionesexactas o aproximadas de algunos modelos max-estables.

En Schlather (2002) se dan algunas condiciones para la obtencion de simulacio-nes exactas para la clase de procesos max-estables

Z (r) = maxi≥1

XiWi (r) .

Suponemos que el proceso estocastico W (·) esta uniformemente acotado poruna constante positiva C < ∞. Para T0 = 0 y k = 1, 2, ..., el algoritmo desimulacion sera el siguiente:

1. Se genera Ek ∼ E y se hace Tk = Tk−1 + Ek, Xk = T−1k ,

2. se genera Wk (·) ∼W (·),

3. si CXk > max1≤i≤k

XiWi (r), volver a 1; en otro caso Z (r) = max1≤i≤k

XiWi (r),

donde E es una distribucion exponencial con media unitaria, (Ti)i ≥ 1 es unproceso de Poisson definido en (0,∞) con medida de intensidad dt y (Xi)i ≥ 1es un proceso de Poisson definido en (0,∞) con medida de intensidad x−2dx.

Se obtendra una buena aproximacion al elegir un C tal que P (W (r) > C) sealo suficientemente pequena.

Para el proceso Z (r) = maxi≥1

XiYi (r − Ui) se puede aplicar un algoritmo analogo,

ya que Y (·) es un proceso uniformemente acotado.

3.4.2. Simulaciones condicionadas

La simulacion condicionada, a diferencia de la no condicionada, no puede obte-nerse de forma exacta.

Page 43: An alisis de Valores Extremos - Universidad de Granada

Wang y Stoev (2011) dan una solucion aproximada a este problema. Suponga-mos que se observa un proceso max-estable Z (·) en las ubicaciones r1, ..., rn.La distribucion de un vector max-estable (Z (r1) , ..., Z (rn))

′se podra apro-

ximar mediante el vector multivariante(Z (r1) , ..., Z (rn)

)′, donde Z (ri) =

maxk=1,...,p

φk (ri)Yk, para i = 1, ..., n, siendo φk (·) funciones determinısticas no ne-

gativas e Yk variables aleatorias independientes con distribucion α-Frechet, esdecir, P (Yk ≤ y) = exp (−σαk y−α), para α , σk , y > 0.

El algoritmo de Wang y Stoev (2011) genera muestras a partir de la probabilidad

condicionada de (Y1, ..., Yp)′

dadas(Z (r1) , ..., Z (rn)

)′= (Z (r1) , ..., Z (rn))

′y

predice Z (r∗) en cualquier ubicacion arbitraria r∗ a partir de las muestras(Y

(sim)i , ..., Y

(sim)p

)′, usando la siguiente aproximacion:

Z(sim) (r∗) = maxk=1,...,p

φk (r∗)Y (sim)k .

3.5. Ajuste de un proceso max-estable Frecheta los datos

En esta seccion se van a presentar dos aproximaciones diferentes para realizarel ajuste de procesos max-estables a los datos. La primera estara basada enmınimos cuadrados y para la segunda se usara el estimador compuesto maximo-verosımil propuesto por Lindsay (1988).

3.5.1. Mınimos cuadrados

El procedimiento consiste en minimizar la funcion

C (ψ) =∑i<j

θi,j − θi,js(θi,j

)2

,

donde ψ es el vector de parametros del proceso max-estable, θi,j es el coeficien-

te extremal predicho para el modelo y θi,j es un estimador semi-parametricodefinido como

θi,j =n∑n

k=1 mın{Zk (ri)

−1, Zk (rj)

−1}

con desviacion estandar s(θi,j

).

Page 44: An alisis de Valores Extremos - Universidad de Granada

3.5.2. Maxima verosimilitud

Este metodo presenta el incoveniente de que la verosimilitud del modelo nose conoce de forma analıtica para dimensiones mayores o iguales que tres. Sinembargo, dado que la densidad bivariante sı es conocida, Ribatet (2009) sugiereel uso funciones de verosimilitud dos a dos. La expresion de la log-verosimilituddos a dos viene dada por

`p (z;ψ) =∑i<j

ni,j∑k=1

log f(z

(i)k , z

(j)k ;ψ

),

donde z es el conjunto total de observaciones de la region, ni,j es el numero

de observaciones entre las localizaciones i y j, y(i)k es la k-esima observacion en

la localizacion i y f (·, ·) es la densidad bivariante de un proceso max-estableFrechet.

Esta estimacion por maxima verosimilitud estara especificada parcialmente;es decir, la variable de la que se han extraıdo las observaciones del modelo,{f (y;ψ) , ψ ∈ Rd

}, tiene una desidad g desconocida. El modelo quedara espe-

cificado si existe ψ∗ ∈ Rd tal que f (y;ψ∗) = g (y) para todo y.

La estimacion del vector de parametros se distribuira como

ψ = N(ψ,H (ψ)

−1J (ψ)H (ψ)

−1),

donde

H (ψ) = n

∫∂2 log f (y;ψ)

∂ψ∂ψTg (y) dy

J (ψ) = n

∫∂ log f (y;ψ)

∂ψ

∂ log f (y;ψ)

∂ψT.

3.6. Seleccion del modelo

Dados varios modelos a los que se ajustan bien a los datos, sera util disponerde herramientas que nos permitan elegir el mas adecuado. Si los modelos acomparar tienen la misma log-verosimilud, se seleccionara el modelo mas simple;sin embargo, si difieren en una mınima cantidad se debera disponer de alguncriterio para discriminar un modelo frente a otro.

Se van a presentar dos criterios de seleccion de modelos; el Criterio de Infor-macion de Takeuchi (Akaike, 1974) y el Estadıstico de la Tasa de Verosimilud(Davison, 2003).

3.6.1. Criterio de informacion de Takeuchi

Este criterio se utiliza para comparar modelos dos a dos.

Page 45: An alisis de Valores Extremos - Universidad de Granada

Se considera una muestra aleatoria Y1, ..., Yn extraıda de una variable con fun-cion de densidad g desconocida.

Se ajustara un modelo estadıstico f (y;ψ) maximizando la log-verosimilitud. Lamedida de divergencia de Kullback-Leibler (Varin, Vidoni, 2005) determina ladiscrepancia entre el modelo ajustado f y el modelo real g,

D (fψ, g) =

∫log

(g (y)

f (y;ψ)

)g (y) dy

Esta medida siempre sera positiva; y se tomara como modelo aquel que minimiceD (fψ, g).

Dado que algunos modelos satisfacen D (fψ, g) = 0, este metodo no es lo sufi-cientemente discriminante; para solucionar este problema se utiliza el Criteriode Informacion de Takeuchi (TIC),

TIC = −2`(ψ)− 2tr

(JH−1

),

donde ψ es la estimacion de ψ y H y J son estimaciones consistentes de lasmatrices H (ψ) y J (ψ), respectivamente.

El mejor modelo se correspondera con aquel que minimice el TIC.

3.6.2. Estadıstico de la tasa de verosimilitud

Este criterio es util para comparar modelos anidados.

Para un modelo estadıstico {f (x, ψ)}, con ψT =(κT , φT

), se quiere comprobar

que los datos son consistentes con la hipotesis de que κ = κ0; para ello, seusara el estadıstico de la tasa dde verosimilitud W (κ0),

W (κ0) = 2{`(κ, φ

)− `(κ0, φκ0

)}→

p∑i=1

λiXi, n→∞,

donde φκ0es la estimacion por maxima verosimilitud de φ bajo la restriccion

κ = κ0, p es la dimension del parametro κ0, Xi son variables independientescon distribucion χ2

1 y λi son los autovalores de

{H−1JH−1

[{H−1

]−1.

Page 46: An alisis de Valores Extremos - Universidad de Granada
Page 47: An alisis de Valores Extremos - Universidad de Granada

Capıtulo 4

Aplicacion con R. Extremosespaciales

Se va a trabajar con el paquete de R SpatialExtremes y con el conjunto de da-tos wind que recoje los maximos anuales de la velocidad del viento, registradosen 35 estaciones meteorologicas de los Paises Bajos en el periodo 1971-2012.

Figura 4.1: Localizaciones de las estaciones meteorologicas

47

Page 48: An alisis de Valores Extremos - Universidad de Granada

maps::map(xlim=c(0,9),ylim=c(50,54),fill=TRUE,col="green3")

points(coord,pch=15)

Para el tratamiento de los datos se seguira el siguiente proceso propuesto porSmith (1990):

1. Ajuste de la distribucion de valores extremos generalizada a los datos.

2. Tranformacion de los datos a la distribucion Frechet.

3. Ajuste de un proceso max-estable a los datos transformados.

4. Diagnosis y eleccion del modelo.

5. Predicciones.

4.1. Ajuste de la distribucion de valores extre-mos generalizada a los datos

Para el ajuste de la distribucion GEV sera necesario comprobar si los datospresentan dependencia espacial y localizar tendencias espaciales si las hubiera.

La forma de comprobar la existencia de dependencia espacial es a traves de larepresentacion del F -madograma y el coeficiente extremal.

Page 49: An alisis de Valores Extremos - Universidad de Granada

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●

● ●

●●

0 20 40 60 80 100 120

1.4

1.5

1.6

1.7

Distancia

Ext

.Coe

ff

(a) Longitud vs. Altitud

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

● ●

●●

0 20 40 60 80 100 1201.

41.

51.

61.

7

Distancia

Ext

.Coe

ff

(b) Latitud vs. Altitud

●●

●●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●● ●

● ●

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

1.4

1.5

1.6

1.7

Distancia

Ext

.Coe

ff

(c) Longitud vs. Latitud

Figura 4.2: Representacion del coeficiente extremal frente a la distancia

En estos graficos no se observa dependencia espacial en funcion de la altitud,unicamente para las dimensiones longitud y latitud se observa una variacion delcoeficiente extremal en funcion de la distancia.

Los siguientes graficos ayudaran a detectar tendencias espaciales:

Page 50: An alisis de Valores Extremos - Universidad de Granada

● ● ● ● ●± 10 ± 20 ± 30 ± 40 ± 50

● ● ● ●± 10 ± 20 ± 30 ± 40

● ● ● ● ●± 1 ± 2 ± 3 ± 4 ± 5

Figura 4.3: Graficos de tendencias para µ (x), σ (x) y xi (x), respectivamente.

symbolplot(wind,coord,which="mean")

symbolplot(wind,coord)

border<-function(add=FALSE)maps::map(xlim=c(0,9),ylim=c(47.5,57.5),add=add)

symbolplot(wind,coord,plot.border=border,scale=2)

En el caso de los parametros σ y ξ no se observa ningun patron. En el grafico dela izquierda, correspondiente al parametro de escala µ, se observa una separacionde los datos, por lo que este parametro se definira en funcion de las coordenadas.

La definicion de los parametros propuesta por Ribatet (2015) es la siguiente:

µ (x) = β0,µ + β1,µlon (x) + β2,µlat (x) + β3,µlon (x) lat (x)

σ (x) = β0,σ

ξ (x) = β0,ξ

loc.M1<-y lon*lat; scale.M1<-shape.M1<-y 1

El ajuste de la distribucion GEV a los datos da como resultado el valor de losparametros estimados junto con sus errores estandar y la matriz de varianzascovarianzas.

# Ajuste de la distribucion GEV a los datos

M1<-fitspatgev(wind,scale(coord,scale=FALSE),loc.M1,scale.M1,shape.M1);

M1

Page 51: An alisis de Valores Extremos - Universidad de Granada

Model: Spatial GEV model

Deviance: 10735.05

TIC: 10768.3

Location Parameters:

locCoeff1 locCoeff2 locCoeff3 locCoeff4

267.56 -15.96 22.85 2.23

Scale Parameters:

scaleCoeff1

33.86

Shape Parameters:

shapeCoeff1

-0.09237

Standard ErrorslocCoeff1 locCoeff2 locCoeff3 locCoeff4 scaleCoeff1 shapeCoeff1

3.12232 1.04371 1.71802 1.58605 1.03977 0.01854

Asymptotic Variance Covariance

locCoeff1 locCoeff2 locCoeff3 locCoeff4 scaleCoeff1

locCoeff1 9.7488927 -0.5203683 1.5094327 -0.4169546 1.6639010

locCoeff2 -0.5203683 1.0893215 -0.7382272 0.2126821 -0.0542326

locCoeff3 1.5094327 -0.7382272 2.9515839 0.9878967 0.3578833

locCoeff4 -0.4169546 0.2126821 0.9878967 2.5155629 -0.2183085

scaleCoeff1 1.6639010 -0.0542326 0.3578833 -0.2183085 1.0811170

shapeCoeff1 -0.0319854 0.0102704 -0.0072285 0.0031509 0.0018621

shapeCoeff1

locCoeff1 -0.0319854

locCoeff2 0.0102704

locCoeff3 -0.0072285

locCoeff4 0.0031509

scaleCoeff1 0.0018621

shapeCoeff1 0.0003439

Optimization Information

Convergence: successful

Function Evaluations: 529

El ajuste de este modelo nos permitira predecir los niveles de retorno para undeterminado numero de anos.

x<-seq(min(coord[,1]),max(coord[,1]),length=100)

y<-seq(min(coord[,2]),max(coord[,2]),length=100)

grid<-expand.grid(x,y);

colnames(grid)<-c("lon","lat")

grid[,1]<-grid[,1]-mean(coord[,1]);

grid[,2]<-grid[,2]-mean(coord[,2]);

Page 52: An alisis de Valores Extremos - Universidad de Granada

ans<-predict(M1,newdata=grid,ret.per=100)$Q100

maps::map(xlim=range(x),ylim=range(y))

image(x,y,matrix(ans,100),add=TRUE,col=cm.colors(64))

contour(x,y,matrix(ans,100),add=TRUE);

maps::map(add=TRUE)

340

350

3

60

370

380

390

400 410

420

430

440

Figura 4.4: Predicion de los niveles de retorno a 100 anos

4.2. Transformacion de los datos a la distribu-cion Frechet.

En primer lugar se transformaran los datos partiendo de la distribucion GEVcalculada en la seccion anterior; para ello, se tendran en cuenta los valores delos parametros ajustados:

loc.coeff.M1<-M1$fitted.values[1:4];

sigma.M1<-M1$fitted.values[5];

xi.M1<-M1$fitted.values[6]

mu.M1<-numeric(nrow(coord))

for(i in 1:nrow(coord))

mu.M1[i]<-loc.coeff.M1[1]+loc.coeff.M1[2]*coord[i,1]+loc.coeff.M1[3]*coord[i,2]+

loc.coeff.M1[4]*coord[i,1]*coord[i,2]

Page 53: An alisis de Valores Extremos - Universidad de Granada

>mu.M1 [1] 1903.066 1928.571 1965.237 1943.246 1992.469 1975.527 2038.791

1976.932 [9] 1987.656 2025.385 2024.461 2074.960 2069.942 2046.741

2127.005 2098.129 [17] 2141.369 2156.563 2123.485 2217.123 2155.867

1798.158 1817.627 1829.274 [25] 1867.950 1872.704 1898.695 1947.514

1934.438 1965.384 1977.807 2014.147 [33] 2003.479 1993.622 2056.935

>sigma.M1

scaleCoeff1

33.85732

>xi.M1

shapeCoeff1

-0.09236842

Con el siguiente codigo y el uso de la funcion gev2frec() se transforma el con-junto de datos original en otro conjunto de datos (wind.frechet.M1) del mismotamano, en el que cada uno de los vectores tiene marginales Frechet:

wind.frechet.M1<-numeric(length(wind));

wind.frechet.M1<-matrix(wind.frechet.M1,nrow=nrow(wind),ncol=ncol(wind));

for(j in 1:ncol(wind))

for(i in 1:nrow(wind))

wind.frechet.M1[i,j]<-gev2frech(wind[i,j],mu.M1[j],sigma.M1,xi.M1)

Ademas se realizara una segunda transformacion en la que los datos seran trans-formados usando la distribucion acumulada empırica, obteniendose el conjuntode datos wind.frechet.M2.

wind.frechet.M2<-apply(wind,2,gev2frech,emp=TRUE)

4.3. Ajuste del proceso max-estable a los datostransformados.

4.3.1. Modelo 1

Se ajustara sobre el conjunto de datos wind.frechet.M1.

De la misma forma que en el ajuste de la distribucion GEV, habra que definirla forma de los parametros del modelo:

symbolplot(log(wind.frechet.M1),coord[,-3],which="mean")

symbolplot(log(wind.frechet.M1),coord[,-3])

border<-function(add=FALSE)maps::map(xlim=c(0,9),ylim=c(47.5,57.5),add=add)

symbolplot(log(wind.frechet.M1),coord[,-3],plot.border=border,scale=10)

Page 54: An alisis de Valores Extremos - Universidad de Granada

● ● ●± 0.5 ± 1 ± 1.5

● ● ● ●± 0.05 ± 0.1 ± 0.15 ± 0.2

● ● ● ●●●± 1 ± 2 ± 3 ± 4 ± 5 ± 6

Figura 4.5: Graficos de tendencias para µ (x), σ (x) y ξ (x), respectivamente.

En este caso, el parametro de localizacion va a depender de las coordenadas,mientras que los parametros de escala y forma seran constantes ya que no seaprecia una tendencia clara en sus respectivos graficos.

µ (x) = β0,µ + β1,µlon (x) + β2,µlat (x) + β3,µlon (x) lat (x) ,

σ (x) = β0,σ

ξ (x) = β0,ξ

Equivalentemente en R.

loc.M1<-y ∼ lon*lat; scale.M1<-shape.M1<-y ∼ 1;

El ajuste del modelo se hara con la funcion fitmaxstab().

M1.maxstab<-fitmaxstab(log(wind.frechet.M1),coord[,-3],"whitmat",nugget=0,

loc.M1,scale.M1,shape.M1)

4.3.2. Modelo 2

Se repite el mismo proceso para el conjunto de datos wind.frechet.M2.

Page 55: An alisis de Valores Extremos - Universidad de Granada

symbolplot(wind.frechet.M2,coord[,-3],which="mean")

symbolplot(wind.frechet.M2,coord[,-3])

border<-function(add=FALSE)maps::map(xlim=c(0,9),ylim=c(47.5,57.5),add=add)

symbolplot(wind.frechet.M2,coord[,-3],plot.border=border,scale=3)

● ● ● ● ● ●

± 0.05± 0.1± 0.15± 0.2± 0.25± 0.3

● ● ● ●

± 0.1 ± 0.2 ± 0.3 ± 0.4

● ● ● ●

± 0.2 ± 0.4 ± 0.6 ± 0.8

Figura 4.6: Graficos de tendencias para µ (x), σ (x) y ξ (x), respectivamente.

No se aprecia ningun patron en la distribucion espacial de los puntos, todos losparametros seran constantes:

loc.M2<-scale.M2<-shape.M2<-y 1;

M2.maxstab<-fitmaxstab(wind.frechet.M2,coord[,-3],"whitmat",nugget=0,loc.M2,scale.M2,shape.M2)

4.3.3. Diagnosis y eleccion del modelo

Para verificar la validez de cada uno de los modelos se va a analizar que lasobservaciones esten bien modelizadas en cada una de las localizaciones y que laestructura de dependencia este bien definida; esto se hara mediante dos funcio-nes: qqgev() en el caso del Modelo 1 y fmadogram() para el Modelo 2.

Modelo 1

qqgev(M1.maxstab)

Page 56: An alisis de Valores Extremos - Universidad de Granada

●●

●●

●●●

●●

●●●

−20.0 −19.0 −18.0

−20

.0−

19.5

−19

.0−

18.5

−18

.0−

17.5

µMLE

µ Mod

el

σMLE

Fre

quen

cy

0.00 0.10 0.20 0.30

05

1015

σModel

ξMLE

Fre

quen

cy

−1 0 1 2 3 4 5 6

05

1015

ξModel

Figura 4.7: Diagnosis de los parametros del modelo.

Con los graficos qq se podra comprobar si los parametros predichos a travesde las tendencias de superficie son relevantes; para ello, se compararan con losestimados por maxima verosimilitud en cada una de las localizaciones:

fmadogram(wind.frechet.M1,coord[,-3],M1.maxstab,which=c(.ext"),col=c("grey"))

fmadogram(wind.frechet.M1,coord[,-3],M1.maxstab,n.bins=200,which=c(.ext"),col=c(1,2),marge=.emp",add=TRUE)

Page 57: An alisis de Valores Extremos - Universidad de Granada

●●

●●

●●

●●

●●

●●

●●

● ●

● ●

●●

●●

●●

● ●

●●

●●

●●

●●

●●

● ●

●●

●●

●●

● ●

●●

●●

●●

● ●

●●

● ●

●●

●●

●●

● ●●

●●

●●

●●

●●

●●

●●

●●●

● ●●

●●

●●

●●

●●

● ●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

● ●

●●

● ●

● ●

● ●

● ●

●●● ●

0 1 2 3 4

1.0

1.2

1.4

1.6

1.8

2.0

h

θ(h)

●●●

●●

●●●

●●

●●●

●●●

●●●●

●●

●●

●●

●●●

●●●

●●

●●

●●●

●●

●●

●●●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

● ●

● ●●

●●

Figura 4.8: F -madograma Modelo 1.

Mediante el F -madograma se comprobara si el modelo es capaz de reprodu-cir la estructura de dependencia espacial; con este grafico se compararan lasestimaciones del coeficiente extremal con las predichas por el modelo ajustado.

Modelo 2

fmadogram(wind.frechet.M2,coord[,-3],M2.maxstab,which=c(.ext"),col=c("grey"))

fmadogram(wind.frechet.M2,coord[,-3],M2.maxstab,n.bins=200,which=c(.ext"),col=c(1,2),marge=.emp",add=TRUE)

Page 58: An alisis de Valores Extremos - Universidad de Granada

●●

●●

●●

●●

●●

●●

●●

● ●

● ●

●●

●●

●●

● ●

●●

●●

●●

●●

●●

● ●

●●

●●

●●

● ●

●●

●●

●●

● ●

●●

● ●

●●

●●

●●

● ●●

●●

●●

●●

●●

●●

●●

●●●

● ●●

●●

●●

●●

●●

● ●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

● ●

●●

● ●

● ●

● ●

● ●

●●● ●

0 1 2 3 4

1.0

1.2

1.4

1.6

1.8

2.0

h

θ(h)

●●●

●●

●●●

●●

●●●

●●●

●●●●

●●

●●

●●

●●●

●●●

●●

●●

●●●

●●

●●

●●●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

● ●

● ●●

●●

Figura 4.9: F -madograma.

Para realizar la seleccion del modelo se podra usar el estadıstico TIC (Criteriode Informacion de Takeuchi); para los modelos calculados anteriormente se tiene:

TIC(M1.maxstab,M2.maxstab)

M1.maxstab M2.maxstab

-14857.13 75049.33

Segun este criterio, se elegirıa el Modelo 1, ya que es el que minimiza el resultadodel TIC; este resultado es previsible, ya que el Modelo 1 es mas restrictivo queel Modelo 2 al haber predefinido los parametros.

Existen otros metodos de seleccion de modelos que penalizan el numero deparametros, como el Estadıstico de la Tasa de Verosimilitud. En R este test sellevara a cabo mediante la funcion anova() usando como metodo la aproxima-cion de Rotnitzky y Jewell RJ”.

Eigenvalue(s): 28.69 14.72 9.37

Analysis of Variance Table

Page 59: An alisis de Valores Extremos - Universidad de Granada

MDf Deviance Df Chisq Pr(>sum lambda Chisq)

M2.maxstab 5 74417

M1.maxstab 8 -15503 3 89920 <2.2e-16 ***

---

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

4.3.4. Predicciones.

Las predicciones para los modelos espaciales se llevan a cabo mediante la funcionpredict, que ya se uso en la seccion del ajuste del modelo GEV; sin embar-go, habra que tener en cuenta que estas predicciones se realizan localizacion alocalizacion, por lo que no se tendra en cuenta la dependencia espacial.

Page 60: An alisis de Valores Extremos - Universidad de Granada
Page 61: An alisis de Valores Extremos - Universidad de Granada

Capıtulo 5

Conclusion

El principal objetivo de este trabajo ha sido realizar una revision de los princi-pales enfoques en el analisis de valores extremos, centrandose principales en losprocesos max-estables y en la dimension espacial.

En la ultima decada han surgido muchos avances en materia de extremos, fun-damentalmente en el campo de la geoestadıstica a traves del uso de extremosespaciales, siendo los procesos max-estables una solucion elegante para modeli-zar estos valores.

Algunos de los ultimos avances en el campo del analisis de los valores extremosson los modelos bayesianos jerarquicos (Ribatet et al., 2012; Reich and Shaby,2012; Thibaud et al., 2015), que proporcionan algunas mejoras en la definicionde las tendencias de superficie y modelos eficientes para las predicciones pun-tuales; extremos espacio-temporales (Huser, 2013; Turkman and Pereira, 2010)y analisis de valores extremos no estacionarios (Cheng y AghaKuochak, 2014).

Sin embargo, el desarrollo de esta teorıa es relativamente reciente y aun siguensurgiendo nuevos avances teoricos y se esperan progresos en el futuro.

61

Page 62: An alisis de Valores Extremos - Universidad de Granada
Page 63: An alisis de Valores Extremos - Universidad de Granada

Bibliografıa

[1] S. A. Padoan A. C. Davison and M. Ribatet. Statistical modeling of spatialextremes. Institute of Mathematical Statistics, Vol. 27, No. 2, 161-186,2012.

[2] H. Akaike. Selected Papers of Hirotugu Akaike, chapter A new look at thestatistical model identification, pages 215–222. Springer, 1974.

[3] J. N. Bacro and C. Gaetan. Advances and Challenges in Space-time Mo-delling of Natural., chapter 5 - A Review on Spatial Extreme Modelling,pages 103–124. Springer-Verlag, 2012.

[4] L. Cheng and A. AghaKouchak. Nonstationary precipitation intensity-duration-frequency curves for infrastucture design in a changing climate.Scientific Reports, No. 4, 7093, 2014.

[5] S. Coles. An Introduction to Statistical Modeling of Extreme Values. Sprin-ger, 2001.

[6] S. Coles and J. A. Tawn. Statistics of coastal flood prevention. PhilosophicalTransactions of the Royal Society of London, No. 332, 457-476, 1990.

[7] S. Coles and J. A. Tawn. Modelling extreme multivariate events. Journalof the Royal Statistical Society, No. 53, 377-392, 1991.

[8] A. C. Davison. Statistical Models. Cambridge Series in Statistical andProbabilistic Mathematics. Cambridge University Press, 2003.

[9] L. de Haan. On Regular Variation and its Applications to the Weak Con-vergence of Sample Extremes. PhD thesis, Mathematical Centre Tract, 32,Amsterdam, 1970.

[10] L. de Haan. A spectral representations for max-stable processes. Annalsof Probability, No. 12, 1194-1204, 1984.

[11] L. de Haan and A. Ferreira. Extreme Value Theory. An Introduction. Sprin-ger, 2006.

[12] R. Fisher and L. H. C. Tippet. Limiting forms of the frecuency distributionof the largest or smallest member of a sample. Proceedings of the CambridgePhilosophical Society. No. 24, 180-190, 1928.

[13] M. Frechet. Sur la loi de probabilite de l’ecart maximum. Ann.Soc. Math.Polon. No. 6, 93-116, 1927.

63

Page 64: An alisis de Valores Extremos - Universidad de Granada

[14] R. Huser and A. C. Davison. Space-time modelling of extreme events. RoyalStatistical Society, No. 76, 439-461, 2013.

[15] J. Pickand III. Statistical inference using extreme order statistics. Annalsof Statistic, No. 3, 119-131, 1975.

[16] M. A. Turkman K. F. Turkman and J. M. Pereira. Asymptotic modelsand inference for extremes of spatio-temporal data. Extremes, No. 13, 375,2010.

[17] T. W. Yee L. Thibaut and D. Arnaud. Expectation particle belief propa-gation. Technical report, University of Oxford. Department of Statistics.,2015.

[18] A. W. Ledford and J. A. Tawn. Statistics for near independence in multi-variate extreme values. Biometrika, No. 83, 169-187, 1996.

[19] B. Lindsay. Composite likelihood methods. Contemporary Mathematics,No. 80, 220-239, 1988.

[20] A. Guillou P. Naveau and D. Cooley. Modelling pairwise dependence ofmaxima in space. Biometrika, No. 1, 1-17, 2009.

[21] M. D. Penrose. Semi-min-stable processes. Annals of Probability, No. 3,1450-1463, 1992.

[22] B. J. Reich and B. A. Shaby. A hierarchical max-stable spatial model forextreme precipitation. The Annals of Applied Statistics, No. 4, 1430-1451,2012.

[23] R. D. Reiss and M. Thomas. Statistical Analysis of Extreme Values withApplications to Insurance, Finance, Hydrology and Other Fields. Birkhau-ser, 1997.

[24] M. Ribatet. Modelling spatial extremes with the spatialextreme packa-ge. In The 9th International Conference on Extreme Value Analysis andApplication. University of Montpellier.

[25] M. Ribatet. A User’s Guide to the SpatialExtremes Package. Ecole Poly-technique Federale de Lausanne, 2009.

[26] M. Ribatet. Spatial extremes: Max-stable processes at work. Journal ofSociete Francaise de Statistique, Vol .154,No. 2,156-177, 2013.

[27] M. Ribatet and M. Sedki. Extreme value copulas and max-stable processes.Journal of Societe Francaise de Statistique, Vol. 152, No. 3,138-150, 2012.

[28] M. Hofmann S. Aulbach, M. Falk and M. Zott. On max-stable processesand the functional d-norm revisited. Extremes, Vol. 16, No. 3, 255-283,2013.

[29] M. Schlather. Models for stationary max-stable random fields. Extremes,Vol. 1, No.5, 33-44, 2002.

Page 65: An alisis de Valores Extremos - Universidad de Granada

[30] M. Schlather and J. Tawn. A dependence measure for multivariate andspatial extreme values: properties and inference. Biometrika, No. 90, 139-156, 2003.

[31] J. Segers. Max-stable models for multivariate extremes. In Copula Modelsand Dependence. Centre de Recherches Mathematiques, 2011.

[32] R. L. Smith. Max-stable processes and spatial extremes. Technical report,1990.

[33] S. A. Stoev. Max-stable processes: Representations, ergodic properties andstatistical applications. Technical report, Department of Statistics, TheUniversity of Michigan, 2010.

[34] C. Varin and P. Vidoni. A note on composite likelihood inference and modelselction. Biometrika. No. 92, 519-528, 2005.

[35] R. von Mises. la distribution de la plus grande de n valeurs. RevueMathematique de l’Union Interbalcanique, No. 1, 141-160, 1936.

[36] Y. Wang and S. A. Stoev. Conditional sampling for spspectral discretemax-stable random fields. Advances in Applied Probability, No. 2, 461-483, 2011.

[37] Z. Zhang. On approximating max-stable processes and constructing extre-mal copula functions. Statistical Inference for Stochastic Processes, No. 12,89-114, 2009.