1.1.1 supuesto de estacionariedad - bienvenidos y krigi… · martha bohórquez. geoestadística 1...

25
Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones El campo aleatorio espacial (proceso estocástico) { } d R D s s Z : ) ( es una familia de variables aleatorias cuyo conjunto índice es d R D . Los datos observados Z(s i ), , no son una muestra ordinaria de tamaño n sino una única realización del proceso n i , , 1 " = { } d R D s s Z : ) ( , que en realidad es una familia de modelos que genera resultados sobre el conjunto índice D. No existen réplicas de los datos, a menos que se tomaran medidas repetidas en cada una de las ubicaciones D s , lo cual es muy poco frecuente en la recolección de datos espaciales. Esto hace preciso, crear un mecanismo para generar éstas réplicas y poder hacer inferencia sobre los datos A estas variables medidas en el espacio también se les llama variables regionalizadas. Los dos componentes estructurales del campo aleatorio que permiten incorporar réplicas son la estacionariedad y la isotropía. 1.1.1 Supuesto de Estacionariedad Este supuesto se refiere a que la estructura probabilística del campo aleatorio es similar en diferentes partes de D, es decir que el proceso alcanza un estado de equilibrio. Esto ocurre cuando las coordenadas absolutas no muestran ninguna influencia sobre la ocurrencia de la variable. Si el campo aleatorio es estacionario y se va a estimar la covarianza [ ] ) ( ), ( h s Z s Z Cov + , por ejemplo, se puede usar una función que dependa solamente de la distancia absoluta s- (s+h)=h, sin importar donde están localizados los puntos. Para que diferentes pares de puntos puedan contribuir a la estimación, solo se necesita que tengan la misma distancia h. De manera formal, una variable regionalizada es estacionaria si su función de distribución no varía con la traslación del vector h, esto es, para ( ) ( ) ( ) [ ] T n s Z s Z s Z s Z , , , ) ( 2 1 " G = y ( ) ( ) ( ) [ ] T n h s Z h s Z h s Z s Z + + + = , , , ) ' ( 2 1 " G se tiene que ) ' ( ) ( s Z s Z F F = Esta condición es llamada también estacionariedad fuerte. 1.1.2 Supuesto de Isotropía La estacionariedad permite combinar pares de datos con la misma diferencia de coordenadas. Estos son vectores de diferencias. Si, además, los vectores de diferencias pueden ser reemplazados con distancias escalares, por ejemplo una distancia euclidiana h para calcular medidas como la covarianza, 1

Upload: hoangmien

Post on 19-Sep-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

1 Estacionariedad e isotropía. Variograma y Covariograma

1.1 Conceptos y Definiciones El campo aleatorio espacial (proceso estocástico) { }dRDssZ ⊂∈:)( es una familia de variables aleatorias cuyo conjunto índice es dRD ⊂ . Los datos observados Z(si), , no son una muestra ordinaria de tamaño n sino una única realización del proceso

ni ,,1={ }dRDssZ ⊂∈:)( , que en realidad es una

familia de modelos que genera resultados sobre el conjunto índice D. No existen réplicas de los datos, a menos que se tomaran medidas repetidas en cada una de las ubicaciones Ds∈ , lo cual es muy poco frecuente en la recolección de datos espaciales. Esto hace preciso, crear un mecanismo para generar éstas réplicas y poder hacer inferencia sobre los datos A estas variables medidas en el espacio también se les llama variables regionalizadas. Los dos componentes estructurales del campo aleatorio que permiten incorporar réplicas son la estacionariedad y la isotropía.

1.1.1 Supuesto de Estacionariedad Este supuesto se refiere a que la estructura probabilística del campo aleatorio es similar en diferentes partes de D, es decir que el proceso alcanza un estado de equilibrio. Esto ocurre cuando las coordenadas absolutas no muestran ninguna influencia sobre la ocurrencia de la variable. Si el campo aleatorio es estacionario y se va a estimar la covarianza [ ])(),( hsZsZCov + , por ejemplo, se puede usar una función que dependa solamente de la distancia absoluta s-(s+h)=h, sin importar donde están localizados los puntos. Para que diferentes pares de puntos puedan contribuir a la estimación, solo se necesita que tengan la misma distancia h. De manera formal, una variable regionalizada es estacionaria si su función de distribución no varía con la traslación del vector h, esto es, para ( ) ( ) ( )[ ]TnsZsZsZsZ ,,,)( 21= y

( ) ( ) ( )[ ]Tn hsZhsZhsZsZ +++= ,,,)'( 21 se tiene que

)'()( sZsZ FF = Esta condición es llamada también estacionariedad fuerte.

1.1.2 Supuesto de Isotropía La estacionariedad permite combinar pares de datos con la misma diferencia de coordenadas. Estos son vectores de diferencias. Si, además, los vectores de diferencias pueden ser reemplazados con distancias escalares, por ejemplo una distancia euclidiana h para calcular medidas como la covarianza,

1

Page 2: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

entonces el campo aleatorio se dice isotrópico. Esto es, la correlación entre los datos no depende de la dirección en la que esta se calcula. Así, un campo aleatorio que es estacionario pero no isotrópico se desarrolla de manera diferente según las diferentes direcciones del espacio. Así no solo basta con conocer cuanto están separados un par de puntos, sino también se necesita conocer la orientación de dicha distancia. Por lo tanto, anisotropía es la ausencia de isotropía, y puede ser detectada en los dispersogramas rezagados, examinando si la dependencia espacial cambia al cambiar la dirección. En términos geométricos la estacionariedad y la isotropía son propiedades de invarianza. La estacionariedad es invarianza bajo la traslación. La isotropía es invarianza bajo rotaciones y reflexiones. Ahora en términos matemáticos, se define ( )[ ] ( )ssZE µ= , que es llamada la tendencia o media del atributo Z(), y con base en esto se define:

1.1.3 Estacionariedad de segundo orden Si se cumple que

( ) µµ =s , es decir, la media es finita y constante Ds∈∀ ( ) ( )[ ] ( )hChsZsZCov =+, , para toda pareja ( ) ( ){ },, hsZsZ + es decir, la

covarianza existe y es función única del vector h. entonces, se dice que es un proceso débilmente estacionario o estacionario de segundo orden. Y si además C() es una función única de la distancia h se llama isotrópica.

1.1.4 Estacionariedad Intrínseca Si se tiene que

y ( ) ( )[ ] 0=−+ sZhsZE ( ) ( )[ ] ( )hsZhsZVar γ2=−+

La cantidad ( )hγ2 es conocida como el variograma y es el parámetro mas importante de la Geoestadística. La definición clásica del estimador del variograma es :

( ) ( ) ( ) ( )( )( )∑ −≡

hNji sZsZ

hNh 212γ

2

Page 3: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

donde la suma es sobre ( ) ( ){ }hssjihN ji =−= :, y ( )hN es el número de elementos distintos de N(h). Este es un estimador insesgado; sin embargo, se ve afectado cuando hay observaciones atípicas. Notas

C() y ()γ son parámetros del proceso estocástico, solamente la varianza es un parámetro de la distribución de una variable aleatoria. Así que

C() y ()γ son cantidades desconocidas y sujetas a estimación. La isotropía es una característica de C() y ()γ . La frase correcta es “un

proceso estacionario con semivariograma isotrópico”. La estacionariedad de segundo orden está definida en términos del

covariograma La estacionariedad intrínseca está definida en términos del

semivariograma. No hay estacionariedad intrínseca con covariograma C(). Si el covariograma existe, el proceso podría ser estacionario de segundo orden, pero no necesariamente intrínseco.

hsemivariograma covarianza

C0

Figura 1. Semivariograma Vs Covariograma

Isotropía significa que la fuerza de la dependencia espacial es solo una

función de una distancia escalar, no de la dirección La clase de procesos estacionarios intrínsecos contienen estrictamente

la clase de procesos estacionarios de segundo orden. Si un proceso es estacionario de segundo orden, es también intrínseco. Pero no todo proceso estacionario intrínseco también será de segundo orden. Así se C() existe, ()γ necesariamente existe. Pero la existencia de ()γ no implica la existencia de C(). Si el proceso es intrínseco pero no estacionario de segundo orden, la función covarianza no existe.

Ambos tipos de estacionariedad requieren que la media sea constante. No requieren que la media sea conocida, pero si que la media no cambie espacialmente.

( ) ( ) ( ) ( )[ ] 00 1111 =−==− sZsZVarss γγ , no depende de la ubicación, pero ( ) 011 CssC =− ( )

( ) ( )[ ] ( )[ iii sZVarsZsZCov =, ]. Por lo tanto, en un proceso de

3

Page 4: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

estacionariedad de segundo orden todas las observaciones tienen la

misma variabilidad. Esta es una forma de la propiedad de homocedasticidad. El supuesto de estacionariedad de segundo orden en estadística espacial, es equivalente al de igualdad de varianza en estadística clásica.

( ) ( ) ( ) ( ) ( )0,,00 ChChChCC ≤−=≥ Para un proceso estacionario de segundo orden, se puede definir la

función ( )( )0ChC , que es llamado el correlograma. Este expresa como la

correlación entre ubicaciones cambia con la separación espacial.

1.2 Relación entre covariograma y semivariograma Asumiendo que el proceso es estacionario de segundo orden y que por lo tanto. está definida; de la definición de variograma se tiene ( )C

( ) ( )[ ] ( )[ ] ( )[ ] ( ) ( )[ ]212121 ,2 sZsZCovsZVarsZVarsZsZVar −+=−

( ) ( )[ ] ( )[ ] ( )[ ] ( ) ( )[ ]212121 21

21

21, sZsZVarsVarsZVarsZsZCov −−+=⇔

( ) ( )[ ] ( )[ ]( ) 212121 21 sssZVarsZVarssC −−+=−⇔ γ ( )

Además como ( ) ([ isZVarC =0 )] , por ser estacionario de segundo orden, se tiene que

( ) ( ) ( )2121 0 ssCssC −−=− γ ( ) ( ) ( )2121 0 ssCCss −−=−⇔ γ

Si un proceso es estacionario de segundo orden tiene ( ) 0≥hC , entonces ( )hC ( ),0C≤ , y cuando h crece. El semivariograma de un

proceso estacionario de segundo orden tiene una asíntota, ( )0C 0≥ ( ) 0→hC

( )0C . Esto provee una herramienta para chequear estacionariedad. Se estima el semivariograma, si tiende a una línea horizontal cuando se incrementa la separación de los puntos, el proceso es estacionario de segundo orden; si crece constantemente, el proceso no es estacionario de segundo orden. Por otro lado, la mitad de los cuadrados de las diferencias, pueden ser usadas para estimar el semivariograma del proceso. El semivariograma es como mínimo intrínsecamente estacionario si

( ) 0→hhγ cuando ∞→h

Como ( ) ( ) ( )[ isZVarCss =→− 021 ]γ cuando la separación de coordenadas aumenta, usualmente se grafican semivariogramas en lugar de variogramas. Las siguientes son las dos características principales del semivariograma:

4

Page 5: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

Silla es la asíntota superior del semivariograma. Únicamente los

procesos estacionarios de segundo orden tienen silla. En estos casos la silla es . También es conocida como meseta. ( )0C

Rango de un proceso espacial es la distancia en la cual . Se dice que aproximadamente

( ) 0≈hC( )≈ porque algunos procesos alcanzan

correlación cero solo asintóticamente para ∞=h , mientras que otros tienen un rango finito.

El rango de un proceso espacial es la distancia a la cual los puntos ya no se consideran correlacionados. Los puntos separados por una distancia inferior al rango se consideran espacialmente correlacionados: Observaciones espaciadas por mas que el rango se consideran independientes.

1.3 El efecto pepita El semivariograma tiene las siguientes propiedades que se siguen directamente de su definición:

( ) ( )hh −= γγ

( ) 00 =γ

distancia

Sem

ivar

ianz

a

rango

silla

Figura 2. Elementos de un semivariograma

El semivariograma se aproxima a una asíntota a medida que la distancia se incrementa. El semivariograma empírico comienza en la distancia mas pequeña entre unidades experimentales. Podría ajustarse a los puntos una función que pasara por el origen. Sin embargo, el gráfico sugiere que el intercepto es distinto de cero.

5

Page 6: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

En general, en las aplicaciones se usa que ( ) 0ch →γ cuando . La justificación a esto es que la varianza de las distintas observaciones en la misma ubicación tiene un error de medida. Cuando no es posible repetir una medida en la ubicación s sin error, entonces se muestra su variabilidad. Pero este efecto de

0→h

( ) 0ch →γ cuando puede deberse a que existe un proceso espacial que opera a distancias mas pequeñas que las que fueron tenidas en cuenta para los valores de h. Este proceso de micro-escala, tiene silla c

0→h

MS. Entonces.

MSME cc += 20 σ

donde es la varianza del error. Por lo tanto, si cualquiera de las dos componentes es diferente de cero, el semivariograma presentará una discontinuidad puntual en el origen; la magnitud de esta discontinuidad es llamada el EFECTO PEPITA y se representa c

2MEσ

0. Silla Parcial: si un semivariograma tiene efecto pepita c0 y silla C , la diferencia entre C

( )0( )0 - c0 es llamada la silla parcial del semivariograma.

En presencia del efecto pepita, la relación entre el semivariograma y el covariograma se altera:

En el modelo sin pepita ( )[ ] ( ) 20 σ== CsZVar i En el modelo con pepita se define ( )[ ] ( ) ξ+== 00 cCsZVar i donde ξ es la

silla parcial ( y ( )[ ] ξσ +== 02 csZVar i

Se puede expresar el semivariograma como ( ) ( )hfch ξγ += 0 , para alguna . Entonces

( )hf

( ) ( )( )

0 0 1

0⎩⎨⎧

=+>−

=hchhf

hCξ

ξ

El efecto pepita es obvio en muchos conjuntos de datos. Si no hay error de medida es un indicador de que no hay muestras a distancias menores que las tomadas. Nota: Si un proceso es estacionario de segundo orden, no debe tener un efecto pepita. De igual forma, si se confirma el efecto pepita, el proceso no será considerado mas como estacionario de segundo orden.

6

Page 7: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

Cuando existe el efecto pepita, se calcula una medida para la estructura de la variabilidad relativa (RSV). Esta es la elevación relativa del semivariograma sobre el efecto pepita en porcentaje:

RSV= 10011000

0

0

xc

cx

c ⎟⎟⎠

⎞⎜⎜⎝

⎛+

−=⎟⎟⎠

⎞⎜⎜⎝

⎛+ ξξξ

RSV mide cuanta de la variabilidad de las observaciones es debido a la estructura. El resto es debido a errores de medida y/o de la variabilidad de micro-escala.

1.4 Modelos de semivariograma con isotropía Los modelos paramétricos de semivariograma son muy importantes en estadística espacial. El semivariograma debe ser CND: condicionalmente no negativo. Para cualquier conjunto de ubicaciones s1,… ,sk y constantes a1,…,ak, se debe cumplir que

( )∑∑= =

≤−k

i

k

jjji ssaa

11 02γ

Al estimar el semivariograma de un conjunto de datos, el semivariograma empírico no necesariamente cumple esta condición, y por lo tanto no puede ser usado para inferencia, ni para ningún tipo de predicción espacial. El procedimiento usual es

calcular el semivariograma empírico de los datos ajustar un modelo de semivariograma paramétrico al semivariograma

empírico. La elección del modelo garantiza la condición CND y por lo tanto se puede proceder a la inferencia estadística y al ajuste del modelo.

1.4.1 Modelo con solo efecto pepita (Pepita Puro) Es un modelo estacionario de segundo orden.

( )⎩⎨⎧

≠=

=0h c0h 0

;s

θγ h

En este modelo todas las observaciones están incorrelacionadas. Es el equivalente espacial de una muestra aleatoria en la estadística clásica.

7

Page 8: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

0

1

2

3

4

5

6

0 5 10 15 20 25

h

1.4.2 Modelo Lineal Es un modelo con estacionariedad intrínseca, válido en Rd, d . 1≥

( )⎩⎨⎧

≠+

==

0 0 0

;0 hhbc

hh θγ

05

1015202530354045

0 5 10 15 20 25

h

Como se puede ver en gráficamente este modelo no tiene estacionariedad de segundo orden, pues el semivariograma no tienen asíntota. Para que sea válido es necesario que 0 ,00 ≥≥ bc

8

Page 9: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

El modelo esférico es uno de los mas populares

1.4.3 Modelo Esférico Es estacionario de segundo orden válido en R1 , R2 y R3

( )

⎪⎪⎪

⎪⎪⎪

>+

≤<⎥⎥⎦

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

⎛−+

=

=

ahcc

ahah

ah

cc

h

h

s

s

0 21

23

0 0

;

0

3

0θγ

02468

101214

0 10 20 30 40 5

h

0

Tiene rango a y silla . Cerca al origen este semivariograma es muy semejante al lineal. Inmediatamente sobrepasa el rango, el modelo se hace cero, hecho que indica que la covarianza sería nula a partir de esta distancia. Esto hace que su uso sea muy generalizado. Sin embargo, el hecho de que sea solo una vez diferenciable en

scc +0

ah = genera problemas pues se requieren las segundas derivadas para la estimación vía máximo verosimilitud. Se ha sugerido como alternativa trabajar con su cuadrado, pero este cerca al origen tiene forma parabólica.

1.4.4 Modelo Exponencial Es estacionario de segundo orden, válido en Rd, d 1≥

( )⎪⎪⎩

⎪⎪⎨

>⎥⎥⎦

⎢⎢⎣

⎡−+

=

= −0h 1

0h 0

; 3

0ah

scch θγ

9

Page 10: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

0

2

4

6

8

10

12

14

0 5 10 15 20 25 30 35

h

El modelo exponencial tiene una silla asintótica. El parámetro del rango a es la distancia a la cual el semivariograma completa el 95% de la silla, este valor se llama también el rango efectivo. La parametrización de este modelo por lo tanto no es única.

1.4.5 Modelo Gaussiano Es estacionario de segundo orden, válido en Rd, d 1≥

( )

⎪⎪⎩

⎪⎪⎨

>⎪⎩

⎪⎨⎧

⎥⎥⎦

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

⎛−−+

=

=0 31

0 02

0 hah

cc

h

hs

γ

02468

101214

0 5 10 15 20 25 30 35

h

La diferencia entre el modelo Gaussiano y el exponencial es el cuadrado en el exponente. Al igual que en el modelo exponencial, el parámetro a es el rango efectivo. El modelo Gaussiano es el mas continuo cerca al origen, de los

10

Page 11: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

modelos considerados hasta el momento. De hecho, es infinitamente diferenciable cerca de 0.

1.4.6 Modelo cuadrático Racional Estacionario de segundo orden. válido en Rd, d . 1≥

( )( )⎪

⎪⎩

⎪⎪⎨

>⎥⎥⎦

⎢⎢⎣

++

=

=0

1

0 0

;2

2

0 hah

hcc

h

hs

θγ

0

2

4

6

8

10

12

14

0 5 10 15 20 25 30

h

1.4.7 Modelo Potencial Estacionariedad intrínseca, válido en Rd, d 1≥

( )⎪⎩

⎪⎨⎧

>+

==

0h

0 0;

0λθγ

hcc

hh

s

Este modelo es válido para 20 <≤ λ , ya que en otro caso crece demasiado rápido y con esto violaría la estacionariedad intrínseca.

11

Page 12: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

020406080

100120140160

0 5 10 15 20 25 30

h

La hipótesis de estacionariedad intrínseca

( ) 02

2 →h

hγ cuando ∞→h

1.4.8 Modelo del Seno Cardinal Estacionariedad de segundo orden, válido en R1 , R2 y R3.

( )⎪⎪⎩

⎪⎪⎨

>⎥⎥⎦

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

⎛−+

=

=0 1

0 0

;0 hh

ah

arcsencc

h

hs

θγ

12

Page 13: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

h

Este modelo admite correlaciones negativas que pueden ser causadas por la periodicidad del proceso.

1.5 Grado de Continuidad El grado de continuidad de un proceso espacial muestra que tan bien está estructurado el proceso, es decir, que tan uniforme es. El que presente un semivariograma con menor incremento cerca al origen y la estructura mas precisa es el más uniforme. La predicción en un lugar no muestreado es más fácil y mas precisa si el proceso es uniforme. Cuando se incrementa la irregularidad le falta estructura al proceso espacial y existe menos información sobre Z() en los lugares vecinos de s. Para la misma silla y rango, el semivariograma exponencial se eleva más rápido que el esférico. Se encuentra mas estructura en un proceso con un semivariograma esférico que con un semivariograma exponencial. Además, la inferencia estadística depende en gran medida de la uniformidad del proceso y así de una correcta modelación del semivariograma. La mala especificación de un semivariograma gaussiano tiene un impacto negativo en la robustez de las predicciones espaciales. Por ejemplo, un semivariograma con un efecto cuadrático cerca al origen (gaussiano, racional cuadrático), muestra un grado de continuidad mayor al de un semivariograma que presente una tendencia lineal cerca al origen(esférico, exponencial). El de mayor irregularidad es el modelo pepita puro, que no tiene absolutamente ninguna estructura.

13

Page 14: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

2 El método Geoestadístico

2.1 Características del método geoestadístico Uno de los principales propósitos de los datos geoestadísticos es predecir el atributo Z(s) en puntos no muestreados. El método geoestadístico consiste de los siguientes pasos:

Usando técnicas exploratorias, conocimiento a priori del fenómeno, y/o ambas, propone un modelo posible de media no estacionaria mas un error estacionario o intrínseco de segundo orden, para Z(s).

Estima por mínimos cuadrados ordinarios, la función media que suaviza los datos. Si la media es estacionaria, este paso no es necesario. Los métodos usados no toman en cuenta la correlación espacial.

Si la media es estacionaria, se calcula el semivariograma empírico usando los residuales del paso anterior de los datos originales. Es posible analizar la anisotropía en múltiples direcciones.

Selecciona un modelo válido de semivariograma );( θγ h que sea compatible con el semivariograma empírico.

Ajusta el modelo elegido para estimar sus parámetros. Usando los parámetros estimados del semivariograma ajustado, se

vuelven a estimar los parámetros de la función media, tomando en cuenta la correlación espacial.

Se aplican iterativamente los pasos anteriores si es necesario. Se predice el atributo Z en puntos no muestreados y se calculan las

correspondientes varianzas de los errores de predicción. Se determinan las ubicaciones óptimas para tomar las observaciones

adicionales y se repite todo el proceso si es necesario. El semivariograma y/o covariograma del proceso espacial juega un papel fundamental en el método geoestadístico. Sin embargo, los semivariogramas empíricos no garantizan que las funciones lineales de los atributos Z(s) tienen varianza positiva. Así, se impone la condición de negativo condicional (cnd) para el semivariograma empírico y éste se puede ajustar a un modelo de semivariograma paramétrico. Así, la estimación empírica del semivariograma es en si misma una ciencia.

2.2 Estimación del semivariograma Recordando que el Variograma se calcula ( ) ( )[ ].)( sZhsZVarh −+=γ El estimador clásico de 2 )(hγ es un estimador del momento

14

Page 15: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

( ) ( ){ }∑ −=)(

2

)(1)(2

hNji sZsZ

hNhγ

Martha Bohórquez. Geoestadística

donde ( ) ( ){ }nihsssshN jiji ,...,1;:, ==−=

Y )(hN es la cantidad de pares distintos en N(h). Note que Z(s1)-Z(s3) es el mismo par Z(s3)-Z(s1). El estimador de momentos no requiere estimación de la media ( )[ sZE= ]µ . Sin embargo, se ha hecho implícitamente el supuesto de que la media es constante, de otro modo, el proceso no es estacionario. Si existe una fuerte tendencia en Z(s), es necesario eliminarla antes de la estimación del semivariograma. Por ejemplo, estimar el semivariograma con los residuos en lugar de los datos originales. Este estimador trabaja con los datos en una cuadrícula regular. Si los datos no están igualmente espaciados, el número de pares que están a una distancia h, N(h), puede ser muy pequeño, posiblemente tan pequeño como 1)( =hN . Para datos desigualmente espaciados se crean intervalos de distancias y se combinan todos los pares de puntos a una cierta tolerancia de h:

( ) =+ hγ2 Promedio ( ) ( )( ) ( ) ( ){ }lji hThhNjisZsZ ∈∈− ;,:2 donde T Donde ( )lhT es una región de tolerancia (intervalo de distancia) alrededor de ε±= hhh l: Si el proceso es estacionario de segundo orden, existen ambos, tanto el covariograma como el variograma, y se puede estimar cualquiera de ellos. El estimador del covariograma está dado por:

( ) ( ) ( ){ } ( ){ }( )∑ −−=

hNji ZsZZsZ

hNhC 1ˆ

donde

( )n

sZZ i i∑=

Sin embargo, este estimador ( )hC es sesgado para C(h) bajo estacionariedad de segundo orden. Estimar ( )hγ es mas conveniente ya que:

No requiere estimación del promedio Es insesgado bajo estacionariedad intrínseca Lo afecta menos la tendencia

15

Page 16: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Cuando hay que eliminar tendencias de los datos mediante algunos ajustes funcionales, la estimación se debe hacer con los semivariogramas y covariogramas de los residuos. En este caso los semivariogramas tienen menos sesgo que los covariogramas.

Martha Bohórquez. Geoestadística

Por lo tanto, si se va a estimar empíricamente la estructura de dependencia del proceso espacial se debe estimar ( )hγ y no ( )hC . Pero, si existe tendencia en los datos, y esta no es eliminada, los dos son sesgados y muy pobres.

2.3 Predicción Espacial

Sea el campo aleatorio ( ){ }dRDssZ ⊂∈: donde se ha observado el atributo Z en las ubicaciones s y se desear predecir dicho atributo en una ubicación no observada, basándose en los valores obtenidos en las muestras hechas. Las técnicas de predicción espacial son modalidades de una familia de métodos llamada Kriging. El nombre se debe al Ingeniero minero D.G. Krige, quien desarrolló en la década de los 50, métodos empíricos para predecir características de una mina en alguna ubicación de interés donde no se conocían datos, usando las características conocidas en lugares cercanos donde si habían sido tomados. Su método original es conocido como Kriging ordinario.

nss ,,, 21

El Kriging aparece en muchas formas de acuerdo a si se conocen la media, la distribución de probabilidad de Z(s), si las predicciones son hechas para puntos o áreas y así sucesivamente. Sin embargo, es importante recordar que el Kriging no es el único método de predicción espacial; existen métodos determinísticos como distancia inversa, interpolación polinomial global, interpolación polinomial local, triangulación lineal, funciones de base radial entre otros. La ventaja del kriging sobre los métodos determinísticos es la estimación de la varianza del error de predicción, lo cual permite además estimar intervalos de confianza para dicha predicción además de que el kriging es un método de estimación que da el mejor estimador lineal insesgado (cuando se cumplen todos los supuestos). Inicialmente, el kriging fue desarrollado para aquellos casos donde hay presencia de estacionariedad y posteriormente fue extendido para casos donde se cumple la hipótesis intrínseca.

2.3.1 Generalidades sobre el kriging La toma de muestras da la información de lo que ocurre en cada punto. Sin embargo, no da información acerca de la relación que pueda existir entre

16

Page 17: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

dichos puntos. Se requiere de una forma precisa de estimar valores en puntos intermedios o en el caso de bloques, por ejemplo, estimar el promedio sobre el bloque. La precisión del estimador usado depende de varios factores:

El número de muestras tomadas La calidad de la medición en cada punto

Martha Bohórquez. Geoestadística

Las ubicaciones de las muestras en la zona; si las muestras son

igualmente espaciadas se alcanza una mejor cobertura, dando mayor información acerca de la zona que aquella que se obtendría de muestras muy agrupadas en unos sectores y separadas en otros. Sin embargo, en la práctica, debido a las características de las regiones de estudio, muchas veces es preciso tomar muestras irregularmente espaciadas.

las distancias entre las muestras; para la predicción es mas confiable usar muestras vecinas que muestras distantes, esto es, la precisión mejora cuando la cercanía de las muestras aumenta, y se deteriora cuando esta disminuye. La extrapolación no es aconsejable.

La continuidad espacial de la variable o atributo en estudio; es más fácil estimar el valor de una variable bastante regular en una región que una que presenta grandes fluctuaciones.

2.3.2 Introducción a la teoría del kriging Ejemplo 1

Supongamos que se tienen las mediciones Z(s1), Z(s2), Z(s3) y Z(s4), en los puntos s1, s2, s3 y s4 respectivamente, y se requiere predecir el valor Z(s0). El valor a predecir se ubica mas cerca de s2 que de cualquier otra ubicación donde se tenga medición; por lo tanto, es lógico pensar que Z(s0) es mas parecido a Z(s2) que a cualquiera de los otros tres valores medidos. De acuerdo a lo anterior, se puede optar para la predicción, por una media ponderada de las cuatro mediciones, en la cual Z(s2) tiene mayor peso que cualquier otra, seguida en su orden por Z(s4), Z(s3) y por último Z(s1).

*s1 *s2

+s0

*s3 *s4

Así, 0 1 1 2 2 3 3 4 4Z(s )= Z(s )+ Z(s )+ Z(s )+ Z(s )λ λ λ λ

17

Page 18: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Donde los iλ , son los factores de ponderación o pesos tales que 1,2,3,4i =

2 4 3 1λ λ λ> > > λ y . 4

1

1ii

λ=

=∑ En general, para obtener una estimación de Z(s0), se realiza una combinación lineal de los valores Z(si), : 1i n= …

Martha Bohórquez. Geoestadística

01

ˆ ( ) ( )n

i ii

Z s Zλ=

= ∑ s

Los parámetros iλ son los factores de ponderación o coeficientes de ponderación y son calculados de acuerdo a los siguientes criterios:

0ˆ ( )Z s sea insesgado

sea mínima 0ˆ( ( ) ( ))Var Z s Z s− 0

Note que

2 20 0 0 0 0 0

22 20 0 0 0 0 0

ˆ ˆ ˆ( ( ) ( )) ( ( ) ( )) ( ( ) ( ))

ˆ ˆ ˆ( ( ) ( )) ( ( ) ( )) ( ( ) ( ))

Var Z s Z s E Z s Z s E Z s Z s

E Z s Z s E Z s Z s E Z s Z s

− = − − −

⎡ ⎤= − − − = −⎣ ⎦

Ahora

[ ]

2 20 0 0 0

1 1 1

20 0

1 1 1

ˆ( ( ) ( )) ( ) ( ) 2 ( ) ( ) ( )

( ) ( ) 2 ( ) ( ) ( )

n n n

i i j j i ii j i

n n n

i j i j i ii j i

E Z s Z s E Z s Z s Z s Z s Z s

E Z s Z s E Z s Z s E Z s

λ λ λ

λ λ λ

= = =

= = =

⎡ ⎤⎛ ⎞⎛ ⎞− = − +⎢ ⎥⎜ ⎟⎜ ⎟

⎝ ⎠⎢ ⎥⎝ ⎠⎣ ⎦

⎡ ⎤⎡ ⎤= − +⎣ ⎦ ⎣ ⎦

∑ ∑ ∑

∑∑ ∑

Si ha estimado el semivariograma o bien se conoce la función de covarianza, también se tendrán los valores

[ ] 20 0( ) ( ) , ( ) ( ) y ( )i j iE Z s Z s E Z s Z s E Z s⎡ ⎤⎡ ⎤⎣ ⎦ ⎣ ⎦

Por lo tanto, se encontrarán los iλ minimizando esta varianza. Del respectivo proceso de minimización se obtendrá un sistema de ecuaciones, que cambiará de acuerdo a las hipótesis que se tengan sobre la media y la covarianza del proceso, y la distribución de la variable en estudio. En la próxima sección se mencionarán algunos de estos casos.

18

Page 19: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

2.3.3 Cálculo de los factores de ponderación para algunos casos Kriging Simple El kriging simple asume el conocimiento tanto de la media como de la covarianza del proceso. Por supuesto, es poco práctico ya que en general

Martha Bohórquez. Geoestadística

estos dos parámetros son desconocidos y es preciso estimarlos a partir de los datos de la muestra. Definamos la variable

( ) ( )Y s Z s µ= −

donde µ es la media de la variable en la región de estudio y por lo tanto

( ) 0E Y s =⎡ ⎤⎣ ⎦ . Entonces si ahora encontramos la predicción de ( )0Y s , tendremos

( ) ( )01

ˆn

i ii

Y s Y sλ=

= ∑ .

Ahora para encontrar los factores de ponderación vamos a minimizar el error de predicción . Como ( ) ( )( )0Y s Y s− 0 ( )0Y s es desconocido, se minimizará el

error cuadrático medio de predicción; esto es, hay que minimizar

( ) ( )( )2

0 0ˆE Y s Y s−

Que según vimos en la sección anterior, se puede escribir como

[ ]

[ ]

2 20 0 0 0

1 1 1

01 1 1

ˆ( ( ) ( )) ( ) ( ) 2 ( ) ( ) ( )

2 (0)

n n n

i j i j i ii j i

n n n

i j i j i ii j i

E Y s Y s E Y s Z s E Y s Y s E Y s

Cov s s Cov s s Cov

λ λ λ

λ λ λ

= = =

= = =

⎡ ⎤⎡ ⎤− = − +⎣ ⎦ ⎣ ⎦

⎡ ⎤= − − − +⎣ ⎦

∑∑ ∑

∑∑ ∑

Ahora, se aplica el proceso clásico de minimización derivando parcialmente respecto a cada uno de los parámetros iλ e igualando a cero estas derivadas, con lo que las ecuaciones quedan:

19

Page 20: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

( ) ( ) ( )2

0 0 01

ˆ 2 2 0 i = 1 nn

j i j iji

E Y s Y s Cov s s Cov s sλλ =

∂ ⎡ ⎤ ⎡ ⎤− = − − − =⎣ ⎦⎣ ⎦∂ ∑ …

con lo cual queda definido un sistema de n ecuaciones con n incógnitas. Para j

arbitraria la ecuación es: ( 1j = … )n

Martha Bohórquez. Geoestadística

( )

( )

01

01

2 2

n

j i j ij

n

j i j ij

Cov s s Cov s s

Cov s s Cov s s

λ

λ

=

=

⎡ ⎤ 0− − − =⎣ ⎦

⎡ ⎤− = −⎣ ⎦

Que es un sistema con única solución en virtud de la matriz de coeficientes la cual es definida positiva. Así para predecir la variable original Z

( ) ( )01

ˆn

i ii

Z s Zµ λ µ=

= + −∑

y la varianza del error de predicción queda

( ) ( )( ) ( )( ) ( )0 01

ˆn

i i ii

Var Z s Z s Var Z s Cov s sλ=

− = − −∑ 0

De donde podemos concluir que la varianza del error de predicción es menor a la varianza de la variable en estudio, lo cual es consecuencia del conocimiento de los parámetros del proceso. Kriging Ordinario El kriging ordinario se usa cuando la variable es estacionaria con covarianza conocida y media desconocida. Aunque el proceso es similar al del kriging simple, no podemos centrar la variable, ya que no conocemos µ , así que es necesario trabajar directamente con la variable en estudio Z. Nuevamente la predicción es

01

ˆ ( ) ( )n

i ii

Z s Zλ=

= ∑ s

Al no conocer la media es necesario garantizar la propiedad de insesgamiento:

20

Page 21: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

( )ˆE Z Z=

De esta forma,

( )1

( )n

i ii

E Z s E Zλ µ=

⎡ ⎤ = =⎢ ⎥⎣ ⎦∑

lo cual es equivalente a

Martha Bohórquez. Geoestadística

[ ]1 1

( )n n

i i ii i

E Z sλ λ µ µ= =

= =∑ ∑

Por tanto, es indispensable que se cumpla la condición de que

1

1n

ii

λ=

=∑

para obtener un estimador insesgado. Se mantiene igual la segunda condición que es la de mínima varianza; partamos de la expresión ya deducida de la varianza

[ ]2 20 0 0 0

1 1 1

ˆ( ( ) ( )) ( ) ( ) 2 ( ) ( ) ( )n n n

i j i j i ii j i

E Z s Z s E Z s Z s E Z s Z s E Z sλ λ λ= = =

⎡ ⎤⎡ ⎤− = − +⎣ ⎦ ⎣ ⎦∑∑ ∑

Donde bajo las nuevas condiciones se tiene:

( ) 2

2 20

( ) ( )

( ) (0)

i j i jE Z s Z s Cov s s

E Z s Cov 2 2

µ

µ σ µ

⎡ ⎤ = − +⎣ ⎦⎡ ⎤ = + = +⎣ ⎦

Sustituyendo en la varianza queda

( ) ( ) ( )2 20 0

1 1 1 1 1 1

ˆ( ( ) ( )) 2 0 2 1n n n n n n

i j i j i i j i j ii j i i j i

E Z s Z s Cov s s Cov s s Cλ λ λ µ λ λ λ= = = = = =

⎡ ⎤− = − − − + + − +⎢ ⎥

⎣ ⎦∑∑ ∑ ∑∑ ∑

pero

2

1 1 1 1

2 1 1n n n n

i j i ii j i i

λ λ λ λ= = = =

⎡ ⎤ ⎡ ⎤ 0− + = − =⎢ ⎥ ⎢ ⎥⎣ ⎦⎣ ⎦∑∑ ∑ ∑

por la propiedad de insesgamiento. Así que la expresión a minimizar es

21

Page 22: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

( ) ( ) ( )1 1 1

2 0n n n

i j i j i i ji j i

Cov s s Cov s s Cλ λ λ= = =

− − − +∑∑ ∑

bajo la restricción

( )ˆE Z Z=

Se utiliza para estos casos el método de los multiplicadores de Lagrange:

Martha Bohórquez. Geoestadística

( ) ( ) ( )1

, ni

i i j i jii

Cov s s Cov s sφ λ µ

λ µλ =

∂= − − − −

∂ ∑

( ) ( ) ( )1

, ni

i i j i jii

Cov s s Cov s sφ λ µ

λ µλ =

∂= − − − −

∂ ∑

( ) ( )1

0n

i i j i ji

Cov s s Cov s sλ µ=

− − − − =∑

( ) (1

n

i i j ii

Cov s s Cov s sλ µ=

− − = −∑ )j

( )1

,1

ni

ii

φ λ µλ

µ =

∂ ⎡ ⎤= −⎢ ⎥∂ ⎣ ⎦∑

1

1 0n

ii

λ=

− =∑

1

1n

iiλ

=

=∑ Dando como resultado el sistema de 1n + ecuaciones del kriging ordinario:

( ) ( )1

n

i i j ii

Cov s s Cov s sλ µ=

− − = −∑ j

11

n

iiλ

=

=∑

a partir de las cuales se encuentran los valores de los factores de ponderación para llevar a cabo la predicción. Por último, la varianza del error de predicción para este caso es

( ) ( )( ) ( )( ) ( )0 0 01

ˆn

i i ii

Var Z s Z s Var Z s Cov s sλ µ=

− = − −∑ +

que tal como es de esperarse es mayor que la del kriging simple, debido al desconocimiento de la media de la variable en estudio. Kriging Ordinario para variables intrínsecas

22

Page 23: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Este es un caso más general, en el cual la varianza no existe y las condiciones impuestas sobre la variable regionalizada son:

( ) ( ) 0E Z s h Z s+ − =⎡ ⎤⎣ ⎦

( ) ( ) ( )12

h Var Z s h Z sγ = + −⎡ ⎤⎣ ⎦

Nuevamente, hay que imponer las siguientes restricciones

Martha Bohórquez. Geoestadística

Estimación lineal

01

ˆ ( ) ( )n

i ii

Z s Zλ=

= ∑ s

Insesgamiento

( )ˆE Z Z=

Mínima varianza

( ) ( ) ( ) ( )2

0 0 0 0ˆ ˆVar Z s Z s E Z s Z s⎡ ⎤ ⎡− = −⎣ ⎦ ⎣ ⎤⎦ es mínima

Aplicando nuevamente el método de los multiplicadores de Lagrange, se obtienen los factores de ponderación y la varianza del error de predicción es

( ) ( )( ) ( )0 0 01

ˆn

i ii

Var Z s Z s s sλγ µ=

− = −∑ +

Este es el caso más general ya que es válido tanto para variables estacionarias como para variables intrínsecas. En general, el kriging es òptimo cuando la variable en estudio proviene de una población con distribución normal. Si esto no se cumple, aun cuando se puede aplicar ya no es óptimo puesto que deja de ser insesgado. La alternativa con cual se debe trabajar es aplicarle a la variable una transformación que la lleve a una normal y a partir de la nueva variable transformada estimar el semivariograma y aplicarle las ecuaciones del kriging. Al final, el análisis requiere llevar la variable a su escala original. Un caso que surge bastante en casos prácticos es el de la distribución log-normal. Por otro lado, si la variable en estudio muestra alguna tendencia en una dirección específica, es indispensable, determinar la forma de esta tendencia y llevar a cabo el respectivo suavizamiento antes de estimar el semivariograma.

23

Page 24: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Martha Bohórquez. Geoestadística

2.3.4 Tipos de Kriging En la siguiente tabla se muestra una lista de las variantes de los métodos de Kriging. Caracteristicas Método Tamaño del objetivo Puntos Kriging puntual Area Kriging en Bloques Se conoce µ es conocida Kriging Simple

µ es desconocida pero constante

Kriging Ordinario

( )[ ] conocido ,ββµ XsZE == Kriging Universal Distribución Z(s)�N Kriging lnZ(s)�N Log-normal Kriging

( )( sZ )φ �N Kriging Trans-gaussiano

Z(s) es una variable indicador Kriging Indicador

Z(s)�N con valores atípicos aislados. Kriging robusto

Distribución desconocida Kriging Mediana Polish

( )sµ es un proceso aleatorio

Kriging Bayesiano

Número de Atributos Un único atributo Kriging Múltiples atributos Cokriging Linealidad

24

Page 25: 1.1.1 Supuesto de Estacionariedad - Bienvenidos y krigi… · Martha Bohórquez. Geoestadística 1 Estacionariedad e isotropía. Variograma y Covariograma 1.1 Conceptos y Definiciones

Predictor lineal en Z(s) Kriging

Predictor lineal en funciones de Z(s) Kriging Disyuntivo

Martha Bohórquez. Geoestadística

2.3.5 Validación Cruzada El método mas usado para verificar la calidad de los resultados así como la validez de los supuestos hechos para la predicción es el de validación cruzada. Consiste en extraer de la muestra los n datos pero uno a la vez, para con los

restantes predecir el valor de la variable en la ubicación extraída; así, se elimina la fila correspondiente a

1n −( )iZ s , se encuentra ( )ˆ

iZ s con los datos restantes, se calcula el error de predicción para cada una de las ubicaciones:

1n −

( ) ( )ˆi iZ s Z s−

También se puede llevar a cabo un diagrama de dispersión de los datos observados contra cada una de sus respectivas predicciones; esto es, graficar todas las parejas ( ) ( )( )ˆ ,i iZ s Z s ; si las predicciones son aceptables esta nube

de puntos debería tender a una línea recta de pendiente 45º.

25