3.4

Tema 3: Análisis espacial. 4) Análisis Ráster III: Interpolación y geoestadística.

Profesora titular: Daniela Ballari PhD – [email protected]

Profesor ayudante: Enrique Acosta PhD – [email protected]

Universidad de Cuenca

Interpolación

Cálculo de valores en puntos no muestreados, a partir de

los valores recogidos en otra serie de puntos.

≈ 10 ≈ 9

La proximidad incrementa la semejanza de valores. Es decir,

existe autocorrelación espacial para la variable interpolada.

No autocorrelación, ptos. con

valores independientes.

Distintos resultados según el

método de interpolación.

Clasificación métodos interpolación

Según los puntos considerados para el cálculo de valores.

● Globales: Consideran que todos los puntos de los que disponemos tienen

influencia sobre el valor a calcular en una celda.

● Locales: Sólo consideran un conjunto restringido de estos. Por umbral de

distancia (todos los situados a una distancia menor que el umbral), o por

conteo (los n puntos más cercanos), o bien ambos.

Según su valor en los puntos de partida.

● Exactos: Los valores asignados a las coordenadas correspondientes a los

puntos de origen son exactamente los recogidos en dichos puntos.

● Aproximados: El valor en esas celdas es el que corresponde al mejor ajuste,

y no ha de coincidir necesariamente con el valor original.

Según la inclusión o no de elementos probabilísticos.

● Estocásticos: Emplean elementos probabilísticos.

● Determinísticos: No los emplean.

a) Regular: Sitúa puntos a intervalos fijos, constituyendo lo que se conoce como una malla de muestreo.

b) Aleatorio: Azar, sin obedecer a ningún condición particular. Recomendado cuando se desconoce el comportamiento de la variable muestreada.

c) Estratificado: Requiere la presencia de una variable adicional relacionada. Si esta variable se encuentra zonificada, podemos subdividir el muestreo haciendo uso de las distintas zonas.

Tipos de muestreo

Métodos

Vecino más próximo

Vecino natural

Ponderado por distancia

Splines

Kriging

Práctica

Problema: Reproducir el ráster de precipitaciones a partir de los

puntos de muestreo y de diferentes métodos de interpolación.

Abrir GIS los archivos:- Precipitaciones mensual acumulada 2000/04 (ráster).

- Puntos de muestreo (vectorial).- Límite de Ecuador (vectorial).

Vecino más próximo

El valor resultante para una celda dada es sencillamente el del

punto más próximo.

Método local, exacto y determinístico.

No es adecuada para el trabajo con variables continuas, pero sí

para variables categóricas.

Vecino más próximo (QGIS)

Si da problemas, comprobar que

el SRC de sampling3 y del proyecto es el mismo

Vecino más próximo (QGIS – SAGA toolbox)

Imagen original del

satélite TRMM (Tropical Rainfall Measuring Mission)

Vecino más próximo (QGIS – SAGA toolbox)

Vecino natural

Halla el subconjunto de muestras de

entrada más cercano a un punto de

consulta y aplica ponderaciones sobre

ellas basándose en áreas propor-

cionales para interpolar un valor

(Sibson, 1981). También se conoce

como interpolación de Sibson o de "robo

de área".

Local (usa un subconjunto de muestras

alrededor de punto de consulta), exacto

y determinístico.

Genera superficies suaves.

Los vecinos naturales de cualquier

punto son aquellos asociados a los

polígonos de Voronoi (Thiessen)

cercanos. http://resources.arcgis.com/es/help/main/10.1/index.html#//005v00000027000000

Vecino natural

Estos polígonos (verdes) se crean al unir

los puntos entre sí, trazando las

mediatrices de los segmentos de unión.

Las intersecciones de estas mediatrices

determinan una serie de polígonos

alrededor de los puntos de control, de

manera que el perímetro de los

polígonos generados es equidistante a

los puntos vecinos y designan su área

de influencia.

A continuación, se crea un nuevo

polígono de Voronoi beige alrededor del

punto de interpolación (estrella roja). La

proporción de superposición entre este

nuevo polígono y los polígonos iniciales

se utiliza como los pesos.

http://resources.arcgis.com/es/help/main/10.1/index.html#//005v00000027000000

Vecino natural (QGIS - SAGA)

Vecino natural (QGIS - SAGA)

Imagen original del


Vecino natural (ArcGIS)

Vecino natural (ArcGIS)

Imagen original del


Ponderado por distancia

Local, aproximado y determinístico.

El valor en celda dada se calcula mediante una media

ponderada de los puntos de influencia seleccionados (por

distancia o por número de estos).

Sólo tienen en cuenta el alejamiento, pero no la posición.

Los métodos basados en

distancia no generan valores

que se encuentren fuera del

rango de valores de los datos

de entrada, lo cual deriva en

un «aplanamiento» de la

superficie y la aparición

de falsas terrazas (a), otros

como los splines (b) sí.

Ponderado por distancia (QGIS)

Ponderado por distancia (QGIS - SAGA toolbox)

Imagen original del


Ponderado por distancia (QGIS)

Ponderado por distancia (ArcGIS)


http://www.esri.com/news/arcuser/0704/files/interpolating.pdf

, Splines &

Imagen original del



Splines o curvas adaptativas

Local / global, exacto y

determinístico.

La superficie creada cumple la

condición de minimizar con

carácter global alguna propiedad

tal como la curvatura.

Pueden alcanzar valores fuera del rango definido por los

puntos de partida.

Splines o curvas adaptativas (QGIS)

Imagen original del


Splines o curvas adaptativas (QGIS)

Splines o curvas adaptativas (ArcGIS)

Imagen original del


Splines o curvas adaptativas (ArcGIS)

Kriging

Local / global, exacto / aproximado y estocástico.

Fuerte carga geo-estadística y existen variantes: Simple, Ordinario, Cokriging.

Requisitos:

● El error de predicción debe ser mínimo.

● Los puntos cercanos deben tener pesos mayores que los lejanos.

● La presencia de un punto cercano en una dirección dada debe restar influencia

(enmascarar) a puntos en la misma dirección pero más lejanos.

● Puntos muy cercanos con valores muy similares deben agruparse, de tal forma

que no aparezca sesgo por sobremuestreo.

http://www.esri.com/news/arcuser/0704/files/interpolating.pdf

Pueden alcanzar valores fuera del rango

definido por los puntos de partida.

● La estimación del error debe

hacerse en función de la estructura de

los puntos, no de los valores.

Kriging

● Autocorrelación espacial.○ Primera ley de la geografía de Tobler: “Todo está relacionado con todo, pero

las cosas más cercanas están más relacionadas que las cosas lejanas”.

○ Correlación de la variable consigo misma, de tal modo que los valores de

esta variable en un punto guardan relación directa con los de esa misma

variable en otros puntos cercanos.

○ Positiva: Los valores altos suelen tener en su entorno valores también altos.

○ Negativa: Los valores altos se rodean de valores bajos y viceversa.

+ – No Autocorrelación

Kriging

● Semivariograma.

○ Se fundamenta en el concepto de semivarianza:

γ(xi,xj) = 1/2(zi−zj)2

○ La semivarianza entre dos puntos es la mitad de la

diferencia al cuadrado de sus valores. Si los valores

son similares, la semivarianza será pequeña.

○ La semivarianza es una evidencia de

autocorrelación espacial.

Kriging

Nube de semivarianza

● Muestra una comparación entre pares de puntos en función de su distancia

geométrica.

● Desventaja: Muchos puntos, difícil de interpretar.

X = distancia entre pares de puntos

Y= semivarianza

Kriging

Variograma empírico

Resume la nube de semivarianza. Separa las distancias por grupos y calcula la

media de la semivarianza por grupos.

X= grupos de distancias

Y= semivarianza media

Kriging

Variograma empírico

Elementos básicos

● Rango: Máxima distancia hasta la cual

existe dependencia espacial. Es el valor

en el que se alcanza la máxima varianza,

o a partir del cual ya presenta una

tendencia asintótica.

● Sill: El máximo valor del variograma,

cuando los puntos se asintotizan.

Representa la máxima variabilidad en

ausencia de dependencia espacial.

● Nugget: Conforme la distancia tiende a

cero, el valor de la semivarianza tiende a

este valor. Representa una variabilidad

que no puede explicarse mediante la

estructura espacial (ruido).

Kriging

Variograma teórico: Ajuste del modelo

Kriging (SAGA)

Nugget = 0

Range = 300.000Sill = 9.500

Kriging (QGIS)

Kriging (QGIS)

Imagen original del


Kriging y varianza (QGIS)

Original TRMM Ponderado por DistanciaPor vecinos

Splines Kriging

Resumen (QGIS)

Estadísticas zonales por provincias (QGIS)

Kriging (ArcGIS)

1

23

http://www.aguaysig.com/2011/03/geoestatistical-analyst-analisis.html

http://foro.gabrielortiz.com/comparte/repositorio/darney/Taller%20de%20Geoestadistica%20lluvias.pdf

Kriging (ArcGIS)

1.- Análisis exploratorio de los datos.

Kriging (ArcGIS)

Moda = (2,14 + 2,49) / 2 = 231,5

Coeficiente de variación (CV) = (Std. Dev / Mean) * 100)

= (94,358 / 259,72) * 100 = 36,33 %

Media, la moda y la mediana son diferentes y el coeficiente de sesgo no está comprendido entre -0,5 y + 0,5

(skewness = 0,50159), por lo tanto, no es una distribución normal y es necesario realizar una transformación logarítmica de los datos para conseguir la distribución normal.

Si CV < 100, no

hay problema con los valores extremos de los

datos.

Si 100<CV≤200, los efectos

causados por los valores extremos de los datos son

tolerables.

Si CV>200, se tiene problemas

severos con los valores extremos de los datos.

Kriging (ArcGIS)

Moda = (5,7 + 5,84) / 2 = 5,77

Coeficiente de variación (CV) = (Std. Dev / Mean) * 100)

= (0,36993 / 5,494) * 100 = 6,73 %

Kriging (ArcGIS)

Se encuentra más o menos normalizado con algunas desviaciones, pero

se nota claramente una tendencia central.

Kriging (ArcGIS)

Kriging (ArcGIS)

Es importante analizar si los

datos manifiestan tendencias

direccionales que permitan

establecer correlaciones en

esas direcciones, y formular

modelos de comportamiento.

Este gráfico 3D nos ayuda a

ver qué tendencia siguen los

datos para luego, en el análisis

estructural, indicar qué tipo de

tendencia debe ser eliminada.

Se observa una débil tendencia

tanto en el plano XZ como en

el plano YZ.

Kriging (ArcGIS)

Rotamos la nube de puntos y

vemos cómo cambian las

líneas de tendencias. Si éstas

siguen:

- Una línea recta

Tendencia lineal.

- Una curva con una

concavidad Tendencia

cuadrática o segundo orden.

- Una curva con más de una

concavidad Tendencia de

orden 3.

Kriging (ArcGIS)

Conclusión del análisis exploratorio:

- Los datos originales no seguían una distribución normal

y ha sido necesario aplicarles una transformación

logarítmica para que su distribución sea normal.

- Es necesario eliminar una tendencia de segundo orden.

Kriging (ArcGIS)

2.- Análisis estructural de los datos y creación del modelo geoestadístico.

Kriging (ArcGIS)

Hemos concluido que es necesario realizar

transformación logarítmica de los datos para que

tengan distribución normal.

Hemos visto que los datos siguen una tendencia

de segundo orden.

Kriging (ArcGIS)

Esta ventana

permite concluir

si los datos

presentan

anisotropía

direccional o no.

Si en la gráfica

aparece un

círculo, no hay

anisotropía

direccional.

Si aparece otra cosa, como es el caso, sí existe anisotropía direccional, y

habrá que indicarlo en la ventana siguiente.

Kriging (ArcGIS)

Angle: Debemos cambiar el ángulo hasta que las líneas que se muestran en la figura coincidan con la

dirección de la elipse en su parte superior.

Bandwidth (lags): Una vez realizado el paso anterior, los puntos o parte inferior de las líneas deben cortar a la elipse, para ello se aumenta o disminuye el valor de Bandwidth.

Cuidado, puede ser que si dejamos «semivariograma» no veamos la elipse de la anisotropía.

Kriging (ArcGIS) Modelo esférico

Kriging (ArcGIS)

- Recálculo de los datos en comparación con los valores medidos para verificar.

- Predicción de los errores.

- Un gráfico de comparación de datos medidos y datos calculados. Los datos que más se

alejan de la línea, son los que mayores errores presentan en su predicción.

Obtenemos:

Modelo esférico

Kriging (ArcGIS)

Resumen del

modelo esférico.

Kriging (ArcGIS)

Modelo esférico

Kriging (ArcGIS)

3.- Mapa de errores

Modelo esférico

Kriging (ArcGIS)

El máximo error (dentro de Ecuador) oscila entre 85 y 138 %, muy alto. La

confiabilidad del modelo se calcula como 100 menos el error máximo, es decir, 100

- 138 = - 38 %. Para que un modelo geoestadístico sea aceptable, debe tener una

confiabilidad superior al 90%, por lo tanto se concluye que es necesario mejorar la

densidad de las estaciones meteorológicas. Los errores mayores en la predicción se producen donde existe menos información.

Modelo esférico

Kriging (ArcGIS)

Para seleccionar el modelo que crea la

mejor superficie interpolada, es necesario

aplicar cada uno de ellos y escoger el que

presente:

- Menor Root-Mean-Square.

- Menor Average Standard Error.

- Root-Mean-Square Standardized más

cercano a uno.

- Mayor porcentaje de confiabilidad.

MODELO ESFÉRICO

Parámetro Valor

Root-Mean-Square 56,96

Average Standard Error 59,68

Root-Mean-Square Standardized 0,97

Confiabilidad -38 %

Paso 4 de 6

Paso 6 de 6

Kriging (ArcGIS) Modelo exponencial

Kriging (ArcGIS)

Mod. esférico

Modelo exponencial

Kriging (ArcGIS)

Modelo exponencial

El máximo error (dentro de Ecuador) oscila entre 106 y 161 %, muy alto. La

confiabilidad del modelo sería 100 - 161 = - 61 % (peor resultado que el modelo esférico, -38 %).

Elección del método de interpolación.

● Las características de la variable a interpolar. a. Valores de precipitación máxima anual, no es adecuado utilizar aquellos métodos que

suavicen excesivamente la superficie resultante, ya que se estarían perdiendo los valores

extremos que, por la naturaleza del valor interpolado, son de gran interés.

● Las características de la superficie a interpolar. a. Variaciones bruscas en puntos de discontinuidad tales como acantilados en el caso de

interpolar elevaciones, son aplicables mediante la imposición de barreras con métodos

como el de distancia inversa, pero no con otros como el kriging.

● La calidad de los datos de partida. a. Los datos de partida son de gran precisión → los métodos exactos porque preservan la

información original.

b. Datos de partida contienen mucho ruido → Kriging que suavizan el resultado y el efecto

de ruido es preferible.

● El rendimiento de los algoritmos. a. Basados en distancia son rápidos y requieren un tiempo de proceso aceptable.

b. Kriging es más complejo y el tiempo de proceso es elevado.

● El conocimiento de los métodos.

3.4

Documents