3.4
DESCRIPTION
CLASSTRANSCRIPT
Tema 3: Análisis espacial. 4) Análisis Ráster III: Interpolación y geoestadística.
Profesora titular: Daniela Ballari PhD – [email protected]
Profesor ayudante: Enrique Acosta PhD – [email protected]
Universidad de Cuenca
Interpolación
Cálculo de valores en puntos no muestreados, a partir de
los valores recogidos en otra serie de puntos.
≈ 10 ≈ 9
La proximidad incrementa la semejanza de valores. Es decir,
existe autocorrelación espacial para la variable interpolada.
No autocorrelación, ptos. con
valores independientes.
Distintos resultados según el
método de interpolación.
Clasificación métodos interpolación
Según los puntos considerados para el cálculo de valores.
● Globales: Consideran que todos los puntos de los que disponemos tienen
influencia sobre el valor a calcular en una celda.
● Locales: Sólo consideran un conjunto restringido de estos. Por umbral de
distancia (todos los situados a una distancia menor que el umbral), o por
conteo (los n puntos más cercanos), o bien ambos.
Según su valor en los puntos de partida.
● Exactos: Los valores asignados a las coordenadas correspondientes a los
puntos de origen son exactamente los recogidos en dichos puntos.
● Aproximados: El valor en esas celdas es el que corresponde al mejor ajuste,
y no ha de coincidir necesariamente con el valor original.
Según la inclusión o no de elementos probabilísticos.
● Estocásticos: Emplean elementos probabilísticos.
● Determinísticos: No los emplean.
a) Regular: Sitúa puntos a intervalos fijos, constituyendo lo que se conoce como una malla de muestreo.
b) Aleatorio: Azar, sin obedecer a ningún condición particular. Recomendado cuando se desconoce el comportamiento de la variable muestreada.
c) Estratificado: Requiere la presencia de una variable adicional relacionada. Si esta variable se encuentra zonificada, podemos subdividir el muestreo haciendo uso de las distintas zonas.
Tipos de muestreo
Métodos
Vecino más próximo
Vecino natural
Ponderado por distancia
Splines
Kriging
Práctica
Problema: Reproducir el ráster de precipitaciones a partir de los
puntos de muestreo y de diferentes métodos de interpolación.
Abrir GIS los archivos:- Precipitaciones mensual acumulada 2000/04 (ráster).
- Puntos de muestreo (vectorial).- Límite de Ecuador (vectorial).
Vecino más próximo
El valor resultante para una celda dada es sencillamente el del
punto más próximo.
Método local, exacto y determinístico.
No es adecuada para el trabajo con variables continuas, pero sí
para variables categóricas.
Vecino más próximo (QGIS)
Si da problemas, comprobar que
el SRC de sampling3 y del proyecto es el mismo
Vecino más próximo (QGIS – SAGA toolbox)
Imagen original del
satélite TRMM (Tropical Rainfall Measuring Mission)
Vecino más próximo (QGIS – SAGA toolbox)
Vecino natural
Halla el subconjunto de muestras de
entrada más cercano a un punto de
consulta y aplica ponderaciones sobre
ellas basándose en áreas propor-
cionales para interpolar un valor
(Sibson, 1981). También se conoce
como interpolación de Sibson o de "robo
de área".
Local (usa un subconjunto de muestras
alrededor de punto de consulta), exacto
y determinístico.
Genera superficies suaves.
Los vecinos naturales de cualquier
punto son aquellos asociados a los
polígonos de Voronoi (Thiessen)
cercanos. http://resources.arcgis.com/es/help/main/10.1/index.html#//005v00000027000000
Vecino natural
Estos polígonos (verdes) se crean al unir
los puntos entre sí, trazando las
mediatrices de los segmentos de unión.
Las intersecciones de estas mediatrices
determinan una serie de polígonos
alrededor de los puntos de control, de
manera que el perímetro de los
polígonos generados es equidistante a
los puntos vecinos y designan su área
de influencia.
A continuación, se crea un nuevo
polígono de Voronoi beige alrededor del
punto de interpolación (estrella roja). La
proporción de superposición entre este
nuevo polígono y los polígonos iniciales
se utiliza como los pesos.
http://resources.arcgis.com/es/help/main/10.1/index.html#//005v00000027000000
Vecino natural (QGIS - SAGA)
Vecino natural (QGIS - SAGA)
Imagen original del
satélite TRMM (Tropical Rainfall Measuring Mission)
Vecino natural (ArcGIS)
Vecino natural (ArcGIS)
Imagen original del
satélite TRMM (Tropical Rainfall Measuring Mission)
Ponderado por distancia
Local, aproximado y determinístico.
El valor en celda dada se calcula mediante una media
ponderada de los puntos de influencia seleccionados (por
distancia o por número de estos).
Sólo tienen en cuenta el alejamiento, pero no la posición.
Los métodos basados en
distancia no generan valores
que se encuentren fuera del
rango de valores de los datos
de entrada, lo cual deriva en
un «aplanamiento» de la
superficie y la aparición
de falsas terrazas (a), otros
como los splines (b) sí.
Ponderado por distancia (QGIS)
Ponderado por distancia (QGIS - SAGA toolbox)
Imagen original del
satélite TRMM (Tropical Rainfall Measuring Mission)
Ponderado por distancia (QGIS)
Ponderado por distancia (ArcGIS)
Ponderado por distancia (ArcGIS)
http://www.esri.com/news/arcuser/0704/files/interpolating.pdf
, Splines &
Imagen original del
satélite TRMM (Tropical Rainfall Measuring Mission)
Ponderado por distancia (ArcGIS)
Splines o curvas adaptativas
Local / global, exacto y
determinístico.
La superficie creada cumple la
condición de minimizar con
carácter global alguna propiedad
tal como la curvatura.
Pueden alcanzar valores fuera del rango definido por los
puntos de partida.
Splines o curvas adaptativas (QGIS)
Imagen original del
satélite TRMM (Tropical Rainfall Measuring Mission)
Splines o curvas adaptativas (QGIS)
Splines o curvas adaptativas (ArcGIS)
Imagen original del
satélite TRMM (Tropical Rainfall Measuring Mission)
Splines o curvas adaptativas (ArcGIS)
Kriging
Local / global, exacto / aproximado y estocástico.
Fuerte carga geo-estadística y existen variantes: Simple, Ordinario, Cokriging.
Requisitos:
● El error de predicción debe ser mínimo.
● Los puntos cercanos deben tener pesos mayores que los lejanos.
● La presencia de un punto cercano en una dirección dada debe restar influencia
(enmascarar) a puntos en la misma dirección pero más lejanos.
● Puntos muy cercanos con valores muy similares deben agruparse, de tal forma
que no aparezca sesgo por sobremuestreo.
http://www.esri.com/news/arcuser/0704/files/interpolating.pdf
Pueden alcanzar valores fuera del rango
definido por los puntos de partida.
● La estimación del error debe
hacerse en función de la estructura de
los puntos, no de los valores.
Kriging
● Autocorrelación espacial.○ Primera ley de la geografía de Tobler: “Todo está relacionado con todo, pero
las cosas más cercanas están más relacionadas que las cosas lejanas”.
○ Correlación de la variable consigo misma, de tal modo que los valores de
esta variable en un punto guardan relación directa con los de esa misma
variable en otros puntos cercanos.
○ Positiva: Los valores altos suelen tener en su entorno valores también altos.
○ Negativa: Los valores altos se rodean de valores bajos y viceversa.
+ – No Autocorrelación
Kriging
● Semivariograma.
○ Se fundamenta en el concepto de semivarianza:
γ(xi,xj) = 1/2(zi−zj)2
○ La semivarianza entre dos puntos es la mitad de la
diferencia al cuadrado de sus valores. Si los valores
son similares, la semivarianza será pequeña.
○ La semivarianza es una evidencia de
autocorrelación espacial.
Kriging
Nube de semivarianza
● Muestra una comparación entre pares de puntos en función de su distancia
geométrica.
● Desventaja: Muchos puntos, difícil de interpretar.
X = distancia entre pares de puntos
Y= semivarianza
Kriging
Variograma empírico
Resume la nube de semivarianza. Separa las distancias por grupos y calcula la
media de la semivarianza por grupos.
X= grupos de distancias
Y= semivarianza media
Kriging
Variograma empírico
Elementos básicos
● Rango: Máxima distancia hasta la cual
existe dependencia espacial. Es el valor
en el que se alcanza la máxima varianza,
o a partir del cual ya presenta una
tendencia asintótica.
● Sill: El máximo valor del variograma,
cuando los puntos se asintotizan.
Representa la máxima variabilidad en
ausencia de dependencia espacial.
● Nugget: Conforme la distancia tiende a
cero, el valor de la semivarianza tiende a
este valor. Representa una variabilidad
que no puede explicarse mediante la
estructura espacial (ruido).
Kriging
Variograma teórico: Ajuste del modelo
Kriging (SAGA)
Kriging (SAGA)
Kriging (SAGA)
Nugget = 0
Range = 300.000Sill = 9.500
Kriging (QGIS)
Kriging (QGIS)
Kriging (QGIS)
Imagen original del
satélite TRMM (Tropical Rainfall Measuring Mission)
Kriging y varianza (QGIS)
Original TRMM Ponderado por DistanciaPor vecinos
Splines Kriging
Resumen (QGIS)
Estadísticas zonales por provincias (QGIS)
Estadísticas zonales por provincias (QGIS)
Estadísticas zonales por provincias (QGIS)
Kriging (ArcGIS)
1
23
http://www.aguaysig.com/2011/03/geoestatistical-analyst-analisis.html
http://foro.gabrielortiz.com/comparte/repositorio/darney/Taller%20de%20Geoestadistica%20lluvias.pdf
Kriging (ArcGIS)
1.- Análisis exploratorio de los datos.
Kriging (ArcGIS)
Moda = (2,14 + 2,49) / 2 = 231,5
Coeficiente de variación (CV) = (Std. Dev / Mean) * 100)
= (94,358 / 259,72) * 100 = 36,33 %
Media, la moda y la mediana son diferentes y el coeficiente de sesgo no está comprendido entre -0,5 y + 0,5
(skewness = 0,50159), por lo tanto, no es una distribución normal y es necesario realizar una transformación logarítmica de los datos para conseguir la distribución normal.
Si CV < 100, no
hay problema con los valores extremos de los
datos.
Si 100<CV≤200, los efectos
causados por los valores extremos de los datos son
tolerables.
Si CV>200, se tiene problemas
severos con los valores extremos de los datos.
Kriging (ArcGIS)
Moda = (5,7 + 5,84) / 2 = 5,77
Coeficiente de variación (CV) = (Std. Dev / Mean) * 100)
= (0,36993 / 5,494) * 100 = 6,73 %
Kriging (ArcGIS)
Se encuentra más o menos normalizado con algunas desviaciones, pero
se nota claramente una tendencia central.
Kriging (ArcGIS)
Kriging (ArcGIS)
Es importante analizar si los
datos manifiestan tendencias
direccionales que permitan
establecer correlaciones en
esas direcciones, y formular
modelos de comportamiento.
Este gráfico 3D nos ayuda a
ver qué tendencia siguen los
datos para luego, en el análisis
estructural, indicar qué tipo de
tendencia debe ser eliminada.
Se observa una débil tendencia
tanto en el plano XZ como en
el plano YZ.
Kriging (ArcGIS)
Rotamos la nube de puntos y
vemos cómo cambian las
líneas de tendencias. Si éstas
siguen:
- Una línea recta
Tendencia lineal.
- Una curva con una
concavidad Tendencia
cuadrática o segundo orden.
- Una curva con más de una
concavidad Tendencia de
orden 3.
Kriging (ArcGIS)
Conclusión del análisis exploratorio:
- Los datos originales no seguían una distribución normal
y ha sido necesario aplicarles una transformación
logarítmica para que su distribución sea normal.
- Es necesario eliminar una tendencia de segundo orden.
Kriging (ArcGIS)
Conclusión del análisis exploratorio:
- Los datos originales no seguían una distribución normal
y ha sido necesario aplicarles una transformación
logarítmica para que su distribución sea normal.
- Es necesario eliminar una tendencia de segundo orden.
Kriging (ArcGIS)
2.- Análisis estructural de los datos y creación del modelo geoestadístico.
Kriging (ArcGIS)
Hemos concluido que es necesario realizar
transformación logarítmica de los datos para que
tengan distribución normal.
Hemos visto que los datos siguen una tendencia
de segundo orden.
Kriging (ArcGIS)
Esta ventana
permite concluir
si los datos
presentan
anisotropía
direccional o no.
Si en la gráfica
aparece un
círculo, no hay
anisotropía
direccional.
Si aparece otra cosa, como es el caso, sí existe anisotropía direccional, y
habrá que indicarlo en la ventana siguiente.
Kriging (ArcGIS)
Angle: Debemos cambiar el ángulo hasta que las líneas que se muestran en la figura coincidan con la
dirección de la elipse en su parte superior.
Bandwidth (lags): Una vez realizado el paso anterior, los puntos o parte inferior de las líneas deben cortar a la elipse, para ello se aumenta o disminuye el valor de Bandwidth.
Cuidado, puede ser que si dejamos «semivariograma» no veamos la elipse de la anisotropía.
Kriging (ArcGIS) Modelo esférico
Kriging (ArcGIS)
- Recálculo de los datos en comparación con los valores medidos para verificar.
- Predicción de los errores.
- Un gráfico de comparación de datos medidos y datos calculados. Los datos que más se
alejan de la línea, son los que mayores errores presentan en su predicción.
Obtenemos:
Modelo esférico
Kriging (ArcGIS)
Resumen del
modelo esférico.
Kriging (ArcGIS)
Modelo esférico
Kriging (ArcGIS)
3.- Mapa de errores
Modelo esférico
Kriging (ArcGIS)
El máximo error (dentro de Ecuador) oscila entre 85 y 138 %, muy alto. La
confiabilidad del modelo se calcula como 100 menos el error máximo, es decir, 100
- 138 = - 38 %. Para que un modelo geoestadístico sea aceptable, debe tener una
confiabilidad superior al 90%, por lo tanto se concluye que es necesario mejorar la
densidad de las estaciones meteorológicas. Los errores mayores en la predicción se producen donde existe menos información.
Modelo esférico
Kriging (ArcGIS)
Para seleccionar el modelo que crea la
mejor superficie interpolada, es necesario
aplicar cada uno de ellos y escoger el que
presente:
- Menor Root-Mean-Square.
- Menor Average Standard Error.
- Root-Mean-Square Standardized más
cercano a uno.
- Mayor porcentaje de confiabilidad.
MODELO ESFÉRICO
Parámetro Valor
Root-Mean-Square 56,96
Average Standard Error 59,68
Root-Mean-Square Standardized 0,97
Confiabilidad -38 %
Paso 4 de 6
Paso 6 de 6
Kriging (ArcGIS) Modelo exponencial
Kriging (ArcGIS)
Mod. esférico
Modelo exponencial
Kriging (ArcGIS)
Modelo exponencial
El máximo error (dentro de Ecuador) oscila entre 106 y 161 %, muy alto. La
confiabilidad del modelo sería 100 - 161 = - 61 % (peor resultado que el modelo esférico, -38 %).
Elección del método de interpolación.
● Las características de la variable a interpolar. a. Valores de precipitación máxima anual, no es adecuado utilizar aquellos métodos que
suavicen excesivamente la superficie resultante, ya que se estarían perdiendo los valores
extremos que, por la naturaleza del valor interpolado, son de gran interés.
● Las características de la superficie a interpolar. a. Variaciones bruscas en puntos de discontinuidad tales como acantilados en el caso de
interpolar elevaciones, son aplicables mediante la imposición de barreras con métodos
como el de distancia inversa, pero no con otros como el kriging.
● La calidad de los datos de partida. a. Los datos de partida son de gran precisión → los métodos exactos porque preservan la
información original.
b. Datos de partida contienen mucho ruido → Kriging que suavizan el resultado y el efecto
de ruido es preferible.
● El rendimiento de los algoritmos. a. Basados en distancia son rápidos y requieren un tiempo de proceso aceptable.
b. Kriging es más complejo y el tiempo de proceso es elevado.
● El conocimiento de los métodos.