introducción al análisis geoestadístico con geostatistical analyst

31
Introducción al análisis geoestadístico con Geostatistical Analyst

Upload: alberca-ambar

Post on 13-Apr-2017

139 views

Category:

Engineering


2 download

TRANSCRIPT

Page 1: Introducción al análisis geoestadístico con geostatistical analyst

Introducción al análisis geoestadístico con Geostatistical

Analyst

Page 2: Introducción al análisis geoestadístico con geostatistical analyst

• Estas variables cumplen con el principio siguiente: “aquellas cosas que están más cerca se pueden parecer más que aquellas más separadas”. Esto quiere decir que la correlación entre valores de una propiedad medida en puntos cercanos tiende a ser mayor que la correlación de valores medidos en punto distantes.

• La estadística tradicional no es capaz de incorporar este principio de ahí el origen del estudio de la geoestadística.

Procesos naturales interpretados mediante teoría funciones aleatorias (variables regionalizadas)

Que estudia la geoestadística

Variable aleatoria: es una variable que puede tomar valores de acuerdo a cierta distribución de probabilidades.Variable regionalizada: es una variable aleatoria caracterizada, además de por el conjunto de valores que puede tomar, por su posición en el espacio.Concepto matemático: una variable regionalizada, es, simplemente una función f(x) que toma valores en todos los puntos x de coordenadas (xi, yi, zi) en el espacio tridimensional.

Page 3: Introducción al análisis geoestadístico con geostatistical analyst

)) xxxZ

La teoría de la variable regionalizada considera la variable (atributo) como una variable aleatoria Z(x), donde x representa las coordenadas espaciales. Los valores de Z, de los que hay uno para cada posición, constituyen una particular realización de un proceso aleatorio.

µ(x) componente estructural(media local desconocida) componente aleatorio, espacialmente

correlacionado, cuya varianza viene dada por la siguiente expresión:

)(2])})[{)])var[ 2 hhxxEhxx Se asume:•Variable y sus derivadas son continuas•Media y varianza constantes

Varianza depende solo de distancia.NO de la posición de los puntos.

Geoestadística: planteamiento (1)

Page 4: Introducción al análisis geoestadístico con geostatistical analyst

Geoestadística: planteamiento (2)Consideremos NixZ i ,2,1, puntos en los cuales se tieneinformación de determinada propiedad y xZ * la estimación de

xZ a partir de los puntos ixZ

ixZ

xZ *

Se quiere conocer el valor en un punto sin información

Variables ambientales continuas, observables solo en puntos concretos.

Estimar, o predecir espacialmente, sin sesgo y con un error mínimo.

Page 5: Introducción al análisis geoestadístico con geostatistical analyst

Planteamiento básico de la estimación (por Kriging):

Considerar la estimación de xZ como una combinación lineal de lasobservaciones disponibles

…y escoger los pesos bajo un criterio en el cual se considera que dicha estimación es óptima. Este es que el estimador sea insesgado y que

xZxZ*

var

sea mínima

n

iii xZxZ

1

)()(*

Valor a estimar en algún punto específico

valor en puntos muestreados cercanos al lugar a interpolar

Peso o ponderación que se le da a cada uno de los valores observados de la variable en el lugar Xi

consecuentemente los valores ’s adecuados son los que minimizan la varianza.

Geoestadística: planteamiento (3)

Page 6: Introducción al análisis geoestadístico con geostatistical analyst

¿Que es un estudio Geoestadístico?Pasos para un correcto estudio geoestadístico:

2. Análisis estructural o variográfico

4. Validación del modelo geoestadístico

Estadística descriptivaAnálisis gráficoAnálisis de tendencias

Cálculo (semi)variograma experimentalAjuste del (semi)variograma a un modelo válido

1. Análisis exploratorio de los datos

3. Interpolación o estimación espacial

Page 7: Introducción al análisis geoestadístico con geostatistical analyst

Análisis Exploratorio de Datos • Primer paso de cualquier análisis -(geo)estadístico o no- de datos.• Sirve a familiarizarse con el conjunto de datos.• Representar los datos en figuras y diagramas en vez de analizar directamente listados en formato tabular¿Cuál es la distribución de los datos?, ¿Existen valores anómalos?, ¿El histograma es simétrico o sesgado?, ¿Los datos presentan alguna tendencia? ¿Son isótropos o anisótropos?Para esto es necesario conocer:

•La distribución espacial (estadísticos de base, histogramas)•Presencia de tendencias (análisis de tendencias)•Búsqueda de valores anómalos (box-plot)

El AED permite entender en profundidad las observaciones del fenómeno para poder tomar decisiones sobre como tratarlos.

Las herramientas que se pueden usar en ArcGIS son: Histogram, Normal QQPlot, Trend Analysis, General QQPlot.

Page 8: Introducción al análisis geoestadístico con geostatistical analyst

K= 10*logNA= (val.máx)/K A=rango/K

NK

Análisis Exploratorio de Datos

K= Número de intervalosh = Tamaño intervaloσ = Desviación estándarn = número de muestras

Page 9: Introducción al análisis geoestadístico con geostatistical analyst

Análisis Exploratorio de Datos

El valor de cada polígono puede ser calculado usando cualquiera de métodos: simple, mean, mode, cluster, entropy, median standard deviation, IQR

Voronoi map: construcción de polígonos formados entorno a un punto (dato).

Trend Analysis: proyección 3D de los datos para identificar tendencias y anisotropías en los datos.

Normal QQplot: gráfico que compara la distribución de la variable con la de una distribución normal.

Page 10: Introducción al análisis geoestadístico con geostatistical analyst

• Describe como varía la variable en función de la distancia y dirección

• Se calcula:

• Se ajusta a un modelo por que el variograma experimental no permite evaluar en distancias o direcciones intermedias

hN

iii zz

N 1

2

)(21

ˆ hxxh

h

Análisis estructural o variográficoEl variograma…

Los modelos utilizados habitualmente en el ajuste del variograma son:Gaussiano, Exponencial, Esférico, Polinomial, etc…

Page 11: Introducción al análisis geoestadístico con geostatistical analyst

Kriging

En ArcGIS el ajuste del semivariograma se realiza una vez elegido el método de interpolación.

El kriging es un método geoestadístico muy difundido y del cual existen un gran número de modificaciones.Estos algoritmos están basados en la descripción de la variación espacial de los datos que se modela mediante el variograma.

Page 12: Introducción al análisis geoestadístico con geostatistical analyst

KrigingExisten varios tipos de kriging:

• Kriging simple: media m conocida• Kriging ordinario: media m desconocida• Kriging con deriva: media desconocida que depende de cada posición m(u)

• Kriging universal - intrínseco: la deriva es un polinomio de las coordenadas• Kriging trigonométrico: la deriva es una función periódica• Kriging con deriva externa: la deriva es proporcional a una variable secundaria

• Kriging no lineal: aplica kriging a una transformada de la variable• Kriging lognormal: cuando el logaritmo de los datos tiene una distribución normal• Kriging de indicadores: aplica kriging a datos binarios (indicadores) que codifican

probabilidades de pertenecer a un tipo de roca o de sobrepasar una ley de corte• Kriging disyuntivo: aplica kriging a factores que descomponen la variable a estimar• Kriging multi-Gaussiano: aplica kriging a la transformada Gaussiana de los datos

• Kriging multivariable = cokriging• Etc.

Page 13: Introducción al análisis geoestadístico con geostatistical analyst

• Prediction maps (interpolación): estiman valores donde las medidas no han sido tomadas.

• Standard error maps: (mapa de la raíz cuadrada de la varianza de las estimaciones) muestra la distribución del error de la interpolación. Este tiende a ser mayor en sitios donde hay poca o ninguna información de la variable estudiada.

• Quantile maps : mapa de los valores donde las predicciones exceden (o no exceden) los valores del percentil especificado.

• Probability maps : mapas de probabilidades que los valores exceden (o no exceden) un umbral especificado. Esta probabilidad es determinada a partir de las estimaciones, del error de distribución y del umbral elegido.

Mapas en ArcGIS

Page 14: Introducción al análisis geoestadístico con geostatistical analyst

Algunas referencias

Samper, F.J. & J. Carrera 1990. Geoestadística. Aplicaciones a la Hidrogeología Subterránea. Centro Internacional de Métodos Numéricos en Ingeniería. Universitat Politécnica de Catalunya. Barcelona.

Myers, D. E. 1987. Optimization of Sampling Locations for Variogram Calculations. Water Resources Research. 23(3): 283(93).

Isaaks, E. & R. M. Srivastava. 1989. Applied Geostatistics. Oxford University Press, New York.

Cressie, N. 1993. Statistical for Spatial Data. John Wiley & Sons, New York.

Díaz-Francés, E. (1993). Introducción a Conceptos Básicos de Geoestadística. Memorias Seminario Estadística y Medio Ambiente. Centro de Investigación en Matemáticas, CIMAT. Guanajuato, México.

Christakos, G. (2000), Modern Spatio Temporal Geostatistics, Oxford University Press, New York.

Page 15: Introducción al análisis geoestadístico con geostatistical analyst

Burrough, P.A. (2001). “GIS and geostatistics: essential partners for spatial analysis”. Environmentaland Ecological Statistics, 8, pp. 361-377.

Chica Olmo, M. y Luque Espinar, J.A. (2002). Interpolación espacial en la creación de cubiertas temáticas en SIG. En: HUERTA, L. (Ed.). Los SIG en la gestión de los riesgos geológicos y el medio ambiente. IGME, pp. 181-198.Webster, R. y Oliver, M.A. (2001). Geostatistics for Environmental Scientists. John Wiley and Sons Ltd, Chichester, 271 pp.

Pilz J.(2009). Interfacing Geostatistic and GIS. Springer-Verlag, Berlin

Algunas referencias

Page 16: Introducción al análisis geoestadístico con geostatistical analyst

Análisis y preparación de los datos• Cargar la extensión Geostátical Analyst• Añadir el mapa base y crear la capa de puntos de estaciones

meteorológicas.• Observar la distribución de los datos.• Calcular estadísticos básicos (open attributa table ->atributo-> (botón

secundario -> Statistics)

Page 17: Introducción al análisis geoestadístico con geostatistical analyst

Comprobar la distribución de los datos• En la barra de herramientas Geostatical Analyst-> Explore data->

Histogram• Seleccionar la media para los valores repetidos.• Seleccionar la capa de puntos y en Attribute el campo que corresponda.• En la pestaña Transformation probar a cambiar entre las opciones• Calcular tamaño y número de intervalos con las fórmulas propuestas

• ¿Cómo cambia el histograma?• ¿Cómo podemos definir la distribución de estos datos?• ¿Es necesaria una transformación que nos acerque a una distribución normal?

Page 18: Introducción al análisis geoestadístico con geostatistical analyst

Comprobar la distribución de los datos• Selecciona los intervalos para saber cuáles son los puntos que lo

forman. Comprobar con las áreas de máximos y mínimos selecccionanado el primer y el último intervalo.

• Comprobamos el diagrama normalQQ, para ello: Geostátical Analyst -> Eplore Data-> NormalQQPlot

• Seleccionar el archivo y la variable correctos• En la transformación cambiar a Log ¿Cambia algo?¿Es mejor?

Page 19: Introducción al análisis geoestadístico con geostatistical analyst

Análisis de tendencias• Permite representar los datos en 3D, dibujando regresión de la variable en los

planos E-O y N-S. • Objetivo: visualizar los datos en conjunto, observar tendencias globales y decidir

eliminar durante la interpolación (sólo eliminar si se minimizan notablemente los errores de las estimaciones)

• Geostatistical Analyst -> Explore Data -> Trend Análisis.• En la pantalla que se abre asegurarse de seleccionar el archivo y la variable

Correctos.• Definir las tendencias presentes. ¿Cómo varían los datos en el área de estudio? ¿Cuál es la

tendencia global de los datos?• Observar si todas las variables presentan la misma tendencia cambiando la variable en la

pestaña Attribute

Page 20: Introducción al análisis geoestadístico con geostatistical analyst

Análisis del semivariograma• Geostatistical Analyst -> Explore Data -> Semivariogram/Covariance

Cloud.• En la pantalla que se abre asegurarse de seleccionar el archivo y la

variable correctos.• Seleccionar el tamaño y el número de intervalos que definirán el

variograma• ¿Son adecuados los valores que vienen por defecto?

Page 21: Introducción al análisis geoestadístico con geostatistical analyst

Análisis del semivariograma• Geostatistical Analyst -> Explore Data -> Semivariogram/Covariance Cloud.• En la pantalla que se abre asegurarse de seleccionar el archivo y la variable correctos.• Para reducir el número de puntos en el semivariograma empírico se lleva a cabo un

proceso de agrupación de aquellos pares de localizaciones presentes en el semivariograma en base a la distancia entre ellos. Este proceso genera una serie de grupos de pares de puntos denominados “Bins” a lo largo de todo el área de estudio.

• El control de las condiciones en que se va a realizar este proceso de agrupación se realiza mediante la modificación del tamaño y número de intervalos (Lag size, Number of Lags).

• Seleccionar el tamaño y el número de intervalos que definirán el variograma• ¿Son adecuados los valores que vienen por defecto?

Page 22: Introducción al análisis geoestadístico con geostatistical analyst

Análisis del semivariograma• ¿Cómo podemos determinar qué valores de intervalo pueden proporcionar

un buen ajuste del semivariograma? Para concretar el tamaño (TI) y número (NI) numerosos estudios geoestadísticos coinciden en que se deben cumplir dos condiciones:

• La mitad de la distancia máxima entre puntos (DMAX/2) debe ser aproximadamente igual al producto del número de intervalos (NI) por el tamaño de los mismos.

• La distancia media entre vecinos próximos (DMED) multiplicada por dos debe ser menor o igual al tamaño del intervalo. De esta manera se garantiza que tenemos una probabilidad de al menos el 95% de encontrarnos con tres puntos por cada intervalo.

• Por tanto, para establecer unos valores adecuados de tamaño y distancia de intervalo tenemos en primer lugar que conocer la distancia máxima entre puntos, así como la distancia media entre puntos cercanos.

Page 23: Introducción al análisis geoestadístico con geostatistical analyst

Análisis del semivariograma• Activar Show search direction y mover con el puntero la dirección

Observar las diferencias que existen entre los semivariogramas realizados para la dirección NE-S-у О.

• Crear el semivariograma siguiendo la dirección de la tendencia global que hemos observado anteriormente. ¿Qué cambia?

Mover con el puntero para cambiar la dirección de observación de la correlación espacial

Page 24: Introducción al análisis geoestadístico con geostatistical analyst

Análisis del semivariograma• El tamaño del intervalo (Lag) controla la distancia para agrupar

muestras. • Si el tamaño del lag es muy grande, se omitirá parte de la correlación espacial

en los datos. • Si el tamaño del lag es muy pequeño, no se conseguirán muchos pares de

puntos para el análisis.

• Una forma aceptada de elegir estos parámetros es que el tamaño de lag multiplicado por el número de lags, sea más o menos, la mitad de la distancia máxima entre los puntos que se están estudiando.

Page 25: Introducción al análisis geoestadístico con geostatistical analyst

Análisis del semivariograma• Seleccionar un punto con un alto valor en el eje Y.

• ¿Qué se observa? ¿y que cambia si se seleccionan unos puntos en la parte derecha del diagrama?

• En las figuras a continuación se representan estas dos situaciones. En el gráfico los puntos seleccionados son destacados en azul y en el mapa se representan las dos posiciones que representan el punto elegido del variograma. Esto es como el programa calcula la distancia (el eje de abscisas) de cada par de puntos y su valor de semivariograma (el eje de ordenadas).

Page 26: Introducción al análisis geoestadístico con geostatistical analyst

Análisis del semivariograma

los puntos están a una distancia pequeña (el punto destacado está cerca del cero sobre el eje de abscisas). Los valores, sin embargo, son diferentes.

• las distancias son mayores y se mantiene la diferencia entre los valores medidos.

Page 27: Introducción al análisis geoestadístico con geostatistical analyst

Análisis Geoestadístico: ajuste del semivariograma y creación de mapas.• Geostatistical Analyst ->

Explore Data-> Geostatistical Wizard.

• En esta primera pantalla se decide el archivo que se usa, el atributo que se quiere interpolar y el método que se quiere usar.

• Kriging -> Next-> Ordinary Kriging-> Prediction Map ->next.

Page 28: Introducción al análisis geoestadístico con geostatistical analyst

Análisis Geoestadístico: ajuste del semivariograma y creación de mapas.• Seleccionar el modelo

esférico y activar la casilla Anisotropy, fijándola en True.

• Por ahora dejarlos valores que vienen por defecto y pulsar Next.

Page 29: Introducción al análisis geoestadístico con geostatistical analyst

Análisis Geoestadístico: ajuste del semivariograma y creación de mapas.• El paso 4 permite decidir el

número de puntos cercanos a incluir en el cálculo y el tipo de sector de búsqueda.

• Pulsar Next

Page 30: Introducción al análisis geoestadístico con geostatistical analyst

Análisis Geoestadístico: ajuste del semivariograma y creación de mapas.• En última pantalla que se abre es posible ver los valores de los errores

asociados a esta interpolación.• Valorar si las estimaciones efectuadas son adecuadas.

• Estos estadísticos indican si el modelo y los parámetros usados son adecuados para la variable estudiada y en qué medida es buena la interpolación. Unas estimaciones correctas deberían cumplir con lo siguiente:

Mean y Mean Standardized: próximos a cero.Root-Mean-Square Standardized: próximo a 1.

Si el valor es mayor estamos infravalorando la variabilidad,Si el valores menor estamos sobreestimando la variabilidad de nuestras estimaciones.

Average Standard Error: debería ser parecido al Root-Mean Square. Si el Average Standard Errores mayor que el Root-Mean Square estamos sobrevalorando la variabilidad de las estimaciones, en caso contrario estamos subestimando la variabilidad.

Page 31: Introducción al análisis geoestadístico con geostatistical analyst

Análisis Geoestadístico: ajuste del semivariograma y creación de mapas.• Ya tenemos un primer mapa de la distribución de nuestra variable

• volvemos atrás y calculamos otros ajustes para nuestro semivariograma.• Crear un mapa con el mismo método y usar otro número y tamaño de lag.

Aumentar el número de puntos incluidos en la estimación.