practica2

25
CENTROGEO DIPLOMADO EN GEOMÁTICA MÓDULO EN GEOESTADISTICA 2010 ANÁLISIS ESPACIAL UNIVARIADO La Geoestadística se define como la aplicación de la Teoría de Funciones Aleatorias al reconocimiento y estimación de fenómenos naturales, o simplemente, el estudio de las variables numéricas distribuidas en el espacio Practica # 2 Prof. Dr. Darío Rojas A. J. Javier Martínez Cervantes Alberto Porras

Upload: javier-m-cervantes

Post on 20-Jun-2015

2.095 views

Category:

Documents


0 download

DESCRIPTION

PRACTICA #2 DEL 20 Y 21 DE AGOSTO DEL 2010, CENTROGEO

TRANSCRIPT

Page 1: PRACTICA2

ANÁLISIS ESPACIAL

UNIVARIADO

2010

CENTROGEO

DIPLOMADO

EN GEOMÁTICAMÓDULO EN

GEOESTADIS

TICA

Practica # 2Prof. Dr. Darío Rojas A.

J. Javier Martínez Cervantes Alberto Porras

La Geoestadística se define como la aplicación de la Teoría de Funciones Aleatorias al reconocimiento y estimación de fenómenos naturales, o simplemente, el estudio de las variables numéricas distribuidas en el espacio

Page 2: PRACTICA2

1) Objetivo

Evaluar y practicar el uso de diversas funciones que permiten realizar el análisis espacial univariado de un conjunto de datos.

A partir de un conjunto de datos construir el diagrama de dispersión h y el variograma experimenta, igualmente se estudiara su forma en función del valor dado de la amplitud de clase (“h” lag). La cual se ajustara a diferentes modelos de variograma experimental; con el cual podremos elegir el que mejor se comporte.

2) Introducción

Las herramientas y funciones que se usaron para describir la relación espacial entre dos variables pueden ser también usadas para describir la relación entre el valor de una variable y el valor de la misma en puntos de su vecindad. Su aplicación nos permite estudiar aspectos tales como la continuidad espacial de la variable, sus tendencias de variación, direcciones privilegiadas o isotropía en su comportamiento espacial.

Las relaciones espaciales entre los datos de una variable pueden ser mostradas mediante el uso de un diagrama de dispersión h, que es la gráfica sobre un par de ejes cartesianos de todos los pares de mediciones (z(xi ), z(xi + h)) de el mismo atributo z en sitios separados por una distancia h y en una dirección particular θ.

Por otro lado, la similitud o disimilaridad entre los datos separados por un vector h

puede ser cuantificada de diversas maneras:

La función de covarianza que mide la similitud entre los datos.

C (h)= 1N ( h) ∑α=1

N (h )

z ( xα )z ( xα+h)−mxm x+h

Donde m x=

1N (h ) ∑α=1

N (h)

z ( xα) y

m x+h=1

N (h ) ∑α=1

N (h)

z ( xα+h )

El correlograma es una medida sin unidades que mide la similitud entre los datos y que es la forma estandarizada de la covarianza. El conjunto de coeficientes de correlación para los diferentes valores de h constituyen la función correlación experimental.

El semivariograma que, a diferencia del correlograma y la covarianza, mide la disimilitud promedio entre los datos separados por un vector h.

Existen diversas herramientas que nos ayudan a cuantificar la relación entre el valor de una variable en un lugar particular y el valor de la misma variable en lugares localizados a distancias diferentes (continuidad espacial).

Entre las herramientas más comunes para cuantificar la continuidad espacial se encuentra el variograma que puede ser visto como un resumen de un grupo de diagramas de dispersión-h en donde a cada valor del variograma le corresponde

2

Page 3: PRACTICA2

un diagrama de dispersión diferente (que depende de la distancia h en el eje de las absisas).

El variograma experimental se constituye como una realización particular del fenómeno de estudio y representa un modelo estadístico (no determinista).

El semivariograma experimental se calcula como:

γ (h )= 12N(h ) ∑i=1

N (h)

( z (ui )−z (ui+h ))2

Donde N(h) es el número de pares de datos cuyas localizaciones están a una distancia h. El semivariograma es una función tanto de la distancia como de la dirección, aunque en el caso de esta práctica consideraremos el caso isotrópico.

3) Datos De WijsLos datos utilizados en esta práctica llevan el nombre de De Wijs. Esta serie de datos fue tomada en 1951 en la mina chilena de Pulacayo y consta de 118 mediciones del contenido de Zinc realizadas en intervalos regulares de distancia (cada dos metros).

A continuación presentamos la serie de datos (el orden es por renglones): 17.7 17.8 9.5 5.2 4.1 19.2 12.4 15.820.8 24.1 14.7 21.6 12.8 11.9 35.4 12.314.9 19.6 10.6 15.1 15.6 9.3 8.1 13.530.2 29.1 7.4 12.3 13.6 9.5 13.1 27.48.8 11.4 6.4 11.0 11.4 14.1 20.9 10.615.3 24.0 12.3 7.8 9.9 20.7 25.0 19.113.1 27.4 15.2 12.2 10.1 12.3 16.7 18.66.0 11.6 11.3 4.7 10.9 6.0 7.2 5.68.9 5.8 8.9 6.7 7.2 9.7 10.8 17.910.9 13.7 22.3 10.2 5.1 13.9 9.0 10.6

13.8 6.5 6.5 10.6 10.6 23.0 21.8 32.830.2 30.8 33.7 26.5 39.3 24.5 24.9 23.216.0 20.9 10.3 22.6 16.2 22.9 36.9 23.518.5 16.4 17.9 18.5 13.6 7.9 31.9 14.17.1 3.9 3.7 22.5 27.6 17.3

4) Diagrama de dispersión h.

4.1) Cargue en su hoja de trabajo de excel los datos contenidos en el archivo dewijs.xls

Como se mencionó, el diagrama de dispersión h muestra la relación entre los pares de valores de una variable, para una clase dada de distancia y dirección.Los pares de datos son típicamente agrupados en clases de distancias (lags) [h ± Δh] y ángulos [ ± Δθ]. Por convención el comienzo del vector h, z(xi) es llamado valor cola (tail), mientras que el valor al final z(xi + h) es llamado el valor cabeza (head).

4.2) Realice los diagramas de dispersión h para los valores del Zn , con h=2m, 4m, 6m. La abscisa corresponde a los valores de las colas y las ordenadas a las cabezas. (Inserte las gráficas obtenidas en su reporte de laboratorio).

Nota: Para poder visualizar de una mejor manera la correlación se puede agregar a la gráfica una línea con inclinación de 45º.

DESARROLLO

Primeramente cargamos Excel, en seguida abrimos el archivo de De Wijs, el cual se trabajó en la práctica pasada.

Los datos medidos están a cada 2 metros de distancia.

3

Page 4: PRACTICA2

Ahora seleccionamos los datos a cada dos metros, esto lo hacemos poniendo el apuntador más clic y jalándolo hasta el último dato.

4

Datos de Zn de De wijcs

Datos a cada 2 metros

Para seleccionar los datos hay que poner el apuntador más clic en el botón izquierdo del ratón y se arrastra hasta el último dato que vayamos a seleccionar.

Page 5: PRACTICA2

5

Ahora le damos botón derecho al mouse y seleccionamos la opción de copiar

Page 6: PRACTICA2

La celda C1 llevara el nombre de “h=2m.”

En la columna “D” pondremos h = 4 metros, para esto seleccionamos lo valores desde 4m hasta el último valor.

6

Ponemos el apuntador en la celda C2, le damos clic al botón derecho del mouse y seleccionamos la opción de pegar

Page 7: PRACTICA2

7

Para el diagrama de dispersión de h = 4m tomaremos los valores desde 9.5 hasta el último dato.

Para seleccionar los datos le damos clic al botón izquierdo del mouse y lo arrastramos hacia abajo

Ya que se tienen seleccionados los datos se le da botón derecho al mouse y se selecciona la opción de copiar

Page 8: PRACTICA2

Listo, después de pegar los datos se realizan los mismos pasos para lag igual a 6 m.

Ahora realizaremos la gráfica de dispersión colas vs cabezas a cada 2, 4 6 10 y 12 metros, para esto seleccionamos los datos de la columna B y C.

8

Ponemos el cursor en la celda D2 le damos botón derecho al mouse y le decimos que pegue los datos

Page 9: PRACTICA2

9

Ya cuando tenemos los datos seleccionados nos vamos a Insertar, gráfica de Dispersión, escogemos la que es solo con marcadores.

Para editar la gráfica y poner la línea de tendencia le damos un clic a la gráfica, ahora nos vamos a Herramientas de gráficos, diseño de gráfico, ahí seleccionamos el diseño número 9, para editar los encabezados nada más se la da doble clic sobre el mismo

Page 10: PRACTICA2

Este mismo procedimiento se realiza para la gráficas faltante, h = 4m, se seleccionan los datos de la columna B2:B117, D2:D117, al tener seleccionadas estas columnas se realizan todos los pasos anteriores para realizar la gráfica de dispersión. Esto es para h= 6m, h=8m, h=10m y h=12m.

4.3 Preguntas

1 ¿Cómo sería la nube de puntos para un valor de h=0?

2 ¿Cómo se manifestaría en el diagrama de dispersión h una correlación perfecta?

3 ¿Es igual el número de puntos que aparecen en los diagramas de dispersión para diferentes valores de h? De qué depende el número de puntos?

4 ¿Qué significa el hecho de que la dispersión de la nube de puntos vaya aumentando conforme aumenta la distancia h?

5 ¿Existe alguna relación entre el ensanchamiento de la nube de puntos y el coeficiente de correlación?

6 ¿Existe alguna relación entre el ensanchamiento de la nube de puntos y el variograma

5) Las Funciones covarianza, correlograma y semivariograma.

5.1) Función de covarianza para el Zinc De acuerdo a las fórmulas vistas en clase implemente la función covarianza (con rangos de clase de 0,2, 4, 6, 8, 10 y 12m) y haga la gráfica correspondiente.

DESARROLLOPrimeramente vamos a crear una columna en Excel don tendremos los rangos de clase.

Rangos de clase a cada dos metros

10

Page 11: PRACTICA2

Adyacentemente a la columna de rangos crearemos la columna de covarianza

Ahora calcularemos la covarianza de los datos de dewijcs, para esto utilizaremos la formula COVAR, ponemos el cursor en la celda P2 y escribimos la formula seleccionando los datos a 0, 2, 4, 6, 8, 10 y 12 metros.

Hay que tomar en cuenta que los datos se tienen que acomodar en la forma de la hoja de arriba

11

En la Celda P2 ponemos la fórmula: =COVAR(B2:B119,B2:B119)

En la celda P3 escribimos la fórmula:

=COVAR(B2:B119,C2:C119)

En la celda P4 escribimos la fórmula:

=COVAR(B2:B117,D2:D117)

Page 12: PRACTICA2

Ya cuando se obtienen los valores de los diferentes rangos se seleccionan los datos y se realiza la gráfica (si no se recuerda cómo se realiza una gráfica, ver practica uno)

5.2) Correlograma.De manera análoga haga la función del correlograma con su gráfica correspondiente.

DESARROLLOAdyacentemente a la columna de COVARIANZA creamos la columna del correlograma (correlación).

h covarianza correlograma0 63.50948652 28.64572944 18.32229196 19.57397058 11.3623777

10 15.52371612 10.786588

Ahora calcularemos la correlación entre los datos de dewijcs, para esto utilizaremos la fórmula COEF.DE.CORREL ( ), ponemos el cursor en la celda Q2 y escribimos la formula seleccionando los datos

Los datos se pueden acomodar al gusto del estudiante, este es sólo un ejemplo para desarrollar la práctica.

12

Page 13: PRACTICA2

Después de calcular todos los valores para “h” se realiza la gráfica “h vs correlograma”

5.3) Preguntas

7. Analice las curvas obtenidas y explique su comportamiento. ¿Existe alguna relación entre ellas?

8 ¿Qué significa el comportamiento decreciente de la función de covarianza y el correlograma?

9. ¿A qué distancia de separación (aproximada) decrece a cero la correlación y covarianza entre los datos?

13

En la Celda Q2 (h=0) escribimos la fórmula:=COEF.DE.CORREL(B2:B119,B2:B119)

En la Celda Q3 (h=2) escribimos la fórmula:=COEF.DE.CORREL(B2:B118,C2:C118)

En la Celda Q4 (H=4) escribimos la fórmula:=COEF.DE.CORREL(B2:B117,D2:D117)

Page 14: PRACTICA2

5.4) Semivariograma.Obtenga los siguientes semivariogramas experimentales e inserte las gráficas correspondientes en su reporte.

i) Clases de distancia de 2m, es decir, h= [0,2,4,6,8…] y Δh=0m

DESARROLLOAbrimos Excel copiamos los datos de Dwijs y los pegamos en la columna A de cada una de nuestras hojas de trabajo

Para calcular el valor del semivariograma de h=2, acomodaremos los datos de la siguiente manera (este es sólo un ejemplo, el estudiante los puede acomodar como mejor se acomode).

Datos de dewijcs a cada 2 metros

14

Vamos a crear tres hojas con H=2, H=4, H=6. En cada una de estas hojas vamos a pegar los datos de Dwijcs en la columna A.

Page 15: PRACTICA2

En las columnas C, E, G y I calcularemos la diferencia entre colas y cabezas al cuadrado

15

En la celda C2 Le damos Enter y se arrastra la formula hasta el valor final (CELDA “C118”)

En la celda C2 escribiremos la fórmula:=(A2-B2)^2Mientras que en la celda I2 sera la siguiente fórmula:=(A2-H2)^2Así sucesivamente para h=4, h=6

Page 16: PRACTICA2

Para calcular los valores restantes del semivariograma h=2, se realiza los mismos pasos mencionados anteriormente. Ya cuando se tienen todos los valores se realiza la gráfica de h= 2, ejemplo:

Después de terminar el semivariograma para h=2, pasamos a la hoja H=4, para calcular su semivariograma de la misma manera como si hiso en el ejemplo pasado.

16

En la celda C120 calculamos el semivariograma de la siguiente manera:=C119/(2*118)

Dónde:C119: es la sumatoria de la columna C118: es el número total de datos ocupados (colas y cabezas)

Cuando se tiene todos los valores calculados, pasamos a realizar la sumatoria de los datos

Page 17: PRACTICA2

En las columnas B, D, F y H calcularemos los valores para el semivariograma h=4

Ya que se tienen los valores calculados pasamos a calcular la sumatoria de cada uno de ellos

Por último se realiza la gráfica para el semivariograma h = 4, ejemplo:

Para el semivariograma h=6 se realizan los mismo pasaos de los ejemplos anteriores

17

En la celda B2 escribiremos la fórmula: =(A2-A3)^2Le damos ENTER y arrastramos la fórmula hasta el valor final (CELDA B236)

En la celda D2 la fórmula será: =(A2-A4)^2

Mientras que en la celda F2 es. =(A2-A5)^2

La celda H2 llevara la fórmula. =(A2-A7)^2

En todos los casos la fórmula se arrastra hasta el valor final, siempre será uno menos que el anterior.

Cuando se tiene todos los valores calculados, pasamos a realizar la sumatoria de los datos

En la celda B239 calculamos el semivariograma de la siguiente manera:=B237/(2*236)

Dónde:B237: es la sumatoria de los datos de la columna C236: Es el número total de datos ocupados (colas y cabezas)

Page 18: PRACTICA2

5.5) Preguntas:10. ¿De acuerdo a su opinión cuál de los variogramas experimentales obtenidos es el más óptimo para su utilización y por qué?

11. ¿Qué le sucede al semivariograma en la distancia correspondiente al rango?

12. ¿Qué efecto se manifiesta cuando el valor del semivariograma no tiende a cero al tender h a cero? ¿A qué se debe este efecto?

6) Ajuste manual del variograma a un modelo teórico.

Elija de los variogramas experimentales anteriores el que le parezca más adecuado para ajustar a un modelo teórico.A continuación grafique su variograma experimental y trate de ajustarlo a un modelo esférico de manera manual. Escoja de manera visual el valor del sill de su variograma, después, a partir de un valor inicial para el rango vaya aumentándolo paulatinamente. Grafique los variogramas ajustados sobre el variograma experimental (mínimo 3). En cada caso obtenga el RMSE (Root Mean Square Error) entre el variograma experimental y el ajustado.

Variograma esférico

γ esf (h )={c [1 . 5|h|a

−0 .5(|h|a )3 ]} si|h|≤a ;

γ (h )=c , si|h|≥a

Donde “c” es el valor del sill y “a” el rango en el modelo esférico.

Ejemplo:

Primeramente tendremos que escoger el variograma experimental que más se ajuste a nuestro modelo teórico, para modo de ejemplo utilizare el semivariograma h=4

De este semivariograma experimental obtendremos él sill y el rango el cual se elegirá de forma visual.

18

Page 19: PRACTICA2

Del semivariograma h=4 tenemos que nuestro sill tendrá un valor inicial de 50 y nuestro rango será de 6.9m, estos valores los tomaremos para calcular el variograma teórico. Nos vamos a una hoja nueva de Excel para calcular los diferentes variogramas teóricos, en este caso vamos a variar los valores de SILL y del RANGO, lo cual nos ayudara a tener el mejor modelo teórico, esto lo comprobaremos con el error medio cuadrático (RMSE).

Por último se realizan las gráficas de cada uno de los variogramas calculados

19

Para calcular el variograma teórico vamos a utilizar la fórmula del variograma esférico, el sill y el rango, en la celda D2 vamos a escribir la fórmula:=SI(C2<=$B$3,$B$2*(1.5*C2/$B$3-0.5*(C2/$B$3)^3),$B$2)

En la celda D11 donde ya se varió el valor del SIIL y el RANGO la fórmula será la siguiente:=SI(C11<=$B$12,$B$11*(1.5*C11/$B$12-0.5*(C11/$B$12)^3),$B$11)

En el utlimo variograma teórico el valor de la fórmula será:=SI(C22<=$B$23,$B$22*(1.5*C22/$B$23-0.5*(C22/$B$23)^3),$B$22)

Hay que tomar en cuenta que para que la fórmula funcione, los datos tienen que estar acomodados de la misma manera que en el ejemplo, los valores del SILL y del RANGO variaran en función de los resultados de cada estudiante.

Page 20: PRACTICA2

El error medio cuadrático se calcula con los valores del semivariograma experimental y los valores del variograma teóricoh semivariograma experimental variograma teórico (G2-H2)^2

4 42.38265957 38.60777026 14.24978938 50.86195279 50 0.74296261

12 52.13467532 50 4.55683874SUMATORIA 19.5495907 RMSE= 1.47383064

6.1) Preguntas:13.- ¿Según usted cuál es el mejor ajuste?14.- ¿Cuál es el ajuste al que le correspondió el menor RMSE?15.- ¿Usted considera que el RMSE es el mejor parámetro para ajustar un variograma experimental a un modelo teórico? ¿Por qué?

20