cl4_cl5

56
Conceptos útiles Configuración geométrica de los datos 1 Fuente: Apuntes de G. Fuster, U. Católica.

Upload: javier-ignacio

Post on 15-Sep-2015

222 views

Category:

Documents


2 download

DESCRIPTION

Conceptos útiles de estimación de recursos, configuración geométrica de los datosMétodos desagrupantes y sus desventajasejemplos

TRANSCRIPT

  • Conceptos tilesConfiguracin geomtrica de los datos

    1

    Fuente: Apuntes de G. Fuster, U. Catlica.

  • Configuracin geomtrica de los datos

    De acuerdo con la configuracin geomtrica de los datos, el muestreo se clasifica en:

    1. Regular

    2. Aleatorio2.1 Estratificado

    2.2 Uniforme

    2.3 Preferencial

    3. Irregular

  • 1. Regular

    Los datos estn espaciados a una distancia constante. Se habla as de mallas de 200x200, 100x100 50x50 metros, por ejemplo.

  • 2.1. Aleatorio estratificado

    Consiste en dividir la zona de estudio segn una grilla regular y escoger al azar la ubicacin del dato dentro de cada celda.

  • 2.2. Aleatorio uniforme

    La ubicacin de los datos se escoge al azardentro de un dominio. Se puede ver estemuestreo como la realizacin de un procesoaleatorio uniforme sobre una superficie.

  • 2.3. Aleatorio preferencial

    La densidad de datos no es uniforme en elespacio. La ubicacin de ellos se escoge al azardentro de un subconjunto del dominio. En laprctica, este muestreo es el ms comn.

  • 3. Irregular

    Si la ubicacin de los datos no es modelable por ninguno de los mtodos anteriores, entonces el muestreo es irregular.

    En este caso, al igual que el muestreo aleatorio preferencial, la solucin para encontrar un estimador consiste en desagrupar los datos dentro del dominio en estudio, o bien, intentar separar el dominio en subconjuntos cuya densidad de muestreo pueda considerarse constante.

  • Cmo impacta?

    Casi siempre se calcula la ley promedio con pesos iguales para todas las muestras.

    Muestras poco separadas son redundantes (esencialmente entregan la misma informacin).

  • Ejemplo

    Ley media de los datos: 0.534%

    o o o

    0.373 0.015 0.172

    o o o

    0.654 0.792 0.308

    o o o

    0.574 1.194 0.724

  • Ejemplo (2)

    Ley media de los datos: 0.671%

    Con 4 datos adicionales, la ley se incrementa un 25%.

    o o o

    0.373 0.015 0.172

    o o o

    0.654 0.792 0.308

    o o

    o0.912

    o1.002

    o

    0.574o

    1.194o

    0.724

    0.882 1.119

  • Mtodos de desagrupamiento

    Polgonos de influencia.

    Mtodo de la grilla.

    Celda desagrupante.

  • Polgonos de influencia

  • Polgonos de influencia

    13

  • Desventajas del mtodo

    El peso asociado a cada muestra es el rea del polgono dividida por el rea total. Proceso lento.

    Las orillas del depsito requieren un tratamiento especial.

    Y para 3 dimensiones?

  • Mtodo de la grilla

    Similar a la idea de los polgonos de influencia, pero fcil de utilizar en 3D.

    Se cubre el dominio con una grilla de puntos.

    Se le asigna a los puntos una ley en base al vecino ms cercano.

    Se calculan las estadsticas sin pesos con todos los puntos de la grilla.

  • Mtodo de la grilla

    o o o

    0.373 0.015 0.172

    o o o

    0.654 0.792 0.308

    o o

    o0.912

    o1.002

    o

    0.574o

    1.194o

    0.724

    0.882 1.119

    o o o

    0.373 0.015 0.172

    o o o

    0.654 0.792 0.308

    o o

    o0.912

    o1.002

    o

    0.574o

    1.194o

    0.724

    0.882 1.119

  • Desventajas del mtodo

    El espaciamiento de la grilla debe ser ms pequea que la separacin de los datos agrupados.

    La grilla tendr muchos puntos si el espaciamiento de ella es pequeo.

    Los problemas de borde se mantienen.

  • Celda desagrupante

    Se toma una grilla regular sobre el dominio.

    Se cuenta el nmero de muestras en cada celda.

    Se define un peso que es inversamente proporcional al nmero de muestras.

  • Definicin de peso:

    nci: nmero de datos en la celda que contiene el dato i.

    wi: peso aplicado al dato i para calcular la media ponderada.

    =

    =

    n

    i i

    i

    nc

    nc

    iw

    1

    1

    1

  • Celda desagrupante

    Ley desagrupada: 0.515%.

    o o o

    0.373 0.015 0.172

    o o o

    0.654 0.792 0.308

    o o

    o0.912

    o1.002

    o

    0.574o

    1.194o

    0.724

    0.882 1.119

    o o o

    0.373 0.015 0.172

    o o o

    0.654 0.792 0.308

    o o

    o0.912

    o1.002

    o

    0.574o

    1.194o

    0.724

    0.882 1.119

    Ley 1/nc peso0.373 1/1 1/90.015 1/1 1/90.172 1/1 1/90.654 1/1 1/90.792 1/1 1/90.308 1/1 1/90.574 1/1 1/90.912 1/5 1/451.002 1/5 1/451.194 1/5 1/450.882 1/5 1/451.119 1/5 1/450.724 1/1 1/9

  • Desventajas del mtodo

    Es un mtodo de prueba y error:

    Generalmente se prueban varios tamaos de celda.

    Generalmente se selecciona el tamao de celda que minimice la ley media *.

    La celda no tiene porque ser cuadrada.

  • Anlisis del tamao de la celda en base a la media

  • Ejemplo Isatis

    23

  • Aplicacin de los mtodos

    Data Locations

    0

    200

    400

    600

    800

    1000

    0 200 400 600 800 1000

    Drillhole CollarDrillhole on GridGrade Above 1%

  • Celda desagrupante

    Se toma el tamao de celda que minimiza la ley en 0.52%.

    Average Grade By Cell Size

    Cell Size (m)

    Ave

    rage G

    rade (%)

    0.40

    0.45

    0.50

    0.55

    0.60

    0.65

    0.70

    0.75

    50 100 150 200 250 300 350 400 450

  • Polgonos de influencia:

  • Resultados:

    Media de los datos: 0.70%.

    Celda desagrupante: 0.52%.

    Polgonos de influencia: 0.54%.

    Mtodo de la grilla: 0.51%.

    Datos regulares cada 200 m : 0.52%.

  • Concepto de valores extremos (outliers)

    Corresponden a valores que se escapan a la poblacin comn de los datos.

    Ningn mtodo estadstico sirve para encontrarlos.

    Estos valores se deben estudiar detalladamente y medir su impacto.

    Chequear en laboratorio la confianza del valor.

    Buscar una base geolgica a su existencia.

    Ajustar vecindad de bsqueda.

  • Repaso estadstica

    D. ABURTO M.

    2014

    29

  • Segn la enciclopedia universal

    La palabra estadstica hace referencia tanto al conjunto de datos de

    observaciones como a la actividad que consiste en su recopilacin, su tratamiento

    y su interpretacin.

    (traducido del libro: Probabilits, Analyse des donnes et statistique, SAPORTA, 1990)

    Ejemplo: El registro diario de la temperatura mxima en Santiago durante los ltimos 20 aos constituye una estadstica, mientras que hacer estadstica sobre estos datos consistira por

    ejemplo en, trazar grficos, calcular la media, valor mximo, etc

    30

  • Generalidades

    Realizar estadstica supone estudiar un conjunto de

    objetos equivalentes sobre los cuales observamos

    caractersticas llamadas variables. Ejemplo: ley de CuT

    (variable) de un yacimiento de tipo prfido cuprfero.

    Poblacin (dominio): nocin fundamental en

    estadstica, grupo o conjunto de objetos equivalentes.

    Los objetos son llamados individuos o unidades

    estadsticas.

    31

  • Generalidades

    La estadstica se interesa en las propiedades de la

    poblacin y no en los individuos en particular (ejemplo:

    nos interesamos en la proporcin de outliers y no en un

    outliers en particular).

    32

  • Definiciones generales

    Generalmente, la poblacin (dominio) es bastante

    grande para ser observada exhaustivamente (ms

    evidente para el caso de una poblacin infinita).

    Censo: El estudio de todos los elementos de una

    poblacin finita.

    Sondaje: observacin de una parte de la

    poblacin, la parte estudiada se llama muestra.

    33

  • Definiciones generales

    Variables: conjunto de caractersticas que describen a cada individuo de una poblacin.

    Cuantitativas o numricas: talla, peso, volumen, densidad, ley de un elemento qumico. Nmeros reales sobre los cuales operaciones matemticas tienen sentido.

    Continuas: leyes de mineral, densidad, recuperacin metalrgica.

    Discretas: nmero de fallas, nmero de camiones.

    Cualitativas o categricas: se expresan de acuerdo a la pertenencia a una categora de un conjunto finito. Ej. Tipo de roca, mineralizacin, alteracin.

    34

  • Generalidades

    El concepto clave en estadstica es la variabilidad, que significa que los individuos en apariencia semejantes pueden tomar valores diferentes.

    El anlisis estadstico es por esencia el estudio de la variabilidad, lo que permitir por ejemplo prever de manera probabilstica el comportamiento de individuos que an no han sido observados. (interpretacin de la informacin o creacin de modelos).

    35

  • Generalidades

    Luego de la recoleccin de datos, la tarea de la estadstica consiste en realizar el tratamiento y la interpretacin de la informacin.

    Estadstica exploratoria o descriptiva: su objetivo es sintetizar, resumir y estructurar la informacin contenida en los datos (tablas, grficos, indicadores numricos). Se generan hiptesis, se construyen grupos homogneos, se reducen variables.

    Estadstica inductiva o inferencial: su objetivo es de extender las propiedades constatadas en la muestra a toda la poblacin, y de validar e inferir hiptesis a priori o formuladas luego de la fase exploratoria.

    36

  • Estadstica y probabilidades

    La teora de probabilidades es una rama de las

    matemticas que se ocupa de las propiedades

    de ciertas estructuras usadas para modelar

    fenmenos donde interviene el azar.

    Permite modelar eficazmente ciertos

    fenmenos aleatorios.

    37

  • Estadstica y probabilidades (nexo)

    La estadstica se basa en la observacin de

    fenmenos concretos (realidad). Los nexos con el

    modelo probabilstico:

    Datos observados imprecisos (error). El modelo

    probabilstico permite representar el error como

    una variable aleatoria.

    Constatacin que la reparticin estadstica de una

    variable (representativa de una poblacin) es

    cercana a modelos matemticos propuestos por el

    clculo de probabilidades (leyes de

    probabilidades).

    38

  • Estadstica y probabilidades

    Las muestras de los individuos observados son la mayora de las veces extradas al azar en la poblacin (para asegurar su representatividad).

    Si el muestreo es equiprobable. Las caractersticas observadas en las muestras se transforman en variables aleatorias y el clculo de probabilidades permite estudiar su reparticin.

    39

  • .

    Experiencia aleatoria: una experiencia es

    calificada de aleatoria cuando no podemos

    predecir sus resultados, y si repetida en

    condiciones idnticas, ella puede entregar

    resultados diferentes.

    40

  • variables aleatorias

    Definicin: Una VA es una funcin que entrega un valor numrico a cada resultado de una experiencia aleatoria. Ejemplo clsico el lanzamiento de un dado.

    Se representa siempre por una letra mayscula,

    en general X, Y o Z.

    Una VA tiene siempre una ley de probabilidad, que describe la probabilidad de cada valor posible de la VA.

    41

  • Tipos de VA

    VA Discreta

    Los valores posibles forman un conjunto discreto.

    Se puede tener la probabilidad de cada valor posible. 1

    VA Continua

    Los valores posibles estn contenidos en un intervalo.

    Hablamos de probabilidad dentro de un intervalo. funcin de densidad de probabilidad.

    42

    1 1

  • Funcin de densidad de VA

    VA Discreta VA Continua

    Si conociramos todos los valores posibles de la VA sera el histograma de la VA. 0

    43

  • Funcin de distribucin acumulativa de VA

    VA Discreta VA Continua

    44

  • Momentos de una VA

    VA Discreta

    Es el promedio aritmtico de los diferentes valores posibles ponderados por sus probabilidades.

    VA Continua

    45

  • Propiedades de la esperanza

    Las propiedades elementales de la esperanza son aquellas de las integrales y se deducen de la linealidad. ! ! ! " ! "

    46

  • Momentos de una VA

    VA Discreta

    #$ % & % '&()*+'

    VA Continua

    #$ % ' & % '& )*+'

    47

    Varianza: Momento centrado de orden 2.

    de su esperanza.

    Varianza: Momento centrado de orden 2. Medida de la dispersin de una VA alrededor

    de su esperanza.

  • Covarianza de una dupla de VA

    ,*- , " % " % ",*- , " " % ",*- , #$

    48

  • 49

    Marcha aleatoria

  • EjercicioFuente: Centre de geostatistique, cole des mines de Paris.

    Lanzar una moneda 20 veces y registrar el resultado (cara o sello). Evento equiprobable. n = 20

    Tenemos !1 si el resultado es sello %1 si el resultado es cara, para ( 1, , +. Trazar en funcin de (. Calcular el promedio y la varianza de .Tenemos: " 121234& Trazar " en funcin de (. Calcular el promedio de ""5, para 6 0, 1, , 4. Calcular el promedio de

    823982 :& , para 6 0, 1, , 4.50

  • 51

    ; 0,3#$ =1

  • 52

  • 53

  • 54

    -1,5

    -1

    -0,5

    0

    0,5

    1

    1,5

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

    Srie1Srie2Srie3Srie4

    0

    0,1

    0,2

    0,3

    0,4

    0,5

    0,6

    0,7

    0,8

    0,9

    0 0,5 1 1,5 2 2,5 3 3,5 4 4,5

    Srie1Srie2Srie3Srie4

    -0,2

    -0,1

    0

    0,1

    0,2

    0,3

    0,4

    0,5

    0,6

    0,7

    0 0,5 1 1,5 2 2,5 3 3,5 4 4,5

    Srie1Srie2Srie3Srie4

    "

    ""5

    " % "5 &

  • EjercicioFuente: Centre de geostatistique, cole des mines de Paris.

    Versin probabilstica:

    Calcular la esperanza y la varianza de . Calcular la esperanza y la varianza de ".

    Depende ella de (? Calcular la covarianza de Cov " , "5 .

    Depende ella de (? Calcular el variograma de A8 6 & " % "5 &

    Depende el de (?

    55

  • Resultados

    0#$ 1 " 0#$ " & ,*- " , "5 B

    & C(6 0D C(6 10C(6 2

    & " % "5 & B0C(6 0D C(6 1& C(6 2

    56