proyecto_401

58
 Estimación Paramétrica y No Paramétrica de la Tendencia en Datos con Dependencia Espacial. Un Estudio de Simulación. Miguel Ángel Reyes Cortés 30 de junio de 2010

Upload: zamir-cruz

Post on 05-Oct-2015

214 views

Category:

Documents


0 download

DESCRIPTION

una mas

TRANSCRIPT

  • Estimacin Paramtrica y No Paramtrica de laTendencia en Datos con Dependencia Espacial. Un

    Estudio de Simulacin.

    Miguel ngel Reyes Corts

    30 de junio de 2010

  • 2

  • ndice general

    1. Conceptos de Geoestadstica 91.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2. Procesos Espaciales . . . . . . . . . . . . . . . . . . . . . . . . 10

    1.2.1. Procesos Espaciales Estacionarios . . . . . . . . . . . . 111.3. Funcin Variograma y Covarianza . . . . . . . . . . . . . . . . 12

    1.3.1. Variograma y Covarianza Tericos . . . . . . . . . . . 131.3.2. Anisotropa . . . . . . . . . . . . . . . . . . . . . . . . 151.3.3. Estimacin del Variograma . . . . . . . . . . . . . . . 151.3.4. Modelos de Variograma . . . . . . . . . . . . . . . . . 171.3.5. Mtodos de Ajuste del Variograma Experimental, Cri-

    terios de Seleccin y Validacin . . . . . . . . . . . . . 19

    2. Estimacin de la tendencia 232.1. El Modelo General . . . . . . . . . . . . . . . . . . . . . . . . 232.2. Estimador paramtrico . . . . . . . . . . . . . . . . . . . . . . 242.3. Estimador No Paramtrico . . . . . . . . . . . . . . . . . . . . 25

    2.3.1. Estimador local lineal . . . . . . . . . . . . . . . . . . 252.3.2. Estimador local lineal en datos espaciales . . . . . . . 282.3.3. Seleccin de la matriz ventana H . . . . . . . . . . . 28

    2.4. Prediccin Espacial Lineal ptima . . . . . . . . . . . . . . . 29

    3. Descripcin del Estudio de Simulacin 353.1. Comparacin de las Estimaciones de la Tendencia . . . . . . 353.2. Simulacin de una muestra . . . . . . . . . . . . . . . . . . . 363.3. Estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.4. Definicin de los Parmetros de la Simulacin . . . . . . . . . 393.5. Plan de Simulacin . . . . . . . . . . . . . . . . . . . . . . . . 41

    4. Resultados 434.1. Especificacin Adecuada del Modelo . . . . . . . . . . . . . . 43

    4.1.1. Variacin de la proporcin del nugget . . . . . . . . . 434.1.2. Variacin del rango . . . . . . . . . . . . . . . . . . . . 47

    4.2. Especificacin Inadecuada del Modelo . . . . . . . . . . . . . 48

    3

  • 4 NDICE GENERAL

    4.2.1. Variacin de la proporcin de nugget . . . . . . . . . . 484.2.2. Variacin del rango . . . . . . . . . . . . . . . . . . . . 51

    4.3. Estimacin No Paramtrica . . . . . . . . . . . . . . . . . . . 52

    5. Conclusiones 55

  • Resumen

    El presente estudio de simulacin tiene por objetivo estimar la tendenciade un conjunto de datos con dependencia espacial de manera paramtricay no paramtrica. Para ello se efecta un plan de simulacin consistenteen diferentes escenarios en los que vara la dependencia espacial por mediodel rango y del nugget, parmetros ambos de la funcin de covarianza. Lasestimaciones de la tendencia por los diferentes mtodos y en los diferenteescenarios se compara mediante el error cuadrtico medio integrado (MISE),lo que permite determinar no slo su exactitud y su precisin, sino tambincomparar el efecto de variar las condiciones de dependencia espacial. Final-mente, la evidencia sugiere que la estimacin no paramtrica puede ser unabuena opcin en casos en los que nada se sabe sobre el modelo de tendenciade los datos observados.

    5

  • 6 NDICE GENERAL

  • Introduccin

    Una problema importante en la mayora de las investigaciones cientficases la formulacin de modelos estadsticos que representen adecuadamenteel fenmeno aleatorio en estudio. En muchos casos, la utilizacin de mo-delos sencillos que supongan que las observaciones de dicho fenmeno hansido tomadas bajo condiciones idnticas e independientes unas de otras noes adecuado. La falta de homogeneidad en los datos suele ser modelada atravs de la suposicin de una tendencia no constante. Por otra parte, siexiste evidencia para pensar que los datos cercanos en el espacio o en eltiempo son ms semejantes que aquellos que estn alejados, es decir, que losdatos puedan presentar dependencia espacial y/o temporal, resulta ms con-veniente emplear modelos que exploten adecuadamente dicha componenteespacial o espacio-temporal. Si bien estos modelos han recibido mucha aten-cin por la comunidad estadstica en los ltimos aos debido sobre todo a suinters prctico, resulta llamativo el escaso nmero de aportaciones donde elprincipal objetivo sea la realizacin de inferencia estadstica en dichos mode-los cuando se supone la existencia de una funcin media o tendencia. En estetrabajo nos centraremos en la estimacin de la tendencia de modelos con de-pendencia espacial y/o espacio-temporal utilizando tcnicas no paramtricasde tipo polinmico local. Estas tcnicas no paramtricas no presuponen unmodelo funcional paramtrico para dicha funcin tendencia. Por otra parte,en la prctica, para poder realizar estas estimaciones ser necesario estimartambin de alguna manera la dependencia entre las observaciones. Para ello,ser necesario formular modelos adecuados. Con el objeto de realizar un es-tudio lo ms completo posible, utilizaremos varios modelos de dependenciaparmetricos y los compararemos con un modelo no paramtricos. La uti-lizacin de estas tcnicas no paramtricas, tanto para estimar la tendenciacomo para estimar la dependencia espacial o espacio-temporal, proporcionaruna mayor flexibilidad en la estimacin y esperamos unos mejores resulta-dos en la prctica. Otros problemas inherentes a los mtodos de estimacinno paramtricas como la seleccin del parmetro de suavizado sern tam-bin tratados. Por ltimo, se aplicarn estas y otras tcnicas a conjuntos dedatos mediante estudios de simulacin, lo que conllevar que ser necesariola elaboracin de software adecuado para poder llevar a cabo este cometido.

    7

  • 8 NDICE GENERAL

  • Captulo 1

    Conceptos de Geoestadstica

    1.1. Introduccin

    De manera general, datos espaciales son aquellos que tienen asociadauna localizacin en el espacio. Consecuentemente, y ampliando la idea ante-rior, un dato espacio-temporal es simplemente la observacin de una variableen cierta localizacin espacial considerando al tiempo como coordenada adi-cional. Este tipo de datos es muy comn en las ciencias de la tierra (geologa,meteorologa, oceanografa, paleontologa. . . ), pero tambin en otras reasdel conocimiento tales como epidemiologa, geografa, ecologa, astronoma,ciencias agrcolas, etc.

    Las variables espacio-temporales de inters pueden ser continuas o dis-cretas, y se presupone que existe correlacin entre dos variables que tenganasociada distinta referencia geogrfica. La idea fundamental con este tipode datos es que las observaciones ms cercanas son ms parecidas entre s,y conforme stas se distancian, la correlacin entre las variables tiende adisminuir, anulndose en algn momento.

    Se le llama estadstica espacial al conjunto de modelos y mtodos quetienen por objetivo el anlisis de datos espacialmente referenciados. Dentrode la estadstica espacial misma, se le llama geoestadstica al conjunto demtodos y modelos para el estudio de datos espaciales con las siguientescaractersticas: 1) Los valores de la variable se observan en un conjuntodiscreto de localizaciones muestrales dentro de alguna regin espacial. 2)Cada observacin es una medida de (o est relacionada directamente con) unfenmeno espacial continuo en las correspondientes localizaciones muestrales[1].

    La geoestadstica puede considerarse una rama de las matemticas apli-cadas cuyos orgenes se remontan a principios de la dcada de 1950. Lasprimeras aportaciones las hizo el ingeniero de minas D.G. Krige y el es-tadstico H.S. Sichel, en Sudfrica, en un intento por mejorar los mtodospara calcular las reservas en las minas de oro. Posteriormente, sus tcnicas

    9

  • 10 CAPTULO 1. CONCEPTOS DE GEOESTADSTICA

    llamaron la atencin de los ingenieros de minas franceses, en especial deGeorges Matheron, quien formaliz los conceptos de Krige en el marco de laTeora de las Variables Regionalizadas [2].

    1.2. Procesos Espaciales

    Los datos geoestadsticos pueden tener dependencia espacial, temporal,o ambas. En muchos casos, adems, este tipo de datos suelen ser multivari-antes.

    Sea D Rd un dominio espacial d-dimensional. Puede pensarse para finesprcticos en d = 3. Para un conjunto de localizaciones x D, a un tiempot, con = 1, 2, 3, ..., n., se pueden realizar mediciones de varios atributosfsicos zi, donde i = 1, 2, 3, ...N . No obstante, considrese por un momentoque la componente temporal no se tiene en cuenta y que slo se mide unatributo fsico en cada localizacin espacial (que corresponde al caso N = 1).De esta manera se tiene una observacin z en cada localizacin x, lo quese representa por medio de z(x). Si z est definida en cada punto de D,entonces decimos que z es una variable regionalizada (VR). Ms an, puedepensarse que cada valor z(x) es una realizacin de una variable aleatoria(VA) Z(x) , con lo que el conjunto {z(x),x D} es una realizacin de unconjunto infinito de variables aleatorias. A este conjunto infinito de variablesaleatorias {Z(x),x D} se le denomina funcin aleatoria o proceso espacial(PE).

    Considrese un vector de posicin arbitrario x0 en el dominio D (quepuede o no formar parte de una muestra). La variable aleatoria correspondi-ente, Z(x0), genera valores z(x0) de acuerdo con su funcin de distribucin

    Fx0(z) = P (Z(x0) z).

    As mismo, en el caso de n variables aleatorias asociadas a n vectores deposicin, la funcin de distribucin se expresa como

    Fx1,...,xn(z1, ..., zn) = P (Z(x1) z1, ..., Z(xn) zn). (1.2.1)Este modelo general constituye la ley espacial de probabilidad de Z(x) y

    permite describir multiplicidad de procesos en la naturaleza. No obstante, enla prctica es imposible determinarla, pues al considerar muestras finitas den posiciones espaciales slo se tiene una realizacin parcial {z(x1), ..., z(xn)}del PE Z(x). Resulta necesario entonces hacer algunos supuestos que per-mitan realizar inferencias [2].

    Por lo general, en las aplicaciones geoestadsticas resulta suficiente esti-mar los momentos de Z(x) hasta de segundo orden, adems de que en lamayora de los casos la informacin disponible no permite inferir momentosde orden superior [3].

  • 1.2. PROCESOS ESPACIALES 11

    El momento de primer orden de Z(x) es la esperanza, definida como

    m (x) = E [Z (x)] . (1.2.2)

    Los momentos de segundo orden que se consideran son

    La varianza de Z(x)

    2(x) = V ar(Z(x)) = E[{Z(x)m(x)}2

    ](1.2.3)

    La covarianza entre Z(xi) y Z(xj)

    Cov(Z(xi), Z(xj)) = E [{Z(xi)m(xi)} {Z(xj)m(xj)}] (1.2.4)

    El semivariograma

    (Z(xi), Z(xj)) =1

    2V ar [Z(xi) Z(xj)] . (1.2.5)

    1.2.1. Procesos Espaciales Estacionarios

    Se dice que el PE Z(x) es estrictamente estacionario en D si la funcinde distribucin (1.2.1) es invariante ante traslaciones; es decir, que dado unconjunto de n puntos{x1, ...,xn} y para algn vector h, se cumple que

    Fx1,...,xn(z1, ..., zn) = Fx1+h,...,xn+h(z1, ..., zn),

    lo que significa que si se cambia la configuracin de puntos en una determi-nada direccin, la distribucin mltiple no se altera. Dado que usualmentese trabaja con los momentos hasta de segundo orden, tiene sentido prcti-co acotar y relajar la hiptesis de estacionariedad estricta a estos primerosmomentos.

    Se dice que Z(x) es estacionaria de segundo orden en D si

    1. Su valor esperado existe y es el mismo para cualquier x

    E [Z (x)] = m (1.2.6)

    2. Para cualquier par de variables, Z(x), Z(x + h), existe la covarianza yslo depende del vector de separacin h

    Cov(Z(x), Z(x + h)) = C(h). (1.2.7)

    La condicin (1.2.7) implica que la varianza existe, es finita y no depende dex, pues

    2 = C(0) = V ar(Z(x)). (1.2.8)

  • 12 CAPTULO 1. CONCEPTOS DE GEOESTADSTICA

    Adicionalmente, el semivariograma tambin es estacionario y cumple la si-guiente relacin con la funcin de covarianza

    (h) (Z(x), Z(x + h)) = 12E[{Z(x + h) Z(x)}2

    ](1.2.9)

    = C(0) C(h),

    con lo que cualquiera de ambas funciones permite caracterizar la depen-dencia espacial del proceso.

    Existen algunos PE que representan a fenmenos fsicos con una capaci-dad de variacin prcticamente ilimitada, por lo que para estas funcionesno est definida la varianza ni la covarianza. Sin embargo, es posible quesus diferencias Z(x + h) Z(x) tengan varianza limitada; es decir, que lasdiferencias sean estacionarias de segundo orden.

    As, se dice que un PE es estacionario intrnseco en D si

    1. El valor esperado de las diferencias cumple que

    E [Z(x + h) Z(x)] = 0 (1.2.10)

    2. La varianza de las diferencias es finita y est dada por

    V ar [Z(x + h) Z(x)] = 2(h) (1.2.11)

    Por lo anterior, si un PE tiene varianza finita, eso implica que sus diferenciastambin tendrn varianza finita; es decir, que si un PE es estacionario desegundo orden tambin ser estacionario intrnseco. En contraparte, si un PEes estacionario intrnseco, no podemos asegurar que tambin sea estacionariode segundo orden [2][3].

    En este captulo nos centraremos en el caso de media constante. El casogeneral se comentar ms adelante.

    1.3. Funcin Variograma y Covarianza

    El variograma1 es una de las herramientas ms importantes en la geoes-tadstica, pues es la base para caracterizar la estructura de dependenciaespacial de algn PE.

    1Aunque estrictamente hablando no son lo mismo, es comn referirse al semivariogramacomo variograma.

  • 1.3. FUNCIN VARIOGRAMA Y COVARIANZA 13

    Figura 1.3.1: Semivariograma .

    1.3.1. Variograma y Covarianza Tericos

    La descripcin espacial de un PE, Z(x), puede hacerse por medio de susdiferencias o incrementos Z(x + h) Z(x). En este sentido, puede decirseque el variograma terico se define a partir de la condicin de estacionariedadintrnseca, dada por las ecuaciones (1.2.10) y (1.2.11).

    Puede observarse, por definicin, [ecs. (1.2.5), (1.2.9)], que el variograma cumple que

    Es siempre positivo o cero, si es que se evala en el origen

    (h) = 0

    Es una funcin par

    (h) = (h)

    El variograma aumenta ms lentamente que ||h||2,

    lm||h||

    (h)

    ||h||2 = 0

    La forma tpica de un variograma acotado se muestra en la Figura 1.3.1.

    Al valor que acota superiormente al variograma se le denomina sill omeseta. Si la variable Z(x) es estacionaria de segundo orden, entoncesla meseta coincide con V ar(Z(x)).

  • 14 CAPTULO 1. CONCEPTOS DE GEOESTADSTICA

    Al valor de ||h|| a partir del cual el valor del variograma es constantee igual a la meseta, se le denomina rango. Para ||h|| mayores que elrango, Z(x) y Z(x + h) son incorrelacionadas.

    Tericamente, (0) = 0. Sin embargo, en la prctica suele ocurrir quelm||h||o (h) 6= 0. A esta desigualdad en el origen se le denominaefecto nugget o pepita. Su existencia se debe a variaciones espaciales adistancias menores que el intervalo de muestreo ms pequeo.

    A la diferencia entre la meseta y el nugget se le denomina sill parcial(psill) o meseta parcial.

    Por su parte, la funcin de covarianza o covariograma se define a partir dela condicin de estacionariedad de segundo orden, dada por las ecs. (1.2.6)y (1.2.7). Con respecto a esta funcin, puede decirse que

    sta es una funcin acotada superiormente por la varianza, es decir,

    |C(h)| C(0).

    Al igual que con el variograma, la covarianza es una funcin par,

    C(h) = C(h),pero, a diferencia de la primera, sta s puede adquirir valores negativos.

    En ocasiones suele dividirse la covarianza entre la varianza, dando lu-gar a la funcin de correlacin o correlograma,

    (h) =C(h)

    C(0),

    expresin que est acotada entre 1 y -1.

    Es interesante mencionar que a partir de una funcin de covarianza es posi-ble deducir una funcin variograma por medio de la ecuacin (1.2.9); noobstante, lo contrario no siempre es posible debido a que el variograma nosiempre es acotado [2]. De cualquier manera, se pefiere usar el estimadordel variograma por poseer menor sesgo en comparacin con el estimadordel covariograma [4]. Adems, si la media no es constante y no se eliminaadecuadamente, pueden producirse malas estimaciones del covariograma.

    La funcin de covarianza debe ser semidefinida positiva; es decir, que lafuncin C(h) involucrada en el clculo de la varianza de una combinacinlineal de n+ 1 VA Z(x) estacionarias debe ser positiva:

    V ar

    {n

    =0

    wZ(x)

    }=

    n=0

    n=0

    wwC(x x) = 0, (1.3.1)

  • 1.3. FUNCIN VARIOGRAMA Y COVARIANZA 15

    para cualesquiera vectores x y pesos w. Lo que permite garantizar que lavarianza de la combinacin lineal de cualquier subconjunto de VA, de unaPE, sea positiva, es que la suma de los pesos w sea igual a cero. As, sin

    =0w = 0, la varianza de una combinacin lineal de VA intrnsecamenteestacionarias se define por

    V ar

    {n

    =0

    wZ(x)

    }=

    n=0

    n=0

    ww(x x) = 0, (1.3.2)

    pues, evidentemente, al no existir la covarianza para PE intrnsecos, la ex-presin (1.3.1) debe quedar en trminos del variograma . Por lo anterior,decimos que es condicionalmente semidefinido positivo, o bien, que escondicionalmente semidefinido negativo [2].

    1.3.2. Anisotropa

    Si la estructura espacial slo depende de la norma de h y, por tanto, esindependiente de su direccin, se dice que Z(x) es isotrpica. Cuando no slodepende de la norma de h, sino que el variograma es diferente considerandodiferentes direcciones, Z(x) es anisotrpica.

    Se le conoce como anisotropa geomtrica a aquella situacin en la que, alvariar la direccin en el espacio, vara tambin el rango del variograma. Estetipo de anisotropa puede corregirse mediante un cambio de coordenadasadecuado.

    Por otra parte, la anisotropa zonal es aquella en la que al variar la direc-cin vara tambin el valor de la meseta. En estos casos, es comn consideraruna combinacin de variograma isotrpico en cierta direccin, 1, y agregarun variograma anisotrpico geomtrico, 2, de tal manera que no influya enla direccin de 1. De esta manera, el PE resultante sobrepone dos procesosincorrelacionados, Z(x) = Z1(x) + Z2(x) [2].

    1.3.3. Estimacin del Variograma

    Para obtener un modelo de variograma que describa adecuadamente ladependencia espacial de los datos, habitualmente se procede de acuerdo a losiguiente:

    1. Estimacin preliminar del semivariograma usando algn tipo de esti-mador experimental.

    2. Ajustar un modelo vlido de semivariograma a las observaciones pre-liminares, ya que stas, normalmente, no pueden usarse directamenteen la prediccin espacial.

    3. Validacin del modelo.

  • 16 CAPTULO 1. CONCEPTOS DE GEOESTADSTICA

    Considrese una variable regionalizada z(x) en el dominio D. Sean z y zlos valores de la VR en los vectores de posicin x y x , respectivamente.Se define la disimilaridad, , entre estas dos cantidades, mediante

    =1

    2(z z)2. (1.3.3)

    Ms an, puede pensarse en el vector resultante de la diferencia de ambosvectores, h = xx , y expresar la dismiliaridad (1.3.3) en trminos de ste,obtenindose

    (h) =1

    2(z(x + h) z(x))2 ,

    es decir, que la disimilaridad depende de la orientacin dada por h. Eviden-temente, la disimilaridad entre z y z debe ser la misma que entre z y z;o bien, en otras palabras, que la disimilaridad es independiente de considerarel vector h oh. Decimos entonces que la disimilaridad es simtrica:

    (h) = (h).La idea de disimilaridad entre dos valores z y z puede extenderse a

    todos los pares de valores de z(x) en las diferentes posiciones muestrales.Esta idea generalizada consiste en calcular la disimilaridad promedio entretodos los pares de valores de z(x) cuya diferencia de sus correspondientesvectores de posicin sea un vector h en particular. Formalmente, se diceque se calcula el promedio de la disimilaridad (h) para una clase dadade vectores $. Los vectores pertenencientes a la clase $ se caracterizan portener la misma norma y direccin dentro de los mrgenes de cierta toleranciaestablecida.

    De esta manera, se define el variograma experimental como

    ($q) =1

    2nc

    nc=1

    {z(x + h) z(x)}2 , (1.3.4)

    siendo h $q, y nc el nmero de pares de vectores de posicin cuya diferenciaes h. La ecuacin (1.3.4), propuesta por Matheron en 1962, se considerael estimador clsico del variograma terico. No obstante que es insesgado,tiene poca robustez, lo que es entendible debido a que es esencialmente unamedia muestral. Por esta razn, Cressie y Hawkins propusieron en 1980 unestimador alternativo ms robusto [2][5].

    En la prctica, lo usal es considerar vectores h cuya norma sea menorque la mitad del dimetro del dominio en cuestin. Con respecto a la reginde tolerancia para h, esta debe ser lo suficientemente grande como para queno aparezcan inestabilidades; en este sentido, se recomienda que el nmerode aportaciones a la estimacin en un salto de h sea al menos de 30 [6].

  • 1.3. FUNCIN VARIOGRAMA Y COVARIANZA 17

    Figura 1.3.2: Variograma exponencial, con a = b = 1. El rango efectivo sealcanza en |h| = 3.

    1.3.4. Modelos de Variograma

    Los semivariogramas experimentales no siempre satisfacen las propiedadesde una funcin de semivariograma, razn por la que se suelen ajustar semi-variogramas tericos vlidos.

    El variograma se puede caracterizar mediante una funcin de covarianzacontinua. Si el variograma es finito y limitado por un valor (), podemosexpresar entonces una funcin de covarianza por medio de

    C(h) = () (h).En la prctica es comn encontrar variogramas experimentales para los

    que, a partir de cierto valor de ||h||, sus estimaciones parece fluctuar alrede-dor de un valor constante. A este tipo de variogramas experimentales se lespuede ajustar un variograma terico como el de la figura 1.3.1, lo que enesencia es una funcin de covarianza:

    (h) = b C(h),donde b = C(0) es el valor de la funcin de covarianza en el origen.

    A continuacin se presentan algunos modelos de covarianza utilizadoscomunmente en casos de PE isotrpicos.

    Efecto nugget.

    Cnug(h) =

    {b ||h|| = 00 ||h|| > 0 ,

  • 18 CAPTULO 1. CONCEPTOS DE GEOESTADSTICA

    con b > 0. El correspondiente variograma es bCnug(h), cuyo valor es0 en el origen y b fuera de l.

    Exponencial

    Cexp(h) = b exp

    (1a||h||

    ),

    con a, b > 0. El variograma correspondiente se aproxima asinttica-mente a b, por lo que en la prctica se considera como rango efectivoaquella norma ||h|| para la cual se ha alcanzado el 95% de C(0). El va-lor del rango efectivo es 3a. La figura 1.3.2 representa tanto la funcinde covarianza como el variograma, en el caso particular de a = b = 1.

    Esfrico

    Cesf (h) =

    {b(

    1 32 ||h||a + 12 ||h||3

    a3

    )0 5 ||h|| a

    0 ||h|| > a.

    En este modelo, a representa el rango y b el mximo valor de la cova-rianza. As, el variograma correspondiente crece hasta llegar al rango, apartir del cual cambia de valor abruptamente hacindose constante enb. La figura 1.3.3 representa la funcin de covarianza y el variogramapara el caso a = b = 1.

    Modelo Matern o K-Bessel

    CMatern(h) =1

    21()

    ( |h|a

    )K

    ( |h|a

    ),

    donde a > 0, 0, es la funcin gamma, y K es la funcin deBessel modificada de segundo tipo de orden .Este modelo resulta particularmente interesante y muy flexible paramodelar variogramas que tiendan ms o menos rpido hacia la meseta,lo que se consigue variando el valor de , que se conoce como parmetrode suavizado. En particular, si = 0.5 se obtiene el modelo de co-varianza exponencial. Con valores de mayores que 0.5 se consiguenvariogramas que tienden ms lentamente hacia la meseta, es decir, sonmodelos que consideran un mayor rango de dependencia. Contraria-mente, para valores de menores que 0.5 se consiguen variogramasque tienden ms rpidamente hacia la meseta, lo que significa que seconsiguen modelos que consideran menores rangos de dependencia [7].

    Existen muchos otros modelos de variograma, que en general puedendividirse en acotados y no acotados. El modelo exponencial y esfrico sonejemplos de variogramas acotados, pero dentro de esta categora puede men-cionarse tambin al modelo lineal con meseta, al modelo circular, modelo

  • 1.3. FUNCIN VARIOGRAMA Y COVARIANZA 19

    Figura 1.3.3: Variograma esfrico con a = b = 1. A partir de |h| = 1, elvariograma es constante e igual a b.

    gaussiano, y al modelo de efecto agujero. Hay otros casos en los que la va-rianza aparenta incrementarse sin lmite. Incluso, si se toman intervalos mspequeos siempre queda variacin sin explicar. Un ejemplo de esto es el mo-delo nugget, ya que toda la varianza se encuentra dentro de un intervalo demuestro ms pequeo. Para ver estos y otros modelos, vase, por ejemplo,la obra de J.P. Chiles [7].

    1.3.5. Mtodos de Ajuste del Variograma Experimental, Cri-terios de Seleccin y Validacin

    Para ajustar un modelo de variograma suele utilizarse la aproximacinpor mnimos cuadrados. Sea el vector de parmetros del variograma, ysean = ((h1), ..., (hk))t y () = ((h1, ), ..., (hk, ))t los vectoresque representan el variograma experimental y el variograma terico en losvectores hj , respectivamente. Entonces, el mtodo de mnimos cuadradosconsiste en los siguientes:

    Mnimos Cuadrados Ordinarios.Este criterio supone que los residuos estn normalmente distribuidos,que son independientes y que las semivarianzas estimadas poseen igualvarianza. As, se elige de tal manera que se minimice la expresin

    ( ())t( ()).

    Mnimos Cuadrados GeneralizadosEn el caso de variables dependientes, este criterio escoge de tal ma-

  • 20 CAPTULO 1. CONCEPTOS DE GEOESTADSTICA

    nera que minimice

    ( ())tV1()( ()),

    donde V() es la matriz de covarianza de . No obstante, en la prcticaes difcil de obtener o aproximar.

    Mnimos Cuadrados PonderadosSuponiendo que las varianzas de no son iguales, este criterio buscaaqul que minimice

    ( ())tW1()( ()),

    donde W() es una matriz diagonal cuyos valores son las varianzas de. Explcitamente, se minimiza

    j

    [(hj) (hj , )]2V ar [(hj)]

    ; (1.3.5)

    sin embargo, el problema es que V ar [(hj)] casi siempre se desconoce.

    Cressie propone una alternativa al estimador de mnimos cuadrados pon-derados, demostrando que una buena aproximacin consiste en reemplazarV ar [(hj)] por [(hj , )]2/N(hj), dando as mayor peso a las semivarianzasque se esperan menores [8]. Si se evalua en en un conjunto finito de vectoreshj , se escoge tal que minimice

    j

    wj()[(hj) (hj , )]2,

    siendo wj() = |N(hj)|/(hj , )2. 2Otra forma de proceder en cuanto al ajuste de un modelo vlido consiste

    en la estimacin por mxima veorsimilitud. Este mtodo es muy conocidoen la inferencia estadstica paramtrica, aunque su empleo en geoestadsti-ca ha sido relativamente reciente (mediados de 1980). Si suponemos que ladistribucin de los datos es normal, se puede deducir fcilmente la expresinde la funcin de verosimilitud y obtener las estimaciones de los parmetrosbuscando los valores que la maxmizan. Para ms detalles, vese la obra deCressie[5].

    La validacin del modelo de variograma puede hacerse de varias maneras.Una de ellas es usando el mtodo leave one out, que consiste en quitar unelemento de la muestra y predecir el valor en ese punto (mediante kriging)con el modelo de variograma obtenido, procediendo de la misma manera

    2Otra alternativa es considerar los pesos wj() como |N(hj)|/(hi)2, ya que en la formaprimeramente mencionada los pesos dependen de , con lo que al minimizar la ecuacin(1.3.5) se maximizan tambin las varianzas.

  • 1.3. FUNCIN VARIOGRAMA Y COVARIANZA 21

    para los dems puntos de la muestra. Al final del procedimiento se obtieneun mapa de las diferencias entre los valores reales y estimados. Si el modelode variograma reproduce correctamente la estructura espacial de los datos,entonces dichas diferencias debern ser cercanas a cero [3].

  • 22 CAPTULO 1. CONCEPTOS DE GEOESTADSTICA

  • Captulo 2

    Estimacin de la tendencia

    En este captulo se tratar la estimacin de la tendencia en un conjunto dedatos espaciales. Una primera aproximacin al problema consiste en proponermodelos paramtricos de la tendencia y estimar los coeficientes de la mismaplanteando un problema de regresin lineal. Otra forma de proceder, noobstante, es de manera no paramtrica, estimando la tendencia en cada puntodel dominio de definicin por medio de algn estimador local.

    2.1. El Modelo General

    Considrese una variable respuesta Y = Z(X) cuya dependencia radicaen un vector de coordenadas XRd, mismas que pueden representar unalnea si d = 1, o un plano si d = 2. De manera general, el modelo para Y sedescompone en una parte determinstica y otra residual de la forma

    Yi = m(Xi) + i, i = 1, 2, ..., n. (2.1.1)

    donde m(X), conocida como funcin de tendencia o deriva, da cuenta dela variabilidad a gran escala. A su vez, (x) representa el comportamientolocal o evolucin a pequea escala, siendo un proceso de media cero, varianzaconstante y con funcin de covarianza que depende de la diferencia entre lasposiciones en cuestin; es decir,

    E[i|Xi] = 0, (2.1.2)

    V ar(i|Xi) = 2, (2.1.3)

    Cov(i, j |Xi,Xj) = 2(Xi Xj). (2.1.4)Denominaremos al modelo 2.1.1 modelo general.

    23

  • 24 CAPTULO 2. ESTIMACIN DE LA TENDENCIA

    2.2. Estimador paramtrico

    Uno de los modelos ms utilizados en estadstica para el caso de datos nohomogneos es el modelo clsico de regresin lineal. Sea Z(x) una funcinaleatoria definida en un dominio D, y exprsese de la siguiente manera:

    Z(x) =

    pj=0

    xj(x)j + (x);

    es decir, que expresamos la funcin aleatoria Z(x) segn (2.1.1), consideran-do que m(x) =

    pj=0 xj(x)j , con = {0, ..., p}t un vector desconocido

    de coeficientes, {xj , j = 0, ..., p} un conjunto de variables explicativas y es un proceso de media cero y, en principio, incorrelacionado y de varianzaconstante.

    Supngase que el objetivo es la estimacin eficiente de la tendencia, obien, la estimacin ptima de los parmeros de la variacin a gran escala,, a partir de las observaciones disponibles en un conjunto de posicionesespaciales {x1, ...,xn} . Puede entonces escribirse el sistema de ecuacionescorrespondiente de manera matricial como

    Z = X + , (2.2.1)

    siendo Z = {Z(x1), ..., Z(xn)}, X la matriz de diseo y = {(x1), ..., (xn)}t.Suponiendo que los errores son incorrelacionados, de media cero y va-

    rianza constante 2, el mejor estimador lineal insesgado de es

    ols =(XtX

    )1XtZ; (2.2.2)

    no obstante, si los errores no tienen varianza constante o no son incorrela-cionados, como ocurre en una situacin de dependencia espacial, es posibleencontrar un mejor estimador de . Supngase entonces que los errores tienenmatriz de covarianza 2, siendo la matriz de correlacin de los errores.En lugar de la ecuacin (2.2.2), se tiene que la mejor estimacin de es

    gls =(Xt1X

    )1Xt1Z, (2.2.3)

    que se conoce como el estimador por mnimos cuadrados generalizados.

    Factorizacin Cholesky. En efecto, en el contexto de regresin por mni-mos cuadrados generalizados, la ecuacin (2.2.3) surge como solucinde minimizar

    (Y X)t 1 (Y X) . (2.2.4)

    Ntese que en el caso en el que se supone que los errores son in-dependientes e incorrelacionados, = I, dando lugar a la solucin

  • 2.3. ESTIMADOR NO PARAMTRICO 25

    (2.2.2). Ahora, puesto que 2 es la matriz de covarianza de los er-rores, sta debe ser no singular y definida positiva. As, es posibleencontrar mediante factorizacin Cholesky una matriz triangular S,tal que = SSt. Sustituyendo esta expresin en la expresin (2.2.4) ydesarrollando, se obtiene que(

    S1Y S1X)t (S1Y S1X) .Llamando a S1Y = Y y S1X = X, se tiene que(

    Y X)t (

    Y X

    ),

    es decir, que ahora se realiza la regresin sobre las nuevas variables Y

    y X . Es fcil ver que los nuevos errores = Y X son incorrela-cionados y de varianza constante:

    V ar() = V ar(Y

    X) = V ar(S1(Y X)) = V ar(S1),y como = SSt es la matriz de correlacin de los errores ,

    V ar(S1) = S1V ar()St = S12SStSt = 2I. (2.2.5)

    De esta manera, la factorizacin Cholesky resulta de inters en el caso deestimacin bajo dependencia espacial porque permite hacer una transforma-cin de los datos originales a datos independientes, como qued demostradoen (2.2.5). Esto ser de mucha utilidad ms adelante para los propsitos deeste trabajo.

    2.3. Estimador No Paramtrico

    El estimador no paramtrico de la tendencia consiste en una generaliza-cin de la estimacin de la tendencia en un punto x considerando un promedioponderado de las respuestas Y , dando mayor peso a las respuestas cercanasy menor peso a las lejanas. El estimador no paramtrico a utilizar en estetrabajo es el llamado local lineal. Este estimador es una generalizacin delestimador de Nadaraya-Watson [9].

    2.3.1. Estimador local lineal

    Considerando por simplicidad el caso unidmensional, la estimacin dela tendencia m(x) en un punto x, se calcula por medio de un promedioponderado de las observaciones Yi,

    m(x) =ni=1

    W xi Yi,

  • 26 CAPTULO 2. ESTIMACIN DE LA TENDENCIA

    donde

    W xi = Kh(Xi x) =K(Xixh

    )n

    j=1K(Xjxh

    ) .Asimismo, K es una funcin ncleo, simtrica y definida positiva, y h es

    una ventana de suavizacin que determina el tamao del vecindario para rea-lizar la respuesta media. La funcin ncleo acta como una funcin de pesoque le otorga mayor importancia a los puntos cercanos y menor importanciaa los puntos alejados de x.

    La funcin K debe cumplir las siguientes propiedades:

    K(x) 0 para todo x.K(t)dt=1

    K(x) = K(x)Hay varias funciones que se pueden considerar como ncleo. Algunas de ellasson

    Ncleo tricubo

    K(x) =

    {(1 |x|3)3 x [1, 1]0 x / [1, 1]

    Ncleo Gaussiano

    K(x) =1

    2piexp

    [0.5x2]Ncleo bicuadrado

    K(x) =

    {(1 x2)2 x [1, 1]0 x / [1, 1]

    Ncleo de Epanechnikov

    K(x) =

    {34(1 x2) x [1, 1]0 x / [1, 1]

    El grado de suavidad de las estimaciones se determina mediante la eleccindel parmetro h. En este sentido, la eleccin del ncleo no es tan importante,sino ms bien importa elegir un tamao de ventana adecuado. Si h es muygrande, la estimacin resulta muy suave; si es muy pequea, prcticamentese interpolan los datos.

  • 2.3. ESTIMADOR NO PARAMTRICO 27

    El estimador de Nadaraya-Watson puede pensarse como un ajuste localconstante entorno a un punto x. De esta manera, una generalizacin deeste estimador consiste en considerar un ajuste local polinmico de grado p,usando los datos alrededor de x. As, se tiene que

    p=0 Estimador de Nadaraya-Watsonp=1 Estimador local linealp=2 Estimador local cuadrticop=3 Estimador local cbicoEl estimador polinmico local se basa en la idea de que la funcin de regresinm se puede aproximar por un polinomio de grado p por medio del desarrollode Taylor. De esta manera se justifica el ajuste polinmico local y en cada xse minimiza la expresin siguiente:

    ni=1

    Kh(Xi x) (Y [0 + 1(Xi x) + ...+ p(Xi x)p])2 . (2.3.1)

    La solucin del problema de minimizacin viene dado por

    = (0, ..., p)t = (XtWX)1XtWZ

    siendo

    X =

    1 X1 . . . X

    11

    . . . .

    . . . .

    . . . .1 Xn . . . X

    pn

    y

    W = diag [Kh(X1 x), ...,Kh(Xn x)] .De esta manera, si interesa la estimacin de m en el punto x0 = x, habr

    que evaluar la expresin

    0 + 1(x x0) + ...+ p(x x0)p,obtenindose

    m(x0) = 0. (2.3.2)

    Otro de los aspectos por determinar es el grado p del polinomio. Eneste sentido, algunos resultados tericos demuestran que el comportamiento

  • 28 CAPTULO 2. ESTIMACIN DE LA TENDENCIA

    asinttico de los estimadores mejora conforme aumenta p [10]. No obstante,en la prctica no queda del todo claro el beneficio de utilizar polinomios degrado elevado puesto que a mayor p, mayor varianza en la estimaciones. Esfrecuente que se necesite de tamaos muestrales considerables para tener unamejora notable en el comportamiento del estimador.

    Adicionalmente, se sabe que las estimaciones que se basan el polinomiosde grado impar presentan mejores propiedades tericas que aquellas basadasen polinomios de grado par. Por tal razn, en la prctica es suficiente utilizarestimadores locales cbicos (p = 3) o estimadores locales lineales (p = 1).

    2.3.2. Estimador local lineal en datos espaciales

    En el caso de datos espaciales se considera un conjunto de vectores aleato-rios {(Xi, Yi)}ni=1, donde las Yi son respuestas escalares y Xi es, en general,un vector en Rd. El problema mutivariante de regresin no paramtrica con-siste en estimar m(x) para algn x en un subdominio de Rd. Desde luego,no se hace supuesto alguno sobre la forma funcional paramtrica de m.

    Como ya se ha mencionado, el modelo que se asume es aqul dado porla ecuacin (2.1.1), junto con las condiciones (2.1.2), (2.1.3) y (2.1.4). Enanaloga con las ecuaciones (2.3.1) y (2.3.2), el estimador local lineal param en x es la solucin para 0 de la minimizacin por mnimos cuadradossiguiente:

    mn0,

    ni=1

    {KH(Xi x){Yi 0 t (Xi x)

    }2},donde H es una matriz simtrica definida positiva, K es un kernel d-variadoy KH(u) = |H|1K(H1u). La matriz H, llamada matriz ventana, es la quecontrola tanto la forma como el tamao del vecindario que se usar en laestimacin de m(x). Explcitamente, el estimador local lineal toma la forma

    m(x, H) = et1(XtxWxXx

    )1XtxWxXxY = s

    txY, (2.3.3)

    donde e1 es un vector de longitud d + 1 cuya primera coordenada es 1y las coordenadas subsecuentes 0; Xx es una matriz cuya fila i-sima es(1, (Xi x)t

    ), Wx = diag {KH(X1 x), ...,KH(Xn x)}, e Y es el vector

    de respuestas escalares (Y1, ... , Yn)t.

    2.3.3. Seleccin de la matriz ventana H

    Tal como ocurra con h en el caso unidimensional, en este caso resulta deespecial importancia seleccionar adecuadamente la matriz H. La seleccinde H puede hacerse mediante el criterio de validacin cruzada generalizada(GCV), que consiste en elegir aquella H que minimice la expresin

  • 2.4. PREDICCIN ESPACIAL LINEAL PTIMA 29

    GCV (H) =1

    n

    ni=1

    (Yi mi

    1 1n trS

    )2, (2.3.4)

    donde S es la matriz cuya i-sima fila est dada por stXi ; es decir, el vector desuavizacin para x = Xi. No obstante, hay evidencia de que no es correctousar el criterio (2.3.4) en presencia de errores correlacionados, ya que suesperanza se ve afectada por dicha correlacin [11]. En realidad, la mayorade los mtodos de seleccin de la matriz H suelen no funcionar del todo bienen presencia de correlacin espacial [12]. En ese sentido, resulta necesariointroducir alguna correccin en la expresin (2.3.4) a fin de que tome encuenta adecuadamente la correlacin espacial y corrija el sesgo.

    Al respecto, M. Francisco-Fernndez y J. Opsomer [13] proponen la si-guiente correccin para la ecuacin (2.3.4):

    GCVc(H) =1

    n

    ni=1

    (Yi mi

    1 1n trSR

    )2, (2.3.5)

    donde R es la matriz de correlacin de las observaciones. An as, en laprctica se suele desconocer la matriz de correlacin, por lo que estos autoresproponen asumir un modelo paramtrico de covarianza y estimar R [13]:

    GCVce(H) =1

    n

    ni=1

    (Yi mi

    1 1n trSR

    )2. (2.3.6)

    Evidentemente, (2.3.6) se aproximar mejor a (2.3.5) en la medida enque el modelo de covarianza asumido sea el adecuado y que las estimacionesde los parmetros de covarianza sean lo suficientemente buenas.

    Ms an, considrese la expresin para el promedio del error cuadrticomedio (mean average squared error, MASE), dado por la siguiente expresin:

    MASE(H) =1

    n(Smm)t (Smm) + 1

    n2tr

    (SRSt

    ), (2.3.7)

    donde m es el vector de tendencia (m(X1), ...,m(Xn))t, y R es la matrizde correlacin terica de los errores. Denomnese a aquella matriz H queminimice la expresin (2.3.7) como H ptima, Hopt.

    2.4. Prediccin Espacial Lineal ptima

    Aunque en el presente trabajo el objetivo no se centra en la prediccindel proceso sino en la estimacin de la tendencia m, se ha decidido incor-porar una subseccin relativa al kriging dada su importancia en en anlisisgeoestadstico.

  • 30 CAPTULO 2. ESTIMACIN DE LA TENDENCIA

    En muchos casos, el objetivo final es la prediccin del proceso en unaposicin espacial x. Si se sigue la aproximacin tradicional, podra pensarseen utilizar el estimador de la tendencia como predictor; sin embargo, enun contexto de dependencia espacial, la tendencia no es el predictor linealptimo. Es en estos casos que resulta de especial importancia el Kriging.

    Supngase que se tiene informacin sobre cierto atributo fsico z en dife-rentes posiciones de un dominio D. Un problema tpico en esta situacin estratar de estimar el valor de z en aquellas posiciones de D en donde no hubomedicin, teniendo en cuenta la estructura de covarianza de las variablesaleatorias Z(x) definidas en las posiciones en cuestin. El mtodo utilizadoes muy similar a una regresin lineal mltiple aplicada a un contexto espacial,en donde las variables aleatorias Z(x) fungen como variables regresoras, y lavariable aleatoria en el punto donde interesa la estimacin, digamos, Z(x0),funge como la variable dependiente. Al conunto de algortimos de regresinlineal cuyo propsito es ese, se le conoce como kriging. Esta es una tcnicade estimacin local que tiene la cualidad de ser el mejor estimador linealinsesgado de z [14].

    Kriging

    Considrese el problema de estimar el valor de un atributo z en algunaposicin x a partir del conocimiento de los valores de z en n diferentes posi-ciones del dominio D, digamos, z(x), = 1, ..., n. Los estimadores krigingson variantes de estimador clsico de regresin lineal Z(x),

    Z(x)m(x) =n(x)=1

    (x) [Z(x)m(x)] , (2.4.1)

    donde (x) es un peso especfico que se le asigna a la observacin z(x),interpretada como una realizacin de la variable Z(x), y m(x) y m(x) sonlos valores esperados de Z(x) y Z(x), respectivamente. Hay ocasiones enlas que no suelen considerarse todos los datos disponibles, sino slo los n(x)datos ms cercanos al punto donde interesa la estimacin de z; es decir, seconsidera un vecindario W (x) centrado en x [14].

    El objetivo de las tcnicas kriging es minimizar la varianza del error deprediccin 2E(x) sujeto a la restriccin de insesgadez del estimador. Es decir,se minimiza

    2E(x) = V ar{Z(x) Z(x)},sujeto a

    E [Z(x) Z(x)] = 0.El estimador kriging depende del modelo que se adopte para la funcin

    aleatoria Z(x). Por lo general, Z(x) se suele descomponer en una componente

  • 2.4. PREDICCIN ESPACIAL LINEAL PTIMA 31

    de tendencia y una componente residual, tal como se expresa en la ecuacin(2.1.1), que aqu se reproduce:

    Z(x) = m(x) + (x),

    donde se supone conocido el variograma o el covariograma de (x).El valor esperado de Z en la posicin x representa el valor de la tendencia

    en dicha posicin:

    E [Z(x)] = m(x).

    Las variantes del kriging dependen del modelo que se adpote para latendencia m(x).

    1. El kriging simple (KS) supone

    m(x) = m,

    es decir, que la media m(x) es conocida en todo el dominio D.

    2. El kriging ordinario (KO) supone que la tendencia m(x) = m es cons-tante pero desconocida. Adems, se cie a fluctuaciones locales de lamedia dentro de un vecindario W (x), dentro del cual se pueda consid-erar la media estacionaria.

    3. El kriging universal (KU) considera que la media m(x) es una funcinque vara suavemente en todo el dominio D. La tendencia se modelapor medio de combinaciones lineales de ciertas funciones de las coor-denadas, fk(x):

    m(x) =

    Kk=0

    kfk(x), (2.4.2)

    Los coeficientes k se consideran desconocidos. Se considera que f0(x) =1, de tal manera que cuando K = 0, se llega al caso particular del krig-ing ordinario.

    Kriging Universal

    El kriging ordinario considera de manera implcita un PE no estacionarioen el dominio D; no obstante, considera que el proceso es estacionario den-tro de cierta vecindad W (x). Sin embargo, hay ocasiones en las que no esposible suponer esto ltimo, incluso considerando vecindades relativamentepequeas. En casos como estos se considera entonces el kriging universal,que modela la tendencia del PE segn la ecuacin (2.4.2) [14].

    Considerando las ecuacines (2.4.1) y (2.4.2), se tiene que

  • 32 CAPTULO 2. ESTIMACIN DE LA TENDENCIA

    Z(x) =Kk=0

    kf(x) +

    n(x)=1

    (x)

    [Z(x)

    Kk=0

    fk(x)k

    ],

    o bien, reagrupando algunos trminos y factorizando,

    Z(x) =n(x)=1

    (x)Z(x) +

    Kk=0

    k

    fk(x) n(x)=1

    (x)fk(x)

    . (2.4.3)Para que el segundo trmino de la suma en (2.4.3) quede sin efecto, es

    necesario que se cumpla que

    n(x)=1

    (x)fk(x) = fk(x), k = 0, ...,K. (2.4.4)

    Como ya se mencion, se considera, por convencin, que f0(x) = 1, detal manera que si K = 0 se llega al caso particular del kriging ordinario, endonde los pesos satisfacen que

    n(x)=1 (x) = 1.

    Las restricciones (2.4.4) permiten entonces expresar el estimador Z(x)en trminos nicamente de de las n(x) variables aleatorias Z(x),

    ZKU (x) =n(x)=1

    KU (x)Z(x), (2.4.5)

    donde, evidentemente, KU (x) satisface que

    n(x)=1

    KU (x)fk(x) = fk(x), k = 0, ...,K. (2.4.6)

    Un poco de lgebra puede mostrar que el estimador (2.4.5) es insesgado,

    E [ZKU (x) Z(x)] = 0,debido precisamente a la condicin (2.4.6). Por otra parte, la minimizacindel correspondiente error de la varianza 2E(x) requiere utilizar multipli-cadores de Lagrange. As, el resultado de minimizar el error de la varianzaes:

    2KU (x) = C(0)n(x)=1

    KU (x)C(x x)Kk=0

    KUk (x)fk(x), (2.4.7)

    donde los KUk representan los correspondientes multiplicadores de Lagrangey C representa la funcin de covarianza de la parte residual . Cuando

  • 2.4. PREDICCIN ESPACIAL LINEAL PTIMA 33

    K = 0, las ecuaciones (2.4.5) y (2.4.7) representan al estimador y la varianza,respectivamente, en el caso de kriging ordinario (KO).

    El KU requiere fijar las funciones de tendencia fk(x) y la funcin decovarianza de la componente residual (x). Con respecto a las funciones fk,stas pueden proponerse de acuerdo a la situacin fsica de turno, aunque enocasiones no hay elementos suficientes para poder hacerlo. No obstante, escomn utilizar polinomios de grado menor o igual a 2 [14].

    Estimacin en el caso de tendencia no constante

    Considrese un proceso Z intrnsecamente estacionario del que se tienenlas observaciones {Z(x1), ..., Z(xn)}. En este caso se cumplen las condicionesdadas por las ecuaciones (1.2.10) y (1.2.11), y es sobre la base de estascondiciones que se plantea el estimador del variograma en la seccin 1.3.1.Cuando la media no es constante no se puede emplear el estimador empricodel variograma; por tal razn, antes de usarlo hay que eliminar la tendenciade los datos. En el caso en el que la media sea conocida (KS), se puedeeliminar la tendencia y estimar el variograma a partir de los residuos; sinembargo, si la tendencia m(x) se desconoce, como ocurre en el caso KU,habr que proceder de otra manera.

    Si se conocen los coeficientes k (como en el caso de KS), se puede estimarel variograma partir del modelo general mediante

    (x) = Z(x)Kk=0

    kfk(x);

    sin embargo, en el caso del KU se desconocen los coeficientes k. Una ideainmediata consiste en estimar los k para as obtener los residuos y a partirde stos obtener una estimacin del variograma. No obstante, el problema esque, para estimar eficientemente el conjunto de k, es necesario conocer lavarianza del proceso Z(x); es decir, se necesita conocer el variograma . Estaproblemtica circular se considera el principal inconveniente del KU [15].

    Sea Pgls = X(Xt1X

    )1Xt1. Sustituyendo (2.2.3) en (2.2.1) se

    obtiene la estimacin de ,

    = ZXgls = (IPgls)Z,cuya matriz de covarianza es

    V ar() = (IPgls)(IPgls)t = X(Xt1X)1Xt.As, an procediendo de la manera ms eficiente, el uso de los residuos

    introduce un sesgo en la estimacin de la dependencia espacial, lo que implicauna estimacin sesgada del variograma terico. Por lo general, el sesgo delestimador del variograma es pequeo en los saltos cercanos al origen y setorna considerable en saltos grandes [16].

  • 34 CAPTULO 2. ESTIMACIN DE LA TENDENCIA

    Adems de lo anterior, en la prctica se tiene el problema adicional deno conocer . En 1984, Neuman y Jacobson propusieron una solucin con-sistente en iniciar con el estimador ols, estimar el variograma a partir delos residuos, ajustar un variograma terico, calcular el estimador de mnimoscuadrados generalizados basndose en el modelo ajustado y repetir iterativa-mente hasta llegar a la convergencia. Aunque este procedimiento suele llegara convergir en unas cuantas iteraciones, no soluciona el problema del sesgo,pues incluso cuando se conoce , el sesgo es diferente de cero [17].

    A pesar de lo anterior en cuanto a la estimacin sesgada del variograma enel KU, el efecto que esto tiene en la prediccin no es considerable; en primerlugar, porque al ajustar un modelo de variograma por mnimos cuadradosgeneralizados (o ponderados), son los saltos ms pequeos los que recibenmayor peso en el ajuste. Adicionalmente, si la prediccin espacial se realizaen una vecindad, el variograma se evala justamente en los saltos pequeos,que es en donde se tiene tanto buena estimacin como buen ajuste. De hecho,Stein muestra que si se logra captar adecuadamente el comportamiento delvariograma en el origen se puede lograr una prediccin eficiente [18].

  • Captulo 3

    Descripcin del Estudio deSimulacin

    El presente estudio de simulacin tiene por objetivo realizar una com-paracin de distintos estimadores de la tendencia considerando datos condependencia espacial de acuerdo al modelo general (2.1.1). La comparacinse realizar entre estimadores de la tendencia paramtricos y no paramtri-cos, vistos en las secciones 2.2 y 2.3.3.

    A partir de una muestra de tamao n, {Xi, Yi}ni=1, el objetivo entonceses estimar la tendencia m y comparar si el estimador en cuestin, m, seencuentra cerca de la tendencia que se quiere estimar. Ms precisamente, loque se quiere comparar entre los diversos estimadores usados es, en promedio,qu tan cerca se encuentran de la tendencia verdadera. Evidentemente, estodeber hacerse considerando un nmero de muestras uficientemente grande,B. En general, los pasos a seguir sern los siguientes:

    Simular una muestra {Xi, Yi} de tamao n.

    Estimar la tendencia m por medio del estimador m.

    Repetir este proceso un nmero grande de veces.

    Considerar una medida de discrepancia entre el estimador m y la ten-dencia m, a fin de poder comparar entre diferentes estimadores.

    3.1. Comparacin de las Estimaciones de la Ten-dencia

    Para comparar las estimaciones obtenidas con los estimadores, ser nece-sario tener una medida que permita, por una parte, comparar en promedioqu tan cerca se encuentran dichas estimaciones de la tendencia verdadera

    35

  • 36 CAPTULO 3. DESCRIPCIN DEL ESTUDIO DE SIMULACIN

    y, por otra parte, tener una idea de la variabilidad promedio de las mismasen todo el dominio de definicin de los datos.

    Una medida que permite evaluar simultneamente ambas caractersticases el error cuadrtico medio integrado (MISE), que se define como

    MISE(m) = E

    [m(x)m(x)]2 dx,

    o bien,

    MISE(m) =

    sesgo2 [m(x)] dx +

    V ar [m(x)] dx. (3.1.1)

    En el presente caso, puesto que se est en un caso discreto, se aproximarla ecuacin (3.1.1) por medio de

    sesgo2 [m(x)] dx

    1

    k2

    ki=1

    kj=1

    [(1

    B

    Bi=1

    mi(ti, rj)

    )m(ti, rj)

    ]2(3.1.2)

    y deV ar [m(x)] dx

    1

    k2

    ki=1

    kj=1

    ( 1B

    Bi=1

    [mi(ti, rj)

    ]2)( 1B

    Bi=1

    mi(ti, rj)

    )2 (3.1.3)siendo (ti, rj) los puntos en la rejilla. En efecto, la ecuacin (3.1.2) con-

    sidera el sesgo cuadrtico en cada punto de la rejilla y calcula un promediode stos, mientras que con la ecuacin (3.1.3) se obtiene un promedio de lasvarianzas en cada punto de la rejilla. Por lo anterior, el mejor estimador serel que tenga el menor MISE.

    3.2. Simulacin de una muestra

    Las simulaciones se realizarn por medio del uso de paquetes especfi-cos dentro del lenguaje de programacin R; fundamentalmente, se har usode geoR. Este paquete est diseado para realizar anlisis de datos geoes-tadsticos y prediccin espacial [19]. En particular, dados un modelo y unosparmetros de covarianza, la funcin grf permite generar simulaciones de

  • 3.3. ESTIMADORES 37

    funciones aleatorias gaussianas en el nmero de localizaciones espaciales in-dicadas.

    Antes de comenzar cada simulacin ser necesario fijar una serie deparmetros, tales como:

    el tamao muestral n

    el nmero de repeticiones B

    definir la funcin de tendencia m que se desea estimar

    el tipo de dependencia espacial con el que se generarn los datos

    En el caso de la estimacin no parmtrica ser necesaria la definicinde otros parmetros, tales como la funcin kernel, o algn parmetro paradeterminar la ventana.

    Una vez definida la tendencia m y la estructura espacial de los errores(alguna de las funciones de covarianza mostradas en la seccin 1.3.4), existendos posibilidades:

    Diseo fijo. Consiste en que el experimentador fija de antemano lasvariables explicativas y son siempre las mismas; por ejemplo, Xi =(Xi1, Xi2), i = 1, 2, ...n, tomando Xi1 y Xi2 equiespaciadas en el in-tervalo (0,1) cada una de ellas. De esta manera, en cada una de las Bsimulaciones la muestra {Xi}ni=1 es la misma, cambiando slo el valorde {Yi}ni=1.Diseo aleatorio. Este diseo consiste en que, en cada una de las Bsimulaciones, se tiene tanto un nuevo conjunto de posiciones mues-trales {Xi}ni=1(que incluso puede ser no equiespaciado) como un nuevoconjunto de valores {Yi}ni=1.

    Una vez generadas las variables Xi se generan los errores (por medio de grf)y se suman a la tendencia m que se haya elegido, obtenindose un valor deY para cada Xi. Por simplicidad, en este trabajo se trabajar con diseofijo.

    3.3. Estimadores

    Haciendo alusin a lo mencionado en la seccines 2.2 y 2.4, con respecto ala estimacin de la tendencia, y en referencia tambin a la solucin propuestapor Neuman y Jacobson, en este trabajo se considerarn cuatro estimadoresparamtricos de la tendencia:

    1. Mnimos cuadrados ordinarios (OLS).

    2. Mnimos cuadrados generalizados con una iteracin (GLS1).

  • 38 CAPTULO 3. DESCRIPCIN DEL ESTUDIO DE SIMULACIN

    3. Mnimos cuadrados generalizados iterativamente hasta la convergencia(GLSe).

    4. Mnimos cuadrados generalizados considerando los parmetros tericosde covarianza (GLSt).

    El procedimiento transcurre de la manera siguiente. Una vez simulados losdatos:

    Se calcula el variograma experimental mediante la funcin variog.Esta funcin permite calcular el variograma experimental ya sea me-diante el estimador clsico o el estimador robusto de Cressie (seccin1.3.3). Es posible tambin indicar algn tipo de tendencia, misma quese estima mediante mnimos cuadrados ordinarios y en cuyo caso elvariograma se realiza sobre los residuos. De esta manera, se tiene laestimacin de los parmetros de tendencia va OLS.

    El siguiente paso es ajustar un modelo de semivariograma al variogra-ma experimental. Esto se hace mediante la funcin variofit, que estimalos parmetros de covarianza (meseta parcial, rango, nugget) ajustandoun modelo paramtrico al variograma emprico. El ajuste del variogra-ma puede hacerse por medio de pesos iguales, pesos de Cressie, o bien,pesos proporcionales al nmero de puntos en cada clase de distancia.

    Una vez estimados los parmetros de covarianza, se calcula la matrizde covarianza. La funcin varcov.spatial permite construir la matrizde covarianza para un conjunto de localizaciones espaciales. A partirde la matriz de covarianza se obtiene la matriz de correlacin, mismacon la que se realizar la factorizacin Cholesky (seccin 2.2).

    Habiendo realizado la factorizacin Cholesky, se efecta la regresincon las nuevas variables Y y X, y sobre los residuos obtenidos sevuelve a calcular el variograma experimental para, nuevamente, ajustarel variograma terico, obtener los parmetros de covarianza, estimarla matriz de correlacin, hacer nuevamente factorizacin Cholesky, yas sucesivamente hasta llegar a la convergencia de los parmetros decovarianza. En ese momento, se detiene proceso.

    En resumen:

    1. Las primeras estimaciones obtenidas sern los parmetros de covarian-za y los coeficientes de tendencia estimados por OLS.

    2. La solucin por GLS1 ser considerando los resultados nicamente enla primera iteracin al hacer factorizacin Cholesky.

    3. La solucin por GLSe sern los ltimos parmetros de covarianza es-timados y los ltimos coeficientes de tendencia estimados al llegar elalgortimo a la convergencia.

  • 3.4. DEFINICIN DE LOS PARMETROS DE LA SIMULACIN 39

    4. El resultado por GLSt se obtiene, en lugar de estimando los parmetrosde covarianza, construyendo la matriz de correlacin con los parmetrostericos; es decir, se hace una vez la factorizacin Cholesky usando lamatriz de correlacin terica.

    Paralelamente a los estimadores anteriores, se considerar el estimador noparamtrico mostrado en la ecuacin (2.3.3). En este caso, el procedimientoconsiste en una vez generada la muestra, estimar la matriz ptima Hopt,considerar un ncleo d-variado y obtener la estimaciones de acuerdo con laecuacin ya mencionada.

    3.4. Definicin de los Parmetros de la Simulacin

    Como ya se mencion, previo a la simulacin se debern establecer par-metros necesarios tales como el tamao muestral, el tipo de dominio o rejilladonde se simularn los datos, la funcin o funciones de tendencia tanto parala simulacin de los datos como para la estimacin de la tendencia (es decir,la especificacin del modelo en los casos paramtricos), los parmetros decovarianza, entre otras.

    Tipo de rejilla. Se considerar una particin equidistante del cuadrado(0,1) (0,1). Cada lado del cuadrado se dividir en 20 segmentos,con lo que se tendr una rejilla de 400 puntos.

    Modelo y parmetros del variograma. Se considerar, tanto en la sim-ulacin de los datos como en la estimacin de la tendencia, el modeloMatern. Los parmetros tericos de covarianza que se establecern pordefecto son

    (0.8, 0.25, 0.2, 0.5), (3.4.1)

    que corresponden a la meseta parcial, rango, nugget, y , respectiva-mente. Debe notarse que el modelo Matern con = 0.5 equivale aconsiderar el modelo exponencial de covarianza. Asimismo, el rangoque se considera es el propio de la funcin de covarianza exponencial,con lo que el rango efectivo en este caso es 3 veces este valor; es decir,0.75.

    Estimacin del variograma. La estimacin del variograma se realizarconsiderando el modelo Matern, con = 0.5. La mxima distanciahasta donde se calcular la disimilitud ser 0.5

    2; es decir, la mi-

    tad de la diagonal de la rejilla. Con respecto al clculo del variogra-ma experimental, se considerar el estimador clsico de Matheron, y

  • 40 CAPTULO 3. DESCRIPCIN DEL ESTUDIO DE SIMULACIN

    Figura 3.4.1: Tendencias usadas en la simulacin

    (a) Tendencia 1 (b) Tendencia 2

    en lo referente al ajuste de variograma terico, se considerarn pesosiguales.1

    Tendencia. Se considerarn dos tipos de tendencia:

    Tendencia 1 (T1). m [(x1, x2)] = x1 + x22 0.5x1x2Tendencia 2 (T2). m [(x1, x2)] = sin(2pix1) + 4(x2 0.5)2Ntese que los coeficientes de tendencia de T2 son (1,4).

    La figura 3.4.1 muestra la apariencia de las tendencias T1 y T2.

    Estimador no paramtrico. El estimador no paramtrico (2.3.3) requierede una matriz H y de un kernel d-variado. Con respecto a la primera,en este trabajo se usar la venta ptima Hopt, misma que se obtiene alminimizar la ecuacin (2.3.7). En cuanto al kernel, se utilizar el kernelde Epanechnikov, que en su versin multivariante se define como

    KEpa(x) =2

    pimax

    {(1 ||x||2), 0} .

    1Si bien es posible elegir los pesos de Cressie, que en cierta forma se prefieren sobreotros pesos, en el presente estudio de simulacin se encontr la dificultad de que al im-plementar el algortimo, en algunas ocasiones ste no converga, dando lugar a valores delos coeficientes de dependencia exorbitantes. Una forma en que se corrigi este problemafue, en primer lugar, considerando pesos iguales en lugar de los de Cressie, y en segun-do lugar, implementando lmites razonables a los valores estimados de los coeficientes dedependencia. De hecho, se pudo detectar que la funcin variofit de geoR tiene un errorde cdigo, toda vez que los lmites para la meseta parcial los considera para el rango, yviceversa. Hay que mencionar que parte importante del tiempo dedicado a este trabajo seinvirti en detectar con precisin y corregir este tipo de errores de cdigo.

  • 3.5. PLAN DE SIMULACIN 41

    Nmero de repeticiones. El nmero de repeticiones en cada simulacinser B = 1000.

    3.5. Plan de Simulacin

    El plan de simulacin consiste en comparar por medio del MISE las es-timaciones de la tendencia obtenidas con los estimadores paramtricos yno paramtricos descritos en las seccin 3.3, teniendo en cuenta diferentessituaciones de dependencia espacial consistentes en:

    Variar el nugget.Manteniendo fijos los dems parmetros de covarianza definidos en(3.4.1), se considerarn diferentes valores del nugget: 0.0, 0.2, 0.5.En este caso el objetivo es observar el efecto de aumentar o disminuirla variacin que se encuentra en intervalos de muestreo menores a losconsiderados. Esta es una primera forma de considerar variaciones enla dependecia de los datos, pues conforme el nugget aumenta, los datosse acercan a la independencia.Es importante mencionar que los valores de la meseta parcial serntales que la suma de sta con el nugget deber ser 1; es decir, que loque se est variando en cada caso es la proporcin de varianza nugget.

    Variar el rango.Otra forma de modificar la dependencia espacial es variando el rango dela funcin de covarianza. A diferencia del caso de variacin del nugget,aqu no se trata de que aumente o disminuya la variacin en escalasmenores a las consideradas en el muestreo, sino que, directamente, setrata de un aumento o disminucin en el alcance de la dependenciaespacial.Al igual que en el caso anterior, se mantienen fijos los dems parme-tros de covarianza en (3.4.1) mientras se consideran diferentes valoresdel rango: 0.1,0.25, 0.5.

    Estas situaciones de dependencia espacial se considerarn de acuerdo a cadauna de los siguientes casos:

    1. Especificacin adecuada del modelo (T2-T2).Consiste en simular los datos con el modelo paramtrico T2, y estimarla tendencia con el modelo paramtrico T2. De esta manera se estimala tendencia de la mejor forma en que puede hacerse paramtricamente;es decir, estimamos con el mismo modelo del cual provienen los datos.

    2. Especificacin inadecuada del modelo (T2-T1).Consiste en simular los datos con el modelo paramtrico T2 y estimar

  • 42 CAPTULO 3. DESCRIPCIN DEL ESTUDIO DE SIMULACIN

    la tendencia con el modelo paramtrico T1. As se estima la tendenciade los datos simulados mediante un modelo de tendencia diferente,como podra ocurrir en una situacin real.

    3. Estimacin no paramtrica (T2-NP). Consiste en calcular la Hopt parael modelo paramtrico T2 y con ella estimar la tendencia mediante(2.3.3).Esta es una situacin parecida al caso 1, slo que en el caso no paramtri-co. En condiciones habituales, con datos reales de los que no se sabede qu modelo de tendencia provienen, se tendra que emplear aquellaH que minimice la expresin (2.3.6). No obstante, en este trabajo seusar la Hopt por cuestiones de optimizacin de tiempo.

    En cualquiera de los casos mencionados, lo que se quiere observar es el efectode las diferentes situaciones de dependencia espacial en el MISE de las ten-dencias estimadas, as como el efecto en las estimaciones de los coeficientesde dependencia espacial.

  • Captulo 4

    Resultados

    A continuacin se muestran los resultados obtenidos en las simulacionesconsiderando las diferentes situaciones de dependencia espacial y los diferen-tes casos de especificacin de la tendencia planteados en la seccin 3.5.

    4.1. Especificacin Adecuada del Modelo

    4.1.1. Variacin de la proporcin del nugget

    MISE

    Los resultados del cuadro 4.1.1 muestran que el sesgo cuadrtico integra-do de la estimacin de la tendencia es prcticamente nulo en cualquiera de lassituaciones de dependencia dadas por el valor del nugget, aunque ligeramentemayor ah cuando se tiene nugget 0, que es cuando se est ms lejos de laindependendencia (en este contexto de variacin del nugget). Por lo anterior,el MISE representa prcticamente la varianza integrada de la estimacin dela tendencia. Lo que se observa es que el mtodo OLS tiene el mayor MISEde todos los mtodos, y que va descendiendo conforme se avanza de OLSa GLSt, lo que representa una ganancia el uso de los mtodos diferentes alOLS. Por otra parte, cuando se observan las distintas situaciones de depen-

    Figura 4.1.1: Sesgo2 integrado, Varianza integrada y MISE. T2-T2. Variacindel nugget.

    Sesgo2 Int. Varianza Int. MISEMtodo N00|N02|N05 N00|N02|N05 N00|N02|N05OLS 0.0004|0.0001|0.0000 0.1670|0.1330|0.0851 0.1674|0.1331|0.0851GLS1 0.0000|0.0000|0.0000 0.0748|0.0650|0.0473 0.0748|0.0650|0.0473GLSe 0.0000|0.0000|0.0000 0.0745|0.0646|0.0476 0.0745|0.0646|0.0476GLSt 0.0000|0.0000|0.0000 0.0697|0.0592|0.0426 0.0697|0.0592|0.0426

    43

  • 44 CAPTULO 4. RESULTADOS

    Cuadro 4.1: Estadsticos descriptivos de los coeficientes de tendencia estima-dos. Nugget 0.0

    (a) 0 = 1

    Mtodo Media Mediana Error EstndarOLS 1.0243 1.0303 0.3971GLS1 1.0069 0.9965 0.2843GLSe 1.0054 1.0016 0.2800GLSt 1.0057 1.0063 0.2752

    (b) 1 = 4

    Mtodo Media Mediana Error EstndarOLS 3.9311 3.9337 2.4626GLS1 3.9860 3.9640 1.5480GLSe 3.9911 3.9797 1.5663GLSt 3.9907 4.0132 1.4894

    dencia dadas por el nugget se observa que conforme ste aumenta, tiendea disminuir el MISE, lo cual es entendible, pues al aumentar el nugget, losdatos se encuentran ms cerca de la independencia.

    COEFICIENTES DE TENDENCIA

    La correcta especificacin del modelo permite en este caso tener las es-timaciones de los coeficientes de tendencia, de las cuales se pueden observaralgunos estadsticos descriptivos en el cuadro 4.1, relativo a nugget 0.0. Sepuede observar cmo todos los mtodos arrojan estimaciones de los coeficien-tes de tendencia prcticamente insesgadas, adems, considerando la cercanaentre la media y la mediana, se trata de distribuciones simtricas.

    Puede observarse tambin cmo al pasar del mtodo OLS a GLSt, laestimacin promedio se acerca ms al valor del parmetro, al mismo tiempoque se gana precisin al obtener menores errores estndar. Concretamente,se tiene mayor precisin en la estimacin de 0 que de 1 en cualquiera de losmtodos, situacin entendible debido a que la funcin de la que es coeficiente1 es ms compleja que la funcin de la que es coeficiente 0.

    Al pasar de nugget 0.0 a 0.2, y despus a 0.5, en general, se observa elmismo fenmeno que en el cuadro anterior; a saber, que hay mayor precisinen la estimacin de 0 que de 1, y que la precisin mejora conforme se pasadel metodo OLS al GLSt, pero adems, se observa que al aumentar el nuggetde provoca una disminucin en el sesgo del estimador y una mayor precisinen la estimacin de ambos coeficientes en cualquiera de los mtodos. Dehecho, al pasar de nugget 0.2 a 0.5 se observ el mismo fenmeno: menor

  • 4.1. ESPECIFICACIN ADECUADA DEL MODELO 45

    Figura 4.1.2: Grficos de caja de las estimaciones 0 y 1. N02

    (a) 0 = 1 (b) 1 = 4

    diferencia entre la media de las estimaciones y el valor del coeficiente, ymenor error estndar en general, mismo que disminuye al pasar de OLS aGLSt. Para tener una idea de las distribuciones, se muestran los grficos decaja de la estimaciones de los coeficientes de tendencia en el caso de nugget0.2.

    COEFICIENTES DE DEPENDENCIA

    En cuanto a los coeficientes de dependencia slo se tiene estimacin dela meseta parcial, del rango y del nugget, toda vez que el parmetro desuavizacin ha permanecido constante por considerar un modelo Materncon = 0.5 tanto en la simulacin de los datos como en el proceso deestimacin. De manera general, se encuentra que la distribucin de las esti-maciones de estos parmetros es asimtrica, pudiendo distinguirse fcilmenteentre la media y la mediana de las estimaciones. No obstante, las estimacionespromedio de los parmetros, ya sea en nugget 0.0, 0.2 o 0.5, son relativamentecercanas a los parmetros tericos.

    Lo anterior se verifica al observar los variogramas obtenidos con losparmetros de covarianza medios comparados con el variograma terico en lafigura 4.1.3. En general, puede observarse que en la regin cercana al nuggethay una ligera sobreestimacin, razn por la que el variograma en esa zona seobserva por encima del terico. Despus, aproximadamente en la parte mediadel variograma, parece haber una subestimacin del mismo, y por ltimo seobserva una regin cercana al final del variograma en la que parece haberuna cierta sobreestimacin del mismo. Eso acusa que, en promedio, tiende ahaber una sobre estimacin tanto del nugget como del rango y la meseta.

  • 46 CAPTULO 4. RESULTADOS

    Figura 4.1.3: Comparacin del semivariograma terico con los variogramasobtenidos mediante el valor medio de los parmetros de covarianza, segnmtodo.

    (a) Nugget 0.0

    (b) Nugget 0.2

    (c) Nugget 0.5

  • 4.1. ESPECIFICACIN ADECUADA DEL MODELO 47

    Cuadro 4.2: Sesgo2 integrado, Varianza integrada y MISE. T2-T2. Variacindel rango.

    Sesgo2int. Varianza int. MISEMtodo R01|R025|R05 R01|R025|R05 R01|R025|R05OLS 0.0000|0.0001|0.0001 0.0509|0.1330|0.2156 0.0509|0.1331|0.2157GLS1 0.0000|0.0000|0.0000 0.0418|0.0650|0.0573 0.0418|0.0650|0.0573GLSe 0.0000|0.0000|0.0000 0.0424|0.0646|0.0572 0.0424|0.0642|0.0572GLSt 0.0000|0.0000|0.0000 0.0404|0.0592|0.0497 0.0404|0.0592|0.0497

    4.1.2. Variacin del rango

    MISE

    Los resultados del sesgo2 integrado, varianza integrada y MISE con-siderando variacin en el rango se encuentran en el cuadro 4.2. En general,se observa que el sesgo cuadrado integrado en cualquiera de los mtodos yen cualquiera de los valores del rango es cero o prcticamente despreciable,aunque quiz, en el caso OLS, si se consideraran valores mayores del rangopudieran observarse valores algo mayores del sesgo. En cuanto a la varianzaintegrada puede observarse que conforme aumenta el rango tiende a aumen-tar la varianza integrada de manera notable, bsicamente en el mtodo OLS,pues lo que se observa en los otros mtodos hace pensar que al aumentar elrango no hay cambios apreciables en la varianza integrada.

    Ya que se observ que el sesgo es despreciable, el MISE en cada uno de losmtodos es una consecuencia del valor de la varianza integrada y se tendranlos mismo comentarios que para la varianza.

    En cuanto a la variacin del MISE segn mtodo, puede observarse queste disminuye notablemente al pasar de OLS a GLSt, siendo el MISE enlos tres ltimos mtodos bastante similares y ya sin cambios importantes alpasar de uno a otro; en realidad, el cambio notorio se observa al pasar deOLS a GLS1.

    COEFICIENTES DE TENDENCIA

    En cuanto a la estimacin de los coeficientes de tendencia, se pudo obser-var que en todos los mtodos se obtienen distribuciones en las que la mediay la mediana son bastante simtricas. Adems, se observ tambin que us-ando el mtodo OLS se obtiene mayor error que en los dems mtodos. Encuanto al cambio en la precisin de las estimaciones, se pudo observar que alaumentar el rango aument la imprecisin de las mismas, al observarse unincremento en el error estndar.

  • 48 CAPTULO 4. RESULTADOS

    Cuadro 4.3: Estadsticos descriptivos de las estimaciones de 1 = 4. Rango0.1 y 0.5.

    (a) 1 = 4. Rango 0.1

    Mtodo Media Mediana Error EstndarOLS 3.9959 3.9670 1.2294GLS1 3.9905 3.9838 1.0934GLSe 3.9907 3.9980 1.1024GLSt 3.9902 3.9553 1.0680

    (b) 1 = 4. Rango 0.5

    Mtodo Media Mediana Error EstndarOLS 4.0026 3.9662 3.1480GLS1 4.0008 4.0367 1.4926GLSe 4.0030 4.0270 1.5219GLSt 3.9938 4.0167 1.3707

    COEFICIENTES DE DEPENDENCIA

    En cuanto a la estimacin de los coeficientes de dependencia, en el casode menor rango, 0.1, se encontr que en promedio se sobreestim el efectonugget, observndose los variogramas con los coeficientes promedio por enci-ma del variograma terico justo en el origen. Despus, en la parte media de lagrfica, se observa que los variogramas estimados se encuentran por debajodel terico, lo que significa que en promedio se sobreestima ligeramente elrango; no obstante, la meseta de los variogramas estimados parece coincidircon el variograma terico, con lo que se puede decir que la estimacin de lameseta fue aceptable.

    En cambio, cuando se observan los variogramas en el caso de rango 0.5se puede constatar que la estimacin media del nugget fue aceptablementecorrecta en prcticamente todos los mtodos; sin embargo, se observa en laparte media que los variogramas estimados con los paramtros medios dedependencia sobrepasan al variograma terico, lo que implica que en estecaso se est subestimando el rango de la dependencia.

    4.2. Especificacin Inadecuada del Modelo

    4.2.1. Variacin de la proporcin de nugget

    MISE

    Los resultados del sesgo cuadrtico integrado, varianza integrada y MISEse observan en el cuadro 4.4. A diferencia de lo que ocurri en el caso donde

  • 4.2. ESPECIFICACIN INADECUADA DEL MODELO 49

    Figura 4.1.4: Comparacin del variograma terico con los variogramasobtenidos mediante el valor medio de los parmetros de covarianza, segnmtodo.

    (a) Rango 0.1

    (b) Rango 0.5

  • 50 CAPTULO 4. RESULTADOS

    Cuadro 4.4: Sesgo2 integrado, Varianza integrada y MISE. T2-T1. Variacindel nugget.

    Sesgo2int Varianza int MISEMtodo N00|N02|N05 N00|N02|N05 N00|N02|N05OLS 0.3163|0.3162|0.3162 0.3917|0.3150|0.2003 0.7079|0.6312|0.5165GLS1 0.4704|0.4516|0.4377 0.2887|0.2401|0.1609 0.7590|0.6918|0.5986GLSe 0.6615|0.6628|0.6829 0.2942|0.2548|0.1846 0.9557|0.9176|0.8675GLSt 0.5788|0.5391|0.4840 0.2757|0.2309|0.1556 0.8545|0.7700|0.6396

    Cuadro 4.5: Promedio de los coeficientes de covarianza, segn mtodo.Nugget 0.0

    Mtodo meseta parcial rango nuggetOLS 1.0760 0.1687 0.0155GLS1 1.4488 0.2893 0.0570GLSe 1.7540 0.3605 0.0765GLSt 1.6471 0.3538 0.0773

    se consideraba especificacin adecuada del modelo, en el presente caso re-sulta difcil en primera instancia distinguir si hay algun patrn en cuantoal comportamiento del MISE y sus componentes en los diferentes mtodosusados.

    Hablando de manera general, puede decirse que aumentar el valor delnugget tiene como consecuencia un decremente en el valor del MISE; es de-cir, que los datos, al acercarse ms a la independencia, favorecen estimacionesglobales con menor error cuadrtico medio integrado. Asimismo, se observaque la varianza disminuye al aumentar el nugget y el sesgo cuadrtico noparece experimentar grandes cambios. Eso significa que los cambios observa-dos en el MISE al aumentar el rango se deben fundamentalmente al aumentode la varianza integrada. En cualquier caso, es evidente que en el presentecaso de mala especificacin de la tendencia las estimaciones son mucho peo-res comparadas con el caso de especificacin adecuada del modelo, en el quese tienen sesgos despreciables y varianzas integradas bastante menores a lasobtenidas cuando no se especifica bien la tendencia.

    COEFICIENTES DE DEPENDENCIA

    En relacin con los coeficientes de dependencia, se encontr que la malaespecificacin del modelo condujo a estimaciones bastante inexactas de losparmetros de covarianza, tal como se puede observar en el cuadro 4.5.

    Como resultado de las malas estimaciones promedio de los coeficientesde covarianza, los grficos de los variogramas estimados resultan bastantediferentes al variograma terico, de tal manera que representan casi por

  • 4.2. ESPECIFICACIN INADECUADA DEL MODELO 51

    Figura 4.2.1: Comparacin del variograma terico con los variogramasobtenidos mediante el valor medio de los parmetros de covarianza, segnmtodo. Nugget 0.0

    completo una estructura espacial de los datos diferente de la que realmentefueron simulados. A manera de ejemplo, puede verse en la grfica 4.2.1 quesi bien el nugget no fue problema grave en cuanto a su estimacin media,si lo fueron de alguna manera el rango y, en especial, la meseta parcial.Eso significa que al haber especificado mal la tendencia, las estimacionessobreestiman la varianza de los datos principalmente al alejarse del origen.En relacin con los casos de variacin de nugget, se observ igualmente quela estimacin del nugget no fue el problema principal, sino el rango (inclusoen mayor medida que en el caso de nugget 0.0) y la meseta, cuyos valoresfueron todava mayores que los observados en el cuadro 4.5, tenindose deesa manera variogramas con mesetas an ms elevadas que las mostradas enla figura 4.2.1.

    4.2.2. Variacin del rango

    MISE

    Los comentarios sobre el MISE variando el rango son bastante similaresa los obtenidos anteriormente en el caso de variacin del nugget en el sentidode que se observan a simple vista valores del sesgo cuadrtico integrado y dela varianza integrada que estn lejos de considerarse propios de una buenaestimacin de la tendencia. No obstante, el aumento del rango implic unaumento del MISE en todos los mtodos, a diferencia de lo que ocurracuando aumentaba el nugget.

    La grfica 4.2.2 pemite observar de manera global los sesgos y varianzas

  • 52 CAPTULO 4. RESULTADOS

    Cuadro 4.6: Sesgo2 integrado, Varianza integrada y MISE.

    (a) Variando el nugget

    Sesgo2int Varianza int MISEMtodo N00|N02|N05 N00|N02|N05 N00|N02|N05NP 0.0523|0.0439|0.0312 0.4686|0.3867|0.2608 0.5209|0.4306|0.2926

    (b) Variando el rango

    Sesgo2 int Varianza int MISEMtodo R01|R025|R05 R01|R025|R05 R01|R025|R05NP 0.0393|0.0439|0.0350 0.1853|0.3867|0.5475 0.2246|0.4306|0.5825

    en la rejilla considerada.Dada la forma de las superficies de tendencia, observables en la grfica

    3.4.1, puede entenderse que en el grfico de sesgo2 se observen especfica-mente esas zonas en donde el sesgo es casi nulo: es en estas zonas donde co-inciden en buena medida ambas tendencias. La varianza, en cambio, tiende aaumentar conforme las posiciones espaciales se alejan del centro de la rejilla.

    COEFICIENTES DE DEPENDENCIA

    En cuanto a la estimacin de los coeficientes de dependencia, la situacines bsicamente la misma que en el caso de variacin del nugget; es decir,que se tienen muy malas estimaciones en promedio de los parmetros decovarianza. En este caso, las estimaciones del nugget resultan un poco peoren el caso de rango 0.1 que en el caso de rango 0.5; a su vez, las estimacionesde la meseta parcial se tornan peores al aumentar el rango.

    4.3. Estimacin No Paramtrica

    Los resultados de la estimacin no paramtrica de la tendencia se mues-tran en el cuadro 4.6.

    Escencialmente, se observa, al igual que en los casos anteriores, que elMISE aumenta conforme el rango aumenta, y disminuye conforme aumenta elnugget. Asimismo, al aumentar el nugget se observa una disminucin tanto enel sesgo cuadrtico como en la varianza; no as con el rango, que al aumentarsu valor el sesgo cuadrtico se mantiene aproximadamente igual mientrasque es la varianza la que aumenta y la causante de que aumente el MISE.

    Es interesante mencionar que los resultados del MISE obtenidos bajola estimacin paramtrica de la tendencia se encuentran en alguna zonaintermedia entre los encontrados bajo estimacin adecuada e inadecuada dela tendencia en los casos paramtricos.

  • 4.3. ESTIMACIN NO PARAMTRICA 53

    Figura 4.2.2: Sesgo2 y varianza obtenidos por el mtodo GLSt. Rango 0.0

    (a) Sesgo2

    (b) Varianza

  • 54 CAPTULO 4. RESULTADOS

    Cuadro 4.7: Matriz ventana Hopt, segn situacin de dependencia

    (a) Nugget 0.0

    0.287 0.0000.000 0.579

    (b) Nugget 0.2

    0.273 0.0000.000 0.546

    (c) Nugget 0.5

    0.239 0.0000.000 0.505

    (d) Phi 0.1

    0.261 0.0000.000 0.533

    (e) Phi 0.5

    0.247 0.0000.000 0.529

    Con respecto a la matriz ventana Hopt utilizada en estos casos, stas semuestran en el cuadro 4.7. Puede observarse cmo al pasar de una situacinde mayor dependencia a menor dependencia, como cuando aumenta el nugget,los valores de la diagonal de la matriz Hopt tienden a disminuir.

    Este efecto resulta interesante debido a que en situaciones de menor de-pendencia, cada dato aporta ms informacin por s mismo, no siendo re-querido abarcar mayor espacio en la rejilla para calcular el estimador locallineal. En cambio, cuando hay mayor dependencia, cada dato aporta menosinformacin por s mismo, con lo que se hace necesario abarcar una mayorrea para poder estimar adecuadamente la tendencia.

  • Captulo 5

    Conclusiones

    En este trabajo se consideraron diferentes escenarios de dependencia es-pacial por medio de la variacin de parmetros de covarianza tales como elrango y el nugget. En cada caso, se consideraron diferentes formas de especi-ficacin de la tendencia a fin de comparar las estimaciones de la tendenciapor diferentes mtodos paramtricos y no paramticos.

    De manera resumida, el MISE de las estimaciones no paramtricas indicaque stas no fueron tan buenas como en los casos de especificacin adecuadade la tendencia de manera paramtrica, pero se obtuvieron mejores resulta-dos que en el caso en el que no se especificaba la tendencia correctamente.Considerando que en la prctica se suele desconocer la tendencia verdaderade los datos, se concluye que a menos que se especifique la tendencia demanera adecuada mediante una funcin similar a la tendencia verdadera, nose puede usar con buenos resultados la estimacin paramtrica de la tenden-cia. Para la mayora de los casos en los que nada se sabe sobre la tendenciaverdadera, los resultados sugieren apoyarse en la estimacin no paramtricade la tendencia.

    Este trabajo deja abiertas varias lneas futuras. Una de ellas consisteen generalizar y realizar estimaciones no paramtricas del variograma, ascomo trabajar tambin en la correccin del sesgo en las estimaciones delmismo, obtenidas a partir de los residuos. Se deja abierta la puerta para labsqueda de mtodos ms eficientes y menos cosotosos computacionalmentepara seleccionar la matriz ventana H, por ejemplo de tipo plug-in.

    Por ltimo, se deja abierta la posibilidad de trabajar en la elaboracinde un paquete estadstico que permita utilizar tanto mtodos paramtricoscomo no paramtricos en la estimacin de la tendencia, que sea adems losuficientemente flexible para emplearlo incluso cuando el propsito principalno es la estimacin de la tendencia, sino la prediccin va kriging.

    55

  • 56 CAPTULO 5. CONCLUSIONES

  • Bibliografa

    [1] P.J. Diggle y P.J Ribeiro Jr. Model-Based Geostatistics. New York.Springer. 2007.

    [2] H. Wackernagel. Multivariate Geostatistics. An introduction with appli-cations. New York. Springer. 2003.

    [3] M.A. Diaz Viera. Geoestadstica Aplicada. Notas de curso. Institu-to de Geofsica, Universidad Nacional Autnoma de Mxico (UNAM).Instituto de Geofsica y Astronoma, CITMA. Cuba. 2002.

    [4] N. Cressie y M.O. Grondona. A comparison of variogram estimationwith covariogram estimation, en The art of statistical science. KV. Mar-dia (Ed.), Wiley. 191-208. 1992.

    [5] N. Cressie. Statistics for Spatial Data. New York. Wiley. 1991.

    [6] A.G. Journel y C.J. Huijbregts. Mining Geostatistics. New York. Aca-demic Press. 1978.

    [7] J.P. Chiles y P. Delfiner. Geostatistics. Modeling Spatial Uncertainty.New York. Wiley. 1999.

    [8] N. Cressie. Fitting variogram models using weighted least squares. J.Math. Geol. 17, 693-702. 1985

    [9] L. Wasserman. All of Nonparametric Statistics. New York. Springer.2006.

    [10] M.P. Wand y M.C. Jones. Kernel Smoothing. London. Chapman & Hall.1995

    [11] X.Liu. Kernel Smoothing for spatially correlated data. PhD. Thesis.Department of Statistics, Iowa State University. 2001.

    [12] J.D. Opsomer, Y. Wang e Y. Wang. Nonparametric regression withcorrelated errors. Statistical Science, 16, 134-153.

    57

  • 58 BIBLIOGRAFA

    [13] M. Francisco-Fernndez y J.D. Opsomer. Smoothing paremeter selec-tion methods for nonparametric regression with spatially correlated er-rors. The Canadian Journal of Statistics. Vol 33, No.2. p279-295. 2005.

    [14] P. Goovaerts. Geostatistics for Natural Resources Evaluation. Oxford.Oxford University Press. 1997.

    [15] M. Armstrong. Problems with universal kriging. Mathematical Geolo-gy, 16, 101-108. 1984.

    [16] G. Matheron. The theory of regionalized variables and its applications.Cahiers du Centre de Morphologie Mathematique, 5. Fontainebleau.France. 1971.

    [17] S.P. Neuman y E.A. Jacobson. Analysis of nonintrinsic spatial variabil-ity by residual kriging with application to regional groundwater levels.Mathematical Geology, 16, 499-521. 1984.

    [18] M.L. Stein. Asymptotically efficient prediction of a random field with amisspecified covariance function. Annals of Statistics, 16, 55-63. 1988.

    [19] P. J. Ribeiro Jr & P. J. Diggle. geoR: a package for geostatistical anal-ysis. R-NEWS, 1(2):15-18. June, 2001.