variables regoonalizada

13
Revista Colombiana de Estadística Volumen 30 No. 1. pp. 115 a 127. Junio 2007 Análisis exploratorio de variables regionalizadas con métodos funcionales Exploratory Analysis of Regionalized Variables with Functional Methods Ramón Giraldo a Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Estadística, Bogotá Resumen Se muestra cómo las estadísticas descriptivas funcionales y el análisis en componentes principales funcional (ACPF) pueden emplearse en la evalua- ción empírica del supuesto de estacionariedad considerado en la modelación de variables regionalizadas. Se toma como ejemplo información georreferen- ciada correspondiente a mediciones de profundidad recogidas en 114 sitios de la Ciénaga Grande de Santa Marta, Colombia. Palabras clave : análisis de datos funcionales, análisis en componentes prin- cipales funcional, estacionariedad. Abstract It is shown how summary statistics of functional data and functional principal components analysis (FPCA) can be used to evaluate the statio- narity assumption considered in modeling of regionalized variables. As an example is taken georeferenced information of depth measured at 114 loca- tions at Ciénaga Grande de Santa Marta, Colombia. Key words : Functional data analysis, Functional principal components analy- sis, Stationarity. 1. Introducción Desde el trabajo pionero de Deville (1974) y más recientemente con el de Ram- say & Dalzell (1991), la comunidad estadística ha estado interesada en el análisis de datos funcionales (ADF). Se han propuesto versiones funcionales para métodos a Profesor asociado. E-mail: [email protected] 115

Upload: yema-cra

Post on 17-Aug-2015

214 views

Category:

Documents


0 download

DESCRIPTION

D

TRANSCRIPT

Revista Colombiana de EstadsticaVolumen 30 No. 1. pp. 115 a 127. Junio 2007Anlisis exploratorio de variables regionalizadascon mtodos funcionalesExploratory Analysis of Regionalized Variables with FunctionalMethodsRamnGiraldoaUniversidadNacionaldeColombia,FacultaddeCiencias,DepartamentodeEstadstica,BogotResumenSe muestra cmo las estadsticas descriptivas funcionales y el anlisis encomponentes principales funcional (ACPF) pueden emplearse en la evalua-cin emprica del supuesto de estacionariedad considerado en la modelacinde variables regionalizadas. Se toma como ejemplo informacin georreferen-ciadacorrespondienteamedicionesdeprofundidadrecogidasen114sitiosde la Cinaga Grande de Santa Marta, Colombia.Palabras clave: anlisis de datos funcionales, anlisis en componentes prin-cipales funcional, estacionariedad.AbstractItisshownhowsummarystatisticsof functional dataandfunctionalprincipalcomponentsanalysis(FPCA)canbeusedtoevaluatethestatio-narityassumptionconsideredinmodelingofregionalizedvariables. Asanexample is taken georeferenced information of depth measured at 114 loca-tions at Cinaga Grande de Santa Marta, Colombia.Key words: Functional data analysis, Functional principal components analy-sis, Stationarity.1. IntroduccinDesde el trabajo pionero de Deville (1974) y ms recientemente con el de Ram-say & Dalzell (1991), la comunidad estadstica ha estado interesada en el anlisisde datos funcionales (ADF). Se han propuesto versiones funcionales para mtodosaProfesor asociado. E-mail: [email protected] Ramn Giraldoestadsticostradicionalescomo, entreotros, regresin(Cardotetal.1999), an-lisisdevarianza(Cuevasetal.2004,Delicado2007),modelolinealgeneralizado(Escabias et al. 2004) o componentes principales (Pezulli & Silverman 1993). LosconceptosbsicosdelADFyalgunasdelasmetodologasantesmencionadasseencuentran en Ramsay & Silverman (2005).No obstante, la tecnologa moderna para la adquisicin de informacin en tiem-po real a menudo produce datos que pueden considerarse directamente como fun-cionales; es posible tambin obtener una cantidad nita y por lo tanto incompletadeinformacinrespectoaunafuncin. Porejemplo, cuandoenlasestacionesmeteorolgicas se colectan datos de temperatura diariamente, a pesar de que estacaracterstica vara de manera continua en funcin del tiempo. En este ltimo casotiene sentido (debido a la continuidad) acudir al ajuste de curvas (Ramsay 1998)para obtener la observacin funcional. Generalmente esta etapa se cumple usandomtodos de suavizado y no paramtricos (Simono 1996). Debido a la continuidadespacial propia de la informacin geoestadstica (Cressie 1993), surge de maneranatural la posibilidad de adaptar las tcnicas funcionales en este contexto.Enunanlisisgeoestadsticolafaseexploratoriasellevaacaboatravsdegrcos que permiten inspeccionar la estacionariedad de la variable regionalizadaestudiada (Isaaks & Srivastava 1987). Bsicamente se construyen dispersogramaspara establecer la presencia de tendencia y de autocorrelacin. Un supuesto fun-damental asumido es que la asociacin espacial es funcin de la distancia y no dela posicin, es decir que la correlacin entre dos sitios depende de la distancia entreellos y no de su ubicacin dentro del rea considerada (Samper & Carrera 1993).En este artculo se muestra, a travs de un estudio de caso, cmo las tcnicas deanlisis de datos funcionales permiten identicar tendencia en media y varianza yexplorar la estructura de autocorrelacin inherente a un conjunto de datos medidosen una regin con continuidad espacial. Para exponer el procedimiento, se tomacomo ejemplo informacin georreferenciada sobre profundidad (m) medida en 114sitiosdelestuarioCinagaGrandedeSantaMarta, localizadoenlacostanortede Colombia (gura 1). En la seccin 3 se explica cmo el dato real de cada sitio(profundidad (m)) puede convertirse en funcional haciendo uso de la continuidadespacial y de mtodos de suavizado. En la seccin 4 se ilustra de qu manera estaadaptacin permite cumplir con el objetivo exploratorio mencionado.2. TeoraEnesteapartadosepresentanlosconceptosquepermitencontextualizareltrabajo y que se emplean en las secciones 3 y 4. En primera instancia se dene, enel marco de la estadstica espacial, qu es una variable regionalizada y cules sonlos supuestos que sobre ella deben estudiarse para lograr un apropiado uso de lasherramientas de prediccin espacial. Posteriormente se introducen los elementosbsicosdel anlisisdedatosfuncionalesyespeccamentesehacereferenciaaalgunas estadsticas descriptivas y al anlisis en componentes principales.Revista Colombiana de Estadstica 30 (2007) 115127Anlisis exploratorio de variables regionalizadas con mtodos funcionales 11712 3 4 56 7 8 9 10 11 12 13 14 15 1617 18 19 20 21 22 23 24 25 26 2728 29 30 31 32 33 34 35 36 37 38 3940 41 42 43 44 45 46 47 48 49 5051 52 53 54 55 56 57 58 59 6061 62 63 64 65 66 67 686970 71 72 73 74 75 76 7778 79 80 81 82 83 84 8586 87 88 89 90 919293 94 95 96 97 9899 100 101 102 103 104105 106 107 108 109110 111 112 113 114R. FundacinBoca de laBarraMAR CARIBER. SevillaC. GrandeC. Clarn10 45' N7 30' WR.AracatacaFigura1: Regin de estudio y localizacin de los sitios de muestreo.2.1. Estadstica espacial, variable regionalizada yestacionariedadEstadstica espacial es la reunin de un conjunto de tcnicas apropiadas parael anlisis dedatos quecorrespondenalamedicindevariables aleatorias endiversossitios(puntosdel espaciooagregacionesespaciales)deunaregin. Demanera ms formal se dice que esta misma trata con realizaciones de un procesoestocstico(campoaleatorio) {Z(s): s D Rd}, enelquesrepresentaunaubicacin en el espacio euclidiano d dimensional y Z(s) es una variable aleatoria enla ubicacin s. Dicha disciplina se subdivide en tres grandes reas (geoestadstica,patronespuntualesydatosdereas). Lapertinenciadecadaunadeellasestasociadaalascaractersticasdel conjuntoDdendicesdel procesoestocsticode inters. Cuando las ubicacioness provienen de un conjuntoD continuo y sonseleccionadas a juicio del investigador (D jo), la informacin se enmarca dentro dela teora geoestadstica (Cressie 1993). En geologa y minera se denomina comovariableregionalizadaal procesoestocsticoas obtenido(Journel &Huijbregts1978, Isaaks&Srivastava1987). Estemismosedenecomoestacionariosi lafuncin de distribucin del vector aleatorio Z(s) = [Z(s1), . . . , Z(sn)]tes idnticaa la del vector Z(s+h) = [Z(s1+h), . . . , Z(sn+h)]tpara cualquier h. El proceso{Z(s) : s D Rd} es estacionario fuerte si:Revista Colombiana de Estadstica 30 (2007) 115127118 Ramn Giraldo1. E(Z(s)) = m, s D Rd, conm R,2. COV [Z(s), Z(s + h)] = C(h) < .Las dos condiciones anteriores implican que la media y la varianza son cons-tantes en la regin y que la covarianza depende solo de la distancia entre los sitiosynodesuposicindentrodel readeestudio. Unsupuestomuyusadoenlaprcticadelanlisisgeoestadsticoeseldeestacionariedaddbilquesebasaenlos siguientes requisitos:1. E(Z(s) Z(s + h)) = k, (s, s + h) D Rd, conm R,2. V [Z(s) Z(s + h)] = 2(h).A 2(h) se le denomina variograma y es la funcin comnmente empleada parahacer estimacin de la autocorrelacin espacial.Paralacorrectaprcticadel anlisisgeoestadsticoesdevital importanciajuzgar la hiptesis de estacionariedad, puesto que la seleccin del mtodo de pre-diccin kriging (Christakos 2000) est directamente asociada con la propiedad demedia constante. Cuando se tienen datos muestrales este requerimiento es estu-diado de manera emprica usando dispersogramas de los valores de la variable deinters contra las coordenadas de medicin (Cressie 1993). La suposicin referentea la covarianza o al variograma es difcil de probar, incluso de forma descriptiva,y no se evala en la mayora de trabajos aplicados.2.2. Anlisis de datos funcionales (ADF)Enunnmerocrecientedecamposaplicadoslasobservacionestomadassoncurvas o imgenes. Estas son ejemplos de funciones puesto que la intensidad me-didaesdisponibleencadapuntodeunsegmentodelneaodeunaporcindeunplanoovolumen. Enel ADFlaunidadbsicadeinformacineslafuncincompleta, ms que un conjunto de valores (Ramsay & Dalzell 1991). En el con-textomultivariadolosdatosprovienendelaobservacindelafamiliaaleatoria{X(tj)}j=1,...,J. Deotrolado, enanlisisfuncional seasumequeestosmismosproceden de una familia continua = {X(t); t T} (Ferraty & Vieu 2006). Dosdeniciones importantes para establecer diferencias entre los contextos real y fun-cional son (Ferraty & Vieu 2006):Denicin 1. Una variable aleatoria se llama variable funcional (v.f.) si tomavalores en un espacio innito dimensional (espacio funcional). Una observacinde se llama un dato funcional.Denicin2. Un conjunto de datos funcionales1, . . . , nes la observacin den variables funcionales1, . . . , n con igual distribucin que.SeaT= [a, b] R. Normalmente se asume que se tienen elementos deL2(T) =

f: T R, tal que

Tf(t)2dt <

Revista Colombiana de Estadstica 30 (2007) 115127Anlisis exploratorio de variables regionalizadas con mtodos funcionales 119L2(T) con el producto interno usual f, g =

Tf(t)g(t) dt es un espacio Euclidiano(He et al. 2000).2.2.1. Estadsticas descriptivas en ADFLas estadsticas descriptivas univariadas y bivariadas clsicas se aplican igual-mente cuando se tienen datos funcionales. Dado un conjunto de datos funcionales1, . . . , n, denidosent TR, lascorrespondientesfuncionesdescriptivasestn dadas por las siguientes expresiones (Ramsay & Silverman 1997):Media: (t) = n1n

i=1i(t).Varianza: V ar((t)) = (n 1)1n

i=1(i(t) (t))2.Desviacin estndar: D.E.((t)) =

V ar((t)).Covarianza: Cov((t1), (t2)) = (n1)1n

i=1(i(t1)(t1))(i(t2)(t2)).Correlacin : Corr((t1), (t2)) =Cov((t1), (t2))

V ar((t1))V ar((t2)).2.2.2. Anlisis en componentes principales funcional (ACPF)Los objetivos del ACPF son los mismos del anlisis en componentes principalesclsico(ACP), esdecirencontrarlosmodosdominantesdevariacinyconocercuntosdeestossonnecesariosparalograrunaaproximacinsatisfactoriaalosdatos originales. El ACP puede denirse en trminos del siguiente procedimientoiterativo (Ramsay & Silverman 2005):1. Seencuentraelvectordepesos=(11, . . . , p1)tparaelcuallosvalores(scores) del componente principalfi1 =

j j1xijmaximizan i f2i1 sujetoa j 2ji = 1

2= 1.2. Se lleva a cabo una segunda y hastap subsecuentes etapas. En lam-simaetapasecalculaunnuevovectordepesos m, concomponentes jm, talque j f2jm es mxima, sujeto a las restricciones m

2= 1 y j jkjm =tkm = 0, k < m.En el caso del ACPF, los valores de las variables se reemplazan por valores defuncionesi(t),tal que el ndice discretojen el contexto multivariado,descritoarriba, se sustituye por un ndice continuo t. Las sumas sobre j se reemplazan porintegrales sobret. Por consiguiente el ACPF se encuentra como sigue:1. Se halla la funcin de pesos 1(t) que maximiza

i f2i1 sujeto a

T21(t) dt =1

2= 1, confi1 =

Ti(t)1(t) dt.Revista Colombiana de Estadstica 30 (2007) 115127120 Ramn Giraldo2. Serealizaunasegundayhasta pnuevas etapas. Enla m-simaetapa,secalculaunnuevovectordepesos m(t) yunnuevocomponenteprin-cipal tal que j f2jmsemaximizasujetoalasrestricciones m

2=1y

Tk(t)m(t) dt = 0.EnACPclsicoloscomponentesseobtienenresolviendolaecuacinpropiaV =, dondeVes una matriz de covarianzas o de correlacin, es un vectorpropio de Vy es un valor propio de V .La versin funcional (Ramsay & Silverman1997)esanlogatomando T(s, t)(t) dt = (t)comoecuacinpropia, donde(s, t) = ni=1 i(s)i(t)eslafuncindecovarianza(i(t)hasidocentrada), es un valor propio y(t) es una funcin propia de la funcin de covarianza(s, t).En el contexto funcional en general se trabaja con la funcin de covarianzas y nocon la de correlacin, porque los valores de las funciones estn en la misma escala.3. MtodoCuandosetienendatosdeunavariableennsitiosdeunareginconconti-nuidad espacial, como los usados dentro del anlisis geoestadstico (Cressie 1993),implcitamente en cada uno de ellos hay una observacin funcional. Suponga quesecalculanlasdistanciaseuclidianasdijdelsitioi, i=1, . . . , n, acadaunodelosjrestantes, j= 1, . . . , n,y que estas se ordenan en el eje de las abscisas. Sia cadadijse le asigna como ordenada el valor medido de la caracterstica de in-ters en el sitioj, se tienen medidas puntuales de una observacin funcional paraelsitioienelintervalo[0, h],dondehesladistanciamximaentreestemismoy sus vecinos. Empleando tcnicas de suavizado (Simono 1996),los valores asencontradospuedenconvertirseenundatofuncional. Enlagura2semues-tran los dispersogramas de profundidad contra distancia en cuatro estaciones demuestreo de la CGSM y funciones (lneas continuas) halladas mediante B-splines(Simono 1996) en cada uno de ellos. Es claro que la distancia mxima entre unsitio y sus vecinos ucta dependiendo de su ubicacin dentro del sistema y queporendelasfuncionesajustadastienendominiosdistintos. Porejemplo, enlasestaciones de muestreo 56 y 82, ubicadas en el centro de la CGSM (gura 1), lasdistanciasmximasestnalrededorde17kmy21km, respectivamente(gura2), mientras que en las estaciones 1 y 114, localizadas en los extremos norte y sur(gura 1), estas son cercanas a los 30km (gura 2).El procedimiento descrito se realiz en cada uno de los 114 sitios de muestreo(gura1), obtenindoseas igual nmerodefuncionesenel intervalo[0, 17000](gura 3). El valorh = 17000 corresponde al mnimo de las distancias mximasentreparejasdesitiosyfueconsideradocomoextremodelsoportedetodaslasfuncionesparahomogeneizarlosanlisis(paratenerigual nmerodedatosentodas las distancias). Cada curva expresa el cambio esperado (suavizado) de pro-fundidad en la medida en que hay alejamiento del correspondiente sitio. Con baseen este conjunto de datos funcionales se calcularon las medidas descriptivas dadasenlaseccin2.2.1yseaplicel ACPFdelaseccin2.2.2, conel propsitodeidenticar tendencia espacial en media y varianza, de establecer el rango de auto-Revista Colombiana de Estadstica 30 (2007) 115127Anlisis exploratorio de variables regionalizadas con mtodos funcionales 121correlacin y de evaluar empricamente si esta ltima funcin es homognea dentrode la CGSM. Los grcos de las funciones propias del ACPF se presentan comoperturbaciones positivas y negativas de la media funcional (media funcional mso menosuna constante porla funcinpropia)(Ramsay &Silverman2005). Conbase en unbiplot y en grcos de contornos de losscores resultantes del ACPF,se hace la interpretacin prctica desde el punto de vista espacial. Los anlisis sellevaron a cabo usando las libreras fda y geoR del software R (R Development Co-re Team 2005).0 10000 20000 300000.51.01.52.02.5Distancia(m)Profundidad(m)Sitio 10 5000 10000 150000.51.01.52.02.5Distancia(m)Profundidad(m)Sitio 560 5000 150000.51.01.52.02.5Distancia(m)Profundidad(m)Sitio 820 5000 15000 250000.51.01.52.02.5Distancia(m)Profundidad(m)Sitio 114Figura2: Valores de profundidad en funcin de la distancia, en cuatro sitios de muestreodelaCinagaGrandedeSantaMarta. Las lneas continuas representanobservaciones funcionales obtenidas por ajustes mediante B-splines.4. Resultados y discusinLasmedidasresmenesglobalesdeprofundidad(tabla1)hacenpensarquelaCGSMes unsistemasomero(promedioalrededor de 1.5 m) yhomogneo(C. V.< 30%). Sin embargo, a pesar de la poca variabilidad, las funciones descrip-tivas calculadas (gura 3) muestran que puede haber zonas con comportamientosRevista Colombiana de Estadstica 30 (2007) 115127122 Ramn Giraldodiferenciales (adems permiten darse una idea global del radio de homogeneidad).El grco dela funcinmedia(gura 3,izquierda) presenta una pendientemuypequea antes de 10km (aproximadamente) con magnitudes prximas al prome-dioglobal (tabla1). Despusdelos10kmpredominanlascurvasconvaloresbajos (gura 3), haciendo que la funcin media tienda a disminuir. Esto insina,desde el punto de vista prctico, que puede estarse presentando un fenmeno deestacionariedadlocal, esdecirquehayzonasdelsistemadondeesrazonablees-perar un valor promedio alrededor de 1.47m, pero que hay otras, especialmentedelasfronterasdel mismo, debajabatimetra. Esclaroquelaprofundidadesmenor en algunos de los extremos de la regin de estudio porque las curvas tien-den a disminuir para distancias grandes, es decir para aquellas con los sitios msalejados (los que estn ubicados en el borde). El valor agregado de este resultadonoeslaidenticacindelaszonasconcaractersticassimilares, puestoqueesopuede detectarse directamente con los datos medidos (Giraldo et al. 2000), sino laidenticacin global del alcance dentro de estas. Este patrn general se describede manera detallada con los resultados del ACPF.Tabla1: Medidas descriptivas de datos de profundidad (m) tomados en marzo de 1997enlaCinagaGrandedeSantaMarta, Colombia. C. V.: CoecientedeVariacin (%).Medida Profundidad (m)Media 1.47Mnimo 0.25Mximo 2.50C. V. 24.10 5000 10000 150000.00.51.01.52.0Distancia (m)Profundidad(m)0 5000 10000 15000-0.50.00.51.0Distancia (m)CorrelacinFigura3: Izquierda: curvasdeprofundidadenfuncindedistanciasentresitios(l-neascontinuasclaras), funcinmedia(lneacontinuaoscura)yfuncindedesviacin estndar (lnea punteada). Derecha. funcin de autocorrelacin.En el grco de la funcin de desviacin estndar (gura 3) se observa que estatomasumximoencero(desviacinestndaralrededorde0.25mdeprofundi-Revista Colombiana de Estadstica 30 (2007) 115127Anlisis exploratorio de variables regionalizadas con mtodos funcionales 123dad) y que disminuye hasta lograr valores prximos a cero (desviaciones estndaralrededor de 0 m de profundidad) para distancias entre 5 y 10 km. Este resultado,a pesar de su apariencia, no demuestra que la variabilidad cambia en funcin deladistancia. Msbienreejalapresenciadeobservacionesextremasenelcon-juntooriginal dedatos. El rangomayorde2m(vermximoymnimo, tabla1)sugierequehayporlomenosdossitiosconcondicionesdeprofundidadmuydistintas. Cuando se emplean mtodos de suavizado, hay mayor inuencia de losdatosenlosextremosdel soportequeenel centrodondehaymsinformacinpara llevar a cabo el ajuste (Simono 1996) y por ello los datos atpicos afectanms la curva resultante si estn al comienzo o al nal del dominio de la funcin.Los valores mnimos y mximos de profundidad (dados en las estaciones 9 y 12,respectivamente, gura 1) aparecen, por construccin, en todos los dispersogramascalculados (ver por ejemplo los mximos y los mnimos de los dispersogramas dela gura 2). Sin embargo, por la razn anterior, su inuencia en el clculo de lasfuncionesnoeslamisma. Lascurvasdelossitios9y12(gura3)olasdelosvecinos a estos (los ubicados hacia la zona norte-centro) tendrn puntos de partidamuy distintos (alejados) de las restantes y a consecuencia de esto la variabilidadfuncional aumenta en las proximidades del origen.0 5000 10000 150001.11.21.31.41.51.61.71.8Distancia (m)Profundidad(m)0 5000 10000 150001.11.21.31.41.51.61.71.8Distancia (m)Profundidad(m)Figura4: Funciones propias (eigenfunctions) del primer y segundo componente princi-pal funcional (izquierda y derecha, respectivamente), gracadas como pertur-baciones positivas (lneas continuas delgadas) y negativas (lneas punteadas)de la media funcional (lnea continua gruesa).La funcin de autocorrelacin (gura 3) muestra un decrecimiento muy rpidoen trminos de la distancia. Toma el valor cero alrededor de los 5 km, lo cual impli-ca que en general sitios separados ms de 5 km no tienen asociacin espacial. Cabeanotar que este es un punto de referencia global para la autocorrelacin. Como semostraradelante, unestudiolocal(puntoapunto)permitedetectarrelacionesespaciales de mayor distancia. De todas formas el rango estimado resulta muchomenor al que se obtiene a travs del clculo de la funcin de semivarianza (Giraldoetal.2000). UnaposibleexplicacindeladiferenciaentrelasdosestimacionesRevista Colombiana de Estadstica 30 (2007) 115127124 Ramn Giraldoeslanoconsideracindevaloresextremosenel ajustedel semivariograma. Ladiscrepancia entre los dos procedimientos podra evaluarse a travs de un estudiode simulacin.Enloreferenteal ACPF, el primercomponenteprincipal funcional (CPF1)explic el 68.2% y el segundo (CPF2) el 16.1% de la variabilidad en la profundidad(considerada de manera funcional). De acuerdo con las funciones de peso halladas(gura 4), el CPF1 explica la relacin entre sitios distantes hasta 7km (medianaescala) y el CPF2 la asociacin hasta 2km (pequea escala). Sitios de muestreocon valores (scores) positivos en el CPF1 tendern a ser someros y aquellos convaloresnegativosenestemismotendrnmayorbatimetra. Enamboscasosenpresencia de correlacin espacial moderada. De otro lado, respecto al CPF2, podrdecirsequesitiosconvalorespositivosendichocomponente, tienenvaloresdeprofundidadporencimadel promedioypocaasociacinespacial yquevaloresnegativosdeestecorrespondenasitiossomerosdebajacorrelacinespacial. Elbiplot resultante (gura 5) sugiere que el CPF2 est asociado a la variabilidad en lasestaciones ubicadas en las zonas centro, centro-oriental y sur-oriental (estacionesde la parte superior del cuadrante uno) y que el CPF1 evidencia lo que ocurre enlas zonas occidental, norte y sur (estaciones en los extremos del eje horizontal).Componente 1Componente 220 10 0 -10 -20 -3020151050-5-10-15S114S113S112S111S110S109S108S107S106S105S104S103S102S101S100S99S98S97S96S95 S94 S93S92S91S90S89S88S87S86S85S84S83S82S81S80S79S78S77S76S75S74S73S72S71S70S69S68S67S66S65S64S63S62S61S60S59S58S57S56S55S54S53S52S51S50S49S48S47S46S45S44S43S42S41S40S39 S38S37S36S35S34S33S32S31S30 S29S28S27S26S25S24S23S22S21S20S19S18S17S16S15S14S13S12S11S10S9S8S7S6S5S4S3S2S1Profundos y con altacorrelacin espacial.Someros, con altacorrelacin espacial.Profundos, con baja correlacin espacial.Someros, con baja correlacin espacial.Figura5: Valores (scores) de los sitios de muestreo sobre los dos primeros componentesprincipales hallados con base en datos funcionales de profundidad. Cada sitioes identicado por una etiqueta que contiene la letras de sitio y un nmerocorrespondiente al dado en la gura 1.Losgrcosdecontornosdelos scorescorrespondientesaloscomponentesprincipales funcionales 1 y 2 (gura 6) revelan que la profundidad est por encimadelpromedioenelcostadooccidentaldelaCGSM,puestoqueenestazonalosvaloresdel CPF1sonnegativos. Ademspuedearmarsequeall existemayordependenciaespacial queenel restodel sistema, esdecir, seesperaencontrarestaciones de esta zona distantes hasta 7km en las que de manera conjunta hayRevista Colombiana de Estadstica 30 (2007) 115127Anlisis exploratorio de variables regionalizadas con mtodos funcionales 125valores altos de profundidad. Lo contrario ocurre en las zonas sur y nor-orientaldonde las magnitudes de este componente son positivas.Los scores correspondientes al CPF2 son especialmente interpretables, de acuer-do con la gura 5, en la zona centro-oriental. Se puede decir entonces que en estasubregindelreadeestudio, elniveldebatimetraesalto, peroquehaypocaasociacin espacial,posiblemente debido a que sus estaciones estn en un puntointermedio entre dos zonas someras (sur y nor-oriental).Engeneral el ACPFpermiteconcluirquelaautocorrelacinespacial node-pendedelaposicin, puestoquetantoenlazonasomeracomoenlaprofundahay correlacinamediana escala. El16% explicado porel CPF2 correspondealarelacinapequeaescalapresenteenlasestacionesdetransicinentrereasprofundasysomeras. As mismopodrapensarsequeel supuestodeestaciona-riedad fuerte no es vlido, porque el nivel promedio global tiende a cambiar paradistanciasmayoresde10km(distanciacortateniendoencuentaquehaysitiosseparados cerca de 30km) y porque parece haber diferencias entre los promediosde batimetra de la zona occidental y los de las zonas sur y nor-oriental del sistema.R. FundacinBoca de laBarraMAR CARIBER. SevillaC. GrandeC. Clarn10 45' N7 30' WR.AracatacaR. FundacinBoca de laBarraMAR CARIBER. SevillaC. GrandeC. Clarn10 45' N7 30' WR.AracatacaFigura6: Grcos de contornos de los scores de los componentes principales funcionales1 (izquierda) y 2 (derecha).5. Conclusin y perspectivasLa metodologa empleada permite establecer de manera global cambios en me-dia, varianzaycorrelacinenunarealizacindeuncampoaleatorioyporcon-siguientehaceposibleel estudioempricodelaestacionariedaddel procesodeinters. Adems hace factible, a travs del uso del ACPF, la evaluacin de la in-teraccin local entre los valores medidos de la variable regionalizada considerada.Revista Colombiana de Estadstica 30 (2007) 115127126 Ramn GiraldoEn el trabajo se present una aplicacin del ADF dentro del contexto explorato-riogeoestadstico. Laextensinalasotrasreasdelaestadsticaespacial ylaformulacin de teoras apropiadas para modelar datos funcionales con correlacinespacial (cuando en cada sitio se observe directamente una funcin), son camposde investigacin abiertos.Recibido: febrero de 2007Aceptado: mayo de 2007ReferenciasCardot, H., Ferraty, F. & Sarda, P. (1999), Functional Linear Model, Statisticsand Probability Letters 45, 1122.Christakos,G. (2000),ModernSpatioTemporal Geostatistics,Oxford UniversityPress, New York.Cressie, N. (1993), Statistic for Spatial Data, John Wiley & Sons, New York.Cuevas, A., Febrero, M. & Fraiman, R. (2004), An ANOVA Test for FunctionalData, Computational Statistics and Data Analysis 47, 111122.Delicado, P. (2007), Functionalk-Sample Problem when Data are Density Func-tions, Computational Statistics .*Published online, http://www.Springerlink.comDeville, J. (1974), Mthodes statistiques et numeriques de lanalyse harmonique,Ann. Insee 15, 3104.Escabias, M., Aguilera, A. & Valderrama, M. (2004), Principal Components Es-timation of Functional Logistic Regression: Discussion of Two Dierent Ap-proaches, Journal of non Parametric Statistics 16(3-4), 365384.Ferraty, F. & Vieu, P. (2006), Non Parametric Functional Data Analysis. Theoryand Practice, Springer, New York.Giraldo, R., Troncoso, W., Mancera, J. &Mndez, N. (2000), Geoestadstica:unaherramientaparalamodelacinenestuarios, Rev. Acad. Col. Cienc.24(90), 6072.He, G., Muller, G. & Wang, J. (2000), Extending Correlation and Regression fromMultivariate to Functional Data, in M. Puri, ed., Asymptotics in Statisticsand Probability, Brill Academic Publisher, Leiden, pp. 114.Isaaks, E. & Srivastava, M. (1987), Applied Geostatistics, Oxford University Press,New York.Journel, A. & Huijbregts, C. (1978), Mining Geostatistics, Academic Press, Lon-don.Revista Colombiana de Estadstica 30 (2007) 115127Anlisis exploratorio de variables regionalizadas con mtodos funcionales 127Pezulli, S. &Silverman, B. (1993), SomePropertiesof SmoothedComponentsAnalysis for Functional Data, Computational Statistics 8, 116.R Development Core Team (2005), R: A language and environment for statisticalcomputing, R Foundation for Statistical Computing, Vienna, Austria. ISBN3-900051-07-0, http://www.R-project.org.Ramsay, J. (1998), Estimating Smooth Monotone Functions, Journal Royal Sta-tistical Society, Series B 60, 365375.Ramsay, J. & Dalzell, C. (1991), Some Tools for Functional Data Analysis, Jour-nal Royal Statistical Society 53(3), 539572.Ramsay, J. & Silverman, B. (1997), Functional Data Analysis, Springer, New York,USA.Ramsay, J. & Silverman, B. (2005), Functional Data Analysis, 2nd edn, Springer,New York, USA.Samper, F.&Carrera, J.(1993), Geoestadstica.Aplicacionesalahidrogeologasubterrnea, Centro Internacional de Mtodos Numricos en Ingeniera, UPCBarcelona.Simono, J. (1996), Smoothing Methods in Statistics, Springer.Revista Colombiana de Estadstica 30 (2007) 115127