laminasteoria tallerunesur2008.ppt [modo de … · 111 i t i d l t d t1.11 importancia de los...

76
Taller de Manejo de Colecciones de Datos y Metadatos para las Ciencias E ló i A bi tl Ecogicas y Ambientales Santa Bárbara del Zulia, Marzo de 2008 Zulay Méndez ([email protected]) Rodrigo Torréns (t @l ) Rodrigo Torréns (torrens@ula.ve)

Upload: dangkiet

Post on 25-Sep-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Taller de Manejo de Colecciones de Datos y Metadatos para las Ciencias

E ló i A bi t lEcológicas y Ambientales

Santa Bárbara del Zulia,Marzo de 2008

Zulay Méndez ([email protected])

Rodrigo Torréns (t @ l )Rodrigo Torréns ([email protected])

Este taller forma parte del entrenamiento necesario para que los

Motivaciones del Taller

p p qcientíficos, investigadores y gerentes de información de institucionesvinculadas a la investigación científica, especialmente en el ámbito dela ecología, clima y ambiente, adquieran los conocimientos básicos parala ecología, clima y ambiente, adquieran los conocimientos básicos parael manejo y gerencia de colecciones de datos y metadatos.

Con ello se persigue despertar el interés de los participantes enCon ello se persigue despertar el interés de los participantes enpreservar, difundir y compartir los datos que provienen de susinvestigaciones y esfuerzos; de este modo se busca evitar la duplicaciónd f l g ió d i f ió f l i tig ióde esfuerzos en la generación de información y enfocar la investigaciónhacia objetivos estratégicos.

Objetivos específicos del Taller

Los participantes aprenderán los conceptos básicos involucrados en elmanejo de datos y metadatos científicos y conocerán la importancia dedocumentar y preservar los datos a largo plazo.y p g p

También conocerán algunas de las herramientas que existen pararealizar diferentes tareas relacionadas y aprenderán a ubicar losy precursos de información disponibles en Internet que sean de su interés.

Base teóricaBase teórica

Sección 1. Datos y Metadatos. ¿Qué son? ¿Por qué son importantes?

Sección 2. Estándares de contenido para Metadatos. Lenguaje de Metadatos para la Ecología (EML).

Sección 3. Gestión de datos ¿Dónde comenzar? Tareas iniciales.

Sección 4 Herramientas para metadatosSección 4. Herramientas para metadatos.

Sección 5. Tareas para la creación de colecciones de datos.

Sección 6. Compartiendo los metadatos. Otros aspectos sobre los metadatos.

Sección 1. Datos y Metadatos. ¿Qué son? ¿Por qué son importantes?• 1.1 ¿Qué son los "datos"?• 1 2 Datos científicos• 1.2 Datos científicos.• 1.3 Degradación de los datos en el tiempo.• 1.4 Uso de los datos científicos a largo plazo.

1 5 Có l l d i l l d l d t ? G tió d D t• 1.5 ¿Cómo lograr el uso secundario y a largo plazo de los datos? Gestión de Datos. • 1.6 ¿Qué significa la palabra metadatos?• 1.7 ¿Qué es una colección de datos?.• 1.8 Preguntas que se deberían poder responder usando metadatos. • 1.9 Aspectos fundamentales que describen los metadatos.• 1.10 Formas o modelos básicos de metadatos• 1.11 Importancia de los metadatos.• 1.12 Ejemplos de metadatos y de comunidades que usan metadatos.

1.1 ¿Qué son los “datos”?

• Los datos constituyen registros de información de diferentes tipos quepueden obtenerse de varias maneras: manualmente, automáticamentea través de instrumentos, o a través de procesamiento realizado porcomputadorescomputadores.

• Por lo general están asociados o son producto de una investigaciónPor lo general están asociados o son producto de una investigacióncientífica.

1.2 Datos científicos

Datos georeferenciados que representan

GEOESPACIALES

en papel o digitalmente elementos o características de la superficie terrestre a diferentes escalas, tales como vías,

í ícursos de agua, límites políticos, escuelas, usos del suelo, etc; en resumen, algo que se puede trazar.

http://main.nc.us/GIS/guide/spatial/

NO GEOESPACIALESDatos numéricos, alfanuméricos o tipo texto recabados en campo o registrados

i t t P d t por instrumentos. Pueden no tener ubicación geo-espacial.

…1.2 Datos científicos

Ejemplos de datos geoespaciales:Imágenes de satéliteSituación Relativa

Mapaságe es de saté te

NLocal

Mi casa !!

…1.2 Datos científicos

Ejemplos de datos NO geoespaciales:Datos discretos basados en tiempo

Datos tabulares en página web

Texto delimitadoTexto delimitado

1.3 Degradación de los datos en el tiempo

Ejemplo de degradación normal de los contenidos de información i d d t t é d l ti

Momento de publicación

asociados con datos a través del tiempo

Detalles específicos acerca de la recolección de los datos se pierden

al pasar el tiempoRetiro o cambio deRetiro o cambio de carrera del científico recolector

Accidente puede destruir

Contenidos de Información

Accidente puede destruir datos y documentación

Muerte del investigador y subsecuente pérdida de registros restantes

TiempoTomado de: [Michener, 1997]

1.4 Uso de los datos científicos a largo plazo

Depende de que sean:

•Organizados y de fácil acceso

Depende de que sean:

Si no se documentan los datos Organizados y de fácil acceso

•Consistentes

Bi d t d

Si no se documentan los datos, pierden su valor y hay que desecharlos.Esto se traduce en pérdida de •Bien documentados

•Facilidad de comprensión por parte de usuarios

Esto se traduce en pérdida de esfuerzos, tiempo y dinero.

de usuarios

1.5 ¿Cómo lograr el uso secundario y a largo plazo de losDatos científicos? Gestión de datos.

ÓPROCESO DE GESTIÓN DE DATOS

1. Adquirir / capturar los 2. Acceso del usuario a un datos conjunto de datos comprensible

completamente documentado

recuperar-compartir datos

Valor agregado que ayuda a maximizar el retorno de la inversión mediante la posibilidad de usar varias veces los mismos conjuntos de mediante la posibilidad de usar varias veces los mismos conjuntos de

datos

1.5 ¿Cómo lograr el uso secundario y a largo plazo de losDatos científicos? Gestión de datos.

Herramientas organizativas y tecnológicas que pueden hacer posible la gestión de datos: la gestión de datos:

Formación de Redes de colaboración entre científicos

Tecnologías de Información y Comunicaciones (TIC)

y entre usuarios de información

Uso de metadatos y estándares de intercambio de información

Tecnologías de Información y Comunicaciones (TIC)

Uso de metadatos y estándares de intercambio de información

1.6 ¿Qué significa la palabra “metadatos”?

•"Datos sobre los datos“

•“..Conjunto común de términos y definiciones que describen las principales propiedades o características de los datos”. (Díaz .,2003,p1)

•"Nivel superior de la información, o instrucciones que describen el contenido, contexto, calidad, estructura, y accesibilidad de una colección , , , , yde datos específica" (Michener, 1997, p.331).

1.7 ¿Qué es una colección de datos?

Dos conceptos sencillos:

• Conjunto de datos de una misma clase.

• “Una colección de datos es una serie de observaciones recolectadas con la misma metodología” [LTER-Luquillo, 2001]g

1 7 ¿Qué es una colección de datos?…1.7 ¿Qué es una colección de datos?Ejemplo de dos colecciones de datos de una estación climatológica

1.8 Preguntas que se deberían poder responder usando metadatos

• ¿Qué describe la colección de datos?¿Qué describe la colección de datos?

• ¿Quién produjo la colección de datos?

P é f d l l ió ?• ¿Por qué fue creada la colección?

• ¿Cómo se creó la colección de datos?

• ¿Cuan confiables son los datos?

• ¿Cómo sería posible obtener una copia de la colección de datos?

• ¿Quién escribió los metadatos?

1.9 Aspectos fundamentales que describen los metadatos

Los Metadatos describen diferentes aspectos de los datos, incluyendo:

• Identificación: ¿cual es el nombre de la colección de datos (dataset)? ¿Quien creó la colección?, ¿que área geográfica cubre?.

• Qué temas se incluyen, ¿cuan actualizada está la información? ¿Hay restricciones para acceder o usar los datos?.

• Calidad de los datos: ¿cuan buenos son los datos? ¿Existe• Calidad de los datos: ¿cuan buenos son los datos? ¿Existeinformación que permite a los usuarios decidir si los datos seadaptan a sus propósitos? ¿Qué exactitud tienen los datos? ¿Losd t tá l t ? Có d ifi l i t idatos están completos? ¿Cómo se puede verificar la consistenciade los datos?.

… 1.9 Aspectos fundamentales que describen los metadatos

• Información sobre entidades y atributos: ¿qué información • Información sobre entidades y atributos: ¿qué información (parámetros, variables, columnas de datos) está incluida? ¿ Cómo está codificada o formateada la información? ¿Qué codificación se

ó?usó?.• Distribución: ¿quien posee los datos? ¿A quien se los puedo pedir?

¿En qué formatos están disponibles? ¿Están disponibles en ¿ q p ¿ pInternet? ¿Cuanto cuestan los datos?.

[ De: http://www main nc us/GIS/guide/using/tutp6nsdi html ][ De: http://www.main.nc.us/GIS/guide/using/tutp6nsdi.html ]

1.10 Formas o modelos básicos de metadatos

DM1 M2

Mc

Ma) b) c)

MD D

D

Metadatos como parte de los datos (Datos de catalogación

dentro de un libro)

Metadatos externos al recurso de información

(Ficha bibliográfica en una

Meta-metadatos (colecciones de metadatos)

) ( gbiblioteca)

D=Dato

M M t d tM=Metadato

…1.10 Formas o modelos básicos de metadatos

Publisher's Cataloging In Publication Data (Prepared by Quality Books, Inc.)

B ll P t i i JMetadatos externos al

óBell, Patricia J.

Roughing it elegantly: a practical guide to canoe camping / by Patricia J. Bell ;illustrated by Linda Oliver Isakson -2nd ed

recurso de información (Ficha bibliográfica en una

biblioteca)illustrated by Linda Oliver Isakson. 2nd ed. p. cm.Includes bibliographical references and index.LCCN: 93-74305ISBN 0-9618227-0-81. Camping-United States2. Camping-United States-Equipment and supplies3. Canoes and canoeing-United States I. Title

GV790.B45 1994

796.54'0973 QBI96-86

Modelo de un catálogo de colecciones (meta-metadatos):

…1.10 Formas o modelos básicos de metadatos

Mc Catalogo de colecciones Mc Catalogo de colecciones

Colección de datos y metadatos

Mc

Colección de datos y metadatos

Mn Metadatos de colección

M1 M2

Dn Colección de DatosD1 D2

Ejemplo de catálogo de colecciones (en internet):

…1.10 Formas o modelos básicos de metadatos

[ http://gce-lter.marsci.uga.edu/lter/asp/db/data_catalog.asp ]

1 11 I t i d l t d t1.11 Importancia de los metadatos

• Facilitar el procesamiento, análisis y modelado de los datos: Dada lal di á i d l d d d dnaturaleza dinámica de los datos en un entorno de red, una vez creados

pueden ser utilizados por múltiples sistemas y para diferentes propósitos.

• Facilitar la determinación de la conveniencia de los datos para cumplir con• Facilitar la determinación de la conveniencia de los datos para cumplir conun objetivo específico: Los metadatos son consecuentemente un requisitoesencial para localizar los datos y productos, evaluarlos y conocer cual essu actual disponibilidad.

• Organizar y mantener el acervo del conjunto de datos de unaorganización: Los metadatos ayudan a organizar y mantener las grandesinversiones en datos, evitan la duplicación de esfuerzos y proveen, lainformación sobre la posesión de datos y productos de una organizacióninformación sobre la posesión de datos y productos de una organización(Valor agregado).

1 11 I t i d l t d t… 1.11 Importancia de los metadatos

• Los metadatos pueden ayudar a los científicos, a los investigadores, alos etadatos puede ayuda a os c e t cos, a os est gado es, aestudiante, al planificador, al político, y en general, al ciudadano común aencontrar y utilizar los datos que apoyen las investigaciones y la toma dedecisiones. También benefician al creador de ellos y a mantener el valorde los mismos y poder asegurar su uso continuo a lo largo del tiempo.

E i l tili ió j d t d t ld d• En consecuencia, la utilización y manejo de metadatos respaldado porestándares nacionales, guías y políticas, beneficia el crecimientoeconómico y los intereses sociales y ambientales de una nación.económico y los intereses sociales y ambientales de una nación.

1.12 Ejemplos de metadatos y de comunidades que usan metadatos

• Bibliotecas.

• Científicos.

• Organizaciones gubernamentales• Organizaciones gubernamentales.

• Negocios, Comercio Internacional.

• Industria, etc.dust a, etc

1 12 Ejemplos de metadatos y de comunidades que usan metadatos… 1.12 Ejemplos de metadatos y de comunidades que usan metadatos

Documentación de datos ecológicos g

… 1.12 Ejemplos de metadatos y de comunidades que usan metadatos

Metadatos Geoespaciales

http://cndg.clearinghouse.gub.uy/http://cndg.clearinghouse.gub.uy/

1 13 Ejemplos de metadatos y de comunidades que usan metadatos… 1.13 Ejemplos de metadatos y de comunidades que usan metadatos

Muestra metadatos Sistema de Información de Biodiversidad de

Colombia Colombia

http://www.siac.net.co/sib/metadatos

Sección 2. Estándares de contenido para Metadatos.Lenguaje de Metadatos para la Ecología (EML)

• 2.1 ¿Para qué estándares? ¿Cuales estándares existen?.• 2.2 Lenguajes y formatos de representación de metadatos.• 2.3 Ecological Metadata Language (EML).• 2.4 Características básicas de EML. • 2 5 Recursos en el Web sobre estándares y EML• 2.5 Recursos en el Web sobre estándares y EML.

2.1 ¿Para qué estándares? ¿Cuáles estándares existen?

Un estándar establece un sistema común de terminología y de definiciones Un estándar establece un sistema común de terminología y de definiciones para documentar datos.

El objetivo en un estándar de metadatos será mejorar la organización yadministración de los datos, y proveer información sobre los datosdisponibles en una organización a terceros.

El estándar de metadatos instrumenta a un productor o usuario con lainformación apropiada para caracterizar los datos haciendo posible lainformación apropiada para caracterizar los datos haciendo posible lacatalogación de los conjuntos de datos que facilitan el descubrimiento,recuperación y reutilización de la información.

… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?

•Los estándares permiten la localización rápida de cierto elemento. Si se utiliza un estándar, encontrar la información específica en un catálogo de metadatos será mucho más fácil que si no se utiliza ningún estándar estándar.

•Los estándares permiten búsquedas automatizadas. Cuando se utilizan los estándares las computadoras se pueden programar utilizan los estándares, las computadoras se pueden programar permitiendo buscar y encontrar conjuntos de datos útiles.

… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?

•Un beneficio de los estándares es que se han generado a través de un proceso de consulta (con otros "expertos") y ofrecen una base a partir de la cual pueden desarrollarse perfiles nacionales u orientados de acuerdo con materiascon materias.

•Ayudan a minimizar la duplicación de esfuerzos en la elaboración, recolección procesamiento o distribución de la informaciónrecolección, procesamiento o distribución de la información.

… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?

Algunos de los estándares para metadatos geoespaciales biológicos y Algunos de los estándares para metadatos geoespaciales, biológicos y ambientales más usados son:

FGDC CSDGM Content Standard for Digital Geospatial Metadata•FGDC-CSDGM. Content Standard for Digital Geospatial Metadata.

Federal Geographic Data Committe (1994): Datos geoespaciales. [http://www fgdc gov][http://www.fgdc.gov]

•FGDC-NBII. Perfil Biológico de FGDC. Biología y ciencias naturales. [http://www nbii gov] [http://www.nbii.gov].

•Global Change Master Directory Interchange Format – DIF. (1993)

Ciencias de la Tierra [http://gcmd gsfc nasa gov]Ciencias de la Tierra. [http://gcmd.gsfc.nasa.gov]

… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?

D i C (D C) C l i d Hi t i N t l•Darwin Core (DwC). Colecciones de Historia Natural.

•Descriptores para Metadatos no-geoespaciales. NCEAS-LTER (1997)

D t lógi B d l tá d EMLDatos ecológicos. Base del estándar EML.

La razón de que existan tantos estándares esLa razón de que existan tantos estándares esque los metadatos se emplean para diversascosas.

… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?

Ejemplo:

Estructura del estándar de datos geoespaciales del FGDCgeoespaciales del FGDC

2.2 Lenguajes y formatos de representación de estádares de metadatos

Los metadatos se pueden representar de diferentes maneras:

E l t i t bl dib j t•En papel: anotaciones, tablas, en dibujos o mapas, etc.

•En archivos de computadora: archivos texto, archivos HTML, en tablas de p , ,Bases de datos, archivos XML, etc.

Los archivos de computadora pueden (deberían) seguir un esquema estándar de representación de información (de los que se habló antes).

… 2.2 Lenguajes y formatos de representación de metadatos

<HTML><HEAD><TITLE>Estacion la Hechicera 2001<TITLE><HEAD><TITLE>Estacion la Hechicera 2001<TITLE><META NAME="DC.Title"

CONTENT="Datos Estación la Hechicera 2001"><META NAME="DC.Description"

CONTENT="Colección de datos climáticos capturados por la estacion meteorológica

La Hechicera. Esta estación es parte de la Red de Estaciones del Edo. Mérida."><META NAME="DC Creator Name"<META NAME DC.Creator.Name

CONTENT="Carlos Guada"><META NAME="DC.Publisher"

CONTENT="Centro de Calculo Científico, Universidad de Los Andes"><META NAME="DC.Type"

CONTENT="text"><META NAME="DC.Date.Issued"

CONTENT="2001">

Metadatos Dublin Coredentro de una pagina Web

(Búsqueda y catalogación de <META NAME="DC.Subject.Geographic"

CONTENT="La Hechicera, Mérida, Venezuela"><META NAME="DC.Coverage.dateStart"

CONTENT="01-2001"><META NAME="DC.Coverage.dateEnd"

CONTENT="12-2001"><META NAME="DC.Format"

CONTENT="text/txt">

recursos de información en Internet.)

CONTENT= text/txt ><META NAME="DC.Identifier.URL"

CONTENT="http://www.cecalc.ula.ve/datos/lahechicera/2001/"><META NAME="DC.Rights.Use"

CONTENT="Uso libre mencionando la fuente (DC.Identifier.URL)"></HEAD><BODY><h1>Datos Estación Hechicera 2001</h1>

<a href="/webclima/datos/lahechicera/2001/"> Ver archivo texto con datos año 2001 </a></BODY></HTML>

… 2.2 Lenguajes y formatos de representación de metadatos

Metadatos usando XML y EML como estandar de

representación (visualizado en un navegador Web)

… 2.2 Lenguajes y formatos de representación de metadatos

Archivo anterior visualizado como página HTML en un

navegador Web)navegador Web)

… 2.3 Ecological Metadata Language (EML)

EML (Ecological Metadata Language) es un estándar basado en XML

para describir datos ecológicos.

Está siendo desarrollado y apoyado por diversas organizaciones:y p y p g

•ESA (Ecological Society of America).

•NCEAS (National Center for Ecological Analysis and Synthesis)•NCEAS (National Center for Ecological Analysis and Synthesis).

•LTER (Long Term Ecological Research Network).

•ILTER (International Long Term Ecological Research Network).

•OBFS (Organization of Biological Field Stations).

•Etc.

… 2.3 Ecological Metadata Language (EML)

En Diciembre de 2002 se publicó la versión 2.0.0 del estándar EML (lo p (

llaman EML2).

Actualmente se esta intentando difundir el uso de EML2 entre la

comunidad ecológica de todo el mundo, lo que traería innumerables

beneficios en cuanto al trabajo colaborativo, intercambio de información,

procesamiento automático de datos y metadatos, etc.

[ http://knb.ecoinformatics.org/software/eml/ ]

2.4 Características básicas de EML

Clases de descriptores genéricos para Metadatos no-geoespaciales de Michener (1997) en los que se basó EML.

I Descriptores de la colección de datosI.Descriptores de la colección de datos

II.Descriptores de la investigación que originó los datos

III Accesibilidad y condición de la colección de datosIII.Accesibilidad y condición de la colección de datos

IV.Descriptores de la estructura de los datos

V Descriptores suplementariosV.Descriptores suplementarios

2.4 Características básicas de EML

Módulos más importantes de EML.

D i ióMód l EML

Atributos de las tablas de información (información de columnas dentro eml attribute

Información de acceso y permisología de accesoeml-access

DescripciónMódulos EML

Información general de la coleccióneml-dataset

Atributos de las tablas de información (información de columnas dentro de las tablas)

eml-attribute

Información del archivo de datos (formato, codificación, etc.)eml-physical

Información de entidades (descripción de tablas de información)eml-entity

Metadatos a nivel de proyectoeml-project

Metadatos para citas de la coleccióneml-literature

Información sobre los métodos de investigación y de recolección de datos

eml-protocol

2.5 Estándares y catálogos de colecciones de metadatos y datos

Dilemas a resolver:

•Los datos que yo necesito ¿existen?

•¿Dónde están?

•¿Cómo los obtengo?

…2.5 Estándares y catálogos de colecciones de metadatos y datos

Un catálogo de colecciones de metadatos y datos sirve para el descubrimiento, localización y consulta de datos , de forma que los usuarios puedan buscar los por temas, lugar, autor, escala, tipo de p p , g , , , pproducto, etc.

áEl estándar de metadatos instrumenta a un productor o usuario con la información apropiada para caracterizar los datos haciendo posible la catalogación de los conjuntos de datos que facilitan el descubrimiento, recuperación y reutilización de la información.

Clearinghouses de datos (Data Clearinghouses)

…2.5 Estándares y catálogos de colecciones de metadatos y datos

Sistema descentralizado de servidores de búsqueda en Internet que contienen metadatos estructurados y datos (colecciones de datos)[D ][De: www.epa.gov ]

Cliente

Puerta de Entrada (Gateway)

...Servidores de metadatos y datos

…2.5 Estándares y catálogos de colecciones de metadatos y datos

Comunidad que usa Clearinghouses de forma más extendida: FGDC

http://clearinghouse1.fgdc.gov/fgdc/EDCgateway_sp.html

…2.5 Estándares y catálogos de colecciones de metadatos y datoshttp://knb.ecoinformatics.org/index.jsp

Sección 3. Gestión de datos ¿Dónde comenzar? Tareas iniciales

• 3.1 Definición de objetivos generales de manejo de información. • 3 2 Definición de políticas de manejo de datos• 3.2 Definición de políticas de manejo de datos• 3.3 Hacer un inventario de los datos. • 3.4 Categorizar y dar prioridades a las colecciones de datos.3 Catego a y da p o dades a as co ecc o es de datos• 3.5 Seleccionar los procedimientos y herramientas a utilizar.• 3.6 Proceso básico de preparación y publicación de colecciones de

datos.

3.1 Definición de objetivos generales de manejo de información

Ejemplo de definición de objetivos:

•Publicar todos los datos y/o metadatos de investigaciones finalizadas( ) l W b ( i i d l i i t d l líti(o en proceso) en el Web (siguiendo los requerimientos de las políticasde manejo de información de la institución o red de trabajo).

•Mejorar la calidad de los metadatos.j

•Crear herramientas de consulta para los catálogos de colecciones.

•Crear herramientas Web que ayuden en el proceso dedocumentación de las colecciones de datos.

•Definir y seguir políticas de manejo y uso de los datos.

EtcEtc…

3.2 Definición de políticas de manejo de datos

Ejemplo de asuntos a definirse:

•Decidir quien realizara el procesamiento, limpieza y aseguramiento del lid d lid d l d tla calidad y validez de los datos.

•Establecer el formato en el que se transferirán los datos.

•Decidir quien será el responsable de documentar las colecciones deDecidir quien será el responsable de documentar las colecciones dedatos.

•Decidir que datos serán publicados y bajo qué condiciones o reglas.

• Seleccionar estándar, etc.

Ejemplo de política de manejo de información (Proceso y política de manejo

…3.2 Definición de políticas de manejo de datos

de información de Estación Coweeta LTER)

1 Investigador principal (PI) comienza el proceso de documentación1. Investigador principal (PI) comienza el proceso de documentación.2. Metadatos son creados y colocados en el Web (dentro de un plazo de seis

meses del inicio del proceso). 3 S l t l l ió d d t l áli i í t i3. Se completa la recolección de datos, el análisis y síntesis.4. Manuscritos se aceptan para publicación.5. Datos colocados en el sitio Web como datos Tipo 2.6. Pasan tres años. Datos se migran a estatus Tipo 1.

Las fechas mencionadas son consideradas períodos máximos limite, y los p , yinvestigadores están obligados a migrar sus datos al Tipo 1 (libre acceso) tan pronto como les sea posible.

3.3 Hacer un inventario de los datos

Hay que saber exactamente lo que se tiene.

• Revisar cuales datos están disponibles y si se dispone de una mínima información sobre ellos (metadatos)información sobre ellos (metadatos)Puede ser la oportunidad de capturar y recuperar información perdida sobre los datos

3.4 Categorizar y dar prioridades a las colecciones de datos

• Hacer una primera clasificación (si no existe) siguiendo criterios de importancia de la colección para los investigadores locales y para posibles futuros usuarios externos de los datos.

3.5 Seleccionar los procedimientos y herramientas a utilizar

ó• Elaborar o tener a mano procedimientos de documentación.• Familiarizarse con el estándar de documentación a seguir.• Tener a mano herramientas útiles que ayudan en cada paso del Tener a mano herramientas útiles que ayudan en cada paso del

proceso.

Sección 4. Herramientas de creación de metadatos

• 4.1 Morpho.4 2 I t f b d t d d t • 4.2 Interfaz web de captura de datos

4.1 Herramientas de creación de metadatos

Interfaz web de captura de metadatos

•Para documentar colecciones en línea (KNB)

• No requiere ninguna instalación, solo un navegador Web y conexión solo un navegador Web y conexión a Internet.

… 4.1 Herramientas de creación de metadatos

Interfaz web de captura de metadatosp

• En desarrollo para ECO-RED.

• Actualmente en prueba.

4.2 Morpho

•Morpho es una aplicación multi-Morpho es una aplicación multiplataforma que permite a losecólogos crear y organizar metadatosy datos y almacenarlos localmente oy datos y almacenarlos localmente oen un servidor de red compartido.

•Los metadatos pueden ser buscadosy recuperados tanto localmente comoa través de la red.

•Morpho puede ser obtenido•Morpho puede ser obtenidogratuitamente a través del sitio Webde KNB (knb.ecoinformatics.org).

… 4.2 Morpho

•Morpho es parte de un esfuerzo de la KNB (Knowledge ( gNetwork for Biocomplexity) para ayudar a manejar datos ecológicos estandarizando los gmetadatos usados para describirlos, y proveer métodos para compartir datos y metadatos.

… 4.2 Morpho

Ventajas uso de Morpho

• Proceso de creación de metadatos en formato estándar EML es transparente al usuario. No tiene que conocer detalles de EML ni de p qXML para crear archivos de metadatos.

• Facilidades de publicación de colecciones en red KNB-LTER. P t it d t t i l i di id l • Programa gratuito que se puede usar tanto a nivel individual como a nivel de red.

• Flexible ante futuros cambios en estándar.• Multiplataforma (Windows, Linux, Macintosh).

… 4.2 Morpho

Desventajas uso de Morpho

• Desarrollo muy nuevo. Todavía tiene algunos errores. • No existe aún versión traducida al español• No existe aún versión traducida al español.• Cambia continuamente de versión y características (el último año se ha

estabilizado bastante gracias a que el estándar EML también se estabilizó).

… 4.2 Morpho

Características Morpho

Qué son perfiles:

• Identificación individual de entrada para Morpho.

• Incluye identificación de usuario.

Qué son paquetes de datos:

• Agrupación lógica de datos (colecciones de datos).

• Bajo un perfil se pueden crear muchos paquetes (colecciones) de datos.

Qué son usuarios:

• Identificación individual de persona asociada a un perfil.

… 4.2 Morpho

La_glorieta

Sección 5. Tareas para la creación de colecciones de datos

• 5.1 Escogiendo e instalando las herramientas. g• 5.2 Usando una herramienta de creación de metadatos.• 5.3 Validación y revisión de metadatos.

5.1 Escogiendo e instalando las herramientas

Considerar:

• Personal de soporte técnico disponible.E t i t i• Entrenamiento necesario.

• Sistema Operativo disponible.• Características del Hardware disponiblesCaracterísticas del Hardware disponibles.• Disponibilidad de conexión a Internet.• Características de la herramienta (dificultad o facilidad de uso-

usabilidad-, idioma de la interfaz, etc.)

5.2 Usando una herramienta de creación de metadatos

Recomendaciones:

• Realizar trabajo previo de recopilación de datos segun se indicó en sección 3sección 3.

• Llenar la mayor cantidad de campos posible, no sólo los obligatorios• Definir y aplicar procedimientos de respaldo de información.

5.3 Validación y revisión de metadatos

Recomendaciones:

• Ubicar dónde se estan generando y guardando los archivos de metadatos y datos (herramientas instaladas localmente). En Windows y etadatos y datos ( e a e tas sta adas oca e te) do s yLinux se pueden “perder” fácilmente en el disco duro.

• Consultar datos en Clearinghouse o Repositorio una vez enviados (Morpho planillas y herramientas Web)(Morpho, planillas y herramientas Web).

• Comprobar completitud de metadatos.• Comprobar correcta generación de metadatos.p g

Sección 6. Compartiendo los metadatos. Otros aspectos sobre los metadatos

• 6.1 ¿Qué voy a hacer con los metadatos? ¿A quien le sirve los metadatos? (uso local vs. uso global).

• 6 2 Haciendo que sus metadatos se puedan intercambiar • 6.2 Haciendo que sus metadatos se puedan intercambiar. • 6.3 Publicación y distribución de colecciones de datos.• 6.4 El futuro.

6.1 ¿Qué voy a hacer con los metadatos? ¿A quién le sirven los metadatos? (uso local vs uso global)

• Uso local.• Uso por parte de la red.• Uso por parte de pares de investigación• Uso por parte de pares de investigación.• Uso global.

Datos

Científicos miembros de red de i ti ió

Datos y metadatos

Científicos y usuarios externos Científicos del mismo campo de investigación

investigación

6.2 Haciendo que sus metadatos se puedan intercambiar

Para intercambiarlos sólo basta seguir un estándar?NO!!Hace falta además:

• Seguir políticas de uso de los datos.

• Tener personal encargado de los datos y metadatos entrenados para las diferentes tareas involucradaslas diferentes tareas involucradas.

• Conexión o acceso regular a Internet deseable.• Servidor central de almacenamiento para datos y metadatos de toda la

red de trabajo deseable.

… 6.3 Distribución y Publicación de metadatos

Decidirse por uno o más métodos de distribución y publicación

• Incluir los metadatos dentro del recurso de información.

• Imprimir los registros de metadatos en papel o guardar una copia de la ió di it l l i di d l i t di it lversión digital en cualquier medio de almacenamiento digital.

• Distribuir los metadatos en Internet. Los metadatos "en-línea" son una herramienta efectiva para que los usuarios encuentren los datos.herramienta efectiva para que los usuarios encuentren los datos.

• Enviar los metadatos acordes a un estándar a un servidor central (Clearinghouse). Usando los elementos definidos en el estándar, proveedores de datos y metadtos pueden colocar sus colecciones disponibles a usuarios en todo el mundo (buscables y accesibles a través de Internet) través de Internet).

… 6.3 Distribución y Publicación de metadatos

Mantenimiento:

• Mantener los metadatos actualizados y revisarlos periódicamente. Si la colección de datos cambia, documentar los cambios en los metadatosmetadatos.

6.4 El Futuro

Usos futuros:

• Redes de manejo de conocimientos basadas en datos y metadatos (intención de KNB).( )

• Acceso a herramientas analíticas "en-línea" para integrar varias herramientas como SAS MATLAB etc con acceso a datos de red de herramientas como SAS, MATLAB, etc. con acceso a datos de red de científicos (LTER).

• Herramientas para producir formas alternativas de metadatos que permitan a cualquier sitio participar fácilmente en otras bases de datos internacionales y Clearinghouses de datos (FGDC, GCMD, NBII, etc.).

Por su atenciónMuchas Gracias

Zulay Méndez: [email protected] ay é de u ay@u a eRodrigo Torréns: [email protected]