catalogación, metadatos y acceso a la información ......eva méndez documentación y linked open...

48
NORMALIZACIÓN Y OTROS NUEVOS ESCENARIOS PARA LA TERMINOLOGÍA Universidad Carlos III de Madrid Dpto. Biblioteconomía y Documentación Eva Mª Méndez Rodríguez [email protected] | @evamen XIV Jornada Documentación y LOV: Por qué lo llaman vocabulario, cuando quieren decir terminología

Upload: others

Post on 04-Aug-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

NORMALIZACIÓN Y OTROS NUEVOS ESCENARIOS

PARA LA TERMINOLOGÍA

Universidad Carlos III

de Madrid

Dpto. Biblioteconomía y

Documentación

Eva Mª Méndez Rodríguez [email protected] | @evamen

XIV Jornada

Documentación y LOV: Por qué lo llaman vocabulario, cuando quieren decir terminología

Page 2: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

X COLOQUIO INTERNACIONAL DE

CIENCIAS DE LA DOCUMENTACIÓN Perspectivas futuras, el presente en perspectiva

Universidad Carlos III

de Madrid

Dpto. Biblioteconomía y

Documentación

Eva Mª Méndez Rodríguez [email protected] | @evamen

DOCUMENTACIÓN Y LOV:

¿Por qué lo llaman vocabulario cuando quieren

decir terminología?

Page 3: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

¿De qué va a hablar?

Page 4: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

¿De qué va a hablar?

DOCUMENTACIÓN y LOV

Page 5: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

¿De qué va a hablar?

NORMALIZACIÓN Y OTROS

NUEVOS ESCENARIOS PARA LA

TERMINOLOGÍA

NORMALIZACIÓN Y OTROS

NUEVOS ESCENARIOS PARA LA

TERMINOLOGÍA

Page 6: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

¿De qué va a hablar?

NORMALIZACIÓN Y OTROS

NUEVOS ESCENARIOS PARA LA

TERMINOLOGÍA

NORMALIZACIÓN Y OTROS

NUEVOS ESCENARIOS PARA LA

TERMINOLOGÍA

Page 7: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

¿De qué va a hablar?

NORMALIZACIÓN Y OTROS

NUEVOS ESCENARIOS PARA LA

TERMINOLOGÍA

NORMALIZACIÓN Y OTROS

NUEVOS ESCENARIOS PARA LA

TERMINOLOGÍA

Page 8: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

UN POCO DE CONTEXTO

Page 9: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

De qué hablábamos en 2001

Page 10: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

La Web en el FUTURO (2001)

Continuará la mezcla de calidades informativas:

• Se mantendrán sitios personales

• Escaparates comerciales con un propósito real

Los ordenadores utilizarán información estructurada de

forma mucho más eficaz.

Se necesita la integración de datos para permitir el

procesamiento automático

SW (Web Semántica).

“...is an extension of the current Web in

which information is given well-defined

meaning, better enabling computers and

people to work in cooperation”

Tim Berners-Lee, James Hendler, Ora Lassila. The

Semantic Web. Scientific American (Mayo 2001)

Page 11: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

De qué hablábamos en 2004

http://www.sedic.es/p_boletinclip41_confirma.htm

http://www.youtube.com</watch?v=P2-ijqZ5jRs&feature=youtu.be

2014

Page 12: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Tim Berners-Lee: 2006, 2009, 2010

http://www.w3.org/DesignIss

ues/LinkedData.html

TED 2010: The year open data

went worldwide http://www.ted.com/talks/tim_berners_lee

_the_year_open_data_went_worldwide.html

TED 2009: On the Next Web http://www.ted.com/talks/tim_berners_lee

_on_the_next_web?%20

Page 13: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

De qué hablaba TBL (1989-2014)

WEB

Page 14: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

La Web del FUTURO (2007): Web x.0

Page 15: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Web de Documentos / Web de Datos

Web de datos

Web de documentos

Page 16: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:
Page 17: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Datos y datos por todas partes

Page 18: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

…pero los datos están en silos aislados

Christian Bizer, Tom Heath, Tim Berners-Lee: Linking Open Data (2008)

Page 19: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Fuente: Stuart Weibel, Makx Dekkers (DCMI)

La WWW y el documento-e: Universo de información Web (1995…

Datos

científicos

Páginas

Web Empresa

Internet

Biblioteca

eGobierno

Comercio

Cualquiera...

Page 20: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

… Y además…

Page 21: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

¿Cómo explotar todos esos datos a través de la Web?

Reutilización de datos

APIs de acceso a datos

Vocabularios estándar para describir

datos interconectados

Herramientas

Web Semántica en la práctica

http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html

Reutilización de datos

APIs de acceso a datos

Vocabularios estándar para describir

datos interconectados

Herramientas

Web Semántica en la práctica

Page 22: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

eb

Vocabularios EN/PARA la Web

Page 23: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Vocabularios en/para la Web

Usuarios más tradicionales de (KOS)

(“vocabularios controlados”).

Comunidades que crean y utilizan esquemas

(schemas) de metadatos como el Dublin Core,

La web semántica (W3C), que desarrolla y usa

ontologías y vocabularios formalizados.

Desarrolladores que incorporan datos

estructurados que describen o “anotan” como

microformatos, microdatos y RDFa

(Schema.org).

Page 24: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Servicios Terminológicos vs Vocabularios

Terminology Services (TS) are a set of

services that present and apply

vocabularies, both controlled and

uncontrolled, including their member

terms, concepts and relationships. This is

done for purposes of searching, browsing,

discovery, translation, mapping, semantic

reasoning, subject indexing and

classification, harvesting, alerting, etc.

Page 25: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Schema= esquema de estructura/descripción

XML: schema es un documento que describe un

vocabulario XML o RDF

En sentido más genérico un schema ("de

metadatos”) es el conjunto de elementos y las

reglas que constituyen un modelo de

metadatos.

Los esquemas de metadatos son modelos,

formatos, estándares, etc. para

estructurar/describir la información.

Page 26: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Scheme= esquema de contenido

Un scheme es un servicio terminológico

controlado o un “vocabulario” de contenido.

Conjunto normalizado de valores que pueden

tener los elementos de los schemas de

metadatos

Ejemplos de encoding schemes <META NAME="DC.subject" SCHEME="UDC" CONTENT="518.118“/>

<META NAME=“DC.date” SCHEME=“W3CDTF” CONTENT=“2005-04-05”/>

<meta name="DC.date“ scheme="DCTERMS.W3CDTF“ content="2001-07-18" />

Page 27: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Usos genéricos

Creación de datos

Gestión de datos

Dominios GEOESPACIAL

HUMANIDADES

GOBIERNO

IMAGEN

EDUCACIÓN

Rec. de Inf.

Comercio-E

Interoperabilidad

Accesibilidad

Conservación

Valoración

Rec. de Inf.

Papel de los metadatos

Paradigma Metadatos: Efecto “Cepillo de Dientes”

Page 28: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Listas de términos: Anillos de sinónimos (sinsets)

Ficheros de autoridad

Glosarios

Diccionarios Lenguaje Natural Lenguaje controlado

Clasificación &

Categorización: Encabezamientos de materia

Esquemas de clasificación Taxonomías

Esquemas de categorización

Grupos de relaciones: Ontologías

Redes semánticas

Tesauros

Listados Folksonomías

En el paradigma NKOS Basado en Hodge y Zeng

Page 29: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Schema & Scheme= Vocabulary Commons

Vocabularies used in the LOD. (Pierre-Yves Vandenbussche)

Page 30: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Data Cloud (2014)

Page 31: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Hay absolutamente “de todo”, desde datos de programas de TV, radio, hasta información de Censos en diversos países, estadísticas de turismo en Zaragoza, pasando por fuentes de artículos científicos como PubMed o fuentes terminológicas como Agrovoc, y bibliotecas digitales (Europeana)

…Vocabularios en el mundo LOD…

Qué hay en LOD

Page 32: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

… Dije que igual hablaba de normalización

Page 33: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

1996 1998

2000 2002

2004 2006 2010

2012

W3C Linked

Data Platform

LDP XG

(May2012)

RDF Model & Syntax

1st Draft–Oct97

OIL

DAML

Tim BL Roadmap on

Semantic Web

(Sept1998)

Tim BL

LOD principles

RDF M&S

W3C-REC, Feb2004

Tim BL TED Talks

(Feb 2009 &

Mar 2010)

Tim BL

Linked Data

(July2006)

RDF M&S

W3C-REC, Oct99

Activity starts,

2001

OWL specifications

W3C-REC, Feb2004

W3C-REC

Aug2009

SKOS 1st Draft

(May2005)

OWL2 specifications

W3C-REC, Oct2009

1st LOD Cloud

Cyganiak & Jentzsch

(May2007)

In XHTML

W3C-REC, Oct2008

W3C-REC, Jan2008

2008

Library Linked

Data XG (May

2010)

Final Reports

(Oct2011)

Last LOD Cloud

Cyganiak & Jentzsch

(Nov2011)

Berners Lee, Hendler

& Lassila (May2001)

FOAF Voc. Spec

(May2005)

FOAF

(Early 2000)

MCF Meta Content

Framework–Jun97

RDFS (RDF Schema)

1st Draft –1998

DCMES

(ISO-2003)

DCMI Singapore

Framework

(Aug2007)

PICS W3C-

REC–Oct96 RDFS Vocabulary

Description Language

March, 1989

RDFS (RDF Schema)

W3C-CR, March1998

Evolución de los estándares WWW. Más de 15 años de

metadatos y vocabularios: algunas lecciones aprendidas

Page 34: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Principios de Linked Data

1. Usar URIs como nombres para las cosas.

2. Usar URIs HTTP, de modo que la gente pueda

buscar y localizar esos nombres.

3. Cuando alguien busque empleando un URI,

proporcionar información útil, utilizando estándares

(RDF, SPARQL).

4. Incluir enlaces a otros URIs, para que se puedan

descubrir y localizar más cosas.

Tim Berners-Lee 2007: http://www.w3.org/DesignIssues/LinkedData.html

Page 35: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

1. URI

Al nombrar los conceptos o cosas mediante URIs, se ofrece una

abstracción del lenguaje natural, y:

• Se evita ambigüedades

• Se ofrece una forma estándar y unívoca para referirnos a

cualquier recurso.

Page 36: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

La información sobre los recursos se representa mediante

descripciones estándares en RDF (Resource Description

Framework).

Las descripciones RDF se basan en tripletas, tres elementos

que se relacionan: sujeto, predicado y objeto.

2. ESTÁNDARES W3C: RDF

Page 37: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Las consultas para localizar los recursos en almacenes

de tripletas RDF se realizan mediante lenguajes de

consulta estándar, como SPARQL, del W3C.

3. ESTÁNDARES W3C: SPARQL

Page 38: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Es necesario enlazar con otros recursos mediante URIs, de

forma que no se queden aislados, se pueda compartir

información con otras fuentes externas, y se ofrezca

información de valor añadido junto a la nuestra.

4. Enlazar con otros IR

Page 39: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Se basa en conceptos identificados con URIs.

Etiquetas preferentes, alternativas y ocultas.

Relaciones semánticas entre conceptos

Relaciones entre etiquetas mediante SKOS-XL.

Colecciones y Esquemas de Conceptos.

Relaciones de mapeado entre conceptos de distintos

esquemas.

Elementos de documentación y Notaciones

SKOS es un vocabulario RDF para representar todo tipo de sistemas de

organización del conocimiento (tesauros, clasificaciones,

encabezamientos de materia)

SKOS (Simple Knowledge Organization Systems)

Page 40: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

LOV datasets

Vocabularies used in the LOD. (Pierre-Yves Vandenbussche)

http://lov.okfn.org/dataset/lov/about

Page 41: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Vocabularios en el paradigma LOD

Alineamiento de vocabularios. Agrovoc

http://aims.fao.org/advice/linked-data

Page 42: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Vocabularios en el paradigma LOD

Datos de autoridades. Caso: VIAF

http://viaf.org/viaf/96994048

Page 43: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Conclusiones

Page 44: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

Cambio de terminología ;-)

¿Qué necesita el paradigma LOD?

Page 45: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

¿Qué necesita el paradigma LOD?

Vocabularios

• Metadatos

• NKOS

Terminologías

Social Tagging

Formalización (RDF, OWL, SKOS)

Nuevas terminologías de URIs / RDF

Estándares

Page 46: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

¿Por qué la Documentación (y la web) necesita de la terminología?

Page 47: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

¡¡¡Gracias por su atención!!!

¿Discusión? / ¿Preguntas?

Page 48: Catalogación, metadatos y acceso a la información ......Eva Méndez Documentación y Linked Open Vocabularies La Web en el FUTURO (2001) Continuará la mezcla de calidades informativas:

Eva Méndez Documentación y Linked Open Vocabularies

[email protected]

@evamen