prof. dra. eva méndez curso organizado por el siu. buenos aires (argentina), 29-30 octubre...

66
Prof. Dra. Eva Méndez Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y estándares Universidad Carlos III de Madrid Dpto. Biblioteconomía y Documentación

Upload: custodia-chaparro

Post on 28-Jan-2016

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Prof. Dra. Eva MéndezProf. Dra. Eva Méndez

Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre

Introducción a la Web Semántica: vocabularios, tecnologías y estándares

Universidad Carlos III de Madrid

Dpto. Biblioteconomía y Documentación

Page 2: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Esta presentación es vuestra en:

http://www.bib.uc3m.es/~mendez/SW-ARGENTINA

Presentaciones

Recursos

Programa

Bibliografía

Page 3: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

PRESENTACIONES PRESENTACIONES

Page 4: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Sobre mi …

Dra. en Documentación. Profesora de la Universidad Carlos III de Madrid (desde 1997)

Miembro del Comité Asesor de la DCMI y co-chair de la DC Social Tagging Community

European Research Scholar en el Centro de Investigación de Metadatos. UNC (Chapel Hill, USA 2005-06)

Experto independiente para la CE en los programas eContentPlus, CIP-PSP y del ICT-Digital Libraries (7FP)

Directora del Máster Oficial en Bibliotecas y Servicios de información digital (semipresencial 2009-2010): http://www.uc3m.es/bibliotecasdigitales

Page 5: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Sobre vosotros…

¿Cuántos de vosotros sois bibliotecarios? ¿archiveros?¿documentalistas? ¿desarrolladores?

¿Qué sabéis de la Web Semántica?¿Qué sabéis de la Web?

¿Cuántos estáis involucrados en alguna iniciativa de biblioteca o xxxx digital?

Si es así…¿En cuál?

¿Qué esperáis aprender aquí?

Page 6: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009De qué vamos a hablar

El problema de la representación y recuperación de información en la WWWLa representación y recuperación del conocimiento: del data mining a las ontologíasConcepto y características de la Web SemánticaEstándares y lenguajes de representación del contenido:

Vocabularios de base léxica: WordNet, SKOSVocabularios de base lógica: Ontologías y Topic MapsTipificación de NKOS (Network Knowledge Organization Systems/Services) para la Web Semántica y sus estándares

Proyectos y áreas de aplicación de las tecnologías de la Web SemánticaWeb 2.0 y la Web Semántica: Web 3.0… Web Social Semántica (Social Semantic Web)Linked data, Open data… y de “la nube”.Bibliotecas digitales semánticas

Page 7: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Contenidos / Programa

Introducción: La Web evoluciona. Conceptos, estándares y usos de la Web Semántica.

La evolución de la Web: diferenciación entre Web 2.0, Web Semántica (SW),etc.Web Semántica, Servicios Web y la Recuperación de información en la WWW.Estándares para la Web y estándares para la Web Semántica: RDF/XMLConceptos clave en la SW: metadatos, ontologías, agentes, etc.

Ejemplos y casos de uso de la Web Semántica.Buscadores semánticosBúsqueda de ontologías, vocabularios y reutilización de ontologíasAlgunas aplicaciones para trabajar con la Web Semántica: Creación de ontologías y tesauros SKOSificados (Protégé, ThManager), creación de perfiles FOAF, etc.

Estándares y Tecnologías para la Representación del Conocimiento en la Web Semántica.

RDF y Metadatos: DCMI-DCAMRDF y Tesauros: SKOSRDF y Ontologías: OWLRDF y Redes sociales: FOAFMicroformatos: Web Semántica en minúsculas

Discusión sobre el futuro de la Web Semántica, Web 3.0, interoperabilidad y Bibliotecas Digitales Semánticas.

Page 8: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Mi posición en el tema…

Berners Lee (1999): Weaving the Web = Tejiendo la Web

Greenberg & Mendez (2007): Knitting the Semantic Web = Tejiendo la Web Semántica

Weaving= como tejen las arañas (ants, buscadores)

Knitting= como tejen las personas (los bibliotecarios)

Weaving= como tejen las arañas (ants, buscadores)

Knitting= como tejen las personas (los bibliotecarios)

Page 9: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web necesita bibliotecari@s, la SW +

The Internet is the World’s largest library. It is just that the books are on the floor

(John Allen Paulos)

The Internet is the World’s largest library. It is just that the books are on the floor

(John Allen Paulos)

Page 10: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web necesita bibliotecari@s, la SW +

Lo que Internet necesita es un/a bibliotecario/a anticuado/a.

Encontrar lo que queremos en la Web debería de ser igual de fácil que encontrar un libro en una biblioteca.

Así será, si Eugenia [pongan aquí su nombre] consigue lo que quiere. Está trabajando para crear un estándar para etiquetar y catalogar información online –que incluye todos los 2.7 billones de páginas web… algo así como un sistema de información Decimal Dewey virtual, si lo preferís. Así, podrás gastar menos tiempo en buscar, y más tiempo en utilizar la información que necesitas.

Shhhhh… Estás en Internet.

Page 11: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

ACTUALIZACIONES (Desde julio)ACTUALIZACIONES (Desde julio)

Page 12: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Todo evoluciona…

… incluso en 4 meses… por supuesto: la Web… y por supuesto: la Web

Semántica

Infodemiología: Google Flu Trends (leer artículo en Nature): http://www.google.org/flutrends

Page 13: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web evoluciona…

Nuevo Website para NeOn Toolkit (7 Agosto 2009):

http://neon-toolkit.org/wiki/New_Website

SKOS Reference: Recomendación del W3C el 18 Agosto 2009

Las bibliotecas buscan “gente interesada en la Web semántica”. Oferta de trabajo Europeana (Oct2009)

Nueva Biblioteca Digital Semántica (Oct2009): http://bami.cilea.it/

International Semantic Web Conference

(ISWC 2009): Washington DC 25-29 Oct 2009

Nuevo libro sobre SW

… incluso en 4 meses

Page 14: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web evoluciona…

http://www.w3.org

Page 15: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

1. Introducción: La Web evoluciona. Conceptos, estándares y usos de la Web Semántica:

• La evolución de la Web: diferenciación entre Web 2.0, Web Semántica (SW)

• Web Semántica, Servicios Web y la Recuperación de información en la WWW.

• Estándares para la Web y estándares para la Web Semántica: RDF/XML

• Conceptos clave en la SW: metadatos, ontologías, agentes, etc.

1. Introducción: La Web evoluciona. Conceptos, estándares y usos de la Web Semántica:

• La evolución de la Web: diferenciación entre Web 2.0, Web Semántica (SW)

• Web Semántica, Servicios Web y la Recuperación de información en la WWW.

• Estándares para la Web y estándares para la Web Semántica: RDF/XML

• Conceptos clave en la SW: metadatos, ontologías, agentes, etc.

Page 16: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Prof. Dra. Eva MéndezProf. Dra. Eva Méndez

Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre

Introducción y contexto: la representación/ recuperación de

conocimiento en la Web. Tendencias

Universidad Carlos III de Madrid

Dpto. Biblioteconomía y Documentación

Page 17: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Introducción y contexto

WEB: Gran cantidad de información (de alta calidad e información científica y/o profesional + información informal, sitios personales, Weblogs, Wikis, etc.)¿Cómo dotar a esa información de fiabilidad y consistencia en la recuperación?Además de la información nacida en la Web (born digital) tendencia al acceso, disponibilidad en línea del patrimonio cultural / científico (EU, España, WDL, etc.)Lo que no está en la Web… no existeLo que no se encuentra, integra… no vale

Ver video

Page 18: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

URI, HTML, HTTPEstáticaWWW

500 millones de usuariosMás de 3 billones de páginas

Exceso de información en la Web

Page 19: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

Fuente: Stuart Weibel, Makx Dekkers (DCMI)

La WWW y el documento-e: Universo de información Web

Datos científicos

PáginasWeb Empresa

Internet

Biblioteca

eGobierno

Comercio

Cualquiera...

Page 20: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Web de documentos / Web de Datos

Web de datos

Web de documentos

Page 21: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Contexto: patrimonio cultural y científico

Conocimiento científico y cultural en formatos tradicionales:

Libros / Revistas

Bibliotecas / Catálogos

Identificación unívoca y uniforme: ISBN, ISSN, NIPO, etc.

Integración

Conocimiento científico y cultural en formatos digitales:

e-books/ e-Journals / Weblogs / portales / homepages...

Bibliotecas digitales, colecciones virtuales, portales bibliográficos...

Identificación inestable (URIs) – estabilizada (PURL, DOI, etc.)

Distribución / dispersión

Page 22: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

El problema de la representación y recuperación de información en Internet

Problema común: organización, gestión y recuperación de información:

Publicación de contenidos

Acceso a la información y cambio (mutabilidad) de la información

Integración de recursos distribuidos

Categorización y valoración de contenidos

Confianza o fiabilidad de los contenidos.

Solución tradicional (Google, etc.): aunque han mejorado mucho… no suficientes para recuperar conocimiento

Page 23: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

Ambigüedad en el significado de las cadenas de búsquedaMultitud de resultados sin orden lógico (Google)Imposible trasladar la relevancia subjetiva del usuario (incapacidad de entender el significado que el usuario tiene en mente)No garantía de fiabilidadFalta ayuda para la formulación de las búsquedas

El problema de la representación y recuperación de información en Internet

Page 24: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

Representación/Recuperación de Información: Data mining

Recuperar conocimiento no es lo mismo que recuperar información

Recuperar conocimiento implica tradicionalmente el procesamiento semántico de grandes cantidades de datos: Data mining

El data mining (minería de datos, explotación de datos, KDD) es un tema complejo (informática + técnicas computacionales estadísticas, IR + ML+l reconocimiento de patrones (Fayyard, etc.).

Page 25: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

Representación/Recuperación de Información: Data mining

Data mining extracción de conocimiento de grandes cantidades de información estructurada

Text mining extracción de información de calidad a partir de textos o información no estructurada.

Page 26: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009“Buscar” vs.“Recuperar (descubrir)”

Data Mining

Text Mining

DataRetrieval

InformationRetrieval

Búsqueda(objetivo)

Descubrimiento(oportunista)

Datos Estructurados

Datos sinEstructurar (texto)

Page 27: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Recuperación de datos

Buscar registros dentro de una base de datos estructurada.

Tipo de base de datos Estructurada

Modo de búsqueda Marcado por un objetivo de búsqueda

Unidad mínima Registro de datos

Ejemplo de necesidad de información

“Buscar un restaurante japonés en Valencia que tengan comida vegetariana”

Ejemplo de sentencia de búsqueda

“SELECT * FROM restaurants WHERE city = Valencia AND type = japanese AND has_veg = true”

Page 28: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Recuperación de información

Encontrar información relevante en fuentes de información sin estructurar (normalmente texto)

Tipo de base de datos Sin estructurar

Modo de búsqueda Dirigido a un objetivo / oportunista (serendipity)

Unidad mínima Documento

Ejemplo de necesidad de información

“Buscar un restaurante japonés en Valencia que tengan comida vegetariana”

Ejemplos de sentencia de búsquda

- “Restaurante japonés” Valencia- Valencia->Restaurantes->Japonés

Page 29: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

Descubrir nuevo *conocimiento* a partir de textos e información sin estructurar

Tipo de base de datos Sin estructurar

Modo de búsqueda Oportunista

Unidad mínima Características del lenguaje o conceptos

Ejemplo de necesidad de información

“Encuentra tipos de comida envenenada, normalmente asociada a restaurantes japoneses”

Ejemplo de sentencia de búsqueda

Clasifica enfermedades asociadas con “restaurantes japoneses”

Recuperar conocimiento (text mining)

Page 30: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Recuperar conocimiento (data mining)

Descubrir nuevo *conocimiento* a través del análisis de datos

Tipo de base de datos Estructurada / semiestructurada

Modo de búsqueda Oportunista

Unidad mínima Números y dimensiones

Ejemplo de necesidad de información

“Muestre la tendencia a través del tiempo de visitas a restaurantes japoneses en Valencia”

Ejemplo de sentencia de búsqueda

“SELECT SUM(visits) FROM restaurants WHERE city = Valencia AND type = japanese ORDER BY date”

Page 31: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

Del análisis de contenido Web a la minería de Contenido Web

Análisis de contenido de la Web (indización y resumen: tagging)

Minería de contenido Web implica:Clasificación Web (categorías predefinidas donde se clasifican las páginas Web: inicios de Yahoo)

Clustering Web (agrupación de páginas web basadas en sus similaridades)

Extracción Web (implica la extracción de elementos HTML, frases o tuplas de las páginas web que representan instancias de los conceptos buscados).

Page 32: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Data mining, Web mining, Web semántica

Aplicar técnicas de data mining para extraer conocimiento de la información Web resulta muy difícil ya que la información está desestructurada

Algunas técnicas del Web mining (text mining de la Web) ayudan a extraer información “de calidad” de la Web (clustering que realiza CiteSeer)

Semantic Web mining= Data mining + Semantic WebLos resultados de la minería de la Web se mejorarán a través de una Web más estructurada basada en estructuras semánticas que permitan extraer/inferir conocimiento (Web semántica)

Las técnicas de minería web pueden ayudar a la construcción de la Web Semántica.

Page 33: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Prof. Dra. Eva MéndezProf. Dra. Eva Méndez

Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre

La evolución de la Web. Diferenciación entre Web 2.0, Web Semántica (SW):

Web 3.0 y linked data

Universidad Carlos III de Madrid

Dpto. Biblioteconomía y Documentación

Page 34: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web en el FUTURO (2001)

Continuará la mezcla de calidades informativas:Se mantendrán sitios personales

Escaparates comerciales con un propósito real

Los ordenadores utilizarán información estructurada de forma mucho más eficaz.

Se necesita la integración de datos para permitir el procesamiento automático

SW (Web Semántica)...

“...is an extension of the current Web in which information is given well-defined meaning, better enabling computers and people to work in cooperation”

Tim Berners-Lee, James Hendler, Ora Lassila. The Semantic Web. Scientific American (Mayo 2001)

Page 35: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web en el FUTURO (2005)

Page 36: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web del FUTURO (2007): Web x.0

Fuente: a través de IRSweb (Javier Martínez Méndez): http://irsweb.blogspot.com/2007/03/cronologa-de-la-web.html

Page 37: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web del futuro/presente: Web 3.0?

¡¡No es tan fácil!!

Page 38: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Web 2.0: Visión típica

Page 39: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Web 1.0 vs. 2.0: Comparación típica

DoubleClickOfoto (Kodakgallery), Altavista

Akamai (business online)mp3.com

Britannica OnlinePersonal websites

EviteDomain name speculation

Page viewsScreen scraping

PublishingCMS

Directories (taxonomy) Stickiness

Google AdSenseFlickr, CorbisBitTorrent (cooperative distribution)Napster, eMule, etc.WikipediaBloggingEventful and EVDBSearch engine optimizationCost per clickWeb servicesParticipationWikisTagging ("folksonomy")Syndication

Web 1.0 Web 2.0

Fuente: Adaptado de O’Reilly

Page 40: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Web 1.0

La Web como un portal de información

Exclusividad de la información

Seccionar la WWW en directorios útiles

Cada uno tenía su pequeño rincón en el ciberspacio

Carece de:Contexto

Interacción

EscalabilidadWeb 1.0

Page 41: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Web 2.0

La Web como plataforma

Centrada en el poder de compartir (crear y validar)

El poder de un sistema de organización más libre (tagging)

Estableciendo conexiones para la integración futura (RSS)

Carece de:Personalización

Portabilidad verdadera

InteroperabilidadWeb 2.0

Page 42: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009¿Web 3.0?

Web Semántica

Web de datos

Personalizable

Ubicua

Móvil

Page 43: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Web 2.0: Racionalización típica

http://upload.wikimedia.org/wikipedia/commons/1/16/Web20mindmapLARG.jpg

Page 44: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009¿Qué/cómo se recupera información en la Web 2.0?

La Web 2.0 necesita motores de búsqueda más específicos para encontrar: amigos, un buen lugar de vacaciones o fotos de otra gente en tu bar favorito… etc.

Technorati, el más famoso buscador de weblogs: http://technorati.com/

Vídeos y podcast http://podzinger.com/

Noticias sindicadas: http://agregax.es/

Especializados ($): Viajes: http://www.trabber.com/es/ Compras: http://es.shoomo.com/ Compras (libros /Amazon): http://pricenoia.com/

Page 45: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Panorama de la descripción en la Web 2.0

No se asusten… volveremos sobre estoNo se asusten… volveremos sobre esto

Page 46: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

Ejemplo de codificación de metadatos en una sede Web (DCMI)

Metadatos descriptivos embebidos (HTML)

Metadatos descriptivos embebidos (HTML)

Metadatos para la sindicación de noticias (RSS)Metadatos para la sindicación de noticias (RSS)

Metadatos descriptivos (RDF vinculado link rel)Metadatos descriptivos (RDF vinculado link rel)

Page 47: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

Ejemplo de codificación de metadatos RSS en una sede Web (DCMI)

http://dublincore.org/news.rss http://dublincore.org/news.rss

Metadatos para la sindicación de noticias (RSS)

Metadatos para la sindicación de noticias (RSS)

Page 48: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Tim Berners-Lee, 2001: SW

“La Web Semántica (SW) no es una Web separada sino una extensión de la actual, en la cual la información se da con un significado bien definido, permitiendo que los ordenadores y las personas puedan trabajar juntos, en cooperación”.

Page 49: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Tim O’Reilly, 2006: Web 2.0

“El principio central que subyace a los gigantes nacidos en la Era de la Web 1.0, que han sobrevivido en la Era Web 2.0, parecen haber adoptado el poder de la Web para que han adopdato el poder de la web para explotar la inteligencia colectiva"

Traducción al español del artículo de O’Reilly: Qué es la Web 2.0: http://sociedaddelainformacion.telefonica.es/jsp/articulos/detalle.jsp?elem=2146

Page 50: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Web 2.0 es La Web Social (Hinchcliffe)

Algunos datos:

Más de un billón de personas conectadas a Internet

100 millones de sitios Web

Alrededor de 1/3 de adultos en USA han contribuido al contenido público de Internet (18% mayores de 65)

Fuente: http://web2.wsj2.com/

“La Web 2.0 tiene mucho más que ver con el cambio que se produce en las personas y en la sociedad que con la tecnología”

Page 51: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Tim Berners-Lee: noviembre 2006

“La Web no va de lo que podemos hacer con los ordenadores. Son personas, y sí, vale, están conectadas por computadores… Pero la informática, entendida como el estudio de lo que pasa en un ordenador, no te dice qué pasa en la Web.”

Fuente: New York TimesNovember 2, 2006

Page 52: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Pero… ¿qué es inteligencia colectiva?

¿Colecciones inteligentes?Bookmarking (marcadores) colectivos, búsqueda colectiva, etc.

“Base de datos de intenciones” (intenciones de búsqueda actos voluntarios de query)

Verbos (acciones colectivas): clicking, rating, tagging, buying

Lo que todos sabemos pero no nos atrevimos a decir en público antes

Listas de discusión… y más Web 2.0: blogs, wikis, etc.

Page 53: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Tim Berners-Lee: Febrero 2009

On the next Web (TED):

Datos enlazados

http://www.w3.org/DesignIssues/LinkedData.html

Page 54: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web del FUTURO (2009)

De islas semánticas a datos enlazados

Page 55: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web del FUTURO (2009): Linked data

Fuente: http://linkeddata.org (marzo 2009)

Page 56: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009La Web del FUTURO (2009): Linked data

Linked Data (datos enlazados) implica utilizar la Web para conectar datos relacionados que no han sido previamente enlazados o bien, utilizar la Web para disminuir las barreras entre los datos que ya están enlazados utilizando otros métodos.

“Término utilizado para describir las prácticas recomendadas para exponer, compartir y conectar piezas de datos, información y conocimiento en la Web Semántica, utilizando URIs y RDF“ (Wikipedia)

Conectar datos distribuidos en la Web

Page 57: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Datos enlazados: Principios

Utilizar URIs para identificar los recursos publicados en la Web

Aprovechar el HTTP de la URI para que la gente pueda localizar y consultar (es decir, desreferenciar) estos recursos.

Proporcionar información útil acerca del recurso cuando la URI haya sido desreferenciada.

Incluir enlaces a otras URIs relacionadas con los datos contenidos en el recurso, de forma que se potencie la RI en la Web.

Page 58: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009

Tags (Social Web/Web 2.0) Linked Data (Semantic Web)

Social Web + SW = Web 3.0 Linked Data

Fuente: Social Semantic Web Syposium (Marzo 2009)

Page 59: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Prof. Dra. Eva MéndezProf. Dra. Eva Méndez

Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre

Pero… qué es la Web Semántica: Concepto y características de la Web

Semántica

Universidad Carlos III de Madrid

Dpto. Biblioteconomía y Documentación

Page 60: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Orígenes de la Web Semántica

Idea original de la Web (Tim B. Lee, 1989).

Berners-Lee: Metadata Architecture (1997); Semantic Web Roadmap (1998): Weaving the Web (1999).

Definición formal (2001):

La Web Semántica es una extensión de la Web actual en la que la información se presenta con un significado bien definido, permitiendo a los ordenadores y a las personas trabajar conjuntamente.

Page 61: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Dificultades para entender la SW

Web semántica = ¿Web + Semántica?

Biblioteca digital= ¿Biblioteca + Digital?

Sociedad de la Información= ¿Sociedad + Información?

Las 3 frases sincategoremáticas de la información del siglo XXI

Page 62: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009¿Web + Semántica?

Semántica implica significado concreto, o unidades que pueden componerse para generar un significado más específico para un discurso más amplio.Web medio universal para los datos, que puede albergar contenido que puede expresarse en un formato leído y utilizado por agentes de software (máquinas) para buscar, compartir y integrar información de forma más fácil.Web Semántica

Visión de esa integración de la información. La habilidad de las máquinas de registrar cómo los datos se relacionan con el mundo real, y un cambio de la necesidad de acceder a una serie de bases de datos a través de una serie de búsquedas, a la traducción del contenido a información legible por máquina, a la que pueda accederse a través de una base de datos interminable

Page 63: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009Dificultades para entender la SW

Intangibilidad del concepto (Cognitivismo, Inteligencia Artificial, Documentación).

El entusiasmo y la proyección de sus principales instigadores (Tim Berners-Lee y James Hendler)

Un conjunto interminable de siglas, acrónimos y conceptos:

RDF, XML, DCMI, SVG, DALM, OIL, OWL, SOAP, WSDL, SKOS, etc.

Metadatos, ontologías, lógica, inferencia, etc.

La propia Web 2.0… (¿microformatos?)

La constante evolución

Page 64: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009¿Qué es la Web Semántica?

Page 65: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009¿Qué es la Web Semántica?

La SW es “muchas cosas” para “mucha gente”

Conjunto de tecnologías para la organización, representación y recuperación del conocimiento digital que añaden semántica interpretable por las máquinas

Objetivos:

Proporcionar un acceso inteligente a la información heterogénea y distribuida en la WWW, posibilitando a los agentes de software mediar entre las necesidades de los usuarios y los recursos de información disponibles

Creación de una Web de datos con significado (información + conocimiento), de tal forma que un programa de ordenador pueda aprender tanto acerca de lo que quieren decir los datos, como acerca de la información necesaria para procesarlos

Procesamiento global e interoperable de la información Web (marcado semántico XML + estructuras de metadatos)

Page 66: Prof. Dra. Eva Méndez Curso organizado por el SIU. Buenos Aires (Argentina), 29-30 Octubre Introducción a la Web Semántica: vocabularios, tecnologías y

Introducción a la Web Semántica: vocabularios, tecnologías y estándares Eva Méndez

Octubre 2009¿Qué es la Web Semántica?

La Web es un conjunto de recursos y enlaces

Estos recursos y enlaces están identificados por URIsLos recursos pueden tipificarse

Para un usuario, esto convierte a la web en algo más interesante

Las máquinas, por su parte tienen que ser capaces de procesar información legible por máquina, permitiendo trabajar personas y máquinas e intercambiar el conocimiento de una forma más eficaz.

"The bane of my existence is doing things that I know the computer could do for me." (Dan Connolly)

Explicación gradual: