datos abiertos: reutilización de información en el sector público

Post on 18-Dec-2014

1.620 Views

Category:

Education

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Presentación realizada por Jose Emilio Labra Gayo para las Jornadas "Empleo y Universidad" organizadas por la Universidad de Oviedo, los días 9 y 10 de Junio de 2010

TRANSCRIPT

Datos abiertos: Reutilización de información

en el sector público

Jose Emilio Labra Gayo

Universidad of Oviedo, Spainhttp://www.di.uniovi.es/~labra

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Esquema

Explosión de datos

Razones para publicar los datos

¿Cómo publicar los datos?Datos abiertos vs datos enlazados

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Explosión de datosContenido generado por usuarios

Información de los gobiernos

Internet de las cosas

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Facilitan la investigación

Tasa de descubrimiento se acelera con mejores accesos a los datos

Por el bien común de la humanidad

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Los sistemas abiertos facilitan las contribuciones externas

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Datos = base para la cooperación Para realizar tareas

comunitarias se requiere acceso a datos comunes

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Eficiencia y calidad de los sistemas

Hay muchos datos comunes que no están publicados

Ej. ¿Lista de municipios?

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

TrasparenciaFomentar participación

Generar confianza

Evaluar al gobierno

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Esta presentación hubiera sido muchísimo más aburrida si no hubiese tenido acceso a los datos parcial o totalmente abiertos de Google, Flickr,

Wikipedia, Slideshare y muchos otros proyectos…

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Si realmente quieres algo…

…déjalo libre

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Como ciudadanos…

…también podemos demandar datos abiertos…

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

…demandar datos abiertos

Cuando los datos pertenecen a la humanidad

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

…demandar datos abiertos

Cuando son hechos independientes y verificables ó de conocimiento común

Ejemplo: conocimiento científico

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

…demandar datos abiertos

Cuando los datos han sido creados con dinero públicoSon nuestros datos

Los han pagado nuestros impuestos

OK, ¡vivan los datos abiertos!pero…

¿Cómo publicarlos?

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

El mayor reto = IntegraciónEn general, el problema no es informatizar algo

El problema es integrar los sistemas

Interoperabilidad

No basta con publicar datos…

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Modelo de Estrellas*

★ Publicar los datos (en cualquier formato)

★★ Utilizar formato estructurado (Excel en lugar de imágenes escaneadas)

★★★ Usar formatos no propietarios (CSV en lugar de Excel)

★★★★ Usar URIs para identificar datos (otros sistemas puedan enlazar nuestros datos)

★★★★★ Enlazar con otros datos externos (proporcionar contexto)

* Enunciado por TimBerners Lee en Gov 2.0 Expo 2010

http://www.youtube.com/watch?v=ga1aSJXCFe0

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Formatos no estructurados

Formatos “caja negra”: Imágenes, vídeos, música, etc.

Formatos binarios: PDF, PS, etc.

Requieren técnicas de tratamiento de la señal, reconocimiento de patrones, etc.

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejemplo: Servicio Público de Empleo

http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Formatos estructurados

Los datos tienen una estructura

Ejemplo: Hojas de cálculoProblema con formatos propietarios

Requieren herramientas que no son públicas

★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejemplo: Servicio Público de empleo

http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/9

★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Formatos no propietarios

Utilizar formatos abiertos estructurados

Ejemplos: CSV, HTML

Problema: Contenido depende del contexto

★ ★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

CSV

“Comma separated values” valores delimitados por comas

★ ★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

HTML

HTML está pensado para representar información que se visualiza en el navegador

El procesamiento puede requerir “screen scrapping”

★ ★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

URIs para identificar datos

Utilizar una URI para identificar un dato

Diferentes representaciones para cada tipo de dato

Negociación de contenido

★ ★ ★ ★

http://puzzles.org/pieza23471

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

XML

XML permite representar información estructurada

Los documentos pueden validarse (XML Schema)

El significado de las etiquetas depende de la aplicación

★ ★ ★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Negociación de contenido

El protocolo de comunicación permite que el navegador informe al servidor del tipo de contenido que prefiere

El servidor devuelve una representación diferente según las preferencias del cliente

★ ★ ★ ★

cliente servidor

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

¿2 representaciones para lo mismo?

Ejemplo: Códigos de barras

★ ★ ★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Enlazar con otros datos

Enlazar datos identificados mediante URIs

Objetivo: Facilitar la identificación de nuevos conjuntos de datosNuevo conocimiento

★ ★ ★ ★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

RDF

RDF es un modelo de representación en forma de grafo

RDF (Resource Description Framework)

Las propiedades tienen valores globales (URIs)

★ ★ ★ ★ ★

dato4530

Oviedo 2009

http://obs.org#totalDesempleados

http://obs.org#añohttp://obs.org#municipio

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

RDF es composicional

2 grafos independientes pueden componerse

★ ★ ★ ★ ★

El lenguaje SPARQL permite realizar consultas a grafos

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

RDF como representación

Negociación de contenidoHTML: información para navegadores

RDF: información para sistemas automáticos

★ ★ ★ ★ ★

http://tiempo.com/prevision/oviedoURI

303 See Other http://tiempo.com/prevision/Oviedo/informe.html

303 See Other http://tiempo.com/prevision/Oviedo/informe.rdf

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Proyecto Linking Open Data

★ ★ ★ ★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

De Wikipedia a DBPediaInfoset

★ ★ ★ ★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

De Wikipedia a DBPedia

★ ★ ★ ★ ★

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Un pequeño ejercicio

Obtener datos de desempleo en municipios asturianos

Excel RDF

HTML + Google Maps

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejercicio: Ejemplo de Excel

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejercicio: RDF

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejercicio: HTML

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Iniciativas para datos abiertos

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Algunas iniciativas en España

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Conclusiones

Publicación de datos abiertos

De datos abiertos a datos enlazados

Nuevos retos:Legalidad: licencias, copyrights,

patentes…

Privacidad

Temporalidad

Semántica e inferencia

Fin de la presentación

Más información: http://www.di.uniovi.es/~labra

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Agradecimientos

Algunas ideas o partes de esta presentación han sido tomadas de otras presentaciones similares de:

Ivan Hermann, Jacco van Ossenbruggen, Nova Spivak, Ian Horrocks, Tim Berners-Lee, Jose Manuel Alonso, Svein-Magnus Sørensen, Jose Luis Marín.

También se han utilizado datos accesibles en Google, Flickr, Wikipedia, Slideshare, etc. a cuyos autores originales me hubiera gustado citar.

top related