big data para bibliotecas de salud 2015

Post on 12-Jan-2017

509 Views

Category:

Data & Analytics

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Oportunidades y desafíos de la gestión de Big Data en bibliotecas de ciencias de la salud

Bibliosalud 2015 – Jorge Serrano-Cobos

2

Qué vamos a ver

1. El concepto

2. Herramientas

3. Técnicas de estudio

4. Desafíos para las bibliotecas

5. Oportunidades para las bibliotecas

6. Conclusiones

1. El concepto es el concepto¿Más allá de un hype, una moda?

4

What we offerMASmedios expertise and skills

Photo by JD Hancock

Desambiguando “Big Data”

5

Big Data versus…¿Mismo perro, distinto collar?

6

Lo obvio…Gestionamos sólo un % de los datos que están a nuestro alcance

7

Una definiciónLas 3 V’ s

Conjunto de activos de información caracterizados por su gran volumen, velocidad y variedad, que exigen formas innovadoras y rentables de procesamiento de la información para mejorar la comprensión y la toma de decisiones.

Doug Laney (Gartner)

¿Hartos ya de Vs?

Photo by 澎湖陽光阿有專業浮潛

Sin datos es como

si…

Photo by Eric Benacek

Con datos …

11

Por tanto, al final…Preguntas > Datos > Información > Respuestas > Conocimiento > Sabiduría

"Big data isn't about the data. It's about analytics."

Gary King (Harvard University)

””

2. HerramientasOh my goodness

13

Tecnologías¿Qué necesitamos?

• Datos

• Modelos de base de datos

• Almacenamiento de los datos

• Software de análisis

• Storytelling / Visualización de información

14

Tipos de datosAtendiendo a su estructura

• Datos estructurados

• Bases de datos propias o de terceros

• Datos de sensores físicos (Internet of Things)

• Metadatos

• Datos no estructurados

• Texto

• No texto

• Datos semiestructurados

15

Tipos de datosAtendiendo a su origen

• Web & Social Media

• Machine-to-Machine

• Transaction Data

• Biometrics

• Human Generated

• …

IBM

16

Tecnologías¿Qué necesitamos?

• Modelos de base de datos

• SQL

• NoSQL

• BD documentales• BD de grafos• BD clave/valor (key/value)• BD multivalor• BD orientadas a objetos• BD tabular• BD de arrays

17

Tecnologías¿Qué necesitamos?

• Software de análisis

• Análisis estadístico puro

• Data Mining

• Text Mining

• Mixtos

• Verticales

• …

18

HerramientasCaro, carísimo, open, freemium…

dataversity.net

19

HerramientasAlgunas alternativas Open Source …

Incorpora datamining / machine learnig con…

”R”, tal cual

3. Técnicas de estudioEs el análisis, estúpido

21

Tipos de análisisEstadística + Computación

• Provenientes de la Estadística:

• Estadística descriptiva

• Estadística inferencial

• Distribuciones de probabilidad

• Estadística multivariante

• Series Temporales

• Ecuaciones diferenciales

• …

22

Tipos de análisisEstadística + Computación

http://www.elprofesionaldelainformacion.com/index.html

Photo by BlueGoa

Diferencias vs. Semejanzas

http://www.slideshare.net/pranny/a-hybrid-recommendation-system

Reglas de asociaciónRelaciones entre diferentes variables

http://www.jmp.com/

Analítica predictiva¿Predecir el futuro?

Text MiningPatrones en datos no estructurados

http://provalisresearch.com/products/content-analysis-software/

27

Text MiningTendencias / histórico

Photo by Steve Jurvetson

¿Sentiment analysis?

Análisis del sentimientoOjo con esto

Photo by Steve Jurvetson

Nicholas Christakis

By Marc Smith

Social Network AnalysisAnálisis de redes con NodeXL

31

Analítica de la bibliotecaUsuarios, papers, científicos…

¿Quién ha dicho altmetrics? ¡Cybermetrics!

32

Analítica de la bibliotecaUsuarios, papers, científicos…

33

Analítica de la bibliotecaUsuarios, papers, científicos…

34

Analítica de la bibliotecaUsuarios, papers, científicos…

4. Desafíos para las bibliotecasGestión de bibliotecas basadas en… ¿el dato?

36

Desafíos para las bibliotecasAparte del presupuesto, claro

• Privacidad de los datos personales

http://www.dilbert.com

37

• Confianza ciega en los datos (caso Google Flu)

http://scholar.harvard.edu/files/gking/files/0314policyforumff.pdf

Desafíos para las bibliotecasAparte del presupuesto, claro

5. Oportunidades para las bibliotecasGestión de bibliotecas basadas en… ¿el dato?

39

Aplicando Big Data a BibliotecasEl rol de la biblioteca

Escenarios:

• La Biblioteca, como emisora de datos

• La Biblioteca, como garante de los datos

• La Biblioteca, como integradora de datos

• La Biblioteca, como analista / explotadora de datos

40

Aplicando Big Data a BibliotecasEl rol de la biblioteca

Escenarios:

• La Biblioteca, como emisora de datos

• La Biblioteca, como garante de los datos

• La Biblioteca, como integradora de datos

• La Biblioteca, como analista / explotadora de datos

41

Big vs Small Librarian Data Como emisores de los datos

Drupal + eXtensible Catalog

http://pcu.bage.es/

42

Aplicando Big Data a BibliotecasEl rol de la biblioteca

Escenarios:

• La Biblioteca, como emisora de datos

• La Biblioteca, como garante de los datos

• La Biblioteca, como integradora de datos

• La Biblioteca, como analista / explotadora de datos

43

Databrarians al poderGarantes de los datos

Algunas iniciativas:

• http://www.re3data.org: Registro global de repositorios de datos de investigación. Y Schema propio de definición de datos en XML , usando DOI para hacer los datos persistentes, únicos y citables.

• http://data.okfn.org/ : trabajan en estándares para compartir datos de todo tipo. (hay un grupo español - http://okfn.es/ )

• http://sparceurope.org/thehaguedeclaration/

44

Databrarians al poderEmisores y garantes de los datos

http://assets.okfn.org/p/data.okfn.org/img/the-idea.png

45

Databrarians al poderEmisores y garantes de los datos

Algunas guías:

• “Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020” http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf

• Guía de la universidad de Duke sobre “Research data management services o RDS http://library.duke.edu/data/guides/data-management/repositories

46

Aplicando Big Data a BibliotecasEl rol de la biblioteca

Escenarios:

• La Biblioteca, como emisora de datos

• La Biblioteca, como garante de los datos

• La Biblioteca, como integradora de datos

• La Biblioteca, como analista / explotadora de datos

47

Búsqueda de datosData sharing, Linked Open Data…

48

Búsqueda de datosData sharing, Linked Open Data…

49

Búsqueda de datosData sharing, Linked Open Data…

50

Búsqueda de datosRecuperar sobre variedad de fuentes de forma unificada…

http://www.easp.es/exploraevidencia

51

Búsqueda de datosRecuperar sobre variedad de fuentes de forma unificada…

52

Búsqueda de datosRecuperar sobre variedad de fuentes de forma unificada…

53

Búsqueda de datosRecuperar sobre variedad de fuentes de forma unificada…

54

Aplicando Big Data a BibliotecasEl rol de la biblioteca

Escenarios:

• La Biblioteca, como emisora de datos

• La Biblioteca, como garante de los datos

• La Biblioteca, como integradora de datos

• La Biblioteca, como analista / explotadora de datos

55

Big vs Small Librarian Data Como integradores de datos

+

56

Big vs Small Librarian Data Como integradores de datos

http://www.foregroundweb.com/

+

57

Análisis de la demanda de información vs. ofertaControl del vocabulario, ayuda en recuperación de info…

Azucena Santillánhttp://www.socialbiblio.com/materiales-de-busqueda-eficaz-de-evidencias-en-cuidados/

58

Análisis de la demanda de información vs. ofertaControl del vocabulario, ayuda en recuperación de info…

https://adwords.google.com/KeywordPlanner

59

Análisis de la demanda de información vs. ofertaControl del vocabulario, ayuda en recuperación de info…

https://www.google.es/trends/

60

Visualización de informaciónStorytelling, contextualización gráfica de la información

https://www.youtube.com/watch?v=X82iJZEViDo&app=desktop

61

Visualización de informaciónA veces, no es cuestión de presupuesto, sino de imaginación

https://docs.google.com/spreadsheets/d/14qNC6yHuJN_rHhfCb_j_3kxV3qhc6fM1aSHaUm6tiyM/

edit#gid=0

5. Conclusiones

63

Conclusiones

1. Lo importante es querer preguntarse, buscar respuestas

2. Las herramientas se democratizan

3. Datos sí, pero con cuidado

4. Múltiples aplicaciones, imaginación al poder

5. Sopesar oportunidades vs. costes

6. La tecnología es útil, las personas más

64

Oficinas centrales:C/Garcilaso 15-B

46003 ValenciaTel.: 96 369 41 23 Fax: 96 369 34 39

Oficinas NYC:175 Varick Sreet

New York. N.Y. 10014 U.S.A.

Gracias :-)

Jorge Serrano-Cobosjorge@masmedios.com

http://www.facebook.com/masmedios

http://twitter.com/masmedios

MASmedios (Madrid)C/Jesús del Valle, 28 bajo

28004, MadridTel.: 636 26 71 78

64

Nota de agradecimiento: Copyright de imágenes, a sus respectivos dueños 65

top related