todo lo que siempre quisiste saber sobre infovis

52
Todo lo que siempre quisiste saber sobre Visualización de Información Pero temías preguntar... Eduardo Graells-Garrido / @carnby [email protected] http://carnby.github.io StarTechConf, Santiago de Chile, 7 de Noviembre de 2015

Upload: eduardo-graells-garrido

Post on 08-Feb-2017

947 views

Category:

Data & Analytics


2 download

TRANSCRIPT

Todo lo que siempre quisiste saber sobreVisualización de Información

Pero temías preguntar...

Eduardo Graells-Garrido / @[email protected]://carnby.github.io

StarTechConf, Santiago de Chile, 7 de Noviembre de 2015

Potenciales Preguntas

¿Qué es InfoVis (Information Visualization)?

¿Para qué sirve?

¿Son todas las técnicas igual de precisas?

¿Es cierto que “los datos no mienten”?

¿Quién (y cómo) diseña visualizaciones?

¿Qué es InfoVis?

(una de tantas perspectivas)

La Visualización de Información es una tecnología que aprovecha los

mecanismos cognitivos para entender, explorar e interactuar*

(en) espacios de información representados de manera

visual/gráfica.

*entre otras posibles acciones :)

Matrices físicas de Jacques Bertinhttp://www.aviz.fr/diyMatrix/

Aprovechamos nuestra cognición a través de la abstracción.Con un círculo, dos puntos y una línea, ¡seguimos viendo un rostro!

Scott McCloud. Understanding Comics

El gráfico estadístico más completo de todos los tiempos según Edward Tufte.Carte figurative des pertes successives en hommes de l'Armée Française dans la campagne de Russie 1812-

1813Charles Minard, 1869.

Algunas visualizaciones ya son familiares y su interpretación es inmediata.

Pero, ¿se puede hacer mejor?

Observatorio de Complejidad Económica. http://atlas.media.mit.edu/

¡Yo creo que sí!

(¿¡Más uvas que vino!?)

Observatorio de Complejidad Económica. http://atlas.media.mit.edu/

La interpretación de una visualización no es inmediata. Nuestros modelos mentales requieren ser desarrollados en el tiempo.

John Stasko. http://www.cc.gatech.edu/~john.stasko/

¿Para qué sirve?

“Visualizations give you answers to questions you didn’t know you had.”

- Ben Shneiderman

¿Cuándo usar visualización?Tamara Munzner. http://www.cs.ubc.

ca/labs/imager/tr/2012/dsm/

Para diferenciar.https://en.wikipedia.org/wiki/Anscombe%27s_quartet

Para analizar. John Snow.

https://en.wikipedia.org/wiki/1854_Broad_Street_cholera_outbreak

Para socializar analizando (¿o analizar socializando? ¡ambas!)Martin Wattenberg y Fernanda Viegas. NameVoyager.

Para entender. Mike Bostock. http://bost.ocks.org/mike/algorithms/

ParaComunicar.

Simon Scarr

Para comparar.http://graphics.wsj.com/infectious-diseases-and-vaccines/

Para representar.¡Inscríbanse! http://auroratwittera.cl/perfil/carnby

¿Son todas las técnicas igual de precisas?

Depende del caso. No siempre precisión es lo que se necesita. En otras ocasiones, se necesita “comunicación” :)

Nuestro cerebro es especialista en comparar largos, no áreas. Stephen Few, http://www.perceptualedge.com/example18.php

Rediseño de Stephen Few.¿Mejor así? Sí.

¿Más fome? También.

En 2|S (Dos Santiagos) justamente queríamos mostrar algo atractivo de ver y entretenido de usar, no estrictamente analítico.

E.G. y Alonso Astroza. http://users.dcc.uchile.cl/~egraells/abrecl/

Otra situación similar: áreas y ángulos no son fáciles de diferenciar.Imagen: https://en.wikipedia.org/wiki/Pie_chart

Por otro lado, cuando hay pocas categorías y se quiere entregar un mensaje específico, un pie chart puede ser una buena elección.

Gráfico: https://xkcd.com/290/

Cartograma de Santiago usando datos anonimizados y agregados de movilidad.

Día lunes a las 6:30AM.

Las áreas se deforman para mostrar la densidad poblacional.

¿Preciso? No.¿Dramático? Sí.

Cartograma de Santiago usando datos anonimizados y agregados de movilidad.

Día lunes a las 2:30PM.

¡Ésta es la verdadera forma de la ciudad!

Para observar nuestro comportamiento. Ej.: discusión sobre aborto en Twitter.Grafo: tendemos a interactuar con quienes piensan similar a nosotros.Wordclouds: palabras más asociadas a las biografías de cada cluster.

¿Es cierto que “los datos no mienten”?

Spoiler: NO. Precisa, a veces. Objetiva, nunca.

Nota: asumimos buena fe. En caso contrario, siempre está “How to Lie with Statistics”.

Prácticamente siempre es necesario normalizar los datos. Hacerlo da rigurosidad y permite comparar.

https://xkcd.com/1138/

Comparación de población chilena en Twitter.

Imbalanced Population(Different Orders of

Magnitude)

Balanced Representation (Equal Orders of Magnitude)

r = 0.68, p < 0.01CASEN Survey

r = 0.95, p < 0.01Census 2012

¿Es representativo este mapa?https://en.wikipedia.org/wiki/File:

Mercator_projection_SW.jpg

Éste está mejor, pero no es perfecto. Por otro lado, ¿sería más difícil de navegar con mapas así?

https://en.wikipedia.org/wiki/Mollweide_projection

La distorsión siempre estará presente :) Es el uso del mapa el que determinará la proyección a utilizar.

http://flowingdata.com/2014/01/13/map-projections-illustrated-with-a-face/

Ejemplo típico: la base de un gráfico no es 0. Si lo que se quiere comparar es valor absoluto, no usar 0 como base es, lisa y llanamente, mentir.

http://flowingdata.com/2015/08/11/real-chart-rules-to-follow/

¿Quién (y cómo) diseña visualizaciones?

Una visión centrada en los problemas a resolver.

Tamara Munzner. http://www.cs.ubc.ca/labs/imager/tr/2009/NestedModel/

El contexto cultural y social es muy importante. No hay dos usuarios iguales.

Dürsteler & Engelhardt.http://infovis.net

En Twitter, el comportamiento de chilenos y chilenas es centralizado.

Se tiende a mencionar y Retwittear más a gente de la Región Metropolitana.

Junto a Mounia Lalmas y Ricardo Baeza-Yates hicimos un algoritmo para de-centralizar timelines.

¿Funcionó?

NO.

El algoritmo no consideraba como la gente percibía la centralización. ¡Gente fuera de la RM encontraba que el contenido sobre Santiago era más

interesante y diverso que el de sus propias regiones!

Pero cuando se utiliza visualización para hacer saliente la diversidad en contenido, cambia la situación.

Para terminar...

InfoVis (o DataVis) es una tecnología (no un conjunto de técnicas). Para mí, su principal uso son la comunicación y la exploración.

No hay que olvidar el contexto:- A veces lo no familiar es más efectivo para

estimular la curiosidad.- Otras veces lo familiar permite comunicar

con mayor claridad un mensaje.

No hay dos personas iguales:- El proceso de diseño debe considerar las

diferencias culturales, sociales e individuales de la audiencia.

- ¡Debemos aprovechar la experiencia conjunta!

Y no olvidar que hay decisiones subjetivas detrás de todo el proceso. La visualización no es objetiva.

¡Gracias!¿Preguntas?

Eduardo [email protected]://carnby.github.io@carnby

Ilustraciones de zorzales@Athziri y @lovecatscl

Pajaritos vectorialeshttp://www.fernandoaldea.com/ (usado con CC)

The Graphic Continuumhttp://blog.visual.ly/graphic-continuum/

Aprovechamos nuestra cognición a través de la abstracción.

Scott McCloud. Understanding Comics

En ambos casos, siempre se debe decidir en torno a complejidad/profundidad y comprensibilidad/simpleza.

Alberto Cairo. The Functional Art

Visualization should be seen as technology [...].1. It provides an extension of ourselves.2. It is a mean to reach goals.

- Alberto Cairo, The Functional Art

Technology has nothing to do with fantastical new devices for moving and everything to do with new ways of thinking, sharing information, and adjusting the way we use the machines we have been using for years.

- Charles Montgomery, Happy City

Gran parte de las acciones que se pueden realizar en una visualización parten desde tres preguntas: ¿por qué (a)? ¿cómo (b)? ¿qué (c)?

Tamara Munzner. http://www.cs.ubc.ca/labs/imager/tr/2013/MultiLevelTaskTypology/

Para explorar. The Bohemian Bookshelf.

http://www.alicethudt.de/BohemianBookshelf/