balotaje argentina 2015 - files.meetup.comfiles.meetup.com/19109162/balotaje argentina 2015... ·...

Post on 08-Aug-2020

3 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Balotaje Argentina 2015

Demostración Big Data:

HPE Vertica + Pulse

Grupo de Usuarios HPE Big Data LATAM

Agenda

Análisis de sentimiento de tweets• ¿Qué es el análisis de sentimiento? Ejemplo

• Arquitectura

• Estructura de Tablas y Vistas

• Configuración del Agente Flume

• Inicio del Agente

• Diccionarios de pulse

• Calculo de sentimiento (sentimental analysis)

• Datos Analizados

• Resultados obtenidos

• Visualización con Tableau

¿Qué es el análisis de sentimiento?

Es software que mediante la comprensión del leguaje cataloga un texto en positivo, negativo o neutro.

Nuestro estudio analiza los mensajes de twitter generados durante el periodo del Balotaje de Argentina 2015 entre Mauricio Macri y Daniel Scioli y realiza este análisis de sentimiento, dándole un valor de 1 a los mensajes positivos, -1 a los negativos y 0 a los neutros.

Veamos un ejemplo

Buscando este mensaje en la base de datos, vemos que el mismo es catalogado como sentiment_score_tweet = -1, negativo

Si analizamos este tweet, es un mensaje negativo para el candidato Macri

Propósito del estudio

Encontrar una relación entre los tweets generados durante el periodo previo al Balataje 2015, analizando el sentimiento de los mismos a favor y en contra de los candidatos, con el resultado electoral de la elección.

Host

Twitter Streaming

API

Arquitectura de la Solución

Agente Apache Flume

Source Sinc

Channel

Pulse

Conector Vertica para Hadoop

Estructura de tablas

Vistas

Configuración del Agente Flume

Iniciar el Agente Apache Flume

Diccionario Pulse, normalización y white list

Diccionario Pulse, palabras positivas y negativas

Calcular el sentimiento de los tweets

insert into elec.tweet_sentiment

(select id,

"user.screen_name",

SentimentAnalysis(text using parameters

filterlinks=true,filterusermentions=false, filterhashtags=false)

over (partition by id, "user.screen_name", text)

from elec.tweets where lang='es'

and created_at between to_timestamp ('2015-11-20 00:00:00','YYYY-MM-DD

HH:MI:SS') and to_timestamp ('2015-11-20 23:59:59','YYYY-MM-DD

HH:MI:SS'));

commit;

Datos analizados

Resultados del Análisis de Sentimiento

Resultados del Análisis de Sentimiento

Resultados del Análisis de Sentimiento

Resultado del Balotaje

Resultado del Balotaje

Resultado de Sentimiento Positivo

Resultados con Tableau

Resultados con Tableau

Resultados con Tableau

Resultados con Tableau

Conclusión

Mediante el presente estudio, hemos detectado relación entre los tweets y el resultado general a nivel global, y no así si lo extrapolamos a las provincias, ya que en algunos casos el sentimiento positivo da resultados diferentes.

Una de las posibilidades que brinda esta tecnología es apoyar a los sistemas de encuestas tradicionales, como así también análisis de sentimientos negativos para tomar decisiones de cambio en base a los mismos.

https://my.vertica.com/

Datos de Contacto

Daniel Robins

daniel.robins@kunan.com.ar

Tel: +54 351 5680045

Skype: daniel.robins2

Grupo de Usuarios: http://www.meetup.com/es-ES/Grupo-de-Usuarios-HPE-Big-Data-LATAM/

Registro y Download: https://my.vertica.com/

top related