“una arquitectura conceptual para el análisis de ... · resultados y discusión el árbol de...

14
“Una arquitectura conceptual para el análisis de contenidos sobre el aborto usando la plataforma Twitter" Paolo R. Roldán Robles, Ana C. Umaquinga-Criollo, Janneth A. García- Santillán,Israel D. Herrera-Granda, Iván D. García-Santillán [email protected] Universidad Técnica del Norte 16 de octubre de 2019 . Ibarra-Ecuador

Upload: others

Post on 14-Nov-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

“Una arquitectura conceptualpara el análisis de contenidossobre el aborto usando laplataforma Twitter"

Paolo R. Roldán Robles, Ana C. Umaquinga-Criollo, Janneth A. García-Santillán, Israel D. Herrera-Granda, Iván D. García-Santillá[email protected]

Universidad Técnica del Norte

16 de octubre de 2019 . Ibarra-Ecuador

Page 2: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

Agenda

• Introducción

•Materiales y métodos

•Resultados y discusión

•Conclusiones y trabajo futuro

Page 3: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

• La disponibilidad de información en internet: insumos en Twitter

• El Aborto en el Ecuador entre 2004 y 2014 fue de 431614 abortos [12]

• Permite contribuir a la toma de decisiones con respecto a lapolítica de salud pública entre otros.

• El crecimiento exponencial del tipo de datos: estructurados, noestructurados semiestructurados.

1. IntroducciónMotivación

• Conocer de manera técnica la opinión pública sobre el aborto en Ecuador, a partir del análisis de contenidos de los tweets enviados desde Ecuador a través de la plataforma de Twitter.

Objetivo

Page 4: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

Materiales y métodos

• Autenticación: se creó una aplicación de Twitter con permisos de

desarrollador, se usó el IDE Spyder Python 3.6 de la plataforma Anaconda 3-

4.3.0.1 y se instaló la biblioteca tweepy.

Page 5: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

• Recolección de datos: Usando la API Streaming de Twitter, se realizó la

descarga de tweets del 16 de agosto al 29 de septiembre de 2018. Para

limitar el territorio o el país, se utiliza el filtro de ubicación [9], [16]. Se obtuvo

un archivo JSON de 1721287 KB de tamaño, que contiene 344149 registros.

• Limpieza y Procesamiento de Datos:

Limpieza: Del archivo recibido, se eliminan los hashtags que no están

relacionados con el tema del aborto,

Procesamiento: El procesamiento se realizó manualmente, con una

investigación adecuada del origen de cada hashtag y su uso.

Materiales y métodos

Page 6: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

• Modelado y Análisis:

Modelado La información resultante se procesó en dos categorías:

A favor del aborto (Aborto +) En Contra del aborto (Aborto -)

Análisis:

✓ Frecuencia de hashtags.

✓Menciones de Usuarios

✓ Porcentajes a Favor y en Contra: Usando los clasificadores Árbol de decisiones y Naive Bayes

✓Ubicaciones: Usando el servicio Nominatim de OpenStreetMap en la versión 1.11.0 de la

biblioteca de geopy, que ofrece las mismas funcionalidades que las APIS de Google Maps pero

de forma gratuita

• Presentación de Resultados

Materiales y métodos

Page 7: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

Resultados y discusiónHashtags Número de

mencionesA favor

(Aborto+)En contra (Aborto-)

1. #salvemoslas2vidas 12480 X

2. #abortolegalya 9467 X

3. #sialavida 5270 X

4. #28s 4102 X

5. #noalaborto 3306 X

Algoritmo Aplicado A favor(Aborto+)

En Contra(Aborto-)

1. Árbol de Decisión 40.7% 59.3%

2. Naive Bayes 44.6% 55.4%

Promedio Total 42,65% 57,35%

Top 5 Hashtags

Resultados por Algoritmo y en promedio

Page 8: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

Resultados y discusión

Menciones diarias de Tweets Mapa de Calor

Page 9: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

Nubes de Palabras

Cuentas de Usuarios hashtags

Resultados y discusión

Page 10: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

Resultados y discusión

El árbol de decisión (97.9%) superó el Clasificador de NaiveBayes en precisión (79.1%), coincidiendo con otro estudio en lacomparación de clasificadores [20], lo que contribuye con unpunto de referencia confiable.

Si se requieren estudios sobre hashtags específicos [11] encuanto al feminicidio e ideología de género, debe considerarse eluso de: #niunamenos y #conmishijosnotemetas,respectivamente; mientras que, para otros estudios sobre eltema del aborto: #salvemoslasdosvidas y #abortolegalya,porque fueron los más utilizados en este estudio.

Page 11: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

Conclusiones

• En Ecuador los usuarios de Twitter, muestra el 40.7% a favor del

aborto y el 59.3% contra el aborto, respaldado por el 97.9% de

precisión del árbol de decisión.

• Existe una estrecha relación entre los hashtags utilizados con el

texto, excepto, en algunos casos donde los hashtags se usan para

mostrar oposición.

Page 12: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

Trabajo Futuro

• Se recomienda una investigación

comparativa del mismo tema, y así

determinar si los porcentajes han

cambiado o si existen nuevas

tendencias. Adicional, se sugiere

considerar redes sociales como

Facebook e Instagram.

Page 13: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

Referencias9. KlokanTech. (2017). BoundingBox. Retrieved August 12, 2018, from

https://boundingbox.klokantech.com/

11. Niklander, S. (2017). Content Analysis on Social Networks: Exploring the #Maduro

Hashtag. 5. https://doi.org/10.1109/ICCNI.2017.8123803

12. Ortíz, E. (2017). Redacción Médica. Retrieved June 29, 2019, from

https://www.redaccionmedica.ec/secciones/salud-publica/el-85-de-los-abortos-

registrados-en-el-ecuador-son-de-causas-desconocidas-90319

16. Sogo, J. G. (2016). Lingẅars. Retrieved February 10, 2019, from

http://lingwars.github.io/blog/twitter-stream.html

20. Vila, Dayana; Cisneros, Saúl; Granda, Pedro; Ortega, Cosme; Posso-Yepez, Miguel;

García-Santillan, I. (2019). Detection of Desertion Patterns in University. Springer Nature

Switzerland AG 2019, 10. https://doi.org/10.1007/978-3-030-05532-5_31

Page 14: “Una arquitectura conceptual para el análisis de ... · Resultados y discusión El árbol de decisión (97.9%) superó el Clasificador de Naive Bayes en precisión (79.1%), coincidiendo

GraciasPaolo R. Roldán Robles , Ana C. Umaquinga-Criollo, Israel D. Herrera-Granda , Iván D. García-Santillán.

[email protected] [email protected] [email protected] [email protected]

Universidad Técnica del Norte

Janneth A. García-Santillán

[email protected]

Unidad Educativa Juan Pablo II