análisis de redes sociales - parametría

9
Análisis de redes sociales - Parametría El análisis de redes sociales es una buena herramienta para conocer y entender la opinión pública usuaria de redes sociales. Cabe señalar que, dado el contexto socioeconómico en nuestro país y la brecha tecnológica característica de los países en desarrollo, este grupo reúne características específicas que merecen un tratamiento diferenciado de los trabajos demoscópicos realizados en vivienda o por teléfono. Acorde con la Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares, en México, solo 70 % de la población tiene acceso a internet (80 millones de mexicanos). Este segmento se identifica por ser el más urbano, más escolarizado y con mayores recursos económicos. Por ello, no es posible hablar que resultados obtenidos por estos medios puedan ser representativos de la opinión pública mexicana en su conjunto. Si bien quienes opinan y participan en medios tecnológicos representa especialmente a la clase media, un análisis de este segmento puede anticipar frecuentemente lo que será un tema de conversación social más general en el futuro. Del total de usuarios de internet casi 90% usa redes sociales. De este grupo, poco más del 85% usa WhatsApp, un 84% tiene una cuenta de Facebook (84%), un 31% usa Youtube, un 27% tiene Instagram, y hasta el 10% son usuarios de Twitter. Entre el público que accede a redes sociales la mayor parte de ellos dedica su tiempo a temas como deportes o espectáculos (alrededor de 85%), mientras que solo una minoría los emplean para debatir los temas de vida pública. Twitter es probablemente la red social con mayor frecuencia de opiniones en temas de interés público. Son diversos los estudios que han señalado la significativa diferencia entre las características de quienes usan redes sociales, siendo Twitter donde se identifica un perfil más especializado, más crítico y/o más informado. Por ello, nuestro análisis se enfoca en esta red social. El presente trabajo se realiza con interfaces basadas en la API de Twitter, donde se filtra- en tiempo real- los tweets de interés para crear una base de datos propia analizable. A partir de este análisis se identifican los topics, hashtags y usuarios más importantes para el seguimiento. Este análisis se basa en un scrapping personal de tweets en México que hacen mención de COVID-19. Tiempo Los datos sobre tweets hasta 2020-05-20 tienen 369,594 tweets. El gráfico de tiempo presenta el número de tweets que mencionan el #COVID19MX. Estos tweets se muestran según la hora de su publicación desde el 31 de marzo al 20 de abril de 2020. Es importante remarcar que los tweets tienen ciclos normales de creación determinado por las horas de descanso, así como la escalada esperada en los fines de semana. Este ejercicio permite evaluar la relevancia de un tema particular para la opinión pública usuaria de redes sociales y, subsecuentemente, entender su relación con eventos observados en un periodo de tiempo. En la actualización de este reporte se incluyeron los tweets a partir del día 31 de marzo de 2020. En este sentido, los puntos más altos fuera de tendencia correspondientes a este periodo se observan los días 5 de abril, 9 de abril, 16 de abril, 21 de abril, 8 de mayo y 12 de mayo. El primero repunte se ajusta en tiempo al anuncio presidencial de acciones para la reactivación de la economía ante la emergencia del COVID-19 —este acontecimiento en particular se retomará más adelante. El segundo punto

Upload: others

Post on 21-Jul-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis de redes sociales - Parametría

Análisis de redes sociales - Parametría

El análisis de redes sociales es una buena herramienta para conocer y entender la opinión pública usuaria de redes sociales. Cabe señalar que, dado el contexto socioeconómico en nuestro país y la brecha tecnológica característica de los países en desarrollo, este grupo reúne características específicas que merecen un tratamiento diferenciado de los trabajos demoscópicos realizados en vivienda o por teléfono.

Acorde con la Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares, en México, solo 70 % de la población tiene acceso a internet (80 millones de mexicanos). Este segmento se identifica por ser el más urbano, más escolarizado y con mayores recursos económicos. Por ello, no es posible hablar que resultados obtenidos por estos medios puedan ser representativos de la opinión pública mexicana en su conjunto. Si bien quienes opinan y participan en medios tecnológicos representa especialmente a la clase media, un análisis de este segmento puede anticipar frecuentemente lo que será un tema de conversación social más general en el futuro.

Del total de usuarios de internet casi 90% usa redes sociales. De este grupo, poco más del 85% usa WhatsApp, un 84% tiene una cuenta de Facebook (84%), un 31% usa Youtube, un 27% tiene Instagram, y hasta el 10% son usuarios de Twitter. Entre el público que accede a redes sociales la mayor parte de ellos dedica su tiempo a temas como deportes o espectáculos (alrededor de 85%), mientras que solo una minoría los emplean para debatir los temas de vida pública.

Twitter es probablemente la red social con mayor frecuencia de opiniones en temas de interés público. Son diversos los estudios que han señalado la significativa diferencia entre las características de quienes usan redes sociales, siendo Twitter donde se identifica un perfil más especializado, más crítico y/o más informado. Por ello, nuestro análisis se enfoca en esta red social. El presente trabajo se realiza con interfaces basadas en la API de Twitter, donde se filtra- en tiempo real- los tweets de interés para crear una base de datos propia analizable. A partir de este análisis se identifican los topics, hashtags y usuarios más importantes para el seguimiento. Este análisis se basa en un scrapping personal de tweets en México que hacen mención de COVID-19.

Tiempo

Los datos sobre tweets hasta 2020-05-20 tienen 369,594 tweets.

El gráfico de tiempo presenta el número de tweets que mencionan el #COVID19MX. Estos tweets se muestran según la hora de su publicación desde el 31 de marzo al 20 de abril de 2020.

Es importante remarcar que los tweets tienen ciclos normales de creación determinado por las horas de descanso, así como la escalada esperada en los fines de semana. Este ejercicio permite evaluar la relevancia de un tema particular para la opinión pública usuaria de redes sociales y, subsecuentemente, entender su relación con eventos observados en un periodo de tiempo.

En la actualización de este reporte se incluyeron los tweets a partir del día 31 de marzo de 2020. En este sentido, los puntos más altos fuera de tendencia correspondientes a este periodo se observan los días 5 de abril, 9 de abril, 16 de abril, 21 de abril, 8 de mayo y 12 de mayo.

El primero repunte se ajusta en tiempo al anuncio presidencial de acciones para la reactivación de la economía ante la emergencia del COVID-19 —este acontecimiento en particular se retomará más adelante. El segundo punto

Page 2: Análisis de redes sociales - Parametría

del 9 de abril corresponde con el momento en el que se presentaron, por primera vez, las estimaciones de casos confirmados con base en el Modelo Centinela de Vigilancia Epidemiológica. Desde su primera aparición, debido a la carencia de una nota metodológica, los datos causaron polémica e incluso confusión entre el público en general.

El tercero punto más alto coincide en fecha con la conferencia matutina presidencial en la que el subsecretario Hugo López-Gatell presentó un mapa desagregado a nivel municipal, cuyo propósito era ilustrar cuáles localidades terminarían la jornada de #SanaDistancia el día 17 de mayo y cuáles extenderían esta medida al menos el 30 de mayo. El cuarto más alto registro de tweets del 21 de abril la conversación se centró en los comentarios del conductor del noticiero de TV Azteca, Javier Alatorre, quien se declaró en contra de la postura y recomendaciones del gobierno federal.

El día 8 de mayo se registra otro crecimiento significativo del número de tweets derivado del anuncio del Secretario de Educación Pública, Esteban Moctezuma, confirmando que no se retomaran las clases hasta que no existan garantías sanitarias para el retorno seguro de alumnado y docentes. Por último, el alto crecimiento el día 12 de mayo se debió a la conmemoración del Día Internacional de la Enfermería, dado su importante papel en medio de esta pandemia.

Un elemento que vale la pena destacar es la tendencia decreciente respecto al tema del COVID-19: en general, se habla menos de forma cotidiana, salvo que exista un estímulo en forma de noticia o comunicados oficiales que lo impulse.

ANÁLISIS DE REDES SOCIALES

Frecuencia de tweets que mencionaron al #COVID19mxTweets agrupados por hora del 30 de marzo al 20 de mayo de 2020

Elaboración propia con datos de Twitter / Parametría

TIEMPO

Abr/04

400

300

200

100

0

Abr/11 Abr/18 Abr/25 May/02 May/09 May/16 May/23

Núm

ero

de tw

eets

Page 3: Análisis de redes sociales - Parametría

Los primeros días vs los últimos días

Más que una nueva normalidad, la discusión del COVID-19 en redes sociales es ya la normalidad. Si bien la frecuencia de tweets relacionados con el virus ha bajado considerablemente, como ya se presentó en la gráfica anterior, las palabras, menciones y temas relacionados con éste han tenido cierto dinamismo. Para ilustrar este ejercicio, se realizará una comparación entre los términos más mencionados en las primeras dos semanas de cuarentena y las últimas dos.

Hashtags

Los hashtags de las primeras dos semanas son encabezados por #QuédateEnCasa, término que no perdió el liderato en ningún momento del periodo de analizado, y #SusanaDistancia. Destaca que #Tlalnepantla se encuentra dentro de los primeros diez hashtags más frecuentes, debido a haber sido el lugar de uno de los primeros brotes hospitalarios. Además, términos como #CuandoTermineLaCuarentena retratan una especie de nostalgia de la abandonada normalidad.

ANÁLISIS DE REDES SOCIALES

Elaboración propia con datos de Twitter / Parametría

LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASHASHTAGSHashtags más utilizados en tweets de COVID19

Primeras semanas de cuarentena: 30-mar al 15-abr

0

2,000

4,000

6,000

8,000

10,000

12,000

14,000

16,000

18,000

20,000

#Que

date

EnCa

sa

#Sus

anaD

istan

cia

#Mex

ico

#CDM

X

#Que

date

EnCa

saYa

#Tla

lnep

antla

#SNT

Esalu

d

#Mex

icoSo

lidar

io

#AM

LOse

VA

#Que

tate

EnLa

Casa

#San

aDist

ancia

#cua

rent

ena

#15A

bril

#Bue

nMie

rcol

es

#Cua

ndoT

erm

ineL

aCua

rent

ena

#Tea

mBS

ide

#Lor

dMol

ecul

a

#EnE

dom

exPr

even

irEsS

alud

#Cua

rent

ena

#AM

LO

17,702

9,474

4,1432,981 2,563 2,498 2,401 2,093 2,068 1,882 1,824 1,749 1,692 1,689 1,689 1,634 1,423 1,348 1,249 1,235

15,000

10,000

5,000

Núm

ero

de tw

eets

Page 4: Análisis de redes sociales - Parametría

En cambio, los hashtags de las últimas semanas se relacionan más con las actividades que ahora son cotidianas en el encierro: #PontePilaEnCasa, #YoConPontePila y #DeporteComunitario. Además, existe un boom en el recomocimiento del personal médico que se dedica a atender a pacientes COVID-19: #DíaDeLaEnfermería, #SalvaVidas y #GraciasPorCuidarnos.

ANÁLISIS DE REDES SOCIALES

Elaboración propia con datos de Twitter / Parametría

LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASHASHTAGSHashtags más utilizados en tweets de COVID19

Últimas semanas de cuarentena: 04-may al 20-may

0

5,000

10,000

15,000

20,000

25,000

#Que

date

EnCa

sa

#Dia

DeL

aEnf

erm

eria

#Sal

vaVi

das

#Cui

dem

osTo

dosD

eTod

os

#Sus

anaD

ista

ncia

#CD

MX

#Pon

tePi

laEn

Casa

#Edo

mex

#Dep

orte

Com

unit

ario

#YoC

onPo

nteP

ila

#Mex

ico

#EnV

ivo

#Los

Lope

z

#San

aDist

anci

a

#Uni

dosS

aldr

emos

Adel

ante

#Pol

icia

DeG

ener

o

#Tra

baja

mos

PorT

uSeg

urid

ad

#Gra

cias

PorC

uida

rnos

#enP

unto

#Vca

rran

za

22,709

6,866

3,028 2,867 2,7582,080 1,794 1,576 1,407 1,387 1,057 1,016 875 790 576 526 526 466 440 423

20,000

10,000

5,000

Núm

ero

de tw

eets

15,000

Page 5: Análisis de redes sociales - Parametría

Menciones

La comparación de menciones a cuentas públicas entre ambos periodos de tiempo también arroja resultados interesantes. En las primeras dos semanas se observa que la Secretaría de Salud federal (SSalud) era la cuenta más mencionada; el subsecretario López-Gatell se hallaba en tercer lugar, después de la cuenta del presidente López Obrador. Además, varios funcionarios públicos federales —el canciller Ebrard, el director del IMSS Zoé Robledo y la secretaria de trabajo Luisa Alcalde— se encuentran en las primeras 20 posiciones debido a su rol central en la atención de distintas áreas de la epidemia. En materia local, sólo los gobenadores Enrique Alfaro (Jalisco) y Alfredo del Mazo (EdoMex) logran entrar dentro de las cuentas con mayor número de menciones.

ANÁLISIS DE REDES SOCIALES

Elaboración propia con datos de Twitter / Parametría

LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASMENCIONESCuentas más mencionadas en tweets de COVID19

Primeras semanas de cuarentena: 30-mar al 15-abr

0

2,000

4,000

6,000

8,000

10,000

12,000

14,000

ssalu

d_m

x

lope

zobr

ador

_

hlga

tell

tu_i

mss

gobc

dmx

met

rocd

mx

felip

ecal

dero

n

gobi

erno

mx

susa

nadi

stan

cia

enriq

uealf

aror

ssalu

dcdm

x

alyn

mon

drag

o237

m_e

brar

d

lope

zdor

iga

zoer

oble

do

luisa

alca

lde

alfre

dode

lmaz

o

a_vc

arra

nza

soyd

avid

show

13,746

9,919

8,191

4,0123,296

2,672 2,6201,817 1,624 1,599 1,304 1,027 885 857 733 632 629 615 585 584

10,000

5,000

Núm

ero

de tw

eets

@

@

@ @ @

@

@

@

@ @

@

@ @ @

@ @ @

@

@

@

Page 6: Análisis de redes sociales - Parametría

En contraste, en las últimas semanas la cuenta más mencionada, como era de esperarse, es del vocero oficial del gobierno: Hugo López-Gatell; le sigue Ebrard y Obrador. En general, se tiende a mencionar menos las cuentas institucionales y se menciona más a las y los titulares de cada institución. También vale la pena destacar que varias cuentas relacionadas con el gobierno de la CDMX cobran relevancia; posiblemente debido a las intervenciones locales que se han hecho tanto en lo económico como en materia de salud pública, en paralelo con lo establecido por el gobierno federal.

ANÁLISIS DE REDES SOCIALES

Elaboración propia con datos de Twitter / Parametría

LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASMENCIONESCuentas más mencionadas en tweets de COVID19

Últimas semanas de cuarentena: 04-may al 20-may

0

1,000

2,000

3,000

4,000

5,000

6,000

7,000

8,000

9,000

10,000

hlga

tell

m_e

brar

d

lope

zobr

ador

_

gobc

dmx

ssalu

d_m

x

skyn

ews

gobi

erno

mx

beat

rizgm

ulle

r

susa

nadi

stan

cia

zoer

oble

do

rosa

icela

_

fond

esoc

dmx

fadl

alaa

kaba

ni

alfre

dode

lmaz

o

ser_

mx

ssalu

dcdm

x

edom

ex

tu_i

mss

sede

cocd

mx

nytim

es

8,267

6,1615,811

4,774

3,529

2,2141,879

1,5451,322 1,236 1,098 1,064 867 862 652 618 490 482 472 432

4,000

2,000

Núm

ero

de tw

eets

@

@

@

@ @

@

@

@ @

@ @

@ @ @

@

@

@ @

@

@

8,000

6,000

Page 7: Análisis de redes sociales - Parametría

Sentimiento

Por último, el sentimiento de ambos periodos tiene diferencias significativas. Al iniciar el periodo de confinamiento, casi la totalidad de tweets se calificaron de forma negativa: la mayoría de los días no contaron con una hora promediada como positiva. Esto puede deberse a que, al momento, se conocía todavía menos de cómo se desarrollaría la epidemia. La falta de información puede generar miedo y confusión entre las personas, por lo que esto explicaría el pesimismo general de las y los usuarios de Twitter.

ANÁLISIS DE REDES SOCIALES

Elaboración propia con datos de Twitter / Parametría

LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASSENTIMIENTOAnálisis de sentimiento en tweets de COVID19: Primeras semanas de

cuarentena: 30-mar 15-abrCada círculo representa una hora; el tamaño del círculo indica la cantidad de tweets encontrados por hora

Mar

/30

12AM

Mar

/31

12AM

Abr/

01 1

2AM

Abr/

02 1

2AM

Abr/

03 1

2AM

Abr/

04 1

2AM

Abr/

05 1

2AM

Abr/

06 0

1AM

Abr/

07 0

1AM

Abr/

08 0

1AM

Abr/

09 0

1AM

Abr/

10 0

1AM

Abr/

11 0

1AM

Abr/

12 0

1AM

Abr/

13 0

1AM

Abr/

14 0

1AM

Abr/

15 0

1AM

Abr/

16 0

1AM

0

-4

Sentimiento

4

5001000

1500

Page 8: Análisis de redes sociales - Parametría

En cambio, las últimas dos semanas, si bien aun el pesimismo impera, se han observado más tweets positivos. Destaca un punto particularmente alto entre el 13 y 14 de mayo. Esta ola de optimismo coincide con el anuncio de los municipios, denominados "Municipios de la Esperanza" por el gobierno federal, que regresarían a sus actividades regulares el 17 de mayo. Es probable que este pico se deba a muchos tweets relacionados con este anuncio: tanto el nombre del conjunto de tales localidades, como el anhelo por la nueva normalidad, explican que el sentimiento haya virado de dirección.

ANÁLISIS DE REDES SOCIALES

Elaboración propia con datos de Twitter / Parametría

LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASSENTIMIENTO

May

/05

12AM

May

/06

12AM

May

/07

12AM

May

/08

12AM

May

/09

12AM

May

/10

12AM

May

/11

12AM

May

/12

12AM

May

/13

12AM

May

/14

12AM

May

/15

12AM

May

/16

12AM

May

/17

12AM

May

/18

12AM

May

/19

12AM

May

/20

12AM

May

/21

12AM

0

-4

Sentimiento

4

Análisis de sentimiento en tweets de COVID19: Últimas semanas decuarentena: 04-May 20-MayCada círculo representa una hora; el tamaño del círculo indica la cantidad de tweets encontrados por hora

5001000

1500

Page 9: Análisis de redes sociales - Parametría

Nota metodológica

Esta herramienta consiste en extraer información directamente desde la API-Twitter. Esta extracción se realiza en tiempo real para buscar y filtrar la información relacionada con el COVID-19 en México. Para el periodo analizado se extrajeron un total de 369,594 tweets. Para identificar las palabras, hashtags y cuentas más mencionadas se utilizan métodos de análisis de texto para limpiar y agrupar conjuntos de términos.

Análisis de sentimiento

Un sistema automatizado se asigna un puntaje a cada palabra en los tweets de la base de datos, lo cual obtiene un puntaje general por tweet. Con estos puntajes se obtiene un promedio de puntuación de los tweets por hora, y subsecuentemente construir el “sentimiento promedio” del día. El puntaje se posiciona en una escala de números reales (-∞, +∞), en la que los valores positivos significan un “sentimiento promedio positivo”, los números negativos significan un “sentimiento promedio negativo” y el número cero significa un “sentimiento promedio neutral”. A continuación se presenta una tabla con palabras que ejemplifican el sistema de puntaje.

Análisis de sentimiento en palabras Negativas Puntuación Positivas Puntuación bastardo -5 excepcional 5

negro -5 magnífico 5 perro -5 asombroso 4

pinchazo -5 celestial 4 tragón -5 eufórico 4 puto -4.7 exuberante 4 burro -4 fabuloso 4

catastrófico -4 fantástico 4 culo -4 ganador 4

defraudador -4 gracioso 4