practicando análisis cibermétrico en redes de investigadores

12
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España. Revistas, autores y palabras clave: Un análisis cibermétrico Elwin Luis Huaman Quispe [email protected] Resumen El presente trabajo realiza un análisis cibermetrico de una red de investigadores, una red de revistas y una red de palabras claves, este análisis se realiza con carácter práctico y exploratorio. La metodología empleada en la cual se apoya este trabajo es la cibermetria el cual permite la obtención de medidas de densidad, grados de centralidad, grados de intermediación, grados de cercanía de los actores en general de los cuales se deducen el análisis de comunidades. Los resultados obtenidos de las redes analizadas se representan gráficamente para una mejor comprensión. Palabras Clave: Cibermetria, análisis de redes, pajek, gephi Créditos: Para realizar este trabajo, se ha revisado literatura científica de: F Sánchez-Pita, JL Alonso-Berrocal (2013): “Los sitios Web de centros de investigación biosanitaria de Castilla y León. Un análisis cibermétrico”, en Revista Latina de Comunicación Social, 68. La Laguna (Tenerife): Universidad de La Laguna, páginas 383 a 419, Retrieved April, 24 from http://www.revistalatinacs.org/068/paper/982_Salamanca/16_Sanchez.html 1. Introducción Desde siempre hay una preocupación por saber cuál es el comportamiento de las redes sociales, no solo en el ámbito del ciberespacio sino también en el ámbito de la sociedad, hoy en día y cada vez más existe un importante avance por comprender y analizar estas relaciones, para ello muchos investigadores emplean la Cibermetría para intentar comprender y desvelar este comportamiento, también cabe mencionar que este análisis parte del concepto de redes y este se aplica a todo los ámbitos de la humanidad en el que existan más de 1 participante. En este informe se pretende en concreto comprender y analizar desde una perspectiva practica el grado de relaciones que se tiene dentro de la red Author.net más que en las otras redes. Teniendo en cuanta la investigación como punto de partida, podemos decir que existe una estrecha relación dentro de los investigadores, es decir uno puede estar relacionado con otro o no lo puede estar, pero un investigador puede tener muchas relaciones así como tampoco las puede tener, entonces ahí nace la premisa de saber quién tiene más poder, mas relaciones, más comunicación dentro de la dimensión investigadora, es por eso que se necesita saber esta información porque a simple vista no se puede ver, para ello existe el análisis de redes. Una vez que comprendemos estos conceptos podemos hablar de medidas que nos dicen en qué grado mayor o menor es importante un investigador o que pasa si este investigador se va. Para muchas Universidades es muy importante el campo de la investigación, porque pueden mejorar sus objetivos si sabes esta información o quizá también tomar mejores decisiones. Por todo esto este informe pretende reforzar la capacidad práctica, de comprensión, análisis e interpretación. Todo esto bajo una perspectiva Cibermétrica así como su representación gráfica. 1.1. Justificación El presente análisis cibermétrico se fundamenta en el estudio y comprensión de medidas que ayuden la representación de los datos; Journal, Author, Keyword. Estas redes fueron proporcionadas por terceros, de los cuales se pudieron extraer los datos de los autores, las revistas y palabras claves. Por lo tanto el análisis cuantitativo que se pretende realizar se apoya completamente en la cibermetria y dentro de ello la posibilidad de analizar las comunidades que se han podido establecer. 1.2. Objeto y objetivos de la investigación Analizar bajo parámetros cibermetricos los datos; Journal.net, Author.net, Keyword.net proporcionadas por JL Alonso-Berrocal. Dicho esto se pretende desde una perspectiva cuantitativa obtener medidas cibermetricas y su respectiva representación gráfica, lo cual facilitara la comprensión. 1.3. Cibermetría y antecedentes El termino Cibermetría se definió por Shiri en 1998 y a partir de ello se establece otro aspecto a investigar en el ciberespacio. Hoy la Cibermetría centra su aplicación como una solución que aborda la explosión documental, basado en las conexiones y estructuras web. Y así

Upload: elwin-huaman-quispe

Post on 22-Jul-2015

143 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Page 1: Practicando análisis cibermétrico en redes de investigadores

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

Revistas, autores y palabras clave: Un análisis cibermétrico

Elwin Luis Huaman Quispe

[email protected]

Resumen

El presente trabajo realiza un análisis cibermetrico de una red de investigadores, una red de revistas y una red de palabras claves, este análisis se realiza con carácter práctico y exploratorio. La metodología empleada en la cual se apoya este trabajo es la cibermetria el cual permite la obtención de medidas de densidad, grados de centralidad, grados de intermediación, grados de cercanía de los actores en general de los cuales se deducen el análisis de comunidades. Los resultados obtenidos de las redes analizadas se representan gráficamente para una mejor comprensión.

Palabras Clave: Cibermetria, análisis de redes, pajek, gephi

Créditos: Para realizar este trabajo, se ha revisado literatura científica de: F Sánchez-Pita, JL Alonso-Berrocal (2013): “Los

sitios Web de centros de investigación biosanitaria de Castilla y León. Un análisis cibermétrico”, en Revista Latina de Comunicación Social, 68. La Laguna (Tenerife): Universidad de La Laguna, páginas 383 a 419, Retrieved April, 24 from http://www.revistalatinacs.org/068/paper/982_Salamanca/16_Sanchez.html

1. Introducción

Desde siempre hay una preocupación por saber cuál es el comportamiento de las redes sociales, no solo en el ámbito del ciberespacio sino también en el ámbito de la sociedad, hoy en día y cada vez más existe un importante avance por comprender y analizar estas relaciones, para ello muchos investigadores emplean la Cibermetría para intentar comprender y desvelar este comportamiento, también cabe mencionar que este análisis parte del concepto de redes y este se aplica a todo los ámbitos de la humanidad en el que existan más de 1 participante. En este informe se pretende en concreto comprender y analizar desde una perspectiva practica el grado de relaciones que se tiene dentro de la red Author.net más que en las otras redes.

Teniendo en cuanta la investigación como punto de partida, podemos decir que existe una estrecha relación dentro de los investigadores, es decir uno puede estar relacionado con otro o no lo puede estar, pero un investigador puede tener muchas relaciones así como tampoco las puede tener, entonces ahí nace la premisa de saber quién tiene más poder, mas relaciones, más comunicación dentro de la dimensión investigadora, es por eso que se necesita saber esta información porque a simple vista no se puede ver, para ello existe el análisis de redes. Una vez que comprendemos estos conceptos podemos hablar de medidas que nos dicen en qué grado mayor o menor es importante un investigador o que pasa si este investigador se va. Para muchas Universidades es muy importante el campo de la investigación, porque pueden mejorar sus objetivos si sabes esta información o quizá también tomar mejores decisiones.

Por todo esto este informe pretende reforzar la capacidad práctica, de comprensión, análisis e interpretación. Todo esto bajo una perspectiva Cibermétrica así como su representación gráfica.

1.1. Justificación

El presente análisis cibermétrico se fundamenta en el estudio y comprensión de medidas que ayuden la representación de los datos; Journal, Author, Keyword.

Estas redes fueron proporcionadas por terceros, de los cuales se pudieron extraer los datos de los autores, las revistas y palabras claves.

Por lo tanto el análisis cuantitativo que se pretende realizar se apoya completamente en la cibermetria y dentro de ello la posibilidad de analizar las comunidades que se han podido establecer.

1.2. Objeto y objetivos de la investigación

Analizar bajo parámetros cibermetricos los datos; Journal.net, Author.net, Keyword.net proporcionadas por JL Alonso-Berrocal.

Dicho esto se pretende desde una perspectiva cuantitativa obtener medidas cibermetricas y su respectiva representación gráfica, lo cual facilitara la comprensión.

1.3. Cibermetría y antecedentes

El termino Cibermetría se definió por Shiri en 1998 y a partir de ello se establece otro aspecto a investigar en el ciberespacio.

Hoy la Cibermetría centra su aplicación como una solución que aborda la explosión documental, basado en las conexiones y estructuras web. Y así

Page 2: Practicando análisis cibermétrico en redes de investigadores

2

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

poder determinar que documentos son más relevantes y tiene más valor respecto de los demás en función de las medidas establecidas en la Cibermetría.

2. Método

2.1. Planteamiento y metodología

Se empleó una metodología cuantitativa para obtener las medidas, índices, comunidades y su representación gráfica, Para nuestro caso se aplican a Autores, Revistas y Palabras claves.

2.2. Software utilizado

2.2.1. Pajek

Es un programa que permite el análisis y la visualización de redes mediante algoritmo (Pajek, 2014). Pajek permite el cálculo de las medidas como; Densidad, Diámetro, Grado de centralidad de entrada, Grado de centralidad de salida, Relación de nodos en función de la teoría Bow-Tie y su representación gráfica.

Las acciones realizadas con Pajek consisten en cargar los ficheros autor.net, journal.net, keyword.net, esto nos permitirá la obtención de las medidas y nodos representativos.

Para el proceso de representación de los gráficos se utilizó del algoritmo Fruchterman Reingold.

2.2.2. Gephi

Gephi es un programa que permite analizar redes y sobre todo está enfocado en su presentación gráfica, también nos permite calcular las medidas; Nodos con mayor grado de entrada, Nodos con mayor grado de salida, nodos con mayor grado de intermediación, Nodos con mayor grado de cercanía.

Debo mencionar que se ha encontrado problemas durante el desarrollo de su representación en redes grandes, puesto que la red Journals.net no puede procesarla.

2.3. Índices y medidas aplicables

2.3.1. Densidad

La Densidad mide la proporción de enlaces que existen entre las relaciones posibles de una red en concreto. Los valores varían entre 0 y 1, siendo mejor los cercanos a 1. También cabe mencionar el diámetro que es el número de clicks necesarios que se deben dar para llegar de un nodo en concreto al nodo más lejano.

2.3.2. Diámetro

Esta medida permite conocer el número de clicks necesario que se debe dar para llegar de un nodo en concreto al nodo más lejano.

2.3.3. Grado

El grado permite medir el número de enlaces directos que tiene un nodo que puede ser; grado de entrada o grado de salida.

2.3.4. Grado de Entrada

El grado de entrada o indegree, indica la cantidad de nodos que apuntan a este.

2.3.5. Grado de Salida

El grado de salida o outdegree, indica la cantidad de nodos a los que apunta este.

2.3.6. Grado de intermediación

También conocido como betweenness, este grado permite detallar que punto en concreto un nodo de la red se encuentra en una posición intermedia con respecto de la red. A mayor grado mejor. Es decir mide el número de veces que un nodo aparece en las rutas existentes en la red.

2.3.7. Grado de cercanía

Este grado es llamado también closeness, permite mostrar la distancia media de cada nodo con el conjunto de nodos que conforman la red, es decir un nodo con mejor capacidad para el envió y la recepción de información. A mayor grado mejor.

2.3.8. Pagerank

Esta medida determina la valoración de una página web a través del número de enlaces que recibe desde otras páginas y también por la importancia de las páginas que le enlazan.

2.3.9. Hubs-autoridades

Permite obtener información de cómo se dirigen las relaciones en sentido global. Los Hubs, son nodos de los cuales parten muchas relaciones es decir tiene un grado de salida mayor. Las Autoridades, son los nodos que reciben muchas relaciones, es decir que tiene un grado de entrada muy grande.

2.3.10. Comunidades

Nos permite hallar las redes de comunidades, para ello utiliza dos parámetros que son; La modularidad y el número de Clusters.

2.4. Representación gráfica de redes

Entendiendo un grafo como un conjunto de puntos y líneas que pueden determinar una dirección y/o camino y llegan a ser dirigidos o no dirigidos. (Sánchez-Pita & Alonso-Berrocal, 2013)

Page 3: Practicando análisis cibermétrico en redes de investigadores

3

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

Figura. 1. Grafo dirigido y no dirigido

Estas representaciones gráficas favorecen la visualización y la correcta interpretación de los datos, esta representación de los datos también permite su visualización por una matriz de adyacencia.

Para la representación gráfica de los grafos de los datos se utiliza el software Gephi, bajo la visualización del algoritmo Fruchterman & Reingold que permite la colocación de los nodos según su fuerza de repulsión.

Figura. 2. Algoritmos

Fuente: www.revistalatinacs.org

También cabe mencionar que para la representación y análisis de comunidades tendremos que utilizar el algoritmo Force Atlas.

Figura. 3. Algoritmo forcé Atlas

3. Resultados

3.1. Propiedades de las redes

Como bien dijimos en las medidas e índices, que la mejor densidad se acerca más a 1, sin embargo podemos apreciar que las tres redes; Author, Journal y Keywords tiene una densidad inferior a 0,30 lo que indica que se debería trabajar más en establecer las relaciones y comunicaciones entre sus distintos nodos.

Figura. 4. Densidad

Respecto del diámetro podemos mencionar que la red journal necesita de 37 pasos para llegar de un nodo.journal al nodo.journal más alejado.

Figura. 5. Diámetro de redes

3.2. Centralidad de las redes

El grado de centralidad indica cuanto más próximo a 0 es mucho mejor. Sin embargo podemos apreciar que todo el conjunto de redes oscila entre 0,57 y 0,60.

0,270,25

0,11

0,00

0,05

0,10

0,15

0,20

0,25

0,30

Author Journal Keyword

Densidad

6

37

10

0

10

20

30

40

Author Journal Keyword

Diametro

Page 4: Practicando análisis cibermétrico en redes de investigadores

4

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

Figura. 6. Centralidad de Entrada

Figura. 7. Centralidad de Salida

3.3. Representación gráfica de las redes

A continuación se representan gráficamente las

redes especificando su clasificación.

3.3.1. Grafos de Authors.net

En este grafo se puede apreciar al ID 13, que pertenece al autor BAR-ILAN, J con un grado de entrada de 247.

Figura. 8. Grado de Entrada

Figura. 9. Lista top 5 con mayor grado de entrada

En el siguiente grafico podemos apreciar al ID 333 que pertenece a SPINK, A con un grado de salida de 275.

Figura. 10. Grado de salida

Figura. 11. Lista top 5 con mayor grado de salida

En los siguientes gráficos podemos apreciar los grados de intermediación y cercanía.

0,58

0,57

0,60

0,55

0,56

0,57

0,58

0,59

0,60

0,61

Author Journal Keyword

InDegree

0,58

0,57

0,60

0,55

0,56

0,57

0,58

0,59

0,60

0,61

Author Journal Keyword

OutDegree

Page 5: Practicando análisis cibermétrico en redes de investigadores

5

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

Figura. 12. Grado de Intermediación

Figura. 13. Lista top 5 con mayor grado de intermediación

Figura. 14. Grado de Cercanía

Figura. 15. Lista top 5 con mayor grado de Cercanía

3.3.2. Grafos de Keywords.net

En este grafo se puede apreciar al ID 1, que pertenece al keyword RESEARCH con un grado de entrada de 585.

Figura. 16. Grado de Entrada

Figura. 17. Lista top 5 con mayor grado de entrada

En el siguiente grafico podemos apreciar al ID 445 que pertenece al Keyword PROGRAMMING con un grado de salida de 189.

Page 6: Practicando análisis cibermétrico en redes de investigadores

6

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

Figura. 18. Grado de salida

Figura. 19. Lista top 5 con mayor grado de salida

En los siguientes gráficos podemos apreciar los grados de intermediación y cercanía.

Figura. 20. Grado de Intermediación

Figura. 21. Lista top 5 con mayor grado de intermediación

Figura. 22. Grado de Cercanía

Figura. 23. Lista top 5 con mayor grado de Cercanía

3.4. Posicionamiento de las redes

A continuación se muestran listas top 5 con mejores valores, que indican el pagerank de los authors y Keywords respectivamente. Sin embargo estos datos son demostrativos y prácticos.

Page 7: Practicando análisis cibermétrico en redes de investigadores

7

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

Figura. 24. Authors, Lista Top 5 de Pagerank

Figura. 25. Keywords, lista Top 5 de Pagerank.

3.5. Análisis de comunidades

A continuación se presenta la representación gráfica de las comunidades que existen dentro de authors.net y dentro de keywords.net. Luego de su análisis.

3.5.1. Comunidades authors.net

En esta red se puede apreciar un grado de modularidad de 0,38 y 5 comunidades o cluster.

Figura. 26. Porcentaje de comunidades

Figura. 27. Comunidades

3.5.2. Comunidades keywords.net

En esta red se puede apreciar un grado de modularidad de 0,39 y 7 comunidades o cluster.

Figura. 28. Porcentaje de comunidades

Page 8: Practicando análisis cibermétrico en redes de investigadores

8

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

Figura. 29. Comunidades

3.6. Resumen

ÍNDICES AUTHOR JOURNAL KEYWORD

Vertices 405 2079 831

Lines 21742 537217 36654

Densidad 0,27 0,25 0,11

Diametro 6 37 10

InDegree 0,58 0,57 0,60

OutDegree 0,58 0,57 0,60

Betweenness 0,04 0,01 0,05

Closeness Input 0,58 0,54 0,50

Closeness Output 0,58 0,54 0,50

Hubs Authori 0,09 0,06 0,10

Modularidad 0,38 0,46 0,39

Cluster 5 7 7

4. Conclusiones

Luego del análisis cibermetrico realizado a las redes authors.net, journals.net y keywords.net se puede decir que el análisis se ha enfocado cuantitativamente, y que ha permite el cumplimiento de los objetivos. También se menciona lo siguiente:

Primero: de las 3 redes analizadas 1 es lista de autores, otra lista de revistas y la tercera es una lista de palabras clave, entonces los análisis no son comparativos, pero si apreciativos.

Segundo: la red journals.net tiene mejores relaciones ya que en las medidas de grado y densidad mantiene mejores valores respecto de los demás.

Tercero: El único autor que presenta mayor grado de intermediación y grado de salida es el ID 333 del autor Spink, A. debe ser considerado importante.

Cuarto: Basado en resultados podemos decir que la red de authors.net tiene una conectividad buena ya que contiene un valor de 6 en el diámetro de su red.

El presente trabajo se ha realizado como trabajo 2 de la asignatura: Gestión de contenidos y análisis de redes en entornos digitales del master en sistemas de información digital.

5. Bibliografía

Pajek. (2014). pajek [Pajek Wiki]. Retrieved April 24, 2014, from http://pajek.imfm.si/doku.php?id=pajek

Sánchez-Pita, F., & Alonso-Berrocal, J. L. (2013). Los sitios Web de centros de investigación biosanitaria de Castilla y León. Un análisis cibermétrico. doi:10.4185/RLCS-2013-982

6. Anexos

Los anexos considerados para el trabajo, son los siguientes:

Authors.gephi

Authors.net

Authros.paj

Journals.paj

Journals.net

Keyword.gephi

Keywords.net

Keywords.paj

También se incluyen las imagines para su mejor visualización a zoom completo:

Author Comunidades.png

Keyword Comunidades.png

Page 9: Practicando análisis cibermétrico en redes de investigadores

9

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

6.1. Anexo: Author comunidades

Page 10: Practicando análisis cibermétrico en redes de investigadores

10

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

6.2. Anexo: Keywords comunidades

Page 11: Practicando análisis cibermétrico en redes de investigadores

11

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.

Page 12: Practicando análisis cibermétrico en redes de investigadores

12

Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.