evaluaciÓn de competencias de los programas de la …
TRANSCRIPT
EVALUACIÓN DE COMPETENCIAS DE LOS PROGRAMAS DE LA FACULTAD DE
INGENIERIA DE LA PONTIFICIA UNIVERSIDAD JAVERIANA FRENTE A LAS
SOLICITADAS EN EL MERCADO LABORAL, POR MEDIO DE PROCESAMIENTO DE
LENGUAJE NATURAL
ÓSCAR GIOVANNI ESPINOSA LEÓN
SANTIAGO RODRÍGUEZ
DIEGO RICARDO SOLANO AVELLA
PONTIFICIA UNIVERSIDAD JAVERIANA
FACULTAD DE INGENIERÍA
MAESTRÍA EN ANALÍTICA PARA LA INTELIGENCIA DE NEGOCIOS
BOGOTÁ, D.C. COLOMBIA
2021
Contenido
Introducción ..................................................................................................................................... 4
Objetivos........................................................................................................................................... 5
General .............................................................................................................................................. 5
Objetivos Específicos ................................................................................................................... 5
1. Comprensión del Negocio ................................................................................................... 6
1.1. Objetivos de negocio ........................................................................................................ 6
1.1.1. Contexto ........................................................................................................................... 6
1.1.2. Criterios de éxito ............................................................................................................ 7
1.2. Evaluación de la situación ............................................................................................... 7
1.2.1. Inventario de recursos .................................................................................................. 7
1.2.2. Requerimientos y restricciones ................................................................................. 9
1.2.3. Riesgos y contingencias .............................................................................................. 9
1.2.4. Terminología .................................................................................................................. 10
1.3. Metas de minería de datos ............................................................................................. 10
1.4. Plan del proyecto.............................................................................................................. 10
2. Comprensión de los datos ................................................................................................. 11
2.1. Recopilación de datos .................................................................................................... 11
2.2. Descripción de los datos ................................................................................................ 11
2.3. Exploración de los datos ................................................................................................ 12
3. Preparación de los datos ................................................................................................... 12
3.1. Selección de datos ........................................................................................................... 12
3.2. Limpieza de datos ............................................................................................................ 12
4. Modelamiento ........................................................................................................................ 14
4.1. Construcción de Diccionarios ...................................................................................... 14
4.2. Modelo de Clasificación ................................................................................................. 27
4.3. Modelo de Clasificación (2 clases) .............................................................................. 29
4.4. Similitud Semántica ......................................................................................................... 31
5. Conclusiones ......................................................................................................................... 35
Bibliografía ..................................................................................................................................... 37
Anexo 1 – Terminología .................................................................................................................... 38
Anexo 2 – Plan del proyecto ............................................................................................................. 39
Anexo 3 – Corpus stopwords adicional ............................................................................................ 40
Anexo 4 – Frecuencias de palabras en ofertas laborales por carrera ............................................. 41
Anexo 5 - Muestra de Resultados Similitud Semántica .................................................................. 45
4 de 44
Introducción
El presente trabajo se realiza con la Pontificia Universidad Javeriana (PUJ) desde la
Secretaría de Planeación con relación al análisis de competencias que se encuentran en el
mercado laboral.
La Universidad busca adaptar las competencias de sus programas profesionales a las
buscadas por el mercado laboral, con el fin de preparar a los alumnos para su ejercicio
profesional y mantenerse a la vanguardia y ser atractivo para posibles estudiantes que
buscan nuevas tendencias en la educación profesional.
De acuerdo con lo anterior, la universidad espera identificar que tan alineados se
encuentran sus programas de pregrado, en la facultad de ingeniería, con las ofertas
laborales que se encuentran en plataformas del mercado laboral, tales como LinkedIn,
utilizando herramientas de procesamiento de lenguaje natural y medidas de similitud.
A partir de los resultados de la investigación, la universidad podrá tomar decisiones para el
ajuste o mantenimiento de sus programas con el fin de mejorar sus indicadores de
matrículas e incluso poder compararse contra programas similares ofrecidos por otras
universidades
5 de 44
Objetivos
General
Identificar las competencias más relevantes requeridas por el mercado laboral para los
programas profesionales de la facultad de ingeniería de la Universidad Javeriana, por medio
de web scraping en LinkedIn y procesamiento de lenguaje natural (NLP).
Objetivos Específicos
• Recolectar datos relacionados a las ofertas laborales publicadas por las empresas
en la red LinkedIn referentes a las ingenierías por medio de técnicas de web
scraping.
• Implementar herramientas de procesamiento de lenguaje natural que permitan
identificar las competencias requeridas por el mercado laboral para el área de
conocimiento de las ingenierías.
• Identificar las competencias claves ofrecidas por los programas de ingeniería de la
Universidad Javeriana, en su perfil del egresado, por medio de herramientas de
lenguaje natural (NLP).
• Evaluar la alineación entre competencias ofrecidas por el mercado laboral y las
ofrecidas por la Universidad Javeriana en sus programas de ingeniería, por medio
de métricas de similitud, tales como la semántica.
6 de 44
1. Comprensión del Negocio
1.1. Objetivos de negocio
1.1.1. Contexto
Las universidades a nivel internacional son entidades encargadas de desarrollar
habilidades y competencias profesionales en sus estudiantes, buscando mantenerse a la
vanguardia de las tendencias y conocimientos desarrollados a nivel técnico, así como los
requeridos por parte del mercado laboral. Si bien estas entidades tienen intereses
económicos, su principal objetivo es social al buscar contribuir con el desarrollo de un país
o una región por medio del desarrollo de conocimiento, la investigación y los procesos de
enseñanza.
Las Universidades continuamente se exponen a evaluaciones de reguladores, como el
Ministerio de Educación en el caso de Colombia, de pares dentro de los procesos de
acreditación de calidad del Sistema Nacional de Acreditación y evaluaciones de diferentes
rankings internacionales que en los últimos años se han convertido en referentes para la
toma de decisiones por parte de los estudiantes. A manera de ejemplo, el QS World
University Ranking evalúa anualmente Universidades a nivel mundial, utilizando los
siguientes criterios:
Reputación Académica (40%).
Reputación ante Empleadores (10%).
Ratio “Miembros de Facultad / Estudiante” (20%).
Citaciones en documentos de investigación (20%).
Ratio de estudiantes internacionales (5%).
Ratio de miembros de facultad internacionales (5%).
Cómo se puede ver, los dos primeros ítems están fuertemente relacionados con la
percepción de terceros frente a la calidad de la Universidad.
Estas diferentes evaluaciones les permiten a las universidades tener información clave para
la toma de decisiones frente a sus programas académicos, sin embargo, la oportunidad
puede no ser la mejor al generar resultados que en el mejor de los casos se actualizan de
forma anual. En este sentido, las universidades buscan desarrollar herramientas que le
permitan contar con información propia para la evaluación y toma de decisiones oportunas,
evitando que cambios en las tendencias, intereses o aspectos económicos, ambientales,
sociales, políticos, tecnológicos o regulatorios puedan generar una desactualización de sus
programas frente a lo requerido por estudiantes y mercado laboral.
En el caso particular de la Pontificia Universidad Javeriana, esta tiene como uno de los
principios que enmarcan su estrategia 2016 – 2021, el ser un referente a nivel nacional e
internacional con una perspectiva de innovación. Para cumplir con lo anterior, la
Universidad ha venido trabajando en programas que le permitan asegurar la cultura de la
excelencia, el fortalecimiento de la comunidad educativa, el desarrollo de su oferta
académica y el mantenimiento de la calidad.
7 de 44
Teniendo en cuenta lo anterior, la Universidad designó a la Vicerrectoría Académica como
principal responsable de establecer las políticas y principios que determinan la forma en
que se desarrollan tanto programas como proyectos al interior. Desde este nivel se toman
decisiones que permiten que la universidad mantenga su liderazgo y reconocimiento, al
ofrecer a los estudiantes y aspirantes, ofertas de educación que satisfagan sus expectativas
y las del mercado laboral para el cual se preparan.
La investigación de las competencias requeridas por el mercado laboral permite a la
Universidad evaluar la alineación de sus programas a las nuevas necesidades de la práctica
profesional, las nuevas tecnologías emergentes y las tendencias a nivel mundial. Así
mismo, permite crear nuevos programas manteniendo la percepción ante el mercado como
una Universidad innovadora y dinámica.
El proyecto propuesto para la obtención de ofertas laborales asociados a los programas de
la universidad y su procesamiento por medio de técnicas de procesamiento de lenguaje
natural busca aportar con el marco estratégico de la universidad, brindando información
valiosa en tiempo cuasi-real para la toma de decisiones en relación con los programas
académicos con el fin de mantener su relevancia y actualidad frente a lo requerido por las
empresas en el ejercicio profesional. En la medida en que se puedan implementar medidas
con la información obtenida, la universidad espera impactar indicadores clave de negocio
como el nivel de inscritos y matriculados, que será analizado en la siguiente sección.
1.1.2. Criterios de éxito
La construcción del modelo y el análisis de comentarios están encaminados a satisfacer
posteriormente los siguientes indicadores clave de desempeño (KPI) de la educación
superior relacionados con las nuevas inscripciones y admisiones por semestre:
• Tasa de cobertura en educación superior (TCED): Corresponde al porcentaje de
estudiantes matriculados en pregrado sobre el total de la población del país de 17 a
21 años en periodos anuales. (SNIES, 2020)
• 𝑇𝑇𝑇𝑇= 𝑇𝑇𝑇𝑇𝑇 𝑇𝑇 𝑇o𝑇𝑇𝑇𝑇𝑇 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑇𝑇 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇
𝑇𝑇 𝑇𝑇𝑇𝑇𝑇𝑇𝑇ó𝑇 𝑇𝑇𝑇𝑇𝑇 17 𝑇 21 𝑇ñ𝑇𝑇∗ 100
• Tasa de aceptación (TA): Corresponde al porcentaje de estudiantes que realizaron
la solicitud y fueron aceptados en la institución y se calcula de la siguiente manera:
• 𝑇𝑇= 𝑇ú𝑇𝑇𝑇𝑇 𝑇𝑇 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑇𝑇 𝑇𝑇
𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑇𝑇 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑇𝑇 𝑇𝑇
𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇∗ 100
1.2. Evaluación de la situación
1.2.1. Inventario de recursos
Nombre Rol Funciones
Fernando Uzcátegui
Jefe del proyecto. Coordinador Inteligencia Competitiva. Secretaría de Planeación. PUJ.
Especificar los requerimientos y
8 de 44
Nombre Rol Funciones
necesidades como cliente del proyecto
Juan Pablo Pájaro
Asesor trabajo de grado. CAOBA Brindar asesoría a nivel de negocio y técnico en los temas del proyecto.
Alexander Gotthard
Asesor trabajo de grado. Departamento administración
Brindar asesoría a nivel de negocio y técnico en los temas del proyecto.
Óscar Espinosa Analista de analítica de datos Desarrollar el proyecto de acuerdo a los requerimientos.
Santiago Rodríguez
Analista de analítica de datos Desarrollar el proyecto de acuerdo a los requerimientos.
Diego Solano Analista de analítica de datos Desarrollar el proyecto de acuerdo a los requerimientos.
Recursos de datos
La fuente de datos son las ofertas laborales en Linkedln enfocadas en las ingenierías que
tiene la universidad.
Recursos de Software
Los datos serán procesados con las siguientes herramientas de software:
• Python ejecutado en Google Colab, entorno de desarrollo en la nube, que permite escribir
y ejecutar código de Python con GPU basado en Jupyter Notebook.
(Colaboratory, 2020). También se escribe y ejecuta código Python en Visual Studio Code,
editor de código fuente de Microsoft (Microsoft, 2020).
• Microsoft Office 365.
Recursos de Hardware
Se cuenta con tres computadoras con las siguientes características generales:
• Intel® Core™ i5-7200U CPU @ 2.50GHz 2.50GHz
• Memoria RAM de 12 GB
• Tarjeta Gráfica de 2 GB
• Disco Duro de 1 TB
• Sistema operativo de 64 bits, Windows 10 Home
El hardware en la nube de Google Colab se gestiona dinámicamente (RAM de 0.75 GB
hasta 12.72 GB y Disco duro de 30.19 GB hasta 107.77 GB) con activación de GPU.
9 de 44
1.2.2. Requerimientos y restricciones
Requerimientos
Realizar el análisis de ofertas laborales y de las características de los egresados
de las carreras de pregrado de la facultad de ingeniería con procesamiento de
lenguaje natural.
Realizar diccionario de datos que contengan competencias blandas, técnicas y de
herramientas.
Ejecutar similitud semántica entre las ofertas de Linkedln y de las características de
los egresados de las carreras de pregrado de la facultad de ingeniería.
Restricciones
Sujeto a la cantidad de ofertas laborales por carrera encontradas en Linkedln en el
espacio de tiempo designado para su obtención y análisis.
1.2.3. Riesgos y contingencias
Riesgo Nivel de Ocurrencia Impacto Mitigación
Límites de descarga
de ofertas laborales
en Linkedln
ALTO ALTO Se utilizan
versiones trial para
descargar la mayor
cantidad de ofertas
posibles
Modelos no
alcanzan resultados
esperados
ALTO ALTO Se probarán
diferentes
algoritmos para
determinar la mejor
solución
Los equipos de
cómputo utilizados
en el proyecto fallen
MEDIO ALTO Se procederá al
mantenimiento del
equipo. En caso de
que persista el
daño, se solicitará
el acceso a un
computador de la
Universidad.
Retiro de algún
miembro del equipo
de trabajo
BAJO ALTO Analizar y validar
efectos en el
proyecto y
replantear alcance.
10 de 44
Riesgo Nivel de Ocurrencia Impacto Mitigación
Pérdida de la
información
trabajada.
BAJO ALTO Los datos,
documentos y
códigos se
almacenarán
constantemente en
el repositorio
asignado
1.2.4. Terminología
El glosario de términos del proyecto se encuentra en el Anexo 1.
1.3. Metas de minería de datos
Las metas de la minería de datos son las siguientes:
1. Extraer y limpiar las ofertas laborales de Linkedln.
2. Realizar diccionarios de competencias blandas, técnicas y de herramientas.
3. Aplicar similitud semántica a las ofertas laborales y a las competencias de
egresados de la universidad.
1.4. Plan del proyecto
1.4.1. Plan del proyecto. Ver Anexo 2.
1.4.2. Técnicas y herramientas de evaluación inicial Como aproximación inicial de las
técnicas y herramientas de la minería de datos utilizadas para el presente
proyecto serán las siguientes:
Uso de scraping para la extracción de datos de Linkedln.
El análisis descriptivo, de exploración y preparación de datos con NLP.
Para realizar la similitud semántica se utilizan dos librerías pertinentes para
dicha tarea: Word2Vec y Sematch.
La creación del modelo de clasificación basado en diferentes algoritmos.
11 de 44
2. Comprensión de los datos
2.1. Recopilación de datos
Para la recolección de los datos se realiza scraping sobre LinkedIn en el buscador de ofertas
laborales. Se realiza esta actividad sobre cada una de las áreas de la ingeniería en donde
la universidad cuenta con carrera de pregrado: ingeniería industrial, ingeniería de sistemas,
ingeniería civil, ingeniería electrónica, ingeniería mecánica, ingeniería mecatrónica,
ingeniería en redes y telecomunicaciones, bioingeniería. Estos datos son obtenidos en
archivos csv.
2.2. Descripción de los datos
A continuación, se presentan los campos que se obtienen de Linkedln al realizar el
respectivo scraping y descargándolos en archivos csv por cada carrera:
Campo Tipo Descripción
jobTitle String Título de la oferta
jobLocation String Ciudad donde se origina la oferta applicantsCount
Integer Cantidad de personas que han aplicado a la oferta
viewsCount Integer Cantidad de personas que han visto a la oferta jobPosterProfileUrl
String Url del perfil de LinkedIn que ingreso la oferta
postedAt Timestamp Fecha en que se ingreso la oferta a LinkedIn
appliesClosed String Indica si la oferta esta cerrada
applyUrl String Url externa de LinkedIn donde se puede aplicar a la oferta
jobDescription String Descripción de la oferta laboral
remoteAllowed String Si la oferta permite trabajo remoto
companyName String Nombre de la empresa que publica la oferta
companyUrl String URL de la empresa en LinkedIn
matchedSkills String Muestra habilidades requeridas para el empleo
jobFunctions String Áreas de la empresa donde se encuentra la oferta
jobIndustries String Industria a la que pertenece la empresa que publica la oferta
appliesClosedAt
Timestamp Fecha de cierre de la oferta
jobType String Tipo de jornada que aplica a la oferna. Ej: jornada completa
jobUrl String URL de la oferta en LinkedIn
jobImageUrl String URL del logo de la empresa que publica la oferta en LinkedIn
timestamp Timestamp Fecha en que se realiza la descarga de los datos
query String URL de la oferta en LinkedIn
12 de 44
Campo Tipo Descripción
error String Muestra si ocurre algún error con la descarga de los datos de la oferta
Se toma el campo “jobDescription” que contiene la información de las ofertas y que contiene
las habilidades, competencias y requisitos que se necesitan para ésta. Con esta información
se procede a verificar la cantidad de palabras que más se repiten para identificar lo que se
piden en las ofertas.
Cantidad de ofertas laborales encontradas en Linkedln relacionadas por carrera:
Carrera Cantidad Registros
Carrera Cantidad de Registros
Ingeniería de sistemas 844 Ingeniería Mecánica 174 Ingeniería industrial 780 Ingeniería Mecatrónica 46
Ingeniería civil 240 Ingeniería en redes y telecomunicaciones
72
Ingeniería electrónica 559
2.3. Exploración de los datos
Para la exploración de datos, con cada archivo de carrera, se hace una lectura de la
columna jobDescription. Con la información ahí contenida se procede a realizar el
procesamiento de lenguaje natural donde se tokeniza el texto, se normaliza, se lematiza y
se procede a hacer una eliminación de stopwords, a nivel de librería y a nivel de contenido
(se toman palabras que no generan un significado relevante en competencias y
habilidades).
En el anexo 3 se muestra el corpus de stopwords adicionales a los que trae la librería.
En el anexo 4 se muestran las gráficas de frecuencias de palabras por cada carrera
relacionada.
3. Preparación de los datos
En el presente ítem se describirá la preparación de los datos que es realizada para cada
una de las carreras y posteriormente proceder a ingresarlos a la fase de modelamiento.
3.1. Selección de datos
Los datos seleccionados son los que hacen referencia al texto del campo job_description
de cada uno de los archivos pertenecientes a cada carrera. Con la información contenida
ahí se pretende obtener las capacidades y habilidades que las ofertas laborales buscan en
sus candidatos.
3.2. Limpieza de datos
La información contenida en el campo “jobDescription” es tokenizada con el fin de tratar
cada palabra como un dato relevante dentro de la oferta laboral. Estos tokens son pasados
13 de 44
a minúscula para evitar que una misma palabra escrita con mayúsculas o minúsculas sea
considerado como diferente.
Palabra Minúscula (lower)
Diseño diseño
diseño diseño
DISEÑO diseño
Dado que en el texto obtenido en el campo “jobDescription” para cada uno de los datos de
las ingenierías mencionadas anteriormente tienen muchos conectores propios del idioma y
que por naturalidad se utilizan con gran frecuencia en dichos textos se procede a eliminarlos
del análisis de éstos. Se utiliza la librería nltk.corpus en Python con la función de stopwords,
tanto para el idioma español como en inglés (debido a que hay algunas ofertas que están
en este idioma), para eliminar estos conectores y demás palabras relacionadas que están
estandarizadas en esta función.
Sin embargo, se encuentra, adicionalmente, palabras que hace parte de las ofertas que,
aunque no son conectores ni pertenezcan al grupo incluido en la función stopwords, no
aportan a nivel de competencias y habilidades contenidas en las ofertas laborales. Por tal
motivo se construye un corpus con estas palabras que se eliminan de los datos para que
se pueda llegar a un resultado orientado al objetivo que se busca en cuanto a competencias
y habilidades. Este corpus se construye de forma iterativa debido a la gran cantidad de
palabras que se encuentran en las ofertas.
Frase Tokens Identificados
Diseños de carreteras
nuevas o la ampliación de
al menos un carril de
carreteras o vías urbanas
existentes.
Diseños carreteras
ampliación carril vías
urbanas.
Los tokens obtenidos son lematizados con el fin de llevar todas las palabras a su forma
normal, evitando que el uso de una forma flexionada haga que una misma palabra con
diferente conjugación sea tenida en cuenta como diferente.
Palabra Tiempo Lemma
Diseñará Futuro Indicativo Diseño
Diseñando Gerundio Diseño
Diseñó Pretérito perfecto Diseño
Diseñamos Plural presente indicativo Diseño
Teniendo en cuenta que existen habilidades que se componen de más de una palabra, es
importante reconocer esto para no tratar estas como palabras independientes; en este
sentido, después de haber realizado el preprocesamiento definido en los puntos anteriores,
se entrega un listado de tokens que deben ser tenidos en cuenta como uno solo.
Tokens Multi-Word Token
inteligencia inteligencia_artificial
artificial
14 de 44
Tokens Multi-Word Token
big big_data
data
plan
plan_maestro_producción maestro
producción
El preprocesamiento y limpieza realizado permite contar con la información definitiva para
proceder a aplicar modelos que permitan determinar cuáles son las habilidades requeridas
por el mercado laboral y las ofrecidas en los programas de la universidad javeriana en la
facultad de ingeniería dentro de su perfil del egresado.
En el anexo 3 se muestra el corpus obtenido con las iteraciones realizadas.
4. Modelamiento
4.1. Construcción de Diccionarios
Se requiere clasificar cada uno de los tokens identificados en la etapa de preprocesamiento
con el fin de clasificar cuales de estos corresponden a competencias y así mismo reconocer
si son competencias técnicas, blandas o herramientas. Con este fin y teniendo como
referencia las metodologías de Part-Of-Speech (POS), en donde se reconoce la categoría
gramatical de la palabra entre sustantivo, adjetivo, verbo, adverbio, pronombre, conjunción
e interjección, se procedió a construir un modelo de reconocimiento de entidades nominales
(NER). Dado que las competencias pueden corresponder a muchas categorías
gramaticales o combinación de estas, el modelo tradicional de POS no cumple con los
objetivos planteados por lo que se procede a construir un modelo propio como un
diccionario con 3 categorías, así:
Técnicas Blandas Herramientas
control_operacional manejar_crisis anaconda
plan_maestro_producción liderar uipath
machine_learning inteligencia_emocional tibco
... … ...
analítico_dato responsabilidad_social mongodb
minería_dato adaptabilidad_a_cambio swift
sistema_producción mejoramiento_continuo mapreduce
El diccionario cuenta con 419 elementos clasificados entre habilidades técnicas (205),
blandas (107) y herramientas (107). Este fue construido a partir de referentes teóricos tales
como el diccionario de competencias de Martha Alles1, referentes de herramientas técnicas
tales como el cuadrado mágico de Gartner, a partir de diversos programas de pregrado de
diferentes universidades a nivel nacional e internacional y a partir de ofertas laborales.
1 A
15 de 44
Teniendo en cuenta lo anterior, se procede a aplicar el modelo de NER construido a las
ofertas laborales de cada una de las carreras, lo que permite conocer cuáles son las
competencias solicitadas por el mercado laboral.
Para cada uno de los tokens (pre-procesados) de la oferta laboral se le asigna el tipo de
competencia que le corresponde, asignando la categoría que le corresponde de acuerdo
con el modelo NER diseñado o asignando la categoría ‘None’ cuando no corresponda con
una competencia.
A continuación, se presentan los diccionarios obtenidos para cada una de las carreras,
teniendo en cuenta las ofertas laborales:
Ingeniería Industrial
Blandas
16 de 44
Las principales habilidades blandas identificadas para ingeniería industrial corresponden a
trabajo en equipo, calidad, organización y liderazgo.
Herramientas
La herramienta más solicitada como prerrequisito en las ofertas laborales para ingenieros
industriales es conocimiento avanzado en Excel.
17 de 44
Técnicas
Las habilidades técnicas más solicitadas para ingenieros industriales son procesos,
estrategia y operación.
Ingeniería Electrónica
Blandas
Para los ingenieros electrónicos la habilidad blanda más solicitada es trabajo en equipo,
seguido de organización, calidad y liderazgo.
Herramientas
18 de 44
Las herramientas que son solicitadas en ofertas laborales para Ingenieros Electrónicos son
principalmente relacionadas con bases de dato en la nube, SQL, Java y Azure
Técnicas
19 de 44
El diseño, soporte, procesos, mantenimiento y bases de datos son competencias técnicas
relevantes en un ingeniero electrónico.
Ingeniería de Telecomunicaciones
Blandas
El trabajo en equipo, la organización y el liderazgo son habilidades clave identificadas en
las ofertas laborales para los Ingenieros de Telecomunicaciones.
Herramientas
Se buscan ingenieros electrónicos que manejen tecnologías en la nube, sql, programación
en C, Java y Python.
20 de 44
Técnicas
Las habilidades técnicas más buscadas en un ingeniero de telecomunicaciones son brindar
soporte, conocimientos en infraestructura, arquitectura y bases de datos. Adicionalmente
vemos que una habilidad requerida es un idioma como el inglés.
21 de 44
Ingeniería Mecánica
Blandas
El trabajo en equipo, la calidad y el liderazgo son las competencias blandas más buscadas
para ingeniería mecánica.
Herramientas
Excel, SAP y word son las herramientas exigidas en las ofertas laborales para ingenieros
mecánicos.
Técnicas
En las habilidades técnicas se buscan conocimientos en mecánica, mantenimiento,
procesos, construcción y operación.
22 de 44
Ingeniería Civil
Blandas
Para los ingenieros civiles se busca como habilidad blanda el trabajo en equipo, la calidad
y responsabilidad.
23 de 44
Herramientas
En ingeniería civil se pide conocimiento de excel, project y word como requisitos para
acceder a una oferta laboral.
Técnicas
Algunas competencias técnicas para ingenieros civiles son construcción, mecánica,
materiales y arquitectura.
Ingeniería Mecatrónica
Blandas
El trabajo en equipo, la organización y planificación son habilidades buscadas en las ofertas
laborales para ingenieros mecatrónicos.
24 de 44
Herramientas
Python, postgressql y java son las herramientas que las empresas que buscan ingenieros
mecatrónicos necesitan de acuerdo con las ofertas laborales.
Técnicas
Conocimiento en mecánica, automatización y mantenimiento son las habilidades técnicas
requeridas para un ingeniero mecatrónico.
25 de 44
Ingeniería de Sistemas
Blandas
26 de 44
Herramientas
En las ofertas laborales para la búsqueda de ingenieros de sistemas se solicita
conocimiento en Java, SQL y Oracle.
Técnicas
El diseño, soporte y bases de datos son habilidades técnicas buscadas en el mercado
laboral para un ingeniero de sistemas.
27 de 44
4.2. Modelo de Clasificación
Como una medida alternativa para la determinación de las habilidades más relevantes por
cada una de las carreras, se procedió a realizar un modelo de clasificación en donde, a
través de las palabras incluidas en una oferta laboral se pudieran determinar la carrera que
se está buscando.
Los tokens son convertidos en una matriz de ceros y unos, donde uno indica que en dicha
oferta laboral se encuentra la palabra y cero significa que la palabra no está presente. El
modelo se limita a 5.000 palabras para evitar la inclusión de palabras no significativas que
adicionalmente pudieran generar sobreajuste y demorar los tiempos de ejecución.
28 de 44
Se procede a realizar la clasificación con un modelo de regresión logística, teniendo en
cuenta que este permite extraer las variables que fueron más significativas para la
clasificación entre las carreras, obteniendo los siguientes resultados:
En la siguiente imagen la primera columna/fila corresponde a Ingeniería Electrónica, la
segunda Ingeniería Industrial, la tercera Ingeniería Mecatrónica, la cuarta Ingeniería
Mecánica, la quinta Ingeniería de Sistemas, y la sexta Ingeniería de Telecomunicaciones.
El resultado general del modelo es que se obtiene un accuracy de 65.10% sobre la base de
validación. Se puede ver que en las carreras en que se tienen un mayor número de casos
se obtiene un resultado sobresaliente en la clasificación de las ofertas laborales, mientras
en aquellos donde tiene un número más reducido de casos, el resultado baja
considerablemente.
Para contrastar el modelo, se utilizaron técnicas adicionales de clasificación, con el fin de
validar si el resultado obtenido con un modelo de caja blanca tenía un nivel de certeza
comparable con el de modelos de caja negra (la ventaja del modelo de caja blanca es la
posibilidad de extraer las variables/palabras que mejor clasifican), obteniendo los siguientes
resultados:
29 de 44
De los modelos contrastados, el que mejor resultado obtuvo fue el de Multinomial Naive
Bayes con un accuracy de 65.75% frente al 65.10% del modelo logístico. Dado el resultado
similar en los dos modelos, se procederá a realizar un modelo adicional, solo con las
carreras Ingeniería de Sistemas e Ingeniería Industrial, que son las dos con mayor número
de datos con el fin de validar si se obtienen mejores resultados y extraer los tokens más
significativos en cada caso.
4.3. Modelo de Clasificación (2 clases)
Se construye un modelo de clasificación con dos clases en donde cero corresponde a
Ingeniería Industrial y uno corresponde a ingeniería de Sistemas. Al correr un modelo de
regresión logística se obtienen los siguientes resultados:
30 de 44
El modelo de dos clases obtiene un incremento significativo en el accuracy, pasando a un
87.9%. Se realiza una nueva comparación con otros modelos para ver la capacidad
predictiva del presentado obteniendo lo siguiente:
Nuevamente el multinomial Naive Bayes obtiene el mejor resultado al generar un accuracy
de 88.2%, por lo que se procede a obtener los tokens más importantes para la clasificación
de cada clase:
Ingeniería Industrial
Ingeniería de Sistemas
31 de 44
Si bien se puede identificar que el modelo de clasificación permite obtener cuales son las
palabras más significativas para determinar si una oferta laboral corresponde a cierta
carrera, se puede ver que se necesita la disponibilidad de un alto número de ofertas
laborales para obtener resultados significativos; adicionalmente, algunas de las palabras
identificadas no corresponden directamente a competencias por lo que no en todos los
casos son útiles para el ejercicio de determinación de las competencias más solicitadas por
el mercado laboral.
4.4. Similitud Semántica
Dentro del procesamiento de los datos obtenidos se quiera buscar la similitud semántica
para verificar las relaciones a nivel de significado y/o concepto las competencias y
habilidades encontradas, es decir, determinar si las competencias encontradas en las
ofertas en Linkedln se relacionan, a nivel conceptual o semántico, a las competencias que
tienen los egresados de las carreras de la facultad de ingeniería [Similitud].
Para realizar esta similitud se realiza de maneras: la primera con la librería sematch [PyPI]
de Python y la segunda con la librería gensim [PyPI-gensim] que contiene los componentes
de word2vec. Los resultados obtenidos de la similitud van entre 0 y 1, cuando más cerca
de 1 esté quiere decir que están muy relacionados conceptualmente las palabras
comparadas. Más cerca de 0 implica que las palabras tienen muy poca o ninguna relación.
Con la librería sematch tiene como parámetros para el cálculo de la similitud las 2 palabras
a comparar. Sin embargo, la comparación está sujeta al corpus que trae internamente lo
que a veces los resultados pueden ser limitados de acuerdo con las palabras que contenga
dicho corpus.
Por otro lado, la librería gensim tiene los mismos parámetros de sematch, pero si puede
cargar un corpus diferente y entrenarlo para que pueda relacionar las palabras de una mejor
manera. Sin embargo, requiere que el corpus sea muy grande (archivos con más de
32 de 44
1.000.000 de registros, que pueden pesar varios gigabytes) para que el algoritmo, al
entrenarlos, den un resultado aceptable.
Se utilizaron para el proyecto 2 corpus: sbw_vectors.bin [Corpus-sbw] y cc.es.300.vec
[Corpus-cc]. Estos corpus, cada uno, contiene más del millón de registros, que al hacer uso
de ellos se evidencia que los resultados son mejores que en la librería sematch pero en
otros casos no. Al analizar estos casos se encuentra que estos corpus son generales al
idioma español, pero no tienen una orientación específica hacia competencias laborales, lo
que implica que algunos resultados no den tan altos como se esperaba.
El resultado obtenido para cada una de las carreras en donde se obtuvo un valor superior
a 0.5 se presenta a continuación:
Ingeniería Industrial
33 de 44
Ingeniería Mecatrónica
Ingeniería Electrónica
34 de 44
Ingeniería de Sistemas
Ingeniería Mecánica
35 de 44
Ingeniería de Telecomunicaciones
Ingeniería Civil
En el anexo 5 se muestran los resultados detallados obtenidos a manera de muestra debido
a que el tamaño de las tablas es grande.
5. Conclusiones
El análisis de ofertas laborales es una fuente importante para que las universidades puedan
evaluar aquellas competencias que se están requiriendo actualmente en el mercado laboral,
con el fin de anticiparse a tendencias y obtener información en tiempo cuasi-real para
determinar el posible ajuste en alguno de sus programas, ya sea por la necesidad de incluir,
36 de 44
ajustar o eliminar competencias técnicas, blandas o herramientas que hacen parte de los
núcleos de formación ofrecidos en sus programas.
Una de las técnicas utilizadas para este fin fue el de reconocimiento de entidades, el cual
permitió determinar para cada carrera cuáles son las competencias que más se repiten
dentro de las ofertas laborales, sin embargo es importante anotar que esta técnica puede
generar resultados sesgados en virtud de la base de datos entregada, por lo que se
recomienda construir una base de datos robusta que incluya las ofertas laborales de un
periodo amplio de tiempo para garantizar que los resultados no responden simplemente a
un fenómeno particular del momento de la observación.
Por otra parte, se utilizaron modelos de clasificación con el fin de determinar la posibilidad
de identificar la carrera solicitada en una oferta laboral a partir de las palabras incluidas en
la misma, buscando determinar si esas palabras que son relevantes para el clasificador
pueden ayudar a detectar las competencias relevantes de la carrera. El resultado fue
satisfactorio para carreras que presentan un número elevado de ofertas laborales,
generando niveles de accuracy superiores al 85%. Sin embargo, muchas de las palabras
obtenidas no corresponden directamente a competencias. El ejercicio sirvió para validar
algunas de las competencias identificadas por medio del reconocimiento de entidades, pero
se tuvo que hacer un proceso de eliminación manual de tokens para poder obtener las
competencias clave requeridas por el mercado laboral.
Por último, la similitud semántica permitió comparar las competencias identificadas en las
ofertas laborales con las ofrecidas por los programas de la Universidad Javeriana,
realizando una validación no solo de si la palabra se encontraba en los dos textos, sino
adicionalmente si una palabra con un significado similar podía encontrarse, cubriendo así
la posibilidad de encontrar las competencias descritas de una manera diferente.
Una posible mejora a los modelos presentados en el presente trabajo de investigación es
la de aplicar el modelo de clasificación utilizando únicamente las habilidades detectadas
por medio del reconocimiento de entidades, buscando eliminar desde el inicio palabras que
no corresponden a competencias. Adicionalmente, para la similitud semántica se pueden
probar con diferentes corpus para la librería de ‘gensim’ para validar si se pueden encontrar
mejores resultados.
37 de 44
Bibliografía
[PyPI], sematch-1.0.4. https://pypi.org/project/sematch/
[PyPI-gensim], gensim-4.0.1. https://pypi.org/project/gensim/
[Corpus-sbw]. Spanish Billion Word Corpus and Embeddings.
https://unipython.com/curso-de-procesamiento-de-textos-gensim/
[Corpus-cc]. Word vectors for 157 languages. https://fasttext.cc/docs/en/crawl-
vectors.html
[Similitud] Un modelo para detectar la similitud semántica entre textos de diferentes
longitudes.
https://www.rcs.cic.ipn.mx/2014_85/Un%20modelo%20para%20detectar%20la%2
0similitud%20semantica%20entre%20textos%20de%20diferentes%20longitudes.p
df
[Guide-Gensim]A Beginner’s Guide to Word Embedding with Gensim Word2Vec
Model | by Zhi Li | Towards Data Science. https://towardsdatascience.com/a-
beginners-guide-to-word-embedding-with-gensim-word2vec-model-5970fa56cc92
38 de 44
Anexo 1 – Terminología
NOMBRE DESCRIPCIÓN CRISP-DM Cross Industry Standard Process for Data Mining
NLP Natural Language Processing TA Tasa de Aceptación
TCED Tasa de Cobertura de la Educación Superior
39 de 44
Anexo 2 – Plan del proyecto Id Nombre de la tarea Duración
(días) Fecha inicio Fecha fin
1 Reunión entendimiento 1 29/01/2021 30/01/2021
2 ETAPA 1 - ENTENDIMIENTO DEL NEGOCIO
20 29/01/2021 05/03/2021
3 Determinar objetivos de negocio 1 01/02/2021 01/02/2021
4 Construcción del plan de proyecto 1 02/02/2021 02/02/2021
5 Evaluación de la situación actual 1 03/02/2021 03/02/2021
6 Determinar las metas de minería de datos
1 04/02/2021 04/02/2021
Extracción de los datos (parte 1) 20 05/02/2021 04/03/2021
7 Primera entrega 1 05/03/2021 05/03/2021
8 ETAPA 2 - BASE DE DESARROLLO MODELO
37 05/03/2021 16/04/2021
9 Extracción de los datos (parte 2) 20 08/03/2021 07/04/2021
10 Preparación de los datos 2 08/04/2021 09/04/2021
11 Análisis descriptivo de los datos 2 12/04/2021 13/04/2021
12 Segunda entrega 1 14/04/2021 14/04/2021
13 Margen de correcciones 2 15/04/2021 16/04/2021
14 ETAPA 3 - Construcción diccionarios 20 19/04/2021 14/05/2021
15 Extracción y exploración de los datos 10 1904/2021 30/04/2021
16 Preparación de los datos 5 03/05/2021 07/05/2021
17 Modelamiento y evaluación 5 10/05/2021 14/05/2021
18 ETAPA 4 – Similtud semántica 20 19/04/2021 14/05/2021
19 Modelamiento y evaluación 20 19/04/2021 14/05/2021
20 ETAPA 5 – Modelo clasificación 9 07/05/2021 21/05/2021
21 Selección de técnicas de modelamiento 1 07/05/2021 07/05/2021
22 Construcción del modelo 4 10/05/2021 14/05/2021
23 Modelamiento y evaluación 2 18/05/2021 19/05/2021
24 Evaluación del modelo 2 20/05/2021 21/05/2021
25 ETAPA 5 - CONCLUSIONES 7 24/05/2021 31/05/2021
26 Documentación final 7 24/05/2021 31/05/2021
40 de 44
Anexo 3 – Corpus stopwords adicional
41 de 44
Anexo 4 – Frecuencias de palabras en ofertas laborales por carrera
Ingeniería Civil.
42 de 44
Ingeniería electrónica.
Ingeniería Industrial
43 de 44
Ingeniería mecánica.
Ingeniería mecatrónica
44 de 44
Ingeniería de sistemas.
Ingeniería redes y telecomunicaciones.
45 de 44
Anexo 5 - Muestra de Resultados Similitud Semántica
Ingeniería civil
Ingeniería industrial
0 material confiabilidad proceso programación equipar actitud infraestructura diseñar organización calidad lógico productividad cadena simulación estrategia matemático liderar
exportación 0.2145 0.2364 0.1838 0.2332 0.1963 0.1025 0.2742 0.1611 0.2890 0.3261 0.1082 0.3364 0.1845 0.1051 0.2004 0.1192 0.0748
computación 0.2196 0.3854 0.1857 0.4707 0.2309 0.1097 0.4045 0.3529 0.2706 0.2225 0.3477 0.3214 0.1922 0.4822 0.2625 0.4762 0.1670
dinamismo 0.1876 0.3135 0.2534 0.1193 0.1885 0.2627 0.2513 0.2400 0.1423 0.2607 0.1782 0.4627 0.0067 0.1821 0.2068 0.1634 0.1977
jee 0.1955 0.0952 0.1399 0.0997 0.1311 0.1762 0.0453 0.1136 0.0872 0.1243 0.2838 0.1559 0.1263 0.1548 0.0850 0.2504 0.0764
respetar 0.1481 0.1920 0.1583 0.1832 0.2311 0.2344 0.1701 0.2541 0.1995 0.2335 0.1374 0.1217 0.1505 0.0067- 0.1693 0.0463 0.1978
automatización 0.2117 0.3828 0.3170 0.3714 0.3211 0.0632 0.4510 0.3525 0.2720 0.2985 0.3418 0.4864 0.1601 0.4514 0.2891 0.2344 0.1651
construcción 0.3458 0.3095 0.3736 0.3411 0.3256 0.2162 0.5537 0.4328 0.3062 0.2906 0.1722 0.2837 0.2356 0.2763 0.3005 0.1963 0.1344
químico 0.3007 0.1632 0.2468 0.0529 0.0557 0.0242 0.0506 0.1897 0.1356 0.0953 0.2617 0.1392 0.1401 0.1635 0.1055 0.5602 0.0577
soportar 0.2597 0.2642 0.1542 0.1677 0.2843 0.2119 0.2926 0.3142 0.1175 0.1959 0.1891 0.2363 0.1522 0.1942 0.1456 0.1142 0.2873
confianza 0.1939 0.4577 0.1824 0.0979 0.1097 0.4750 0.2596 0.1067 0.1989 0.3870 0.1278 0.3364 0.1180 0.1712 0.2681 0.1061 0.2706
sig 0.0413 0.1634 0.0787 0.0946 0.1032 0.0589 0.0799 0.0816 0.0603 0.0623 0.1773 0.2488 0.1049 0.1764 0.0931 0.1543 0.0997
analítico 0.2953 0.2405 0.3166 0.2045 0.0757 0.1067 0.0736 0.2336 0.1303 0.1633 0.4549 0.1870 0.0574 0.2769 0.1788 0.4173 0.0760
ibm 0.1856 0.1585 0.1594 0.2450 0.1904 0.0995 0.2216 0.1780 0.2146 0.1404 0.1647 0.1525 0.1842 0.1949 0.1762 0.2355 0.2135
instalación 0.3740 0.3125 0.3272 0.3505 0.3547 0.2184 0.6019 0.3918 0.3702 0.3543 0.1887 0.3143 0.2240 0.3646 0.3495 0.0780 0.1537
entrenador 0.1381 0.0853 0.1246 0.2313 0.1550 0.1648 0.1411 0.1496 0.0928 0.1162 0.0741 0.0937 0.1382 0.0775 0.1531 0.2632 0.3156
cloud 0.2195 0.2480 0.1308 0.2975 0.2396 0.0160 0.3210 0.2159 0.1931 0.1860 0.2016 0.2139 0.1316 0.3079 0.1972 0.1330 0.1028
innovación 0.2236 0.3436 0.2385 0.3119 0.1957 0.3262 0.4556 0.3693 0.3327 0.2980 0.3183 0.5456 0.1427 0.2905 0.4317 0.2657 0.2795
portugués 0.1152 0.1109 0.0875 0.1410 0.1412 0.0995 0.0830 0.0891 0.0205 0.1291 0.1237 0.0702 0.0366 0.0036 0.0781 0.2306 0.1108
sql 0.1746 0.2139 0.1665 0.3698 0.2022 0.0578 0.2097 0.1750 0.1741 0.1446 0.2741 0.1902 0.1295 0.3376 0.1580 0.2275 0.0575
estadístico 0.1760 0.2363 0.2122 0.1880 0.0336 0.0064 0.1334 0.1542 0.1413 0.1103 0.3312 0.1523 0.1182 0.3091 0.1499 0.4109 0.1542
46 de 44
Ingeniería Electrónica
Ingeniería de sistemas
Oferta/Carrera señalar robótico actitud comunicaciónliderazgo infraestructuradiseñar justicia
físico 0.159 0.335 0.225 0.205 0.247 0.224 0.152 0.141
arquitectura 0.229 0.134 0.272 0.260 0.231 0.443 0.371 0.248
planificación 0.155 0.122 0.248 0.322 0.356 0.507 0.383 0.250
dba 0.113 0.191 0.077 0.248 0.156 0.223 0.242 0.067
probabilidad 0.146 0.111 0.172 0.179 0.119 0.180 0.165 0.141
presión 0.129 0.186 0.341 0.272 0.333 0.198 0.092 0.251
calidad 0.155 0.102 0.255 0.298 0.186 0.392 0.238 0.263
logístico 0.099 0.200 0.070 0.226 0.316 0.410 0.189 0.111
nube 0.071 0.234 0.233 0.189 0.099 0.220 0.106 0.158
influenciar 0.250 0.180 0.304 0.301 0.346 0.162 0.383 0.202
ibm 0.123 0.258 0.100 0.237 0.273 0.222 0.178 0.197
instrumentación 0.154 0.341 0.278 0.201 0.123 0.331 0.294 0.096
computación 0.084 0.344 0.110 0.358 0.240 0.404 0.353 0.213
químico 0.147 0.235 0.024 0.084 0.120 0.051 0.190 0.003
angular 0.126 0.212 0.151 0.148 0.130 0.163 0.193 0.141
estrategia 0.204 0.162 0.480 0.367 0.417 0.444 0.329 0.239
spark 0.097 0.310 0.130 0.146 0.182 0.102 0.105 0.111
ws 0.108 0.153 0.085 0.195 0.167 0.112 0.094 0.138
robótico 0.038 1.000 0.172 0.121 0.225 0.178 0.337 0.097
responsabilidad 0.183 0.083 0.398 0.322 0.466 0.324 0.187 0.461
programación 0.117 0.223 0.218 0.368 0.290 0.392 0.298 0.128
47 de 44
Ingeniería Mecánica
Ingeniería Mecatrónica
Oferta/Carrera instalaciónliderar automatizacióndiseñar negociacióncomunicaciónproceso ético matemáticomanufacturarfísico robótico instrumentaciónoperación organizaciónmantenimientomecánico
sap 0.034 0.039 0.083 0.004 0.013 0.089 0.053 0.098 0.139 0.103 0.146 0.170 0.116 0.091 0.084 0.130 0.136
optimización 0.425 0.171 0.627 0.395 0.268 0.263 0.315 0.289 0.314 0.237 0.231 0.236 0.340 0.352 0.306 0.461 0.346
sql 0.257 0.057 0.369 0.175 0.126 0.217 0.167 0.177 0.227 0.193 0.173 0.209 0.241 0.212 0.174 0.212 0.212
presupuestar 0.231 0.193 0.339 0.435 0.170 0.120 0.204 0.269 0.191 0.233 0.105 0.171 0.167 0.220 0.157 0.323 0.175
calidad 0.354 0.100 0.298 0.238 0.186 0.298 0.253 0.222 0.059 0.274 0.216 0.102 0.269 0.236 0.342 0.358 0.165
c 0.244 0.085 0.160 0.092 0.156 0.233 0.192 0.102 0.215 0.224 0.129 0.049 0.103 0.264 0.210 0.255 0.101
mysql 0.291 0.066 0.374 0.210 0.141 0.234 0.192 0.201 0.195 0.206 0.169 0.223 0.226 0.199 0.119 0.172 0.158
project 0.206 0.140 0.211 0.240 0.106 0.051 0.141 0.118 0.167 0.184 0.124 0.287 0.156 0.123 0.125 0.118 0.233
estrategia 0.349 0.356 0.289 0.329 0.385 0.367 0.331 0.260 0.119 0.231 0.143 0.162 0.230 0.509 0.429 0.249 0.124
diseñar 0.392 0.369 0.353 1.000 0.187 0.191 0.186 0.254 0.264 0.521 0.152 0.337 0.294 0.203 0.175 0.253 0.326
mecánico 0.331 0.127 0.434 0.326 0.112 0.129 0.267 0.248 0.464 0.299 0.451 0.555 0.351 0.262 0.156 0.232 1.000
matemático 0.078 0.101 0.234 0.264 0.065 0.152 0.180 0.360 1.000 0.172 0.569 0.261 0.211 0.196 0.122 0.044 0.464
javascript 0.290 0.060 0.357 0.291 0.096 0.232 0.174 0.234 0.245 0.310 0.206 0.296 0.173 0.192 0.165 0.163 0.230
inglés 0.115 0.107 0.092 0.103 0.074 0.174 0.184 0.150 0.314 0.141 0.286 0.225 0.179 0.135 0.144 0.126 0.209
químico 0.187 0.058 0.170 0.190 0.120 0.084 0.247 0.253 0.560 0.244 0.482 0.235 0.199 0.200 0.136 0.083 0.460
confianza 0.120 0.271 0.146 0.107 0.296 0.290 0.182 0.210 0.106 0.064 0.244 0.115 0.108 0.184 0.199 0.227 0.113
programación 0.351 0.110 0.371 0.298 0.260 0.368 0.216 0.204 0.264 0.226 0.189 0.223 0.359 0.317 0.334 0.226 0.198
indicador 0.168 0.105 0.206 0.207 0.094 0.142 0.246 0.261 0.156 0.048 0.134 0.180 0.209 0.070 0.068 0.177 0.234
construcción 0.658 0.134 0.405 0.433 0.339 0.380 0.374 0.164 0.196 0.350 0.182 0.208 0.333 0.476 0.306 0.484 0.278
48 de 44
Ingeniería en redes y telecomunicaciones