carrera de licenciatura en informÁtica trabajo final de grado olga gabriela arancibia vega profesor...
TRANSCRIPT
CARRERA DE LICENCIATURA EN INFORMÁTICA
TRABAJO FINAL DE GRADO
Olga Gabriela Arancibia Vega
Profesor Tutor: Lic. Pablo LenaProfesores Consultos:
Lic. Sally BursztynLic. Beatriz Steinberg
Una respuesta a la deserción en la educación superior argentina a través de la
minería de datos.
Propuesta:
Propuesta
Escenario Actual Altos niveles de deserción de los
estudiantes. Prevención: Predicciones Manuales
y Subjetivas. Tendencias para el Cambio
Conocimiento de las características del alumno.
Prevención: Detección temprana del desertante.
Escenario
Oportunidad
Minería de Datos
Bases de Datos
Herramientas
Modelos
Conocimiento
Válido
Novedoso
Útil
Comprensible
Predictivos
Descriptivos
Oportunidad
Entorno KDD
Preparación de
Datos
Minería de Datos
EvaluaciónInterpretación
Entorno KDD
Sistemas de
InformaciónPatrones Conocimiento
Incorporación a los Procesos del
Establecimiento
2. Aplicar Minería de Datos
1. Recopilar datos de los desertantes históricos
3. Identificar Patrones y Perfiles de Riesgo
4. Aplicar Acciones Preventivas
5. Medir los Resultados
Incorporación
Integración y Recopilación de Datos Evaluación Evaluación Técnica Evaluación Institucional
Minería de Datos Modelos Tareas Algoritmos
FASE0
FASE2
FASE3
FASE4
FASE1
Aplicación de las Fases del Proceso KDD
FASE0
FASE2
FASE3
FASE4
FASE1
Establecer los Objetivos Objetivos de la Institución Objetivos de Minería de Datos
Selección, Limpieza y Transformación de Datos
Fases
ConclusiónMinería de Datos Disminución de la deserción en la
educación superior argentina Herramienta eficaz y viable Soporte innovador Conocimiento
válido novedoso útil comprensible.
Conclusión
Futuras Líneas de Investigación Aplicar las técnicas de minería de datos en las
bases de datos de las instituciones de educación superior a: Conformación de comisiones de clases o grupos de
trabajo e investigación. Identificación de alumnos que cambian de carrera o
institución. Generación de una herramienta especializada en el
ámbito educativo. Adaptación de la curricula en las especializaciones o
materias optativas, investigando qué materias se toman juntas, o materias eligen los alumnos a continuación de otra.
Determinar los intereses de los potenciales alumnos para la oferta de nuevos cursos o carreras.
Futuras Líneas de Investigación
Caso de Aplicación
Caso de Aplicación
Escenario
0
50
100
150
200
250
1ro. 2do. 3ro. 4to.
Caso de Aplicación
37%
63%
Desertantes No Desertantes
Distribución de Abandono por Cuatrimestre Situación
1er Cuatrimestre
Año 2005
Escenario
Recursos PLATAFORMA
Microprocesador Pentium 4 de 2.8 Mhz. 512 Mb. de Memoria RAM, Disco Rígido de 40 GB Sistema Operativo Windows 2000 Server.
HERRAMIENTA: Weka
EQUIPO DE TRABAJO: Propio e Interno
Caso de Aplicación
Recursos
FASE 0
Caso de Aplicación
De la institución Bajar los índices de deserción para el
primer año, primer cuatrimestre. Incorporar DM a los procesos regulares
progresivamente. De minería de datos:
Modelo Descriptivo Identificar características de desertantes
anteriores. Modelo Predictivo
Detectar alumnos en riesgo.
Definir los Objetivos
Objetivos
Caso de Aplicación
Base de Datos Relacional
Campos utilizados
Provenientes de la Ficha de Inscripción + Baja
Seleccionados por los especialistas
FASE 1 Integración y Recopilación
Integración
Caso de Aplicación
FASE 2
Atributos Seleccionados y Modificados
Edad
Sexo
Estado Civil
Hijo
Trabajo
Deserto [si/no]
Vista Minable
Selección, Limpieza y Transformación
Selección
Caso de Aplicación
Minería de Datos - Agrupamiento
Archivo:Universo
(632)
Desertantes(233)
NoDesertantes
(399)Agrupamiento
AgrupamientoA: Casado | Sin Hijos | Varón | 40 a 46 años |Trabaja en el Área
B: Soltero | Sin Hijos | Varón | 18 a 25 años |Trabaja en otra Área
C: Soltero | Sin Hijos | Varón | 18 a 25 años |No Trabaja
A: Divorciado | Sin Hijos | Varón | 34 a 39 años |Trabaja en el Área
B: Divorciado | Sin Hijos | Mujer | 34 a 39 años |Trabaja en otra Área
C: Soltero | Sin Hijos | Mujer | 18 a 25 años |No Trabaja
FASE 3
39%
22%
17%
27%
18%
18%
Agrupamiento
Caso de Aplicación
Minería de Datos – Clasificación
Archivo:Universo
FASE 3
EDAD = 1825| SEXO = Varón: D | SEXO = Mujer| | TRABAJO = NT: ND| | TRABAJO = TA: D | | TRABAJO = TNA: ND…….. (etc.)
Árbol de Decisión Algoritmo C 4.5
Reglas de
Clasificación
Clasificación
Caso de Aplicación
Técnica
Cobertura (Recall)
Precisión
Institucional
Interpretación
Lenguaje
Simplicidad
FASE 4 Evaluación
- +Complejidad Creciente
Evaluación
Caso de Aplicación
Resultados
37%
63%
Desertantes No Desertantes
14%
86%
Desertantes No Desertantes
Situación1er
CuatrimestreAño 2005
Situación1er
CuatrimestreAño 2006
Resultados
Muchas Gracias
Fin