sistema de informaciÓn de gestiÓn de procesos acadÉmicos apoyado con redes neuronales...

79
1 SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES HOLMES ELIAS PINTO AVILA ANDRES FELIPE GONZALEZ GALEANO UNIVERSIDAD POPULAR DEL CESAR FACULTAD DE INGENIERÍAS Y TECNOLOGÍAS PROGRAMA DE INGENIERÍA DE SISTEMAS VALLEDUPAR 2011-1

Upload: wlogia

Post on 28-Nov-2015

26 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

1

SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES

HOLMES ELIAS PINTO AVILA

ANDRES FELIPE GONZALEZ GALEANO

UNIVERSIDAD POPULAR DEL CESAR

FACULTAD DE INGENIERÍAS Y TECNOLOGÍAS

PROGRAMA DE INGENIERÍA DE SISTEMAS

VALLEDUPAR

2011-1

Page 2: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

2

SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS

APOYADO CON REDES NEURONALES ARTIFICIALES

HOLMES ELIAS PINTO AVILA

ANDRES FELIPE GONZALEZ GALEANO

Director

Ing. Norberto Díaz

UNIVERSIDAD POPULAR DEL CESAR

FACULTAD DE INGENIERÍAS Y TECNOLOGÍAS

PROGRAMA DE INGENIERÍA DE SISTEMAS

VALLEDUPAR

2011-1

Page 3: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

3

1. INTRODUCCIÓN

La utilización de las redes neuronales para el manejo y posterior estudio de los

procesos de información desarrollado en entorno web como una herramienta

interactiva de un Sistema de gestión de procesos académicos y financieros en

ambiente web para las instituciones de educación básica y media del municipio de

Valledupar, nace con la intención de innovar los métodos de almacenamiento de

registros utilizados de forma tradicional. Se pretende demostrar que la

implementación de estos modelos en las instituciones educativas ha de facilitar la

socialización de conocimientos.

Por otra parte, se ha producido un fuerte incremento en el conocimiento y la

aplicación de modernas técnicas econométricas y estadísticas que tiempo atrás

eran consideradas como sofisticadas y sólo al alcance de unos pocos. Nos

estamos refiriendo a las regresiones no lineales, el análisis estadístico

multivariante y en particular a las técnicas de minería de datos o data mining. La

aplicación de estas técnicas, utilizando las redes neuronales artificiales, está

contribuyendo a una significativa mejora de los trabajos y los resultados que se

desarrollan en el amplio campo de la investigación y, en muchos casos, han

supuesto nuevas formas de enfrentarse a problemas económicos tradicionales.

Sin embargo, cuando se trata de redes neuronales artificiales aplicado a la

educación se encuentran pocos trabajos realizados, por lo cual, este proyecto, se

convierten en un herramienta indispensables para promover un aporte científico a

la educación de hoy.

De igual forma, la creación de un software interactivo de administración de

información que permita la unificación de criterios de los docentes e incorporar en

Page 4: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

4

el proyecto educativo institucional los procesos y procedimientos de evaluación;

estrategias para la superación de debilidades y promoción de los estudiantes,

definidos por estos y/o el consejo directivo, después del análisis de la información

como referente principal de los procesos académicos diseñados y aplicados por

los docentes, que son los primeros en tomar las medidas para realizar actividades

académicas en la institución.

Mediante este proyecto, se hará un seguimiento estratégico por parte de la

Institución, el Docente, Los Padres de Familia a la información completa

generada por los estudiantes para consolidar o reorientar los procesos educativos

relacionados con el desarrollo integral. Esta experiencia de desarrollo es una

alternativa positiva, pues, permitirá integrar tecnología y conocimiento, en

inteligencia artificial utilizando las redes neuronales como apoyo a los modelos de

conocimiento e inferencia lógica.

Así, en los objetivos sociales del mundo educativo comprenden una amplia gama,

que persigue la reducción del fracaso escolar; el aumento del rendimiento

académico; la mejora en la calidad de la enseñanza (entendida como el acceso a

las nuevas tecnologías; instalaciones educativas; educación más personalizada y

métodos pedagógicos exitosos) y la igualdad de oportunidades educativas para

todos los alumnos.

El objetivo fundamental de esta Tesis es el de aportar nueva luz en torno a la

función de producción y la medición de la eficiencia escolar a partir del análisis no

lineal de una realidad tan compleja como la educativa. Este análisis no lineal será

llevado a cabo mediante un modelo basado en redes neuronales artificiales

(RNAs).

El propósito de este proyecto va encaminado a facilitar el aprendizaje y la

Page 5: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

5

captación total de la información con el fin de tener un mejor desempeño en la

práctica profesional, contribuyendo al mejoramiento del aprendizaje en los

procesos cognitivos que se realizan en la educación Básica y Media.

1.1. PLANTEAMIENTO DEL PROBLEMA

1.1.1 Descripción del problema

Los procesos de administración de la información en la educación han ido

evolucionando a lo largo del tiempo. Si bien, en la Universidad Popular del Cesar

se han presentado muchos proyectos con este perfil y ninguno de estos ha optado

por tomar las redes neuronales como aporte estructural y significativo que se

podría innovar al incorporarse un módulo dentro del sistema de gestión de

información académica apoyado por medio de redes neuronales artificiales que

permita conocer de primera mano los estados académicos, sociales y financieros

de los estudiantes, para resolver los problemas de deserción y bajo desempeño en

la institución educativa, como también un módulo de consulta psicológico que

permita el estudio de comportamiento del estudiante; además el estudio en línea

de los nuevos estudiantes con el fin de detectar sintomatologías de deserción

escolar, son inconvenientes que se pueden solucionar a la hora de desarrollar este

software.

En el pasado, los docentes, se apoyaban en informes periódicamente muy

limitados, y por otra parte el estudiante en obtener calificaciones cuantitativas; con

la llegada de las tecnologías digitales, la educación ha sufrido cambios en los

métodos y procesos de enseñanza dando paso a la masificación y uso de

recursos tecnológicos para el aprendizaje y el manejo de la información. En

consecuencia, el uso de la tecnología debe ser un factor fundamental en el

desarrollo del aprendizaje y una herramienta que ayude a construir e implementar

Page 6: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

6

un modelo de enseñanza más flexible. Sin embargo, los modelos actuales de

calificación son muy rígidos y no permiten tomar decisiones “inteligentes”, hacer

proyecciones estadísticas de alto nivel académico institucional, donde prime la

investigación y la construcción del conocimiento mediante unos recursos

tecnológicos. Igualmente, las Instituciones no cuentan con herramientas

tecnológicas adecuadas acordes al contexto global de los sistemas educativos de

hoy día, esto impide integrar nuevos recursos de aplicación libre, disponibles en la

red de Internet, útiles para la implementación de nuevas estrategias pedagógicas.

Así mismo, la falta de proyectos de innovación tecnológica en las instituciones de

educación básica y media, no ha permitido la transformación de nuevos ambientes

de aprendizaje, conservando el viejo modelo tradicional de clase en el aula.

De igual manera, el incremento en la población estudiantil en estas instituciones

dificulta el control y acompañamiento por parte del personal encargado de hacer

seguimiento al comportamiento de manera individual de cada estudiante, lo que se

traduce en actos de violencia, drogadicción, alcoholismo y otros más, que

repercuten negativamente en el mismo estudiante, en su núcleo familiar y desde

luego en la institución como ente responsable del proceso de formación.

Por otra parte, los estudiantes que han obtenido bajas calificaciones no cuentan

con sistemas de información automática que les alerte, les de orientaciones y a la

vez les brinde recursos didácticos tales como: ejercicios, talleres, auto-

evaluaciones, que apunten a reforzar el área de deficiencia identificada a través

del mismo sistema. Igualmente, los padres de familia no conocen de manera

actualizada, los estados académicos, sociales y financieros de su(s) hijo(s) en la

institución.

Por último, existe el problema de adaptación del software en las instituciones

Page 7: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

7

oficiales y no oficiales, ya que el Artículo 1290 estandariza para las instituciones

oficiales ciertos modelos educativos diferentes a los no oficiales, el desarrollo de

un software que permita adecuarse a estos modelos sin tener que realizar grandes

cambios en la plataforma suelen ser difícil de encontrar.

Todos estos inconvenientes dieron paso al querer desarrollar una plataforma

integral educativa que tiene como reto superar todos estos problemas presentados

en el mencionado proyecto.

1.1.2. Formulación del Problema

Para la formulación del proyecto se han planteado las siguientes preguntas:

¿Con la implementación de una plataforma en ambiente web de un sistema de

gestión de procesos académicos apoyado en las redes neuronales, mejorará el

nivel de aprendizaje de los estudiantes y a su vez ayudará al control académico,

social y financiero de las instituciones de educación básica y media del municipio

de Valledupar?

¿Son las redes neuronales artificiales una herramienta útil para un Sistema de

gestión de procesos académicos en ambiente web para instituciones de

educación básica y media del municipio de Valledupar?

1.2. OBJETIVOS

1.2.1. Objetivos Generales

Implementar un Sistema de Información de Gestión de Procesos Académicos

apoyado con Redes Neuronales Artificiales como estrategias pedagógicas de

Page 8: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

8

evaluación y predicción para el desempeño académico de los estudiantes de las

instituciones educativa de Básica y Media de Valledupar.

1.2.2. Objetivos Específicos

Desarrollar una plataforma educativa que permita mediante la gestión de una Base

de Datos, proporcionar información académica, social y financiera de los

estudiantes.

Generar por medio de las Redes Neuronales Artificiales, información que permita

implementar estrategias pedagógicas para la predicción y prevención en el

desempeño académico de los estudiantes.

Desarrollar un módulo que permita a la Institución diagnosticar sintomatologías de

deserción escolar por estudiante, apoyada en Redes Neuronales.

Implementar un módulo para el manejo estadístico que refleje el desempeño

académico para reorientar los procesos educativos relacionados con el desarrollo

integral en la Institución.

1.3. JUSTIFICACIÓN

La elaboración de un Sistema de Información de Gestión de Procesos Académicos

apoyado con Redes Neuronales Artificiales para instituciones de educación

básica y media del municipio de Valledupar, contribuye con el desarrollo de

experiencias y proyectos interdisciplinarios e innovadores apoyados en el uso de

herramientas tecnológicas y pedagógicas, para la formación integral del

estudiante. Por ello, este proyecto propone implementar los siguientes procesos

para el desarrollo integral del mismo:

Page 9: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

9

Realizar los procesos de inscripción, matricula, entrevistas psicológica a través

de la plataforma web.

Ingresar a la plataforma los logros cualitativos, calificaciones, asistencias,

estado de comportamiento.

Poder consular las notas, notificaciones, estados de pagos por parte de los

estudiantes y padres de familia.

Realizar procesos de carga académica para los docentes.

Identificar por medio del sistema las características personales, intereses,

ritmos de desarrollo y estilos de aprendizaje del estudiante para valorar sus

avances.

Proporcionar información básica para consolidar o reorientar los procesos

educativos relacionados con el desarrollo integral del estudiante a través de la

plataforma.

Suministrar información por medio de datos estadísticos que permita

implementar estrategias pedagógicas para apoyar a los estudiantes que

presenten debilidades y desempeños inferiores en su proceso formativo.

Determinar la promoción de estudiantes al final del año escolar.

Aportar información para el ajuste e implementación del plan de mejoramiento

institucional por medio de las proyecciones estadísticas utilizando las redes

neuronales.

Page 10: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

10

Los procesos anteriores permiten mejorar las condiciones académicas y

financieras de una entidad educativa, acompañada en algunos casos por la

inteligencia artificial como una alternativa innovadora para el proceso académico.

La implementación de las redes neuronales está implícita en la estructura interna

del software permitiendo mayor robustez a esta aplicación logrando de forma

inteligente administrar, analizar y sugerir mejores métodos para futuros trabajos

académicos.

La Inteligencia Artificial se ha aplicado considerablemente en la medicina y la

psicología, pero poco se ha hecho por evaluar sus efectos en la educación ,

permitiendo asegurar la calidad de un producto que esté al servicio de las

instituciones educativas en el municipio de Valledupar, entendiendo ésta como un

proceso sinérgico en que el alumno no sólo crece en conocimiento, sino como

persona integral, por ello la información se debe tratar como un ente prioritario

para el estudio de comportamiento y conductas académicas que permitan prever

factores como la deserción escolar, estilos de aprendizajes, entre otros.

1.4. DELIMITACION

1.4.1. Delimitación Espacio Temporal

Este proyecto se ejecutará en el territorio municipal, más específicamente en el

Colegio Gimnasio del Saber, Colegio Juvenil, Colegio Osvaldo Vergara, Colegio

San Antonio, cabe destacar que por ser un sistema basado en ambiente Web se

puede visualizar desde cualquier parte del mundo la información pública en el

Sitio.

1.4.2. Delimitación Conceptual

Page 11: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

11

La ejecución de este proyecto se limitará a la creación de un sistema que

administre los procesos académicos y administrativos de la institución así como

también la implementación de Redes Neuronales para el tratamiento de la Base

de Dato, el contenido será publicado en el Sitio Web, que permitirá la fácil y rápida

administración de dichos procesos, minimizando el tiempo de trabajo de cada uno

de los empleados en la Institución y también mejorando la calidad de servicio a los

estudiantes y padres de familia.

2. MARCO REFERENCIAL

2.1 ANTECEDENTES

La Implementación de un Sistema de Información de Gestión de Procesos

Académicos apoyado con Redes Neuronales Artificiales es un proyecto con un

enfoque innovador y de un contexto no explorado hasta el momento en la

Universidad Popular del Cesar ya que se conocen trabajos realizado para el

diseño e implementación de plataformas académicas en entorno web, que no

incluyen en sus estudios las redes neuronales artificiales, como por ejemplo:

“Desarrollo e Implementación de un Sistema Vía Web Para Los Procesos

Académicos Del Colegio Bilingüe Fisher Kids” de los autores: Diana Gutiérrez

Mercado, Lenin Nuñez Reales; “Construcción de Sitio Web Y Sistema De

Información para el Control de la Carga Académica en El Instituto Técnico

Del Norte Sede Valledupar” de los autores: Jaidy Laizaat Botello Rocha, John

Harold Díaz González; “Desarrollo e Implementación de un Portal Web

Educativo como Apoyo a los Procesos Educativos y Servicios de

Seguimiento Académico y Estudiantil En La Institución Educativa Técnica

Agropecuaria y de Participación Comunitaria Julio Cesar Turbay del

Municipio de el Carmen de Bolívar, Bolívar Colombia.” de los autores: Monica

Patricia Rodriguez Rada, Yuly Milena Amorocho Hernandez. Estos trabajo no

Page 12: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

12

contienen seguimientos detallados aplicados a la población estudiantil, por la

naturaleza compleja de la información, de la parte socioeconómica (sexo, edad,

estudios del padre, estudios de la madre, trabajo del padre, trabajo de la madre) y

académica, es por ello que, sin desmeritar los trabajos anteriores, nuestro

proyecto trasciende más allá de las fronteras del seguimiento académico y enfoca

sus estudios en las redes neuronales como aplicación para resolver soluciones

que otros autores se habían planteado pero que no se habían a atrevido a

desarrollar.

A nivel nacional no se conocen trabajo que aplique el estudio de las redes

neuronales a los objetivos propuesto en nuestra investigación.

Por otra parte, a nivel internacional se han presentados investigaciones como

“Predicción del Éxito en Estudios Universitarios Mediante Redes

Neuronales”, de los autores: Lourdes Molera Mª Victoria Caballero, con este

trabajo se pretende estudiar la posibilidad que tiene un alumno matriculado en la

Universidad de Murcia (en la licenciatura de Economía o ADE, o en la diplomatura

de Ciencias Empresariales) de finalizar con éxito sus estudios en un determinado

periodo de tiempo. Para ello, se construye una red neuronal a partir de información

acerca de sus características socioeconómicas y sus resultados académicos, y

otros para tener en cuenta es “Predicción del Rendimiento de los Estudiantes

y Diagnóstico Usando Redes Neuronales” de los autores: Zulma Cataldi,

Fernando Salgueiro, Fernando Javier Lage de la Universidad Tecnológica

Nacional. Facultad Regional Buenos Aires, este proyecto es aplicado a los

estudiantes que comienzan una carrera universitaria en sus evaluaciones

parciales y finales. Se toman los datos de las evaluaciones parciales y a partir del

análisis de los mismos se busca efectuar un diagnóstico con base en los errores

cometidos. De este modo, en función de los datos de los primeros exámenes se

podrán predecir errores futuros y dar sugerencias para realizar una ejercitación

Page 13: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

13

correctiva a fin de mejorar la producción. Para efectuar la predicción de los

próximos errores se usa una red neuronal y sobre esta base se le sugiere al

estudiante una secuencia de ejercicios y problemas a fin de mejorar su producción

y por lo tanto sus calificaciones. “Detección de alumnos de riesgo y medición

de la eficiencia de centros escolares mediante redes neuronales”. En este

trabajo, de aproximación a la tesis doctoral que el autor Daniel Santín González de

la Universidad Complutense de Madrid estaba elaborando en 1999, se utilizan las

redes neuronales para intentar solucionar empíricamente tres problemas

habituales en el campo de la economía de la educación: Detección de alumnos

con alto riesgo de fracaso escolar, evaluación de la eficiencia relativa de centros

educativos y evaluación de la eficiencia relativa de diferentes planes de estudio en

datos individuales de 7454 alumnos de enseñanzas medias de octubre de 1984

(1985) en 256 centros públicos y privados.

Por lo anterior, en la actualidad, no se encuentran estudios realizados en la

educación básica y media en Colombia que permitan aplicar las redes neuronales

artificiales como lo describen los objetivos del presente proyecto.

3. MARCO TEORICO

Debido a que es de vital importancia implementar una herramienta tecnológica

que permita identificar las características personales, intereses, ritmos de

desarrollo y estilos de aprendizaje, comportamientos financieros del Estudiante

para así valorar sus avances académicos y que le facilite a las instituciones

educativas la información necesaria para consolidar o reorientar los procesos

educativos relacionados con el desarrollo integral del Estudiante y la Institución

educativa, permitiendo de esta manera dar un aporte al plan de mejoramiento

institucional, para esto el estudio pretende desarrollar en dos etapas el presente

proyecto, describiendo en su orden, estas etapas de la siguiente manera:

Page 14: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

14

Desarrollo y puesta en marcha de los módulos Académicos y Financieros

de la Plataforma Educativa.

Implementación de las Redes Neuronales Artificiales a la Base de Datos de

la Plataforma Educativa.

3.1. Componentes que integran la Plataforma Educativa

El diseño del Sistema se basa en la premisa de disponer de una estructura

combinada de elementos de almacenamiento, acceso y análisis de la información

necesarios para dar solución a las necesidades planteadas. El proceso de

implementación ha consistido en cinco grandes fases (figura 1):

Análisis de las necesidades: Estudio de necesidades, usuarios y

posibilidades existentes para poner en marcha el Sistema de Información.

Diseño: Selección del hardware y herramientas necesarias.

Page 15: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

15

Diseño lógico: Transformación del modelo de Sistema a alto nivel interno;

define el sistema y soluciones a emplear en función del esquema seleccionado

anteriormente.

Implantación física: Implementación del diseño en la realidad.

Testeo: Realización de pruebas y uso en proyectos de investigación educativa

en desarrollo.

Estrategias de actuación: Acciones a emprender para mejorar el Sistema de

Información Académica y Financiera.

3.1.1. Análisis de las necesidades.

En este apartado del diseño es donde se dimensiona el Sistema de Información a

implantar, en función de las necesidades de los usuarios potenciales (las

Instituciones Educativas) y el cumplimiento de los objetivos a alcanzar durante la

realización del proyecto. Para constituir de estudio presentado se han analizado

los requerimientos y necesidades en función de los usuarios potenciales y

necesidades de gestión y procesamiento de información.

Usuarios potenciales: Usuarios internos del sistema: Administrativos y

estudiantes de las instituciones educativas. De la estimación del número de

usuarios potenciales y sus necesidades ha sido posible presuponer la

potencia requerida por el Sistema y el costo final a abordar, así como la

normalización de usuarios internos en los servidores y terminales.

Necesidades de gestión y procesamiento: Introducción, almacenamiento

y actualización de la información de forma rápida, coherente y eficiente a

Page 16: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

16

partir del estudio de las necesidades informativas, acceso, gestión y análisis

de los datos a partir de aplicaciones servidas.

Extracción de información a partir de la explotación de los datos

almacenados mediante salidas graficas, tabulares, etc.

3.1.2. Análisis de la información susceptible de ser introducida

Uno de los aspectos fundamentales a considerar en la Implementación un Sistema

de Información de Gestión de Procesos Académicos apoyado con Redes

Neuronales Artificiales es:

El análisis de los datos de interés

Disponibilidad de acceso

Estrategias de almacenamiento en función del modelo lógico de

almacenamiento

Debido al elevado número de datos que generan información espacial, este

apartado debe considerarse como un estudio preliminar de lo que será el núcleo

de la base de datos, abierto y susceptible de ser ampliado con nueva información.

Para ello se ha creado una Plataforma Educativa en entorno web basada en

MYSQL, PHP y utilizando técnicas de programación en AJAX, la implementación

de los aplicativos para las Redes Neuronales Artificiales aun son objetos de

estudios.

3.1.3. Diseño conceptual y lógico del Sistema.

Se ha optado por diseñar un Plataforma Educativa en entorno web a partir de una

Page 17: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

17

arquitectura cliente-servidor distribuida basada en un servidor de datos y

aplicaciones (uno con sistema operativo Linux y otro con Windows) a los que los

usuarios acceden a través de estaciones de trabajo Windows o Linux (equipos

para acceso al servidor pero con capacidad para trabajar de forma autónoma a

través de Internet Explore, Mozilla y otros exploradores) o terminales, equipos con

poca potencia utilizados para acceso mediante escritorios remotos al sistema.

3.1.4. Implementación física del Sistema

El Sistema propuesto se basa en un servidor (tabla 1), el cual se ha configurado

para una serie de tareas concretas:

Almacenamiento, gestión y servidor de los datos (desde los datos

propios de la Plataforma Educativa hasta copias de seguridad de los

usuarios)

Gestión de los usuarios.

Servidor de aplicación de acceso a la información

Servidor S.O Procesador Memoria RAM

Capacidad

PowerEdge T110

Sistema Operativo

Windows Server® 2008 R2, Foundation

Procesador

Intel® Xeon® X3440, 2.4 GHz, 8M Cache, Turbo

4GB de memoria (2x2GB), 1066MHz, Dual Ranked UDIMM

Uno de 500GB 7.2k RPM Serial ATA 3Gbps 3.5-in Cabled Hard Drive

Page 18: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

18

Tabla 1: Características técnicas del servidor

Figura 2: Servidor en torre PowerEdge T110

Dichos servidor, localizado bajo el dominio https://www.sinted.com es el núcleo del

Sistema implementado, dando cobertura a la totalidad de usuarios creados a partir

de un grupo de trabajo para Windows y Linux, considerado como la base de datos

espacial mas el conjunto de programas para gestión, visualización y explotación

de la información Académica. Esta Plataforma Educativa Proporciona los

siguientes servicios:

Sistema: Responde a parámetros que previamente el Administrador le

ingresa, contiene una interface visual indicando a los demás autores las

tareas que corresponde a cada uno de ellos.

Rector/Personal Administrativo: El Sistema le permite tener acceso a

todo los roles del aplicación.

Page 19: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

19

Administrador: Tiene acceso a toda la información, altera parámetros del

Sistemas.

Psicóloga: interactúa con el Sistema alimentando las fichas psicológicas

del los actores como el Estudiante e Inscritos, dando su aprobación para el

ingresos de estos a la institución.

Docente: aplica su modelo pedagógico e ingresa las notas al sistema,

asigna tareas a los Estudiantes, envía notificaciones a Padre de Familia,

corrobora con los datos estadísticos del Sistema su método de enseñanza,

consulta en forma grafica los datos estadísticos generados por el Sistema.

Auxiliar Administrativo: imprime todo tipo de certificados en formato PDF,

genera fichas de matriculas.

Estudiante: consulta sus notas, realiza encuestas, autoevaluaciones, ve

notificaciones.

Padre de Familia: recibe notificaciones de los Docentes, consulta saldo de

pensiones, verifica las notas del Alumno.

Inscritos: Realiza procesos de inscripción para el ingreso a la Institución.

Docentes y Estudiantes Antiguos. Se ingresan las referencias del

estudiante en cuanto sus datos personales, datos de los padres,

información laboral; como también se registran los docentes asignándoles

la carga académica esta incluye curso, aula y asignaturas que solo a él le

corresponden. A estos el Sistema le asigna un nombre de usuario y

contraseña para poder ingresar a la plataforma ubicada en la web.

Proceso de ingreso de desempeños y valorativos. Se describen a

continuación:

o Se asignan el rango cuantitativo a cada desempeño de los logros.

o Se ingresan periodos, el conceptos, valorativo de Logros, el Sistema

genera los códigos.

Page 20: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

20

o El docente ingresa las notas a los estudiantes correspondientes, El

sistema calcula los porcentajes y de acuerdo a la definitiva muestra

los logros de ese valorativo.

Asignación de Roles a los usuarios. A continuación en la figura No. 3 se

muestra los roles que cumplen cada usuarios.

Figura 3: Esquema del Asignación de Roles a los Usuarios del SINTED

3.1.5. Testeo

Realización de pruebas y uso en proyectos de investigación educativa en

desarrollo, con el fin de mejorar la Plataforma educativa y entregar un excelente

producto se hace necesario realizar pruebas al Sistema hasta lograr un nivel

óptimo.

Page 21: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

21

3.1.6. Estrategias de actuación

Acciones a emprender para mejorar el Sistema de Información Académica,

teniendo en cuenta la opinión de los usuario se tomaran las medidas pertinentes al

diseño para ello se pretende mejorar en lo posible el diseño de la interfaz de

usuario, la programación, y en algunos casos la entidad relacional de la base de

datos.

4. MARCO CONCEPTUAL

En el presente anteproyecto se darán a conocer los conceptos que los términos

involucrados en nuestro estudio:

4.1 ¿Qué es una Red Neuronal?

Una red neuronal artificial es un modelo interconectado cuyos elementos o nodos

simulan las funciones desempeñadas por las células cerebrales denominadas

neuronas, siendo capaces de aprender, memorizar un conjunto de patrones,

clasificarlos, inferir o generalizar a qué clase pertenece un nuevo objeto a partir de

la experiencia acumulada durante un previo entrenamiento, puede establecer

asociaciones entre objetos, siendo por tanto capaces de reconocer símbolos, tales

como letras, números o cualquier otro patrón u objeto. En consecuencia, el

reconocimiento de patrones es su principal aplicación. Además, las redes

neuronales artificiales muestran un comportamiento robusto como los circuitos

neuronales reales. Esto significa que una red neuronal es capaz de reconocer un

objeto previamente memorizado, incluso si dicho objeto se le presenta a la red

neuronal ligeramente distorsionado o acompañado de un cierto nivel de “ruido”.[1],

por ello, se pensó en la implementación de un Sistema que sea capaz de

reconocer y clasificar patrones conformados por desempeños cualitativos

Page 22: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

22

formadas por oraciones complejas y resumidas a valores de 1 o 0 en presencia o

ausencias de estos logros, esta clasificación se logra gracias a un valor

cuantitativo ingresado por el docente y de acuerdo a una escala valorativa la RNA

reconoce que logros debe asignar al estudiante, y a continuación llamar las tareas

o talleres si en realidad lo requiere el alumno. A pesar, que en este artículo se

toma solo un ejemplo puntual de la investigación y desarrollo de este, en su

contexto el Sistema es mucho más amplio en cuanto a sus niveles de aplicaciones

para todo el Sistema de Gestión de Procesos Académicos.

4.2. Un Poco de Historia

La inteligencia artificial (IA), entendida como el modelado y la simulación de las

actividades cognitivas complejas; percepción, memoria, solución de problemas,

etc. Que caracterizan a los organismos avanzados, y en particular a los seres

humanos se separó, tal y como señalan Waltz et al. (1988), casi desde su inicio en

dos ramas bien diferenciadas: Por un lado, se trató de modelar la actividad

racional compleja mediante sistemas formales de reglas y manipulación simbólica.

Esta es la rama más conocida de la IA, que se puede denominar simbólico-

deductiva, en donde se postulan una serie de reglas y el sistema resuelve los

problemas realizando deducciones sobre las reglas programadas. Las reglas Si-

Entonces le dicen al sistema cómo se debe reaccionar ante distintos estados. De

esta forma, un sistema experto es un método de representación y procesamiento

del conocimiento, mucho más rico y poderoso que un programa clásico de

ordenador. Sin embargo, con respecto al cerebro humano las limitaciones son

múltiples. Los problemas planteados en términos difusos o ambiguos son difíciles

de analizar con sistemas de procesamiento simbólico.

Page 23: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

23

Por otro lado, se desarrollaron modelos computacionales conexionistas inspirados

en las redes neuronales biológicas. Su principal característica es su inductividad,

ya que extraen la información necesaria para resolver un problema a partir de un

conjunto de ejemplos, sin necesidad de indicarle las reglas necesarias para

resolver dicho problema.

Si bien es mucho más conocida la aproximación simbólico-deductiva y su principal

aplicación: los sistemas expertos, (en general, sistemas basados en el

conocimiento), existe un considerable y renacido interés por los modelos

conexionistas. Los avances tecnológicos ofrecen, como ya ha sido apuntado,

recursos cada vez mayores para representar estructuras muy complejas y realizar

cálculos a gran velocidad y en paralelo, apoyando y fomentando la investigación

en este campo y sus aplicaciones a distintas áreas del conocimiento. En la tabla 3

se puede observar un resumen de las principales diferencias entre ambos

enfoques.

4.3 Organización del Cerebro humano y la Neurona

Las neuronas son células que forman el cerebro humano y animal. Con un tamaño

variable y comprendido entre 3 y 1.000 μ con células excitables al exhibir la

propiedad de transmisión de señales de una neurona a otra, ver tabla 3. Una de

las características más llamativa de una neurona es su organización,

distinguiéndose el soma o cuerpo celular, el axón y las dendritas. Si consideramos

un modelo general de neurona que incluya las características input y output de un

modelo, entonces las dendritas representan en la neurona las estructuras

responsables de la percepción de la señales de entrada u input. Una vez

procesada por la neurona las señales de entrada, la neurona producirá o no una

señal muy particular denominada potencial de acción. El potencial de acción, cuyo

Page 24: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

24

origen se sitúa en la unión entre el soma y el axón, es el resultado de un

fenómeno conocido como despolarización de membrana. Ver Fig. 4.

Fig. 4: Modelo general de una neurona.

Cada una célula individual que se relaciona, y por tanto se conecta con otras

neuronas, a través de una conexión muy particular llamada sinapsis. Por

consiguiente, una neurona de una célula en que el conjunto de sus actividades

están orientadas al procesamiento de las señales de entrada así como al

mantenimiento y modificación de las sinapsis. Esta ultima propiedad de la

sinapsis, la posibilidad de su modificación, es uno de los conceptos centrales del

presente artículo, ya que es precisamente el mecanismo celular en que se basa el

aprendizaje de nuestras redes neuronales. Si modificamos la sinapsis, es decir si

cambiamos la calidad de las conexiones entre neuronas, entonces la facilidad o

dificultad con la que se transmiten las señales entre neuronas cambian, y por tanto

la respuesta o output de un circuito neuronal a las señales de entrada.

Page 25: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

25

Actualmente, salvo en operaciones simples de cálculo aritmético, el cerebro

humano es superior a cualquier ordenador. Las principales características del

cerebro son su robustez y paralelismo masivo, ya que su funcionamiento no se ve

alterado ante cambios de pequeña importancia, y su flexibilidad, ya que se adapta

con rapidez a entornos cambiantes y, además, puede tratar con información

ambigüa o incompleta. Como se verá más adelante, la propiedad del cerebro

humano más buscada en las RNAs es la capacidad de aprender de la experiencia

y generalizar a partir de ella.

4.4 Las Redes Neuronales Biológicas

Se estima que el cerebro humano está compuesto por más de cien mil millones de

neuronas interconectadas de forma variable y compleja. Su especial forma de

trabajo le convierte en el dispositivo más versátil y eficaz para procesar todo tipo

de información procedente del mundo real.

En la figura 4 se puede ver la representación esquemática de dos neuronas

biológicas.

En el cuerpo de la célula o soma se localiza el núcleo de la misma. De este soma

se extienden fibras en forma de árbol llamadas dentritas, que son receptoras de

impulsos procedentes de otras neuronas. También del soma sale una única y muy

larga fibra llamada axón, que transporta la señal procesada por la neurona al

exterior. El axón se subdivide arborizándose en más fibras denominadas

ramificaciones axionales. Al final de éstas se encuentran las uniones sinápticas o

sinapsis, que constituyen los puntos de conexión con las dentritas de otras

neuronas. Una neurona recibe información de miles de otras neuronas y a su vez

envía información a miles de neuronas más. La transmisión de una señal de una

neurona a otra en la sinapsis es un proceso químico altamente complejo (figura 4).

Page 26: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

26

El proceso comienza cuando la neurona transmisora libera neurotransmisores,

especialmente iones de sodio y potasio, en la sinapsis. Su misión es incrementar,

(si la neurona es excitadora), o decrementar (si es inhibidora), el potencial

eléctrico del soma de la neurona receptora y su efecto puede ser más o menos

intenso en función de la cantidad de neurotransmisores liberados. Las señales

excitadoras e inhibidoras recibidas por una neurona se combinan en el soma y, en

función de la estimulación total recibida, la neurona toma un cierto nivel de

activación. Si esta activación supera un determinado nivel umbral, se traduce

enviando breves pulsos, o potencial de acción, de una determinada fuerza y

duración a lo largo del axón. Se dice entonces que la neurona se ha activado.

Estos pulsos viajan por el axón hasta alcanzar las sinapsis con otras neuronas

desde donde el proceso se repite otra vez. No todas las sinapsis son iguales y por

tanto, no todas tienen el mismo efecto sobre la neurona receptora ya que algunas

señales son más fuertes que otras. Otro factor que importa a la hora de activar

una neurona es el número de conexiones que recibe.

Aunque todavía se desconoce mucho sobre la forma en que el cerebro aprende a

procesar la información, las teorías actuales sobre el aprendizaje nos dicen que su

efecto en el cerebro resulta de la modificación de las conexiones o sinapsis entre

neuronas, lo que unido al procesamiento de información de la neurona determinan

el mecanismo básico de la memoria, [Arbib, 1995]. Este mecanismo de

modificación de los pesos sinápticos se produce en el tiempo por medio de la

experiencia del sujeto y se realiza aumentando o disminuyendo el número de

neurotransmisores liberados en determinadas sinapsis ante un mismo estímulo.

Así, una neurona cuyo potencial antes no lograba alcanzar el umbral, ahora sí lo

hace y se activa, y viceversa, otra que antes se activaba ahora puede que no lo

haga y así la respuesta que el individuo da ante una misma situación real sea bien

distinta, decimos entonces que hemos aprendido. Normalmente el aprendizaje

Page 27: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

27

requiere además de un maestro que indique como realizar bien una tarea. Tras un

proceso de ensayo-error el individuo es capaz de realizar correctamente una tarea

que antes no era capaz de resolver.

4.5. Elementos y Organización de una red Neuronal Artificial

Las neuronas artificiales o como comúnmente se llaman nodos o elementos

procesadores, se reúnen en capas. En una red neuronal artificial hay al menos dos

capas. En primer lugar, y en contacto con el mundo exterior; se encuentra la capa

de entrada, esta recibe información de entrada: las características de un objeto,

una letra, un número, un perfil sicológico con ciertos rasgos, unas características

académico, familiar. En segundo lugar una vez concluido el procesamiento de la

información de entrada en la red neuronal, el resultado es enviado hacia la capa

de salida, también en contacto con el mudo exterior, y cuyas neuronas suministran

la información de salida.

4.6. Algunas ventajas e inconvenientes de las redes neuronales.

Tras esta aproximación al mundo de las redes de neuronas parece conveniente

resaltar someramente algunas de sus ventajas e inconvenientes respecto a otras

técnicas estadísticas y econométricas:

No necesitan ser programadas; son capaces de aprender a partir de

ejemplos reales mediante la adaptación de los pesos.

No hace supuestos acerca de la distribución de las variables

independientes y por tanto permite la introducción de variables continuas y

categóricas lo cual resulta una importante ventaja frente al análisis

discriminante que supone distribución normal multivariante.

Page 28: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

28

La red permite realizar transformaciones no lineales lo que es una ventaja

frente a los modelos de regresión y análisis discriminante múltiple

tradicionales a la hora de llevar a cabo clasificaciones ya que puede

generar superficies de decisión arbitrariamente complejas.

La principal desventaja de las redes de neuronas son por un lado la

imposibilidad de determinar cómo se procesa internamente la información y

por otro su incapacidad para contrastar el modelo.

A continuación se muestra una tabla comparativa del cerebro humano y un

computador:

CEREBRO COMPUTADOR

Unos 100.000 millones de unidades de proceso.

Una unidad de proceso.

Cientos de operaciones por segundo. Millones de operaciones por segundo.

Precisión aritmética muy escasa. Precisión aritmética absoluta.

Paralelismo masivo. Operaciones en serie.

Lógica difusa. Lógica rígida.

Memoria de tipo asociativo y almacenada de forma dispersa.

La información se guarda en posiciones de Memoria de acceso directo.

Tolera fallos (muerte de neuronas). Los pequeños fallos (averías) son críticos.

Maneja todo tipo de información, incluso sujeta a incertidumbre, en poco

Sistemas altamente especializados con capacidad para procesar información

Page 29: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

29

tiempo pero no necesariamente con exactitud.

muy concreta, siguiendo instrucciones dadas.

Tabla No. 2 Comparaciones entre el Cerebro y un Computador

4.7 Aplicabilidad técnica de las redes neuronales a los problemas

propuestos

El ejercicio empírico que desarrollamos a continuación aplica la técnica de las

redes neuronales a los problemas propuestos. Estos problemas podrían ser

afrontados con las técnicas de clasificación estadísticas y econométricas

tradicionales (análisis discriminante y regresión logística). No es el objetivo de este

estudio llevar a cabo comparaciones entre las distintas técnicas capaces de

aportar soluciones; existen distintos estudios empíricos que ratifican la mayor

fuerza predictiva de las redes (véase Bonilla, M. y Puerta, R. (1997). En general

pensamos que para aplicaciones prácticas lo ideal sería aplicar varias técnicas y

complementar los resultados de unas y otras de forma que las predicciones

resulten lo más eficientes posibles.

Como se mencionó anteriormente, el reconocimiento de las RNA es adquirido por

medio de un aprendizaje. Se distinguen tres tipos de aprendizajes: supervisado,

no supervisado y por refuerzo. El primero, y en el que se basa nuestro estudio,

consiste en aprender una función a partir de ejemplos de sus entradas y sus

salidas. Para ello se enumeran tres componentes:

Una proyección directa de las condiciones del estado actual a las acciones.

Un método para inferir las propiedades relevantes del mundo a partir de una

secuencia de percepciones.

Page 30: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

30

Información sobre de cómo evoluciona el entorno y sobre los resultados de las

posibles acciones que el sistema pude llevar a cabo.

Cada uno de estos componentes puede aprenderse con una realimentación

apropiada. Consideremos, por ejemplo, un Sistema entrenándose para convertirse

en supervisor de bajas calificaciones. Cada vez que perciba una calificación por

debajo de un rango “menor que x”, x es igual a un número menor o igual a 10, el

Sistema puede aprender una regla condicional-acción que le indique cuando

asignar conceptos pertenecientes al rango, esto es indicado en el componente 1.

Informando que ciertos patrones lógicos pude reconocerlos como síntomas básico

de un bajo, medio o alto desempeño académico, aprendiendo a reconocer esos

patrones (componente 2). Realizando acciones y observando sus resultados

puede aprender las consecuencias de sus acciones (componente 3).

En el caso (componente 1) del ejemplo anterior, el Sistema aprende la regla

condición - acción para asignar conceptos, esto es, una función que a partir del

estado genera una salida booleana (asignar o no un concepto). En el caso

(componente 2), el sistema aprende una función que a partir de un patrón genera

una salida booleana (enviar una tarea al alumno o no). En el caso (componente 3),

aprende una función que a partir del estado y las acciones de asignar tareas

genera una labor pedagógica de ayuda académica. Nótese que tanto en los casos

(componente 1) y (componente 2), el docente suministra el valor correcto de la

salida de cada ejemplo; en el tercero, el valor de salida proviene de lo que el

Sistema percibe. En entornos totalmente observables, como es este caso, el

Sistema siempre puede observar los efectos de sus acciones, y por lo tanto,

puede utilizar métodos de aprendizaje supervisado para aprender a percibirlos.

Por el contrario, en entornos que son parcialmente observables, el problema es

más difícil, ya que los efectos más inmediatos pueden ser invisibles.

Page 31: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

31

4.8 Definición y conceptos básicos de las Redes Bayesianas

Una red bayesiana es un grafo a cíclico dirigido y anotado que describe las

distribución de probabilidad conjunta que gobierna un conjunto de variables

aleatorias.

Sea U =X1,X2, ...,Xn un conjunto de variables aleatorias .Formalmente,

una red Bayesiana para U es un para B = <G, T > en el que:

G es un grafo a cíclico dirigido en el que cada nodo representa una de las

variables X1, X2, ...,Xn, y cada arco representa relaciones de dependencia

directas entre las variables. La dirección de los arcos indica que la variable

„apuntada‟ por el arco depende de la variable situada en su origen.

T es un conjunto de parámetros que cuantifica la red. Contiene las probabilidades

PB(xi|xi) para cada posible valor xi de cada variable Xi y cada posible valor xi de

Xi, donde éste último denota al conjunto de padres de Xi en G.

Así, una red bayesiana B define una distribución de probabilidad conjunta única

sobre U dada por:

𝑃𝐵 𝑋1 ,𝑋2 ,…,𝑋𝑛 = 𝑃𝐵 𝑋 𝑖 | 𝑋𝑖 1 𝑛𝑖=1

Es importante observar que la topología o estructura de la red no sólo proporciona

información sobre las dependencias probabilísticas entre las variables, sino

también sobre las independencias condicionales de una variable o conjunto de

ellas dada otra u otras variables. Cada variable es independiente de las variables

Page 32: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

32

que no son descendientes suyas en el grafo, dado el estado de sus variables

padre.

La inclusión de las relaciones de independencia en la propia estructura del grafo

hace de las redes bayesianas una buena herramienta para representar

conocimiento de forma compacta (se reduce el número de parámetros

necesarios). Además, proporcionan métodos flexibles de razonamiento basados

en la propagación de las probabilidades a lo largo de la red de acuerdo con las

leyes de la teoría de la probabilidad. La figura5 muestra cómo representar un

clasificador Naive Bayes en forma de red bayesiana.

Figura 5: Grafo de un clasificador de Naiv e Baye s

Esta red captura la suposición fundamental de Naive Bayes: todos los atributos Ai

(hojas del árbol) son independientes entre sí conocida la clase C, por lo que no

existen arcos entre los atributos s y existe un arco del nodo raíz a cada uno de los

atributos.

La figura 6 presenta un ejemplo concreto de una red bayesiana que representa un

cierto conocimiento sobre Educación. En este caso los nodos representan

Page 33: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

33

síntomas de deserción escolar y factores que la causan. Como ya se ha

mencionado, la variable a la que apunta un arco es dependiente de la que está en

el origen de éste. Por ejemplo, desconcentración depende de deserción y

embarazo.

Figura 6: Ejemplo de red bay esiana con algunos de sus parámetros

Pueden observarse las suposiciones de independencia acertadas por la red, por

ejemplo, reacciones es condicionalmente independiente de económico, embarazo,

desconcentración y Falta de Interés (nodos no descendientes de reacciones) dado

deserción (su único nodo padre).Es decir, se observa en la red que:

P(R|E,DESER,EMBA,DESC,F)=P(R|DESER) donde R es reacciones, E es

economía, DESER es deserción, EMB es embarazo, DESC es desconcentración,

y F es falta de Interés.

Page 34: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

34

Se han representado también los parámetros de probabilidad condicional

asociados a algunos de los nodos de la red. La tabla P (Econ) guarda los valores

de probabilidad a-priori de economía; P (DESER|Econ) la probabilidad de

deserción dada economía; y P (desc|deser,emba) la probabilidad de

desconcentración dados deserción y embarazo. Nótese que, en este caso, para

guardar los parámetros no es necesario mantener las tablas completas, ya que las

variables estudiadas son binarias, por lo que para cada una sólo sería necesario

conservar los valores de una fila. Teniendo en cuenta que el tamaño de las tablas

de parámetros crece exponencialmente con el número de padres de un nodo, es

conveniente observar distintas técnicas para reducir el número de parámetros

necesarios. Una forma de reducirlos es empleando los denominados modelos

canónicos, entre los que pueden mencionarse:

Modelo de interacción disyuntiva (Noisy OR).

Modelo de interacción conjuntiva (Noisy AND).

Compuerta Max (Noisy Max gat e).

Compuerta Min (Noisy Min gat e).

Los modelos no pueden aplicarse indiscriminadamente, sino que dependen de la

naturaleza de las relaciones, y por tanto del dominio. El más común es el Noisy

OR, que se aplica cuando varias causas pueden ocasionar un efecto cada una por

sí sola, y la probabilidad del efecto no disminuye si se presentan varias de ellas.

Por ejemplo, en el modelo de la figura se puede aplicar cuando varios casos de

deserción pueden producir el mismo síntoma. En este caso sólo se especificaría

un parámetro por cada nodo padre (por ser los padres binarios), en vez de 2n,

siendo n el número de padres. En el caso de la figura 5, en lugar de la tabla

P(desc|deser,emba) podría aplicarse Noisy OR y guardar únicamente las

probabilidades correspondientes a P (desc | deser =Si) y P(deser | emba =Si).

Page 35: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

35

4.9 Inferencia

A partir de una red ya construida, y dados los valores concretos de algunas

variables de una instancia, podrían tratar de estimarse los valores de otras

variables de la misma instancia aplicando razonamiento probabilístico.

El razonamiento probabilístico sobre las redes bayesianas consiste en propagarlos

efectos de las evidencias (variables conocidas) a través de la red para conocer las

probabilidades a posteriori de las variables desconocidas. De esta forma se puede

determinar un valor estimado para dichas variables en función de los valores de

probabilidad obtenidos.

Cuando se conocen los valores observados para todas las variables de la red

excepto para una, obtener una estimación para ésta es inmediato a partir de la

fórmula de la distribución de probabilidad conjunta de la red.

En un caso más general interesaría obtener una estimación del valor de alguna

variable dados valores observados para un subconjunto de todas las restantes. En

general, una red puede usarse para calcular la distribución de probabilidad para

cualquier subconjunto de variables dados los valores de cualquier subconjunto de

las restantes.

La solución exacta de esta forma de inferencia es, en general, un problema NP-

duro Incluso el uso de soluciones aproximadas resulta ser en ciertos casos NP-

duro, aun que en la práctica estos últimos resultan eficientes en muchos casos.

Existen diferentes tipos de algoritmos propuestos, que se aplican dependiendo de

la topología del grafo y de si obtienen la probabilidad de una sola variable objetivo

o de todas las desconocidas. No es objetivo de este anteproyecto entrar en

Page 36: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

36

detalles sobre los distintos algoritmos. Una breve taxonomía de los algoritmos más

conocidos sería la siguiente:

Un variable, cualquier grafo:

Algoritmo de eliminación. Cualquier variable, estructuras

sencillamente conectadas (árboles, poli árboles).

Algoritmo de propagación de Pearl.

Cualquier variable, cualquier grafo:

Agrupamiento (junction tree), simulación estocástica, acondicionamiento.

El mecanismo de inferencia sobre redes bayesianas permite utilizarlas para

construir clasificadores. Para ello, se ha de construir una red bayesiana en la que

clase y atributos sean las variables interrelacionadas en el grafo. La clase

corresponderá a la variable desconocida, objetivo de la inferencia. Dada una

instancia cual quiera para la que se conozcan todos sus atributos, la clasificación

se efectuará infiriendo sobre el grafo la probabilidad posterior de cada uno de los

valores de la clase, y seleccionando aquél valor c que maximice dicha

probabilidad. Nótese que si se emplea una red no restringida se elimina el bias

introducido por la suposición de independencia del clasificador Naive Bayes.

4.10 Aprendizaje de redes bayesianas

Durante mucho tiempo las redes bayesianas se construyeron a mano a partir del

conocimiento de expertos. La pregunta a plantearse a continuación es la siguiente:

¿pueden inducirse a partir de conjuntos de datos clasificadores basados en redes

Page 37: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

37

bayesianas? Si no se restringe la topología de las redes inducidas, ¿pueden

obtenerse clasificadores mejores que Naive Bayes?

El problema del aprendizaje bayesiano puede describirse informalmente como:

dado un conjunto de entrenamiento D =u1,u2,...,uN de instancias de U,

encuéntrese la red B que se ajuste mejor a D. Típicamente, este problema se

divide en dos partes:

Aprendizaje estructural: obtener la estructura de la red.

Aprendizaje paramétrico: conocida la estructura del grafo, obtener las

probabilidades correspondientes a cada nodo.

4.10.1. Aprendizaje paramétrico

4.10.1.1 Datos completos

El aprendizaje de los parámetros es simple cuando todas las variables son

completamente observables en el conjunto de entrenamiento. El método más

común es el llamado estimador de máxima verosimilitud, que consiste

sencillamente en estimar las probabilidades deseadas a partir de la frecuencia de

los valores de los datos de entrenamiento, de forma análoga a como se hace en

NaiveBayes.

La calidad de estas estimaciones de penderá de que exista un número suficiente

de datos en la muestra. Cuando esto no es posible se puede cuantificar la

incertidumbre existente representando la mediante una distribución de

probabilidad, para así considerar la explícitamente en la definición de las

probabilidades. Habitualmente se emplean distribuciones Beta en el caso de

Page 38: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

38

variables binarias, y distribuciones Dirichlet para variables multi valuadas. Esta

aproximación es útil cuando se cuenta con el apoyo de expertos en el dominio de

la aplicación para concretar los valores de los parámetros de las distribuciones.

Si existen variables de tipo continuo la estrategia más habitual es aplicar

discretizarlas antes de construir el modelo estructural. Existen algunos modelos de

redes bayesianas con variables continuas, pero están limitados a variables

gaussianas relacionadas linealmente. Es posible también efectuarla discretización

mientras se construye el grafo de la red, si éste se aprende utilizando el principio

MDL como medida de ajuste.

4.10.1.2. Datos incompletos

A parecen mayores dificultades cuando los datos de entrenamiento no están

completos. Pueden plantearse dos tipos de información incompleta:

Valores faltantes: faltan algunos valores de uno o varias variables en

algunos ejemplos.

Nodo oculto: faltan todos los valores de una variable.

El primer caso es más sencillo, y existen varias alternativas, entre estas:

Eliminar los ejemplos con valores ausentes.

Considerar un nuevo valor adicional para la variable: “desconocido”.

Considerar el valor más probable a partir de los datos de la misma en

las de más instancias.

Considerar el valor más probable en base a las demás variables.

Page 39: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

39

Las dos primeras opciones son habituales en problemas de aprendizaje, y válidas

siempre y cuando se cuente con un número elevado de datos completos. La

tercera opción viene a ignorar las posibles de pendencias de la variable con las de

más, cuando ya se cuenta con la estructura que las describe en el grafo; no

siempre proporcionar los mejores resultados.

La cuarta técnica se sirve de la red ya conocida para inferir los valores

desconocidos. Primero se rellenan las tablas de parámetros usando todos los

ejemplos completos. Después, para cada instancia incompleta, se asignan los

valores conocidos a las variables correspondientes en la red y se propaga su

efecto para obtener las probabilidades a posteriori de las no observadas. Entonces

se toma como valor observado el más probable y se actualizan todas las

probabilidades del modelo antes de procesar la siguiente instancia incompleta.

La aparición de nodos ocultos requiere un tratamiento más complejo. Existen

diferentes técnicas para estima las probabilidades faltantes en este caso. Una

habitual es la aplicación del algoritmo EM (Expectation Maximization), cuya

aplicación ya se ha estudiado en la asignatura en el contexto de las técnicas de

agrupamiento. Su aplicación al aprendizaje de parámetros se traduce en lo

siguiente:

Asignar valores aleatorios(o basados en conocimiento experto, si se

dispone de él) a las probabilidades desconocidas de la red.

Utilizar los datos conocidos para estimar desconocidos infiriéndolos sobre el

modelo con las probabilidades actuales.

Completar el conjunto de datos con los valores estimados y volver a

calcular las probabilidades de la red a partir de ellos.

Repetir los dos pasos anteriores hasta que no hay a cambios significativos

en las probabilidades.

Page 40: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

40

Se destaca que existe cierta similitud entre el aprendizaje de la red bayesiana

cuando existen nodos ocultos y el aprendizaje de pesos en las capas ocultas de

un perceptrón multicapa en el que se conocen los valores de entrada y salida para

cada ejemplo, pero ningún valor para los elementos de proceso intermedios.

Basándose en esta idea se propone una técnica de gradiente similar a la usada en

el algoritmo de retro propagación. La técnica trata de maximizar la probabilidad

de los datos de entrenamiento conocida la hipótesis P(D | h),considerando como

espacio de hipótesis el conjunto de todas las posibles combinaciones de valores

para las probabilidades que parametriza la red. Para ello, sigue el gradiente de

lnP(D|h) con respecto a las probabilidades de la red, actualizando cada parámetro

Wijk desconocido de forma iterativa con el incremento:

𝑤𝑖𝑗𝑘 = 𝑤𝑖𝑗𝑘 + 𝑘. 𝑃 𝑥𝑖𝑗 ,𝜋𝑖𝑘 𝑑

𝑤𝑖𝑗𝑘𝑑𝜖𝐷

(2)

Donde Wijk es el parámetro desconocido correspondiente a la probabilidad

condicional de que la variable Xi tome el valor X ij cuando sus padres i toman los

valores ik, y k es una tasa de aprendizaje. En cada iteración las probabilidades Wijk

se renormalizan tras el incremento.

Tanto el algoritmo EM como el de gradiente ascendente encuentran soluciones

que son sólo óptimas localmente, por lo que en ambos casos la calidad del

resultado de penderá de la asignación inicial de las probabilidades desconocidas.

4.10.3. Aprendizaje estructural

El aprendizaje estructural conlleva explorar un espacio de grafos. Esta tarea es

muy compleja. A poco que se incrementa el número de variables (nodos), el

Page 41: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

41

número de posibles grafos a construir con ellas se dispara. Por eso en muchos

ocasiones se restringe el espacio de búsqueda a grafos con características

concretas. Existen muchos algoritmos específicos para el aprendizaje de redes

donde G se limita a un árbol, o aun poli árbol, o a otras estructuras menos

generales.

No obstante, existen técnicas para aprender redes con estructuras generales.

Trabajar sin restricciones debería permitir, idealmente, construir redes que ajusten

mejor al conjunto de entrenamiento, por complejas que sean las dependencias

entre los atributos.

Hay dos aproximaciones básicas al aprendizaje de redes sin restricciones. La

primera de ellas reúne métodos que exploran las relaciones de dependencia

existentes entre pares, tripletas u otros subconjuntos de variables para elegir la

forma en que deben conectarlas. El estudio de esas relaciones requiere establecer

un a criterio cuantitativo para medir la de pendencia entre variables, y es dicho

criterio el que guía la construcción de la red. Un ejemplo de algoritmo que se

engloba en esta familia de técnicas es el de construcción de TAN de Friedman y

Goldz Smith.

Dicho algoritmo crea una red con una topología restringida, pero el principio que

guía la construcción es el mismo, una medida de información mutua que cuantifica

la relación entre las variables.

La otra aproximación habitual al aprendizaje de redes consiste en realizar una

búsqueda guiada por una medida global de calidad. Nótese que en la

aproximación anterior el criterio guía es local, se aplica a subconjuntos reducidos

de variables, no a toda la red. En esta otra aproximación, la operación general

Page 42: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

42

consiste en generar distintos grafos mediante un algoritmo de búsqueda y aplicar

a cada uno de ellos una función de medida de calidad para decidir qué grafo

conservar en cada paso.

Existen muchos algoritmos que siguen esta técnica, definidos a partir de la

combinación de dos elementos:

Algoritmo de búsqueda

Medida global de ajuste

Es habitual emplear algoritmos de búsqueda heurística. Intentar una búsqueda

exhaustiva por todo el espacio de grafos es sencillamente intratable. Algunas

posibilidades son las técnicas de ascenso de colinas (hillclimbing), algoritmos

genéticos, búsquedas bidireccionales, etc...Otra opciones aplicar una búsqueda

voraz. Se comienza con una red vacía y se aplican sucesivas operaciones locales

mejorando de forma maximalla medida de ajuste hasta que se encuentra un

óptimo local. Las operaciones aplicadas incluyen la adición, borrado e inversión de

arcos.

También hay muchas medidas de ajuste. Dos habituales son la medida bayesiana

y el principio de mínima longitud de descripción.

La medida bayesiana trata de maximizar la probabilidad de la estructura dados los

datos de entrenamiento P(Bs|D).Como el objetivo de la medida es comparar el

valor obtenido para distintas estructuras i y j , es habitual recurrir al cociente:

P(BSi|D)/P(BSj|D)=P(BSi,D)/P(BSj,D)

Page 43: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

43

Considerando variables discretas y datos independientes, las probabilidades

conjuntas del segundo cociente se pueden estimar utilizando las predicciones

hechas por cada estructura ante los datos de entrenamiento.

Por su parte, el principio MDL caracteriza el aprendizaje en términos de

compresión de los datos. El objetivo del aprendiz es encontrar un modelo que

facilite la obtención de la descripción más corta posible de los datos originales. La

longitud de esta descripción toma en cuenta:

La descripción del propio modelo, penalizando la complejidad del mismo.

La descripción de los datos que usan el modelo, alentando su verosimilitud.

En el contexto de las redes bayesianas, el modelo es la red. Dicha red B describe

la probabilidad condicional PB sobre las instancias que aparecen en los datos.

Usando esta distribución, puede construirse y codificarse un esquema que asigne

palabras de código más cortas a las instancias más probables. De acuerdo con el

principio MDL, debería escogerse una red B tal que la longitud combinada de la

descripción de la red y los datos codificados (con respecto a PB) sea mínima.

A partir de este punto, distintos autores definen diferentes formas de medir cada

elemento de la descripción a partir del esquema general:

MDL (B|D)=complejidad (B)–verosimilitud (D) ,en el que un valor menor MDL(B|D)

de es mejor. Por ejemplo, se define:

𝑀𝐷𝐿 𝐵 𝐷 = 𝐵 . 𝑙𝑜𝑔 𝑁

2− 𝑁. 𝑙𝑜𝑔 𝑃𝐵 𝑑𝑖 3

𝑁

𝑖=1

Page 44: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

44

El primer término (complejidad (B)) representa la longitud de una descripción de la

red en la que se emplean 𝑙𝑜𝑔 𝑁

2 bits para cada parámetro (N es el tamaño de D),

siendo |B| el número total de éstos. El segundo término mide cuántos bits se

necesitan para describir todos los elementos di en D asignando las longitudes de

código en función de la distribución de probabilidad PB.

Tanto la medida bayesiana como MDL son bien conocidas y están bien

estudiadas. Ambas funciones son asintóticamente equivalentes cuando aumenta

el tamaño de la muestra, y además asintóticamente correctas: con probabilidad

igual a uno la distribución aprendida converge a la distribución subyacentea

medida que el número de muestras aumenta.

4.11. Clasificador Naive Bayes Aumentado con un Árbol (TAN)

A la hora de construir un clasificador bayesiano teniendo en cuenta las

dependencias existentes existen alternativas más sencillas que enfrentarse a la

construcción de una red bayesiana sin restricciones. Dichas alternativas consisten

en extender el clasificador Naive Bayes con modificaciones estructurales.

La idea general es construir una estructura que refleje algunas relaciones de

dependencia entre los atributos, manteniendo separada la variable clase. Una vez

construida dicha estructura, se añade un arco desde el nodo correspondiente a la

clase a cada uno de los atributos, tal y como ocurre en Naive Bayes.

Cuando no se imponen restricciones sobre la estructura de dependencias entre

atributos se habla de un clasificador BAN–Naive Bayes aumentado con una red.

Esta opción es exactamente igual de compleja que construir una red bayesiana sin

tener en cuenta el carácter especial del nodo clase. Sin embargo, si se imponen

Page 45: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

45

restricciones razonables en la estructura que se creará entre los atributos se

pueden construir clasificadores en tiempo polinómico.

En este apartado se considerará la restricción de que los nodos atributos formen

tan solo un árbol, construyendo así un clasificador TAN (Tree Augmented Naive -

Bayes). La figura 7 muestra un ejemplo de clasificador TAN.

Figura 7: Ejemplo de estructura Naive Bayes aumentada con un árbol

Puede observarse que cada nodo atributo un solo un nodo padre (aparte del nodo

clase C) con la excepción de A1, que es el nodo raíz del subárbol de atributos.

4.11.1. Algoritmo de Friedman-Goldszmidt (1996)

Se presenta un algoritmo para la construcción de estructuras TAN. Este algoritmo

se inspira directamente en uno propuesto por [CHOW] para construir redes

bayesianas conforma de árbol. En el algoritmo original se usa la cantidad de

información mutua entre pares de variables como criterio para determinar entre

cuáles de ellas se incluyen arcos de dependencia. En el algoritmo para construir

TAN se emplea la información mutua condicionada a la variable clase, dado que

Page 46: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

46

ésta se incorpora posteriormente al grafo. Dadas dos variables discretas X, Y la

cantidad de información mutua entre ellas condicionada a la variable Z se define

como:

𝐼 𝑋;𝑌 𝑍 = 𝑃 𝑥, 𝑦, 𝑧 . 𝑙𝑜𝑔 𝑃 𝑥, 𝑦, 𝑧

𝑃 𝑥 𝑧 𝑃𝑃 𝑦 𝑧

𝑧∈𝑋𝑦∈𝑌𝑥∈𝑋

4

La información mutua, por definición, proporciona una medida de la dependencia

entre las variables que relaciona. La información mutua condicionada hace la

propio, teniendo en cuenta que se conoce el valor de una tercera.

El algoritmo para la construcción del TAN consta de 5 pasos:

Paso F1.Calcular I(Xi; Xj|C)con i< j;i, j=1,2,...,n. Los valores se estiman a partir de

la frecuencia de los datos de entrenamiento.

Paso F2. Construir un grafo no dirigido completo cuyos nodos correspondan a los

atributos X1,X2,...,Xn. Asignar a cada arco entre nodos Xi y Xj un peso dado por

I(Xi,Xj|C).

Paso F3. Aplica r el algoritmo de Kruskal al grafo anterior para construir un árbol

expandido máximo.

Paso F4. Transformar el árbol no dirigido resultante en uno dirigido, escogiendo

un nodo cualquier como raíz y asignando direcciones a todas las aristas a partir de

él.

Paso F5.Construir un modelo TAN añadiendo un nodo etiquetado como C y

posteriormente un arco desde C a cada atributo Xi.

Page 47: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

47

El algoritmo de Kruskal parte de los n(n–1)/2 pesos del grafo completo para

construir un árbol que incluya todos sus nodos y en el que la suma de los pesos

de todos los arcos sea máxima. Kruskal opera escogiendo arcos del grafo original

a través de los siguientes pasos:

PasoK1.Asignar las dos aristas de mayor peso al árbol a construir.

PasoK2. Examinar la siguiente arista de mayor peso y añadirla al árbol a no ser

que forme un ciclo, en cuyo caso se descarta y se examina la siguiente arista de

mayor peso.

PasoK3.Repetir K2 hasta que se hayan seleccionado n–1 aristas.

Consideremos un ejemplo de uso del algoritmo para ver paso a paso la forma en

que opera. Supóngase un dominio en el que los ejemplos se describen con cinco

atributos X, Y, Z, V, W, y se clasifican en valores de C. Los resultados en cada

paso del algoritmo serán los siguientes:

PasoF1.Se calculan todos los valores de información mutua condicionada por C

para cada par de variables. Sea el orden de los valores obtenidos el siguiente:

I(X,Z|C)>I(Y,V|C)>I(X,Y|C)>I(Z,V|C)>I(X,V|C)>

>I(Z,W|C)>I(X,Y|C)>I(X,W|C)>I(Y,Z|C)>

>I(Y,W|C)>I(V,W|C)

Paso F2. Se construye el grafo no dirigido completo. Basta concrear los nodos

correspondientes a todos los atributos y mantener los valores de información

Page 48: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

48

mutua accesibles como pesos de los arcos –no es necesario construir

explícitamente los arcos en memoria. Véase más adelante la figura 7a.

Paso F3. Aplicación de Kruskal para obtener un árbol expandido de peso

máximo.

PasoK1.Se añaden los dos arcos de mayor peso (figura 7b).

- Paso K2. Se añade el siguiente arco de mayor peso: X-Y (figura 7c).

-Paso K2.Se añade el siguiente arco de mayor peso: Z-V (figura 4d).Sin embargo,

se comprueba que forma un ciclo, por lo que se descarta y se añade el siguiente:

X-V(figura 4e). De nuevo X-V forma un ciclo, así que se descarta también y se

añade Z-W (figura 7f).

-Paso K3. Ya existen tantos arcos como nodos menos uno. Finaliza Kruskal.

Paso F4.Se selecciona el nodo X como origen del árbol. A partir de él, se asignan

direcciones a los arcos recorriendo todas las ramas alejándose se X (figura 7g).

Paso F5. Se añade un nodo para la clase C y se conecta cada nodo atributo con

C mediante un arco (figura 7h).

Page 49: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

49

Figura 7: TAN paso a paso con el algoritmo de Friedman y Goldszmidt

Se demuestra que el algoritmo propuesto construye un TAN qué maximiza

el valor de LL(BT|D),siendo D el conjunto de datos de entrenamiento.

También se asevera que la complejidad temporal del algoritmo es O(n2

N), siendo n el número de atributos y N el tamaño del conjunto de

entrenamiento. El análisis propuesto es el siguiente:

El paso F1 tiene complejidad O(n 2 N).

El paso F3 tiene complejidad O(n2logn)–alalgoritmo de Kruskal es un

algoritmo clásico bien conocido.

Los pasos F2 (sólo requiere construir los nodos), F4 y F5 tienen

complejidad O(n).

Page 50: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

50

Usualmente se cumple que N > log n, por lo que se toma como

complejidad global O(n 2 N).

En un contexto en el que los datos de entrenamiento hubieran sido

generados por una estructura TAN, el algoritmo visto es asintóticamente

correcto, en el sentido de que si la muestra de casos es suficientemente

grande, recuperará exactamente la estructura que generó los datos.

4.11.2 Algoritmo de Keogh y Pazzani

Keoghy Pazzani (1999) proponen un algoritmo voraz que va añadiendo

arcos a una estructura Naïve Bayes. En cada paso se añade el arco que

manteniendo la condición de que en la estructura final cada variable no

tenga más de un padre, mejore en mayor medida el porcentaje de bien

clasificados obtenidos mediante el mismo.

5. Diseño del Sistema de Redes Neuronales

El diseño del Sistema se basa en la premisa de disponer de una estructura

combinada de elementos de almacenamiento, acceso y análisis de la información

necesarios para dar solución a las necesidades planteadas.

5.1. Diseño Cualitativo: Estudio de necesidades, usuarios y posibilidades

existentes para poner en marcha el Sistema de Información. A continuación se

presenta un diagrama de Contexto para un Sistema de Información para la gestión

de los procesos académicos y financieros.

Page 51: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

51

Figura 8. Diagrama de Contexto

Diseño de la Plataforma Educativa: La interface grafica permitirá interactuar con

los Docentes, padres de familia, estudiantes, entre otros.

Diseño de los modelos de Red Neuronal Artificial: Transformación del modelo de

RNA interno; define soluciones del Sistema a emplear en función del esquema

seleccionado anteriormente.

5.2 Diseño Cuantitativo

Para este análisis se tomaron muestras de diferentes instituciones educativa, se

realizaron los estudios correspondientes a la implementación de una plataforma

educativa que cumpliera con el decreto 1290 del Ministerio de Educación el cual

fija las pautas para el correcto ingreso de las notas a la plataforma, como también

verificar si existía en el mercado laborar un software que cumpliera con estos

Page 52: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

52

objetivos. Además, se ejecutó investigación cualitativa empleando el método de

estudio de caso a través de una investigación, cuya estrategia metodológica se

baso en los valorativos de desempeños fueron facilitados por los docentes quienes

tomaron sus conclusiones de cada capítulos de los libros que utilizan para las

enseñanza de cada asignaturas.

Para el desarrollo de la aplicación se tendrá en cuanta, el siguiente algoritmo de

entrenamiento aplicado a una red neuronal backpropagation, ver Fig. 9 en la que a

se definen las siguientes fases:

1. Inicializar pesos

2. Definir la Matriz de Entrenamiento

3. Calcular los estados de activación

4. Calcular el error en cada una de las capas de salidas

5. Calcular el error en cada una de las neuronas de la capa oculta o

intermedia

6. Modificar Cada uno de los pesos

7. Repetir el paso anterior hasta que el error total E cometido por la red

neuronal sea igual o inferior a cero

Page 53: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

53

Fig. 9: Diagrama de flujo de una Backpropagation.

A continuación se describe cada proceso teniendo en cuenta las referencias

bibliográficas [1], y sin olvidar el enfoque pedagógico de los objetivos de la

investigación presente.

1. Inicializar los pesos wjk de las conexiones entre las neuronas de la capa de

salida e intermedia y los pesos wij de las conexiones entre las neuronas de

la capa intermedia y de entrada asignándoles, por ejemplo, valores

aleatorios por medio de una función de números aleatorios.

2. Definir la matriz de entrenamiento y en las que este representados para

cada vector de entrada el valor de salida deseado. Supóngase que

deseamos clasificar objetos, identificados como los desempeños

cualitativos de las evaluaciones, en las categorías A1, A2,…An, ya que

estaremos definiendo la red neuronal como un clasificador, entonces los

componentes Ii de los vectores de entrada representaran las características

Page 54: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

54

de los objetos, asignándole a cada componente un valor de 1 o 0 en función

de su presencia o ausencia, respectivamente. En la tabla No.3 se describen

para cada caso los conceptos que corresponden, indicando si la

característica esta o no presente.

CASO 1 Reconoce los elementos y propiedades de la multiplicación.

CASO 2 Distingue analíticamente en una serie de ejercicios prácticos.

CASO 3 Realiza multiplicaciones de hasta dos cifras y multiplicaciones abreviadas.

CASO 4 Aplica correctamente estas operaciones en la solución de problemas matemáticos sencillos.

Tabla 3: Casos de conceptos para las Fortalezas, Debilidades de la

asignatura Matemáticas y Geometría del Grado primero hasta quinto.

En la tabla No. 4 a cada vector de entrada le asociaremos una salida S con

componentes de estudios correctamente elegidos para cada rango de calificación

ingresado por el docente.

DESEMPEÑO C1 C2 C3 C 4 S NOTA

SUPERIOR 1 1 1 1 16 10.0

Page 55: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

55

Tabla 4: Matriz de entrenamiento corresponde a los valores c1, c2, c3, c4 de

SUPERIOR 1 1 1 0 15 9.0-9.9

SUPERIOR 1 1 0 1 14 8.0-8.9

SUPERIOR 1 1 0 0 13 7.5-7.9

SUPERIOR 1 0 1 1 12 7.0-7.4

ALTO 1 0 1 0 11 6.6-6.9

ALTO 1 0 0 1 10 6.0-6.5

ALTO 1 0 0 0 9 5.0-5.9

ALTO 0 1 1 1 8 4.6-4.9

ALTO 0 1 1 0 7 4.0-4.5

BAJO 0 1 0 1 6 3.0-3.9

BAJO 0 1 0 0 5 2.6-2.9

BAJO 0 0 1 1 4 2.0-2.5

BAJO 0 0 1 0 3 1.6-1.9

BAJO 0 0 0 1 2 1.3-1.5

BAJO 0 0 0 0 1 1.0-1.2

Page 56: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

56

La Red Neuronal

El valor de salida deseado será el que identifique a la clase o categoría a la que

pertenece cierto objeto. Cada salida contiene el concepto que se presentan en la

siguiente tabla (tabla no. 5).

SALIDA Concepto

S1 Mejore más sus hábitos de estudio y cumpla con sus compromisos académicos en la asignatura.

S2 Procure cumplir con sus compromisos académicos.

S3 Debe retomar las temáticas desarrolladas durante el bimestre y resolver ejercicios de aplicación.

S4 Debe repasar los conceptos y las ecuaciones para la solución de ejercicios.

S5 Se recomienda retomar la lectura y análisis del texto.

S6 Procure ser más constante en sus participaciones y retome las temáticas vistas.

S7 ¡Usted puede lograr mejores resultado, cuente con mi apoyo!

S8 Se recomienda repasar los procedimientos de las sesiones del bimestre B.

S9 Debe participar más en clase y aumentar su interés por el inglés.

Page 57: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

57

S10 Con un poco más de dedicación su desempeño mejorará.

S11 Con un pequeño esfuerzo alcanzarás el nivel superior.

S12 Procure analizar con más detenimiento las situaciones y esquemas que se le plantean.

S13 Continúe con el mismo entusiasmo y dedicación al estudio.

S14 Siga con el mismo entusiasmo y desempeño.

S15 Figura disciplinariamente, como un(a) estudiante modelo para sus compañeros felicitaciones. Continúe así!

S16 Su desempeño es superior. ¡Felicitaciones!

Tabla 5: Conceptos de Recomendaciones según el número de salida

identificado por la RN.

3. Calcular el estado de activación Ok de las neuronas de la capa de salida y

el estado de activación Oj de las neuronas de la capa intermedia, es decir

obtener los valores net para las neuronas de la capa de salida e intermedia:

𝑛𝑒𝑡𝑘 = 𝑤𝑗𝑘𝑂𝑗 𝑗

(5)

𝑛𝑒𝑡𝑖 = 𝑤𝑖𝑗 𝐼𝑖

𝑖

(6)

Page 58: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

58

Obteniendo a continuación:

𝑂𝑘 = 𝑓(𝑛𝑒𝑡𝑘)

𝑂𝑗 = 𝑓(𝑛𝑒𝑡𝑗 )

Los valores net se obtienen considerando que por requerimiento del modelo la

función de activación es continua, por ejemplo la función sigmoidal.

4. Calcular el error o valor 𝛿𝑘 en la capa de salida aplicando la expresión que

se muestra en la ecuación 7:

𝛿𝑘 = 𝐷𝑘 − 𝑂𝑘 𝜕𝑂𝑘

𝜕𝑛𝑒𝑡 𝑘 (7)

Obsérvese que el término 𝐷𝑘 − 𝑂𝑘 representa el error de una neurona k siendo

similar al término de error utilizado en la regla del perceptrón. Ahora bien, en la

regla de aprendizaje de una red backpropagation ya no sólo consideramos si una

neurona de salida se encuentra o no en error, tal y como ocurre si I y D solo toman

valores 0 o 1. Asimismo, tampoco consideramos únicamente la magnitud del error,

como ocurre en algunas aplicaciones prácticas en las que se requieren

componentes I y D en los vectores de entrada y salida definidas por vectores

reales, por ejemplo 0,126. En una red backpropagation además de calcular el error

escalamos su valor al estar este multiplicado por la derivada:

𝜕𝑂𝑘𝜕𝑛𝑒𝑡𝑘

(8)

Page 59: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

59

Si se utiliza la función de activación sigmoidal, sustituyendo la derivada por su

valor tendremos que:

𝛿𝑘 = 𝐷𝑘 − 𝑂𝑘 𝑂𝑘 1−𝑂𝑘 (9)

ya que 𝑂𝑘 1− 𝑂𝑘 es la derivada de la función sigmoidal.

Calcular el error o valor 𝛿𝑗 en cada una de las neuronas de la capa oculta o

intermedia. Ahora bien, ¿cómo calcular Dj − Oj si no es posible comparar la

salida Oj de las neuronas de la capa intermedia con un valor deseado para dicha

capa? Obsérvese que en el caso de la capa intermedia no disponemos de un

vector deseado con componentes Dj . La solución adoptada creadores de esta

red constituye por su originalidad la principal contribución de la regla de

aprendizaje. Delegando la responsabilidad del cálculo de error en la capa

intermedia a la capa de salida de la red. El error δj en cada una de las neuronas

de la capa de salida se calcula aplicando la expresión que se muestra a

continuación:

δj = δk wjk k

∂O j

∂net j (10)

Leyendo la expresión deducimos que el error en una neurona j es proporcional a la

suma ponderada de los errores en la k neuronas de la capa de salida, siendo la

derivada el factor de proporcionalidad. Si observamos detenidamente el término

Page 60: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

60

entre paréntesis concluiremos que los pesos wjk de las conexiones entre las

neuronas j de la capa oculta y las k neurona de salida, representa los factores de

ponderación. En consecuencia cuanto mayor sea el peso, y por tanto la fuerza

sináptica, entre alguna de las k neuronas de salida y una neurona j mayor será la

responsabilidad de la neurona k en el error de la neurona. Finalmente, y

asumiendo que utilizamos la función de activación sigmoidal, sustituyendo en la

derivada que aparece en la expresión obtendremos:

δj = δk wjk

k

∂Oj

∂netj Oj(−Oj) (11)

5. Modificar el valor de los pesos aplicando la expresión general en la que se

recoge la regla de aprendizaje. La actualización del valor de los pesos debe

ser efectuada tanto en los pesos wjk de las conexiones entre las neuronas

de la capa de salida e intermedia, ver ecuación ().

wjk t + 1 = wjk t + ∆wjk (12)

Como en los pesos wij de las conexiones entre las neuronas de la capa intermedia

y de entrada:

wij t + 1 = wij t + ∆wij (13)

La regla de aprendizaje de una red backpropagation establece que el cambio

Page 61: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

61

experimentado por un peso es proporcional al error δ y a la señal de entrada,

siendo la tasa de aprendizaje ∝ el factor de proporcionalidad. Por consiguiente,

tendremos que el cambio experimentado por los pesos de las conexiones entre la j

neuronas de la capa oculta y las k neuronas de salida será igual a:

∆wij = ∝ δkOj (14)

Mientras que para los pesos asociados a las conexiones entre las j neuronas de la

capa oculta y las i neuronas de la capa de entrada:

∆wij = ∝ δjOi (15)

Si finalmente sustituimos en las expresiones para los pesos el cambio

experimentado, es decir el valor ∆w, sustituyendo a su vez el valor δ por la

expresión correspondiente representada en los pasos 4 y 5, tendremos las

expresiones con las modificaciones una y otra vez los pesos durante la fase de

entrenamiento de la red. En el caso particular de los pesos asociados a las

conexiones entre las neuronas de la capa de salida e intermedia, obtendremos la

expresión general siguiente:

∆wjk t + 1 = wjk t + α Dk − Ok Ok 1− Ok Oj(16)

Siendo la expresión que corresponde a los pesos de las conexiones entre las

neuronas de la capa oculta y de entrada la que se muestra a continuación, en la

Page 62: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

62

ecuación (13):

wij t− 1 = wij t + α δk wjk

k

Oj 1 − Oj Ii (17)

6. Repetir el paso anterior hasta que el error total E cometido por la red

neuronal sea igual a cero o inferior a un cierto valor o cota preestablecido

previamente. El valor del error E es una medida de aprendizaje en la red, y

por tanto de su ejecución durante la fase de entrenamiento, calculándose

de acuerdo con la siguiente expresión:

E = δ2kk (18)

Obsérvese que sustituyéndose en la expresión el valor δk sin tener en cuenta la

derivada, tendremos que E es igual a:

E =1

2 (Dk − Ok)2 k (19)

Una vez la red neuronal haya alcanzado sus valores óptimos estos valores son

guardados en una base de datos de conocimiento para luego presentarlos como

un banco del saber y identificar de acuerdo a los valores de entrada los

desempeños cualitativos, a los que pertenece para así poder dar sus

consideraciones de trabajos asignada a estos valores relacionados.

La implementación de las redes neuronales artificiales en los sistemas de gestión

Page 63: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

63

educativa representan una excelente herramienta para evitar tareas rutinarias al

docente, clasificar conceptos, permitiéndole a este poder obtener mejoras los

modelos académicos de evaluaciones, también la sistematización de sus labores

representa una avance al plan de mejoramiento institucional. Un sistema basado

en RNA de tipo backpropagation resulto practico para la implementación de este

ejemplo práctico descrito en el presente artículo debido a que se utilizaron un

vector de cuatro entradas, ocho neuronas ocultas y una neurona de salida, los

datos de entrada que inicialmente eran valores numérico debieron ser

transformado, según su escala correspondiente en binarios para poder

presentárselos a la Red Neuronal y de esta forma poder clasificar las salidas

deseadas. Sin embargo, para futuros trabajos pensando en un clasificador de

soporte para asignar tareas y aprendizaje de conceptos de temas ya vistos en

clase de un sistema de notas, por ejemplo, seria recomendado utilizar las redes

bayesianas, u otras RNA que permitan la implementación del mismo.

Para los resultados de la investigación se guardaron los patrones de entradas, se

empleó la utilización de los conceptos para las Fortalezas, Debilidades de la

asignatura Matemáticas y Geometría del Grado primero hasta quinto contenidos al

final de cada capítulo y para la información de las recomendaciones se tuvo en

cuenta las opiniones de los docentes de cada grado. De esta manera se

clasificaron todo un banco de perfiles para que mas adelantes estos se pudieran

identificar al ser presentados como patrones de entradas para cada clase o

categoría en particular y de este modo regístralos en el sistema.

La clasificación, identificación y análisis de esos patrones obtuvieron un

rendimiento en las consultas del 90 % ya que para los docentes se le facilitó la

asignación de calificaciones utilizando el modelo estudiado.

Page 64: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

64

6. MARCO LEGAL

Este proyecto está enmarcado en el artículo 1290 de 2009 del MINISTERIO DE

EDUCACIÓN NACIONAL, por el cual se reglamenta la evaluación del aprendizaje

y promoción de los estudiantes de los niveles de educación básica y media, y en

cuyos artículos describe lo siguiente:

ARTÍCULO 1. Evaluación de los estudiantes. La evaluación de los aprendizajes de

los estudiantes se realiza en los siguientes ámbitos:

1. Institucional. La evaluación del aprendizaje de los estudiantes realizada en

los establecimientos de educación básica y media, es el proceso

permanente y objetivo para valorar el nivel de desempeño de los

estudiantes.

ARTÍCULO 3. Propósitos de la evaluación institucional de los estudiantes. Son

propósitos de la evaluación de los estudiantes en el ámbito institucional:

1. Identificar las características personales, intereses, ritmos de desarrollo y

estilos de aprendizaje del estudiante para valorar sus avances.

2. Proporcionar información básica para consolidar o reorientar los procesos

educativos relacionados con el desarrollo integral del estudiante.

3. Suministrar información que permita implementar estrategias pedagógicas

para apoyar a los estudiantes que presenten debilidades y desempeños

superiores en su proceso formativo.

4. Determinar la promoción de estudiantes.

5. Aportar información para el ajuste e implementación del plan de

mejoramiento institucional.

Page 65: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

65

ARTÍCULO 4. Definición del sistema institucional de evaluación de los

estudiantes. El sistema de evaluación institucional de los estudiantes que hace

parte del proyecto educativo institucional debe contener:

1. Los criterios de evaluación y promoción.

2. La escala de valoración institucional y su respectiva equivalencia con la

escala nacional

3. Las estrategias de valoración integral de los desempeños de los

estudiantes.

4. Las acciones de seguimiento para el mejoramiento de los desempeños de

los estudiantes durante el año escolar.

5. Los procesos de autoevaluación de los estudiantes.

6. Las estrategias de apoyo necesarias para resolver situaciones pedagógicas

pendientes de los estudiantes.

7. Las acciones para garantizar que los directivos docentes y docentes del

establecimiento educativo cumplan con los procesos evaluativos

estipulados en el sistema institucional de evaluación.

8. La periodicidad de entrega de informes a los padres de familia.

9. La estructura de los informes de los estudiantes, para que sean claros,

comprensibles y den información integral del avance en la formación.

10. Las instancias, procedimientos y mecanismos de atención y resolución de

reclamaciones de padres de familia y estudiantes sobre la evaluación y

promoción.

11. Los mecanismos de participación de la comunidad educativa en la

construcción del sistema institucional de evaluación de los estudiantes.

ARTICULO 5. Escala de valoración nacional: Cada establecimiento educativo

definirá y adoptará su escala de valoración de los desempeños de los estudiantes

en su sistema de evaluación. Para facilitar la movilidad de los estudiantes entre

Page 66: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

66

establecimientos educativos, cada escala deberá expresar su equivalencia con la

escala de valoración nacional:

Desempeño Superior

Desempeño Alto

Desempeño Básico

Desempeño Bajo

La denominación desempeño básico se entiende como la superación de los

desempeños necesarios en relación con las áreas obligatorias y fundamentales,

teniendo como referente los estándares básicos, las orientaciones y lineamientos

expedidos por el Ministerio de Educación Nacional y lo establecido en el proyecto

educativo institucional. El desempeño bajo se entiende como la no superación de

los mismos.

ARTÍCULO 14. Derechos de los padres de familia. En el proceso formativo de

sus hijos, los padres de familia tienen los siguientes derechos:

1. Conocer el sistema institucional de evaluación de los estudiantes: criterios,

procedimientos e instrumentos de evaluación y promoción desde el inicio de

año escolar.

2. Acompañar el proceso evaluativo de los estudiantes.

3. Recibir los informes periódicos de evaluación.

4. Recibir oportunamente respuestas a las inquietudes y solicitudes

presentadas sobre el proceso de evaluación de sus hijos.

ARTÍCULO 16. Registro escolar. Los establecimientos educativos deben llevar un

registro actualizado de los estudiantes que contenga, además de los datos de

Page 67: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

67

identificación personal, el informe de valoración por grados y el estado de la

evaluación, que incluya las novedades académicas que surjan.

ARTÍCULO 17. Constancias de desempeño. El establecimiento educativo, a

solicitud del padre de familia, debe emitir constancias de desempeño de cada

grado cursado, en las que se consignarán los resultados de los informes

periódicos.

Cuando la constancia de desempeño reporte que el estudiante ha sido promovido

al siguiente grado y se traslade de un establecimiento educativo a otro, será

matriculado en el grado al que fue promovido según el reporte. Si el

establecimiento educativo receptor, a través de una evaluación diagnóstica,

considera que el estudiante necesita procesos de apoyo para estar acorde con las

exigencias académicas del nuevo curso, debe implementarlos.

7. METODOLOGIA

7.1 Población Y Muestra

La Implementación de un Sistema de Información de Gestión de Procesos

Académicos apoyado con Redes Neuronales Artificiales se ha tomado como

muestra los estudiantes de las instituciones educativa de Básica y Media de

Valledupar, ver tabla 5, para esta forma tener en cuenta el nivel socioeconómico,

académico, pues, existen diferencias en estos tres colegios que pueden presentar

resultados interesantes al momento de la investigación.

Page 68: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

68

INSTITUCION

No.

POBLACIONAL

PORCENTAJE

DE LA MUESTRA

NIVEL

SOCIO-

ECONOMICO

ESTRATO

Gimnasio Del Saber

1400 10% ALTO 6

Juvenil 210 10% MEDIO 3

San Antonio 260 10% MEDIO-BAJO 1

Osvaldo Vergara

Fernández

260 10%

MEDIO-BAJO 2

Tabla No.5 relación de Niveles socioeconómicos y medida poblacional

Para esto, se tomarán muestras de tipo de opinión, encuestas, formularios de

datos, las escalas de mediciones son de tipo cualitativo y cuantitativo, utilizando

para la obtención o recolección de información la Plataforma Educativa.

7.2 Tipo de Estudio

Teniendo en cuenta los objetivos plateado de la investigación y desde el marco

epistemológico nuestro estudio es de tipo Analítico (comparativo), ya que se

pretende aplicar a un número poblacional de estudiantes un aplicativo basado en

redes neuronales para determinar sus comportamientos.

7.3 Técnicas y Recolección de información

Page 69: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

69

A continuación se describen las actividades en las diferentes fases, los

requerimientos de personal, hardware y software, para que la instalación y puesta

en marcha se desarrolle con éxito en los tiempos estimados y para que las

Instituciones asimilen con beneficio el cambio tecnológico al que se enfrenta.

Figura 10. Actividades y sus fases de implementación del software

En la fase de asimilación, se expone la metodología a los integrantes del proyecto,

se definen los diferentes roles y las responsabilidades de cada rol; adicionalmente,

se preparan los recursos logísticos necesarios para iniciar la actividades propias

del proyecto.

La fase de experimentación o afinamiento del diseño, inicia con la

conceptualización de sistema y termina con la aprobación del documento de

alcance funcional. Durante esta fase, el usuario entra en contacto con el sistema

para entender la globalidad del mismo. Facilitando la toma de decisiones frente a

alternativas de parametrización. Durante esta fase el recurso humano del

contratista asimila las propiedades y necesidades del usuario final y las directivas

del Colegio insumo requerido para el ajuste para el ajuste del diseño de la solución

y para delinear etapas restantes del proyecto.

En la Fase de construcción, se realizan todos los ajustes requeridos al diseño de

la solución a nivel de desarrollo de software, las labores de parametrización,

Page 70: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

70

migración de información y cargue de los saldos iníciales en aquellos módulos

que así lo requieran. Adicionalmente, se efectúan pruebas de funcionalidad.

Finalmente en la fase de entrega, se verifica el cumplimiento de los compromisos

adquiridos para firmar el acta de recibo a satisfacción del sistema.

Fases de la metodología

Figura 11. Metodología del tiempo y sus niveles de actividad

Interacción Fases de la metodología

Figura 12 Interacción Fases de la metodología del tiempo y sus niveles de

actividad

7.3.1. Revisión de requerimientos Técnicos (Hardware y software)

Page 71: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

71

En el proceso de implantación del sistema es requisito indispensable la instalación

y puesta en marcha de la plataforma computacional con todas las pruebas y

ajustes necesarios.

Para el funcionamiento del sistema se requiere como mínimo:

Un servidor de base de datos descrito en la sección 3.1.4. Implementación física

del Sistema.

La configuración recomendada para el servidor se estima para poner con 100

usuarios concurrentes. De antemano no puede proyectarse el crecimiento de

servidores y canales de comunicación por cuanto no se conoce el volumen de

transacciones, el número de usuarios del sistema y los tiempos de respuesta

requeridos por el cliente. El departamento de tecnología del Colegio deberá hacer

las mediciones del caso para determinar este crecimiento.

El sistema puede operar instalado el servidor de aplicaciones y servidor de base

de datos en un solo computador. El sistema permite, si el cliente lo estima

conveniente, distribuir los componentes del sistema en diferentes servidores (uno

o más servidores de aplicaciones, servidor de bases de datos, servidor web,

servidor de reportes). Todos los requeridos en hardware deben estar instalados y

funcionando.

7.3.2. Plan de trabajo de la implementación (tiempo de ejecución)

El plan de trabajo del proyecto se llevara a cabo en nueve (11) meses calendario,

contados a partir de la fecha del acta de inicio, con la participación del equipo del

proyecto será definido más adelante y con el cronograma propuesto (ver Anexo

No.1 CRONOGRAMA DEL PROYECTO).

Page 72: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

72

7.4. Fuentes Primarias

Las principales fuentes de información que se utilizan como punto de referencia

para la elaboración, diseño, e implementación del Sistema

7.5 Fuentes Secundarias

Para la realización de este proyecto se toman en cuenta otros sistemas

Page 73: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

73

ANEXOS

CRONOGRAMA DE ACTIVIDADES

El cronograma de las actividades a realizar se muestra a continuación:

Paralelo a estas actividades, los procesos financieros que se pretende

implementar en la aplicación con un tiempo estipulado de once meses, descritos

de la siguiente manera:

Page 74: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

74

Page 75: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

75

PRESUPUESTO

El capital que se necesita para la realización del proyecto se resume en la siguiente

tabla:

FUENTES TOTAL

PERSONAL 35‟200.000

EQUIPO Y ACCESORIOS 5‟000.000

PAPELERIA 400.000

LIBROS 1‟000.000

INTERNET 2‟100.000

CD Y DISQUETES 50.000

SERVIDOR 23‟750.000

TOTAL 63‟750.000

Tabla 1. Presupuesto general del proyecto (en $).

Page 76: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

76

BIBLIOGRAFIA

Andina de la Fuente, D. "Tutorial de redes neuronales". Dpto. de Señales,

Sistemas y Radiocomunicaciones. Grupo de circuitos. Universidad Politécnica de

Madrid.

Arbib, M.A. (1995): "The Handbook of Brain Theory and Neural Networks". The

MIT Press.

Beltratti, A.; Margarita, S.; Terna, P. (1996): "Neural Networks for economic and

financial modelling". International Thomson. Computer Press.

Bonilla Musoles, M.; Puerta Medina, R.(1997): "Análisis de las redes neuronales:

Aplicación a problemas de predicción y clasificación financiera". Documento de

Trabajo. Departamento de Economía Financiera y Matemática. Universidad de

valencia.

Hanushek, E. (1986): "The economics of Schooling". Journal of Economic

Literature. Vol 24, nº3, pp. 1141-1171.

Hebb, D.O. (1949): "The organization of behavior". Science Editions, New York,

NY.

Hornik, K., Stinchcombe, M. and White, H. (1989): "Multilayer Feed-forward

Networks are Universal Approximators". Neural networks 2, pp. 359-66.

Page 77: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

77

Hornik, K., Stinchcombe, M. and White, H. (1990). "Universal Approximation of an

Unknown Mapping and its Derivatives using Multilayer Feed-forward Networks".

Neural Networks 3, pp. 551-60.

Le Cun, Y. (1985): "Une Procédure d¢ Apprentissage pour Réseau à Seuil

Asymétrique", in Proceedings of Cognitiva.

Martínez de Lejarza, I. (1996): "Redes Neuronales Auto-Organizadas y Clustering:

Una Aplicación a la Agrupación Económico-Funcional de Entidades de Población".

Documento de Trabajo. Facultat de CC. Econòmiques i Empresarials.

Departamento de Economía Aplicada. Universitat de València.

Mc Culloch, W.S. y Pitts, W.A. (1943): "A logical Calculus of the Ideas Immanent in

Nervous Activity". Boulletin of Mathematics and Biophysics, 5, págs. 115-133.

Minsky, M. y Papert, S. (1969): "Perceptrons: An introduction to Computacional

Geometry". The MIT Press. Cambridge, MA.

Modrego, A.; San Segundo, M.J. (1988): "Ecuaciones de rendimiento escolar para

la evaluación de las enseñanzas medias". Revista de Educación. Septiembre-

Diciembre 1988. pp 147-179

Parker, D.B. (1985): "Learning Logic". MIT Center for Computational Research in

Economics and Management science, T.R. 47.

Pedraja, F. y Salinas, J. (1996): "Eficiencia del gasto público en educación

secundaria: una aplicación de la técnica envolvente de datos". Hacienda Pública

Española Nº138, pp. 87-96.

Page 78: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

78

Rosemblatt, F. (1958): "The Perceptron: A probabilistic model for information

storage and organization in the brain". Psychological Review 65, págs 386-408.

Rosemblatt, F. (1959): "Principles of Neurodynamics". Spartan Books, New York.

Rumelhart, D. E.; Mc Clelland, J.L.; and the PDP Research Group (Eds.) (1986):

"Parallel Distributed Processing: Explorations on the Microstructure of Cognition,

vol.I. Foundations", MIT Press, Cambridge, MA.

San Segundo, M.J. (1991): "Evaluación del Sistema Educativo a Partir de Datos

Individuales". Economía Industrial. Marzo - Abril 1991, pp. 23-37.

San Segundo, M.J. (1998): "Igualdad de oportunidades educativas". Ekonomiaz Nº

40 1.er Cuatrimestre.

Santín, Daniel (1998) "Eficiencia relativa de las Comunidades Autónomas en

Enseñanza Secundaria: un enfoque socioeconómico" Documento de Trabajo

Facultad de Ciencias Económicas y Empresariales. UCM, nº 9822.

Tejedor, F. J.; Caride, J. A. (1988): "Influencia de las variables contextuales en el

rendimiento académico". Revista de Educación. Septiembre-Diciembre 1988. pp

112-146.

VV.AA. (1994): "Acerca de la producción eductiva: Estudio de los Centros

Educativos de la Comunidad Autónoma del País Vasco". Colección estudios y

documentos Nº 20. Gobierno Vasco. Departamento de educación, universidades e

investigación.

Page 79: SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES.pdf

79

Werbos, P.J. (1974): "Beyond Regression: New tools for Prediction and Analysis in

the Behavioral Sciences". Unpublished Ph.D. Dissertation, Harvard University.

Department of Applied Mathematics.

White, H. (1992): "Artificial Neural Networks: Approximation and Learning Theory".

Blackwell, Oxford.