mineria de datos ing

Upload: mcbernalj

Post on 08-Jul-2015

537 views

Category:

Documents


0 download

TRANSCRIPT

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN

Programa Educativo (PE):Ingeniera en Ciencias de la Computacin

rea: Tecnologa

Programa de Asignatura: Minera de Datos

Cdigo: CCOM-606

Crditos: 5

Fecha: Julio de 2009

Programa de Asignatura: Minera de Datos

1

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN

1. DATOS GENERALES Nivel Educativo: Nombre del Programa Educativo: Modalidad Acadmica: Nombre de la Asignatura: Ubicacin: Correlacin: Asignaturas Precedentes: Asignaturas Consecuentes:

Licenciatura Licenciatura en Ciencias de la Computacin Mixta Minera de Datos Nivel Formativo Bases de Datos Sin Consecuente Conocimientos: Bases de Datos, Probabilidad y Estadstica.

Conocimientos, habilidades, actitudes y valores previos:

Habilidades: Abstraer, Modelar, Experimentar, Interpretar resultados, Correlacionar y aplicar conocimientos previos. Actitudes y valores previos: Actitud favorable para el trabajo multidisciplinario y en equipo, tolerancia para realizar pruebas no siempre exitosas. De respeto y empata con las personas.

2. CARGA HORARIA DEL ESTUDIANTE Concepto Horas teora y prctica Horas de prctica profesional crtica Horas de trabajo independiente Total 80 5 Horas por periodo 80 Numero de crditos 5

Programa de Asignatura: Minera de Datos

2

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN

3. REVISIONES Y ACTUALIZACIONES Autores: Fecha de diseo: Fecha de la ltima actualizacin: Ma. del Roco Boone Rojas (Coord. Responsable de Prog. de Asignatura) Mara J. Somodevilla Garca. Marco Antonio Soriano Ulloa David E. Pinto Avendao. Julio 16, 2009 Julio 16, 2009

Revisores:

ACADEMIADELREADEBASESDEDATOSEING.DESOFTWARE: AMBROSIOVZQUEZALMADELIA BOONEROJASMARIADELROCIO DELAROSAFLORESRAFAEL MARNDORADOGUILLERMO MOLINAGARCIAMARADELCONSUELO PREZDECELISHERREROMARADELACONCEPCIN PINTOAVENDAODAVID SOMODEVILLAGARCAMARAJOSEFA SORIANOULLOAMARCOANTONIOEsta asignatura fue creada por la necesidad de incorporar un campo de investigacin emergente de las Ciencias de la Computacin, que permitir al alumno conocer los modelos, tcnicas y herramientas para la extraccin de conocimiento de los datos, til para el anlisis y toma de decisiones.

Sinopsis de la revisin y/o actualizacin

4. PERFIL DESEABLE DEL PROFESOR (A) PARA IMPARTIR LA ASIGNATURA: Disciplina Profesional: Ciencias de la Computacin. Nivel Acadmico: Experiencia Docente: Experiencia Profesional: Maestra 6 aos 5 aosPrograma de Asignatura: Minera de Datos

3

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN 5. OBJETIVOS: 5.1 Educacional: El estudiante resolver problemas con un enfoque metodolgico, utilizando tcnicas y herramientas computacionales.

5.2. General: Que el alumno sea capaz de resolver problemas que involucren un proceso de Extraccin de Conocimiento. En particular, que utilice modelos, tcnicas y herramientas de la fase de Minera de Datos.

5.3. Especficos: Que el alumno sea capaz de. 1. Situar los antecedentes, el concepto de Minera de Datos, Problemas, tipos de datos y modelos a los que se aplica, su relacin con otras disciplinas y mbitos de aplicacin. 2. Identificar las nociones bsicas de cada una de las fases del proceso de Descubrimiento de Conocimiento en Bases de Datos (Knowledge Discovery from Databases, KDD). 3. Identificar y aplicar metodologas y tcnicas asociadas a la primera fase del KDD, llamada de integracin y recopilacin, y realizar algunas consideraciones sobre las fases de limpieza y transformacin y de exploracin y seleccin de datos. 4. Identificar y aplicar las principales tcnicas para resolver problemas de Minera de datos, as como la forma de expresar su resultado. 5. Conocer las caractersticas y experimentar las facilidades bsicas de alguna herramienta para la Minera de Datos. 6. Analizar alguna aplicacin de la Minera de Datos e identificar cada una de las fases del proceso de KDD asociado a la aplicacin.

6. MAPA CONCEPTUAL DE LA ASIGNATURA:

Programa de Asignatura: Minera de Datos

4

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN

Programa de Asignatura: Minera de Datos

5

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN

7. CONTENIDO Objetivo Especfico Contenido Temtico/Actividades de aprendizaje 1.1 Antecedentes y el Concepto de Minera de Datos. 1.2 Ejemplos de problemas de aplicacin. 1.3 Tipos de Datos. 1.3.1 Estructurados. 1.3.2 Complejos o Heterogneos. 1.4 Tipos de Modelos. 1.5 La minera de datos y el KDD. 1.6 Relacin con otras Disciplinas. 1.7 mbitos de Aplicacin. Bibliografa Bsica Jos Hernndez Orallo, M.Jos Ramrez Quintana, Csar Ferri Ramrez, Introduccin a la Minera de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd Edition, Morgan Kaufmann, ISBN 0120884070, 2005. Complementaria

Unidad

1. Introduccin.

Conocer los antecedentes, el concepto de Minera de Datos, Problemas, tipos de datos y modelos a los que se aplica, su relacin con otras disciplinas y sus mbitos de aplicacin.

Jiawei Han, Micheline Kamber, Data Mining : Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A Knowledge Discovery Approach, Springer, ISBN: 978-0-38733333-5, 2007.

2. El Proceso de KDD.

Proporcionar las nociones bsicas de cada una de las fases del proceso de Descubrimiento de Conocimiento en Bases de Datos (Knowledge Discovery from Databases, KDD).

3.1 Las Fases del Proceso de Extraccin de Conocimiento. 3.2 Fase de Integracin y Recopilacin. 3.3 Fase de Seleccin, Limpieza y Transformacin. 3.4 Fase de Minera de Datos.

Jos Hernndez Orallo, M. Jos Ramrez Quintana, Csar Ferri Ramrez, Introduccin a la Minera de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining:

Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A

Programa de Asignatura: Minera de Datos

6

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN Unidad Objetivo Contenido 3.5 Fase de Evaluacin e Interpretacin. 3.6 Fase de Difusin, Uso y Monitorizacin. Bibliografa Knowledge Discovery Practical Machine Approach, Springer, Learning Tools and nd Techniques, 2 Edition, ISBN: 978-0-38733333-5, 2007. Morgan Kaufmann, ISBN 0120884070, 2005. Jos Hernndez Orallo, M. Jos Ramrez Quintana, Csar Ferri Ramrez, Introduccin a la Minera de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd Edition, Morgan Kaufmann, ISBN 0120884070, 2005. Jos Hernndez Orallo, M. Jos Ramrez Quintana, Csar Ferri Ramrez, Introduccin a la Minera de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining: Practical Machine Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A Knowledge Discovery Approach, Springer, ISBN: 978-0-38733333-5, 2007.

3. Preparacin de Datos.

Estudiar e identificar las metodologas y tcnicas asociadas a la primera fase del KDD, llamada de integracin y recopilacin, y realizar algunas consideraciones sobre las fases de limpieza y transformacin y de exploracin y seleccin de datos.

Antecedentes de las bodegas de datos. OLTP y OLAP. Arquitecturas de las bodegas de datos. Implementacin, Operacin y Mantenimiento de una bodega de datos. Consideraciones sobre la fase de limpieza y transformacin. Valores anmalos, valores faltantes. Consideraciones sobre la fase de exploracin y seleccin. 4.1 Reglas de Asociacin. A priori. 4.2 rboles de Decisin. 4.3 Naive Bayes 4.4 Regresin Lineal y Logartmica. 4.5 Agrupamiento. Kmeans. 4.6 Redes Neuronales.

4. Tcnicas de Minera de Datos.

Identificar tcnicas representativas para realizar tareas que permiten la generacin de modelos predictivos y/o descriptivos.

Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A Knowledge Discovery

Programa de Asignatura: Minera de Datos

7

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN Unidad Objetivo Contenido Bibliografa Learning Tools and Approach, Springer, Techniques, 2nd ISBN: 978-0-387Edition, Morgan 33333-5, 2007. Kaufmann, ISBN 0120884070, 2005. Jos Hernndez Orallo, Jiawei Han, Micheline M. Jos Ramrez Kamber, Data Mining: Concepts and Quintana, Csar Ferri Ramrez, Introduccin a Techniques, 2nd edition, Morgan la Minera de Datos, Kaufmann, ISBN Editorial Pearson, 1558609016, 2006. ISBN: 84 205 4091 9, K. Cios, W. Pedrycz, R. 2004 Ian Witten and Eibe Swiniarski, L. Kurgan, Data Mining: A Frank, Data Mining: Knowledge Discovery Practical Machine Approach, Springer, Learning Tools and ISBN: 978-0-387Techniques, 2nd 33333-5, 2007. Edition, Morgan Kaufmann, ISBN 0120884070, 2005. Jos Hernndez Orallo, M. Jos Ramrez Quintana, Csar Ferri Ramrez, Introduccin a la Minera de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A Knowledge Discovery Approach, Springer, ISBN: 978-0-387-

5. Herramientas.

Conocer las caractersticas y experimentar las facilidades de alguna herramienta para la Minera de Datos. Caso de Estudio: Weka.

5.1 Entorno de Trabajo de Weka. 5.2 Archivos arff. 5.3 Explorer. 5.4 Ejemplos.

6. Aplicaciones.

Presentar y analizar una aplicacin de Minera de Datos, en donde se revise cada una de sus fases del KDD.

1.1 Planteamiento del Problema. 1.2 Revisin de las fases del KDD para el problema planteado.

Programa de Asignatura: Minera de Datos

8

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN Unidad Objetivo Contenido Bibliografa Edition, Morgan 33333-5, 2007. Kaufmann, ISBN 0120884070, 2005.

Programa de Asignatura: Minera de Datos

9

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN

8. CONTRIBUCIN DEL PROGRAMA DE ASIGNATURA AL PERFIL DE EGRESO Perfil de egreso Unidad Conocimientos Habilidades

Actitudes y valores

1. Introduccin.

De los antecedentes, el concepto de Minera de Datos, Problemas, tipos de datos y modelos a los que se aplica, su relacin con otras disciplinas y mbitos de aplicacin.

Para identificar los antecedentes, el concepto de Minera de Datos, Problemas, tipos de datos y modelos a los que se aplica, su relacin con otras disciplinas y mbitos de aplicacin.

Estar preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformacin sustentable de la realidad. Ser un profesional responsable, solidario, crtico, tico y comprometido con la sociedad y con el medio ambiente. Estar preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformacin sustentable de la realidad. Ser un profesional responsable, solidario, crtico, tico y comprometido con la sociedad y con el medio ambiente.

2. El Proceso de KDD.

De las nociones bsicas de cada una de las fases del proceso de Descubrimiento de Conocimiento en Bases de Datos (Knowledge Discovery from Databases, KDD).

Para identificar cada una de las fases del proceso de KDD en la resolucin de problemas.

3. Preparacin de Datos.

De las metodologas y tcnicas asociadas a la primera fase del KDD, llamada de integracin y recopilacin, y realizar algunas consideraciones sobre las

Para identificar y aplicar las metodologas y tcnicas necesarias para la preparacin de los datos para la posible aplicacin de una

Estar preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformacin

Programa de Asignatura: Minera de Datos

10

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACINPerfil de egreso Unidad Conocimientos Habilidades Actitudes y valores

fases de limpieza y transformacin y de exploracin y seleccin de datos para la posible aplicacin de una tcnica de Minera de Datos.

tcnica de Minera de Datos.

sustentable de la realidad. Ser un profesional responsable, solidario, crtico, tico y comprometido con la sociedad y con el medio ambiente. Estar preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformacin sustentable de la realidad. Ser un profesional responsable, solidario, crtico, tico y comprometido con la sociedad y con el medio ambiente. Estar preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformacin sustentable de la realidad. Ser un profesional responsable, solidario, crtico, tico y comprometido con la sociedad y con el medio ambiente. Estar preparado para trabajar en equipo, emprender, liderar proyectos

4. Tcnicas de Minera de Datos.

De las principales tcnicas para resolver problemas de Minera de datos, as como la forma de expresar su resultado.

Para aplicar las tcnicas de Minera de Datos ms apropiadas en la resolucin de problemas.

5. Herramientas.

De las caractersticas y las Para manejar una herramienta facilidades bsicas de alguna de Minera de Datos como herramienta para la Minera de apoyo a la resolucin de Datos. problemas.

6. Aplicaciones.

De al menos una aplicacin de la Minera de Datos y de cada una de las fases del proceso de KDD asociado a la misma.

Para interactuar con usuarios y especialistas de diversas reas de conocimiento,

Programa de Asignatura: Minera de Datos

11

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACINPerfil de egreso Unidad Conocimientos Habilidades Actitudes y valores

entender sus necesidades y proponer soluciones basadas en la aplicacin de las metodologas y tcnicas asociadas al proceso de KDD.

e incidir en la transformacin sustentable de la realidad. Ser un profesional responsable, solidario, crtico, tico y comprometido con la sociedad y con el medio ambiente.

Programa de Asignatura: Minera de Datos

12

BENMERITA UNIVERSIDAD AUTNOMA DE PUEBLA VICERRECTORA DE DOCENCIA DIRECCIN GENERAL DE EDUCACIN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIN 9. ORIENTACIN DIDCTICO-PEDAGGICA. Estrategias a-e Tcnicas a-e Tcnicas Estrategias de aprendizaje: grupales, Lectura y comprensin, de debate, Reflexin, del dilogo, Comparacin, de problemas, Resumen. Estrategias de enseanza: de estudio de casos, ABP, comparacin, Aprendizaje activo, sntesis, Aprendizaje cooperativo, lluvia de ideas, Aprendizaje colaborativo, analogas, Basado en el portafolio, descubrimiento. exposicin. Ambientes de aprendizaje: Aula, Laboratorio, Simuladores. Actividades y experiencias de aprendizaje: Visita a diversos mbitos de aplicacin. 10. CRITERIOS DE EVALUACIN Criterios Exmenes Parciales Proyectos Prcticas Ejercicios Total 11. REQUISITOS DE ACREDITACIN El promedio de las calificaciones de los exmenes aplicados deber ser igual o mayor que 6. Los proyectos son obligatorios. 80% mnimo de asistencia. Porcentaje 30 40 20 10 100

Recursos didcticos Materiales: Proyectores, TICs, Plumn y pizarrn,

Programa de Asignatura: Minera de Datos

13