proyecto docente análisis de datos y procesado de la

16
Datos básicos de la asignatura Titulación: Máster Universitario en Ingeniería de Telecomunicación Año plan de estudio: 2014 Curso implantación: 2020-21 Centro responsable: E.T.S. de Ingeniería Nombre asignatura: Análisis de Datos y Procesado de la Información Código asigantura: 51420022 Tipología: OPTATIVA Curso: 2 Periodo impartición: Segundo cuatrimestre Créditos ECTS: 4 Horas totales: 100 Área/s: Teoría de la Señal y Comunicaciones Departamento/s: Teoría de la Señal y Comunicaciones Coordinador de la asignatura MURILLO FUENTES JUAN JOSE Profesorado Profesorado del grupo principal: MURILLO FUENTES JUAN JOSE Objetivos y competencias OBJETIVOS: Los descriptores de la asignatura en la memoria de verificación del Máster Universitario en Ingeniería de Telecomunicación son los siguientes: Fundamentos de clasificación y estimación Bayesianas. Estimación/Regresión semianalítica y máquina. Procesos Gaussianos. Clasificación semianalítica y máquina. ERM y máquinas de Vectores Soporte. Métodos no paramétricos. Agrupamiento. Grafos. Aplicaciones. Técnicas de PROYECTO DOCENTE Análisis de Datos y Procesado de la Información Grupo 1 (INGLÉS) Machine Learning CURSO 2020-21 Última modificación 02/09/2020 Página 1 de 16

Upload: others

Post on 23-Oct-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Datos básicos de la asignaturaTitulación: Máster Universitario en Ingeniería de TelecomunicaciónAño plan de estudio: 2014

Curso implantación: 2020-21Centro responsable: E.T.S. de Ingeniería

Nombre asignatura: Análisis de Datos y Procesado de la InformaciónCódigo asigantura: 51420022Tipología: OPTATIVACurso: 2Periodo impartición: Segundo cuatrimestre

Créditos ECTS: 4Horas totales: 100Área/s: Teoría de la Señal y ComunicacionesDepartamento/s: Teoría de la Señal y Comunicaciones

Coordinador de la asignatura

MURILLO FUENTES JUAN JOSE

Profesorado

Profesorado del grupo principal:

MURILLO FUENTES JUAN JOSE

Objetivos y competencias

OBJETIVOS:

Los descriptores de la asignatura en la memoria de verificación del Máster Universitario en

Ingeniería de Telecomunicación son los siguientes:

Fundamentos de clasificación y estimación Bayesianas. Estimación/Regresión semianalítica y

máquina. Procesos Gaussianos. Clasificación semianalítica y máquina. ERM y máquinas de

Vectores Soporte. Métodos no paramétricos. Agrupamiento. Grafos. Aplicaciones. Técnicas de

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 1 de 16

análisis de componentes: principales, independientes, no negativas, acotadas, escasas (poco

activas). Algoritmos de separación y extracción de información. Técnicas de análisis de datos

tensoriales. Regularización y muestreo compresivo. Aplicaciones en separación y mejora de

señales de voz, imágenes, señales de comunicaciones, interfaces cerebro-máquina, búsqueda e

indexación automática de documentos.

De acuerdo a estos descriptores, el objetivo fundamental de esta asignatura es estudiar

herramientas de análisis de datos y procesado de información dentro desde el ámbito de

reconocimiento de patrones y aprendizaje máquina, y adquirir la capacidad de aplicarlos a datos e

información real. Asociados a este objetivo general, el alumno deberá

- conocer las herramientas de procesado estadístico más relevantes

- revisar las herramientas lineales de estimación, clasificación y regresión, así como los sistemas de

recomendación y de detección de anomalías

- conocer el funcionamiento y base de las redes neuronales artificiales

- distinguir métodos supervisados de métodos no supervisados

- entender la diferencia entre métodos discriminativos y generativos

- aprender el uso, incluida aplicación práctica de algún clasificador y de algún regresor

- iniciar al alumno en la decisión a la hora de la herramienta a adoptar y la preparación de los datos

- conocer los lenguajes de programación utilizados en el ámbito

Así, entre los resultados del aprendizaje, de forma global el alumno será capaz de resolver

problemas de análisis de datos y procesado de información, mediante la identificación de la

herramienta adecuada y de su utilización. Y en particular, se detallan los siguientes

- identificar los diferentes tipos de problemas y en particular distinguir entre escenarios lineales y no

lineales, supervisados y no supervisados, de clasificación y de regresión.

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 2 de 16

- identificar las principales diferencias entre las herramientas y métodos existentes.

- asimilar el funcionamiento y principios teóricos de diferentes métodos.

- resolver problemas con datos reales.

COMPETENCIAS:

Dentro de las competencias, se trabajaran las siguientes en esta asignatura:

CB01 Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en

el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.

CB03 Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad

de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones

sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y

juicios;

CB05 Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar

estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

CG01 Capacidad para proyectar, calcular y diseñar productos, procesos e instalaciones en todos

los

ámbitos de la ingeniería de telecomunicación.

CG12 Poseer habilidades para el aprendizaje continuado, autodirigido y autónomo.

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 3 de 16

CG13 Conocimiento, comprensión y capacidad para aplicar la legislación necesaria en el ejercicio

de la profesión de Ingeniero de Telecomunicación.

CT01 Funcionar de forma efectiva tanto de forma individual como en equipo.

CT05 Reconocer la necesidad y tener la capacidad para desarrollar voluntariamente el

aprendizaje continuo.

CT07 Trabajar y comunicarse eficazmente en contextos nacionales e internacionales.

RdA01 Profundo conocimiento y comprensión de los principios de su especialidad.

RdA03 Capacidad para resolver problemas fuera de las pautas estándar de su rama de ingeniería,

definidos de forma incompleta que tienen especificaciones inconsistentes.

RdA05 Capacidad de utilizar su conocimiento y la comprensión adecuada para conceptualizar

modelos, sistemas y procesos de ingeniería.

Contenidos o bloques temáticos

I. Introducción: teoría de probabilidad

II. Preparación de los datos y recomendaciones prácticas

III. Detección de Anomalías

IV. Regresión y clasificación

V. Sistemas de recomendación

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 4 de 16

VI. Aprendizaje profundo

Relación detallada y ordenación temporal de los contenidos

Unidad 0. Presentación (1.25h approx.) - Presentation

- Información General

- Referencias

- Motivación

- Definición de aprendizaje máquina

- Clasificación de métodos

Unidad 1. Teoría de la Probabilidad (3.75h approx.) - Probability Theory

- Conceptos básicos

- Modelos generativos vs. discriminativos

- Teoría de la estimación y estimadores

- Teoría de la decisión

* Tarea 1: Detección de Anomalías (2.5h approx.) - Anomaly Detection

Unidad 2. Regresión Lineal y Polinómica (5h approx.) - Linear and Polinomic Regression

- Regresor lineal: mínimos cuadrados

- Regresor polynomial

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 5 de 16

- Regularización

- Ejemplo

Unidad 3. Sistemas de Recomendación (1h approx.) - Recommendation Systems

- Sistemas de recomendación

- Sistemas basados en contenidos

- Filtrado colaborativo

* Tarea 2: Sistemas de Recomendación (1.5h approx.) - Recommendation Systems

Unidad 4. Regresión Logística para clasificación (1.5h approx.) - Logistic Regression for

Classification

- Regresión logística

- Clasificación multiclase con SoftMax

- Ejemplo

* Tarea 3: Clasificación MNIST (2.5 h) - Classification of MNIST

Unidad 5. Cuestiones de diseño (2.5 h) - Practical Issues

- Diagnosis

- Selección de modelo

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 6 de 16

- Validación cruzada

- Sesgo frente a varianza y regularización

- Tamaño de los datos

- Pasos en el diseño

- Representatividad de los datos (skewness)

- Grandes tamaños de datos

* Tarea 4: Regresión para estimación de energía en aerogenerador (5 h) - Regression for

Aerogenerator Energy

Examen (1 h)

Unidad 6. Redes Neuronales y Deep learning (5 h) - Artificial Neural Networks and Deel Learning

- Red neuronal multicapa

- Redes convolucionales

- Ejemplo con Tensor Flow y Keras

* Tarea 5: Clasificación con deep learning - Classification with deep learning

Unidad 8. Software de Machine Learning (5 h) - Software for Machine Learning

- Introducción a Software BigML

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 7 de 16

- Ejercicios

Unidad 9. Métodos kernels (2.5) - Kernel Methods

- Conceptos básicos

- Mínimos cuadrados con kernels

- Ejercicio

Actividades formativas y horas lectivas

Actividad Créditos Horas

B Clases Teórico/ Prácticas 3,2 32

Metodología de enseñanza-aprendizaje

Clases teóricas

Mediante clases magistrales se introducen los conceptos teóricos del asignatura. Estas clases

serán de corta duración.

Prácticas informáticas

Se plantearán un conjunto de problemas a resolver, que el alumno deberá abordar desde las

técnicas vistas en las clases teóricas. A esta actividad se dedicará la mayor parte del tiempo. Se

trabajará con datos reales.

Sistemas y criterios de evaluación y calificación

En el proyecto docente correspondiente, el profesor determinará los criterios y sistemas específicos

elegidos para la evaluación, así como su peso concreto en la calificación de la asignatura.

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 8 de 16

Criterios de calificación del grupo

CRITERIOS DE EVALUACION EN EL ESCENARIO ORDINARIO

La evaluación se basará fundamentalmente en exámenes y en la evaluación de la resolución de

problemas propuestos, mediante memorias.

En los exámenes se evaluará sobre todo la parte teórica de la asignatura, y constituirá el 30% de la

calificación final.

Para la evaluación de los problemas propuestos se pedirá entregar una pequeña memoria de cada

tarea propuesta, que se evaluará junto con el trabajo desarrollado en clase. Representará un 60%

de la calificación.

Un 10% de la calificación medirá el interés, motivación y trabajo en clase.

NORMAS DE OBLIGADO CUMPLIMIENTO

No se permite la difusión o redistribución privada o pública de

- Material de la asignatura incluyendo apuntes del profesor, transparencias, videos, audios,

enunciados de exámenes y tareas,

- Grabaciones realizadas por los alumnos de las clases.

En las distintas actividades de evaluación tales como exámenes o tareas, el estudiante, o los

estudiantes si la evaluación es en grupo, habrá de comprometerse a:

- No permitir ni realizar ningún tipo de suplantación de identidad.

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 9 de 16

- No recibir ayuda externa, ni proporcionarla por ningún medio oral, escrito, digital ni de ningún otro

tipo.

- No compartir, difundir ni reproducir en ningún modo el enunciado de la evaluación ni de su

resultado (respuestas del examen, memoria de una tarea,?).

- Realizar, en general, la evaluación de forma honesta, responsable y confiable, con ánimo de que

el resultado de la evaluación refleje el aprendizaje alcanzado por el propio alumno.

Cualquier violación de las reglas anteriores significará el suspenso de la asignatura y la adopción de

cualesquiera otras medidas disciplinarias que pudieran derivarse.

PLAN DE CONTINGENCIA PARA EL CURSO 2020/21

Dada el actual escenario de pandemia y de acuerdo con las normas del Vicerrectorado de

Ordenación Académica, deben especificarse las adaptaciones de la asignatura, tanto para el

desarrollo de la docencia como para el desarrollo de los procesos de evaluación, a dos posibles

escenarios: un escenario de menor actividad académica presencial como consecuencia de medidas

sanitarias de distanciamiento interpersonal que limiten el aforo permitido en las aulas (escenario A)

y un escenario de suspensión de la actividad presencial (escenario B).

En el escenario A, la docencia y la evaluación de la asignatura se realizarán combinando tanto

medios presenciales como telemáticos de acuerdo con las instrucciones dictadas en cada momento

por las autoridades académicas y sanitarias competentes. En el escenario B, tanto la docencia

como la evaluación de la asignatura tendrán lugar de manera íntegramente remota.

En el desarrollo de la docencia, y en ambos casos, se hará uso preferente de la herramienta

Blackboard Collaborate, dentro de la plataforma de Enseñanza Virtual, sin perjuicio de que se

acuerde el uso de cualquier otra herramienta. También se deja abierta la posibilidad de distribuir

clases pregrabadas u otro tipo de material, dejando el tiempo de clase para su visionado y estudio,

resolver preguntas sobre el mismo y/o actividades de evaluación.

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 10 de 16

Las tutorías se realizarán de forma remota, sin perjuicio de que el alumno y el profesorado puedan

concertar una tutoría presencial, siempre que se realice dentro de las condiciones que establezca el

Servicio de Prevención de Riesgos Laborales de la Universidad de Sevilla.

En la evaluación de la docencia, entre otras posibilidades, se contemplará el uso de herramientas

de evaluación online para realizar los exámenes previstos, hacer la evaluación de forma oral o

sustituir, de forma parcial o total, los exámenes por otras actividades, que podrán incluir la

evaluación de la actividad y participación del estudiante.

En la evaluación online, se indicará la forma de identificación del alumno, dentro de las

posibilidades que la Universidad de Sevilla determine. Una identificación no satisfactoria conllevará

la no evaluación del examen del alumno.

Se incluirán mecanismos de garantía de la autoría de las pruebas por parte del estudiantado que la

Universidad de Sevilla considere adecuados. En particular, las pruebas orales, si las hubiere,

podrán quedar grabadas, por el procedimiento y en la forma que la Universidad de Sevilla

determine, para facilitar una posterior revisión o apelación de la prueba.

En los exámenes online el profesorado podrá exigir realizar una prueba o ensayo previo.

En los exámenes online se determinará si habrá, y en qué condiciones, procedimiento alternativo en

caso de que el alumno sufra problemas de conectividad durante el transcurso del examen.

En los exámenes presenciales, el profesorado aclarará si es posible y en qué condiciones realizar

una prueba en el caso de que el alumno esté en cuarentena por Covid19, siempre dentro del

presente marco normativo o del que establezca la Universidad de Sevilla.

En particular, para esta asignatura, si no fuera posible realizar el examen presencial, se contempla

evaluar el 90% de la asignatura en base a memorias de los trabajos propuestos. Se deja abierta la

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 11 de 16

posibilidad a requerir a los alumnos que defiendan de forma oral alguna o todas las memorias

presentadas. El otro 10% quedará para evaluar el interés, trabajo y motivación en clase.

Horarios del grupo del proyecto docente

http://www.etsi.us.es/academica

Calendario de exámenes

http://www.etsi.us.es/academica

Tribunales específicos de evaluación y apelación

Presidente: SERGIO ANTONIO CRUCES ALVAREZ

Vocal: FRANCISCO JAVIER PAYAN SOMET

Secretario: JOSE RAMON CERQUIDES BUENO

Suplente 1: RUBEN MARTIN CLEMENTE

Suplente 2: RAFAEL BOLOIX TORTOSA

Suplente 3: FRANCISCO JOSE SIMOIS TIRADO

Bibliografía recomendada

BIBLIOGRAFÍA GENERAL:

Pattern recognition and machine learning

Autores: Christopher M. Bishop

Edición: 2009

Publicación: Springer

ISBN: 0-387-31073-8, 978-0387-31073-2

Machine learning, a probabilistic perspective

Autores: Kevin P. Murphy

Edición: 2012

Publicación: The MIT Press

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 12 de 16

ISBN: 978-0-262-01802-9

Deep learning

Autores: Ian Goodfellow, Yoshua Bengio, Aaron Courville

Edición: 1

Publicación: MIT Press

ISBN: 9780262035613

Information Theory, Inference, and Learning Algorithms

Autores: David J.C. MacKay

Edición: 1

Publicación: Cambridge University Press

ISBN: 9780262035613

Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and

Techniques to Build Intelligent Systems

Autores: Aurelien Geron

Edición: 14 octubre 2019

Publicación: O'REILLY

ISBN: 978-1492032649

BIBLIOGRAFÍA ESPECÍFICA:

Gaussian processes for machine learning

Autores: C. E. Rasmussen, C. J. I. Williams

Edición: 2006

Publicación: MIT Press

ISBN: 0-262-18253-X

Graphical models for machine learning in digital communications

Autores: B. J. Frey

Edición: 1999

Publicación: The MIT Press

ISBN: 0-262-06202-X

Learning with kernels

Autores: B. Scholkopf, A. J. Smola

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 13 de 16

Edición: 2002

Publicación: The MIT Press

ISBN: 0-262-19475-9

Information Theory, Inference, and Learning Algorithms

Autores: David J.C. MacKay

Edición: 1

Publicación: Cambridge University Press

ISBN: 9780262035613

Factor Graphs and the Sum-Product Algorithm

Autores: Frank R. Kschischang, Brendan J. Frey, and Hans-Andrea Loeliger

Edición: 1

Publicación: IEEE Transactions on Information theory, Vol. 47, No. 2, Pp. 498. Feb 2001

ISBN: 9780262035613

Bayesian reasoning and machine learning

Autores: David Barber

Edición: 2012

Publicación: Cambridge University Press

ISBN: 978-0-521-51814-7

INFORMACIÓN ADICIONAL

- Code of the book by Geron https://github.com/ageron/handson-ml2

- List of videos on machine learning https://www.springboard.com/blog/machine-learning-youtube/

- Weekly brief list of pieces of news

https://www.deeplearningweekly.com/?utm_source=Deep+Learning+Weekly&utm_campaign=5230c

b8a5f-EMAIL_CAMPAIGN_2019_04_24_03_18_COPY_01&utm_medium=email&utm_term=0_3845

67b42d-5230cb8a5f-77193189

- Course on Machine Learning by Prof. Nguyen at Standford University:

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 14 de 16

https://es.coursera.org/learn/machine-learning

- (Spanish) Canal de youtube DotCSV, de Carlos Santana Vega, ingeniero informático y divulgador

de conocimientos sobre inteligencia artificial. Se deja una lista de reproducción pública con los

vídeos más importantes

https://www.youtube.com/playlist?list=PLx3EIRLhRAK6oovkZV8OjSI4CdRHaYo8H

- Podcast by M. I. Jordan

https://podcasts.apple.com/es/podcast/74-michael-i-jordan-machine-learning-recommender-systems

/id1434243584?i=1000466516116&l=en see more at

https://podcasts.apple.com/es/podcast/lex-fridman-podcast-artificial-intelligence-ai/id1434243584?l=

en

- Podcast by A. Nguyen

https://podcasts.apple.com/es/podcast/73-andrew-ng-deep-learning-education-and-real-world-ai/id1

434243584?i=1000466196078&l=en see more at

https://podcasts.apple.com/es/podcast/lex-fridman-podcast-artificial-intelligence-ai/id1434243584?l=

en

- Discussion on

https://datascience.stackexchange.com/questions/65736/why-does-keras-need-tensorflow-as-backe

nd

- Image Convolution examples: https://aishack.in/tutorials/image-convolution-examples/

- (Spanish) Qué son y cómo crear una red neuronal convolucional con Keras (Ander Fernández

Jauregi):

https://anderfernandez.com/blog/que-es-una-red-neuronal-convolucional-y-como-crearlaen-keras/

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 15 de 16

- A. W. Harley. "An Interactive Node-Link Visualization of Convolutional Neural Networks". 2020 [en

línea]. Disponible en: https://www.cs.ryerson.ca/~aharley/vis/conv/.

- ¿Cómo funcionan las Convolutional Neural Networks? Visión por Ordenador.Aprende Machine

Learning. 2020[en línea]. Disponible en:

https://www.aprendemachinelearning.com/como-funcionan-las-

convolutional-neural-networks-vision-por-ordenador/.

PROYECTO DOCENTE

Análisis de Datos y Procesado de la Información

Grupo 1 (INGLÉS) Machine Learning

CURSO 2020-21

Última modificación 02/09/2020 Página 16 de 16