fórmese en técnicas de minería para la modelización · exploración básica de un conjunto de...

12

Upload: buitram

Post on 24-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

OBJETIVO DIRIGIDO A REQUISITOS

El curso tiene como objetivo la formación en técnicas de manipulación y modelización de datos en el contexto empresarial. Utilizando el programa de Minería de Datos SPSS-Modeler, el alumno aprenderá a diseñar rutas de lectura y preparación de datos y a aplicar con solvencia técnicas de análisis estadístico descriptivo, técnicas de predicción de eventos y técnicas de segmentación.

A diferencia de otros cursos cortos con contenidos análogos, este curso pretende combinar el empleo práctico de las herramientas de análisis con una base teórica suficiente para que el alumno adquiera un mayor control sobre la aplicación de las técnicas y la correcta interpretación de resultados.

Dirigido a profesionales con actividad o interés en tareas de análisis cuantitativo en el contexto de los negocios que deseen una mayor profundidad en la formación técnica.

Aquellos que previamente hayan tenido experiencias formativas en materias y software similares, encontrarán en el curso la oportunidad de afianzar los conocimientos teóricos de base para las principales técnicas empleadas en el análisis cuantitativo de mercados.

Para aquellos que cursen el programa completo de enseñanza, no se requieren conocimientos previos de estadística o análisis de datos así como tampoco de manipulación de datos.  

El carácter progresivo del curso hace recomendable atender a todos los módulos para ir afianzando poco a poco los conocimientos base de la práctica del análisis cuantitativo. No obstante, si algún alumno no desea incorporarse a los módulos iniciales de carácter más introductorio, como la Introducción a la Minería de Datos, Introducción al SPSS-Modeler o Preparación y Optimización de Datos, deberá disponer de los conocimientos que se revisarán en esas secciones para incorporarse con aprovechamiento a los módulos analíticos posteriores.

El curso está diseñado en un contexto modular y con una duración total de 120 horas.

Fórmese en técnicas de Minería para la Modelización de Datos en el contexto empresarial.

INTRODUCCIÓN AL ANÁLISIS Y MINERÍA DE DATOS EN EL CONTEXTO EMPRESARIAL

6 HORAS El objetivo fundamental del Módulo es ofrecer al alumno una panorámica de las técnicas de análisis de datos disponibles, su utilidad diferencial, aplicabilidad, ventajas e inconvenientes en el mundo real. El alumno aprenderá qué tipos de técnicas son las más adecuada para cada uno de los problemas más habituales en el contexto del Business Intelligence. Antes de ello, de forma introductoria se presentará el concepto y alcance de la Minería de Datos en el contexto empresarial.

MÓDULOS

Análisis de Datos y Minería de Datos en el contexto empresarial actual.

• Caracterización del concepto de Minería de Datos en el contexto del Business Analytics.

• Características básicas de un proyecto de Minería de Datos

• Estándar CRISP-DM (Definición)

Descripción técnica del catálogo de técnicas de análisis disponibles: qué utilizar, cuándo y cómo.

• Criterios técnico/analíticos de clasificación de las distintas técnicas de Minería de Datos.

• Objetivos metodológicos habituales en el análisis de negocio y relación con las distintas técnicas.

• Catálogo de técnicas orientadas a la PREDICCIÓN O CLASIFICACIÓN: utilidad diferencial y criterios de selección correcto.

• Catálogo de técnicas de SEGMENTACIÓN: utilidad diferencial y criterios de selección correcta.

• Catálogo de técnicas de análisis de DEPENDENCIA: utilidad diferencial y criterios de selección correcta.

Presentación de casos prácticos resueltos con minería de datos

• Case Study: previsión de ABANDONO para compañía de seguros.

• Case Study: análisis PREDICTIVO para compañía suministradora.

• Case Study: análisis de SEGMENTACIÓN para compañía de viajes.

I.

2

INTRODUCCIÓN BÁSICA A LA HERRAMIENTA INFORMÁTICA SPSS/MODELER

9 HORAS El alumno se familiarizará de forma muy básica con el entorno de trabajo que ofrece el programa SPSS/Modeler como herramienta informática para el análisis de datos / minería. No se trata de un curso intensivo en la formación de la herramienta sino de una primera toma de contacto en la que el alumno aprenderá el manejo básico de las principales funcionalidades del programa mediante la revisión de ejemplos de análisis sencillos.

Descripción técnica de la plataforma SPSS-Modeler: requisitos, instalación, versiones, configuración básica Ilustración práctica guiada para el manejo de SPSS-Modeler Gestión del Standard CRISP-DM en SPSS-Modeler Gestión de la paleta de procedimientos en SPSS-Modeler Elaboración y gestión de rutas en SPSS-Modeler:

• Manejo de nodos, supernodos y autogeneración de nodos

• Opciones de configuración de ruta • Parametrización de ruta, uso de globales y gestión

de errores

Gestión de Modelos Analíticos y Ouputs en SPSS-Modeler • Uso de nodos de modelado y "nuggets" de

modelo • Opciones de construcción de modelos: standard,

boosting, bagging,... • Introducción a la Combinación de Modelos para la

mejora analítica: nodos Analisis y Ensemble

Otras utilidades y paquetes de recursos en el SPSS-Modeler

• Otras soluciones y recursos a combinar con SPSS – Modeler

• Introducción a la utilización de scripts en SPSS -Modeler

• Introducción a los recursos de optimización de Modeler

Deployment de resultados y recursos analíticos con SPSS – Modeler

3

Captura de Datos

• Manipulación de nodos de origen.

• Combinación - Agregación de distintos orígenes de datos.

Instanciación y depuración (forzado) inicial de datos: nodo Type.

Auditoría de Datos: nodo Audit

• Definición y gestión de valores perdidos.

• Definición y gestión de valores atípicos y extremos.

• Detección multivariante de anomalías en SPSS - Modeler (Nodo Anomaly).

Operaciones básicas de manipulación de registros.

• Operaciones básicas: selección, agregación, ordenado y distinción.

• Operaciones analíticas: equilibrado de categorías, muestreo estadístico.

Operaciones básicas de manipulación de variables / campos.

• Operaciones básicas: creación, transformación, anonimizado, set-to-flag, reestructurar,

transponer y reordenar.

• Operaciones analíticas: reclasificación, binning, imputación de missings (filler), partición e

intervalos de tiempo.

PREPARACIÓN Y OPTIMIZACIÓN DE DATOS PARA EL ANÁLISIS EN SPSS/MODELER

12 HORAS El alumno aprenderá a incorporar datos externos de distintos orígenes en SPSS/Modeler. Aún más importante, una vez incorporados en la herramienta, el alumno se familiarizará con las principales operaciones de manipulación y preparación de datos que garantizarán la óptima aplicación de las técnicas de análisis. En estas operaciones se incluyen desde sencillos procesos de manipulación operativa (etiquetado, filtros, nuevas variables,...) a interesantes tratamientos de depuración estadística esenciales para garantizar el éxito del análisis posterior (detección y tratamiento de atípicos, ponderación de muestras, imputación de valores perdidos,....)

II.

4

EXPLORACIÓN ESTADISTICA BÁSICA. PRESENTACIÓN DE TABLAS Y GRÁFICOS ANÁLÍTICOS

24 HORAS En primer término, el alumno aprenderá las nociones básicas de análisis estadístico necesarias para la exploración básica de un conjunto de datos desde una perspectiva puramente práctica y aplicada. Adicionalmente, aprenderá como realizar los gráficos adecuados para el análisis exploratorio básico y, opcionalmente, cómo preparar tablas personalizadas para ilustrar las principales características de esos datos.

El módulo aborda el análisis estadístico desde la perspectiva univariante para después centrarse en el análisis de relación/dependencia entre dos variables. El curso supone una excelente plataforma formativa para iniciar con garantías el resto de módulos técnicos. No se requieren conocimientos estadísticos básicos. Se requiere formación introductoria básica en Modeler/SPSS.

Análisis univariante. • Introducción al catálogo de recursos de Análisis gráfico y manejo de gráficos en SPSS-Modeler. • Análisis gráfico para variables categóricas. Selección de tipos e interpretación. • Análisis gráfico para variables continuas y series de tiempo y transformación estadística. • Análisis estadístico descriptivo básico: base teórica y recursos en SPSS-Modeler. • Desarrollo de aplicación práctica completa.

Análisis de relaciones bi-variantes (X-Y). • Análisis gráfico para observar relaciones bivariantes: tipos y recursos en SPSS-Modeler. • Análisis estadístico de relación bivariante

- Introducción Teórico - Práctica al Contraste de Hipótesis Estadísticas. - Análisis de Tablas de Contingencia y Contraste de independencia. Manejo de nodo

Matriz - Contraste de Diferencias de Medias. Base estadística y manejo de nodo Medias - Análisis de correlación estadística. Manejo del nodo Statistics.

• Desarrollo de aplicación práctica completa.

Introducción estadística al Análisis de Errores en modelos predictivos.

Preparación automatizada de variables para el modelado en SPSS-Modeler.

Introducción al análisis FACTORIAL para la agregación de variables (elaboración de indicadores sintéticos y aproximación de inobservables).

• Presentación teórico práctica del ANÁLISIS FACTORIAL por componentes principales: utilidad y descripción técnica.

• Elaboración de un análisis FACTORIAL en SPSS - Modeler: Configuración e interpretación de resultados.

• Desarrollo de aplicación práctica completa: estudio de caso (Indicador Sintético de Actividad).

III.

5

SEGMENTACIÓN DE CLIENTES Y MERCADOS CON

SPSS/MODELER

18 HORAS Este módulo, el primero enfocado a la modelización, aborda específicamente uno de los análisis más demandados en consultoría analítica de negocios: la segmentación o agrupación. El contenido, organizado tanto en sesiones teóricas como prácticas, aborda dos de las principales técnicas de Cluster NO jerárquico: K-Means y Two Step. Se ilustrará al alumno sobre cómo elegir la técnica apropiada, como planificar con éxito un proyecto de análisis de segmentación y cómo configurar e interpretar en la práctica un buen modelo de segmentación.

Introducción al análisis de segmentación

• Objetivos del análisis de segmentación. Claves de diseño de un buen proyecto

de análisis de Segmentación

• Diferencias entre el cluster jerárquico tradicional y la segmentación en Minería

• Presentación técnica de los distintos métodos de segmentación (aproximación

teórico-práctica)

• Preparación de datos para el análisis de segmentación

Análisis K-MEANS Cluster

• Características técnicas: fortalezas y debilidades

• Configuración del análisis e interpretación de resultados en SPSS-Modeler

• Desarrollo de Aplicación práctica completa: estudio de caso

TWO STEP -Cluster. Diferencias con el K-Means, configuración e interpretación de

resultados en SPSS – Modeler

• Características técnicas: fortalezas y debilidades (diferencias con el K-Means)

• Configuración del análisis e interpretación de resultados en SPSS-Modeler

• Desarrollo de Aplicación práctica completa: estudio de caso

Auto-Modelado de segmentación en SPSS – Modeler

IV.

6

ANÁLISIS DE ASOCIACIÓN APLICADO A EVENTOS (UPSELLING, CROSSSELLING, BASKET ANALYSIS, ETC)

12 HORAS En este módulo, se abordan algunos de los modelos específicos más utilizados para los análisis de asociación de eventos, frecuentemente utilizados, por ejemplo, para análisis de cadenas de compra. Se definirán las diferencias entre las distintas alternativas técnicas, cómo disponer los datos para el modelado, y cómo configurar e interpretar los modelos en SPSS-Modeler.

Utilidad de los modelos de Asociación en Business Inteligence (upselling, crosselling

y bastek analysis)

Segmentación Vs Asociación. Catálogo de recursos técnicos.

Introducción a los modelos de asociación en SPSS – Modeler

• Disposición de datos para el análisis de asociación en SPSS – Modeler

• Modelo APRIORI. Configuración básica e interpretación de resultados en SPSS-

Modeler

• Modelo CARMA. Configuración AVANZADA en SPSS-Modeler e interpretación de

resultados

• Modelo GRI (Generalized Rule Induction) en SPSS-Modeler

Introducción a los modelos de detección de secuencia en SPSS – Modeler

• Modelo SECUENCIA (Generalized Rule Induction) en SPSS-Modeler

Desarrollo de Aplicación práctica completa: estudio de caso (Basket Analisis para

V.

7

ANÁLISIS PREDICTIVO DE EVENTOS EN SPSS/MODELER. (COMPRA, CHURNING, RIESGO DE CRÉDITO, ETC)

39 HORAS

En este módulo, el más extenso del curso, el alumno se familiarizará con el catálogo de técnicas disponibles para la realización de modelos predictivos, esencialmente en el caso de predicción de variables categóricas, asociadas en la práctica empresarial real a eventos cruciales en el contexto del análisis de negocio: compra, impago, abandono, otros riesgos, ... Se incluyen en este módulo técnicas predictivas clásicas para variables categóricas como los árboles de decisión o las redes neuronales, junto a técnicas que permiten el análisis causal de eventos (modelos de regresión lineal y modelos Logit). En todos los casos, tras la formación teórica necesaria, el alumno aprenderá como configurar, realizar y presentar estos análisis en SPSS/Modeler empleando las alternativas técnicas más frecuentemente utilizadas en el mundo empresarial.

Introducción teórico - práctica sobre la práctica de la previsión/predicción en la empresa.

Presentación del catálogo de técnicas disponibles en análisis: diferencias y criterios de selección

básicos.

Lecciones teórico prácticas para el manejo y la interpretación de resultados en modelos predictivos.

• Interpretación de tablas de confusión / acierto

• Manejo estadístico de errores de tipo I y II; curvas ROC

• Nodos de análisis y gráficos de evaluación predictiva en SPSS- Modeler

Introducción a los Árboles de Clasificación en SPSS-Modeler (C5, CHAID, CRT y QUEST).

• Catálogo de árboles disponibles: diferencias y similitudes

• Introducción a la configuración e interpretación de árboles de clasificación

- Ejemplo introductorio con Aplicación de Modelo C5

• Lecciones teórico prácticas para el manejo y la interpretación de resultados en modelos

predictivos categóricos.

- Interpretación de tablas de confusión / acierto.

- Manejo estadístico de errores de tipo I y II; curvas ROC.

• Lecciones de manejo de Otros Árboles de Clasificación y funcionalidades en SPSS –

Modeler

- Modelo CHAID. Configuración e interpretación de resultados.

- Sesiones Interactivas en SPSS – Modeler.

- Modelos CRT y QUEST . Configuración e interpretación de resultados.

• Desarrollo de Aplicación práctica completa: estudio de caso (Abandono de Clientes).

VI.

8

Introducción al análisis de REGRESIÓN LINEAL y al el análisis predictivo / estructural LOGIT en

SPSS – Modeler.

• Introducción al modelo de regresión múltiple: objetivo, introducción técnica teórica y

errores frecuentes de manejo

• Interpretación básica de resultados de un modelo de regresión.

- Contraste de hipótesis en los parámetros: introducción teórico estadística e

interpretación práctica.

- Análisis de errores del modelo de regresión

• Utilidad diferencial del análisis LOGIT: Presentación teórico -práctica. Diferencias con la

aproximación MLP

• Especificación de un modelo LOGIT: muestra, variables métricas, dicotómicas e

interacciones

• Interpretación de resultados del modelo LOGIT

- Interpretación diferencial de parámetros en un Modelo LOGIT.

- Análisis de la capacidad predictiva del modelo LOGIT.

• Desarrollo de Aplicación práctica completa: estudio de caso (Impago Bancario).

Introducción a las REDES NEURONALES en SPSS – Modeler

• Introducción teórica al concepto, alcance y funcionamiento de una RED NEURONAL como

técnica predictiva.

• Utilidad diferencial de las redes NEURONALES. Diferencias con OTRAS aproximaciones.

• Especificación de un Modelo de RED NEURONAL e interpretación de resultados en SPSS

– Modeler.

• Desarrollo de Aplicación práctica completa: estudio de caso (Predicción de Upselling).

9

Posibilidad de bonificación a través de la Fundación Tripartita. Gestión de los fondos totalmente gratuita.

Los asistentes pueden matricularse a la Escuela completa o bien a

módulos independientes.

MÓDULOS HORAS Precio sin IVA

Máximo bon. por la Tripartita FECHAS

IIntroducción al análisis y minería de datos en el contexto empresarial e introducción básica a la herramienta informática IBM SPSS MODELER

16 325 21810 FEB

al 20 FEB

II Preparación y optimización de datos para el análisis en SPSS MODELER 12 250 164

24 FEBal

3 MAR

III Exploración estadística básica. Presentación de tablas y gráficos analíticos

24 465 3286 MAR

al 24 MAR

IV Segmentación de clientes y mercados con SPSSMODELER 20 360 273

27 MAR al

17 ABR

V Análisis de asociación aplicada a eventos 12 250 16424 ABR

al 28 ABR

VI Análisis predictivo de eventos en SPSSMODELER 36 720 491

5 ABR al

2 JUN

Del 10 de febrero al 2 de junioMartes y viernes de 15:30 a 19:30 h.

CONTACTO

Teléfono 91 761 21 78 Póngase en contacto con nuestro equipo y le informaremos de cualquier duda o cuestión que pueda surgirle.

Email [email protected] Mándenos un email y le atenderemos enseguida.

Online @Arrow_Edu_ES O bien puede contactarnos a través de nuestro perfil en Twitter.

Arrow ECS Education Services

Avenida de Europa 21, Parque Empresarial La Moraleja 28108 Alcobendas, Madrid

©2014 Arrow Electronics, Inc. Arrow y el logo de Arrow son marcas registradas de Arrow Electronics, Inc.