minerÍade datos - professional...

18
MINERÍA DE DATOS

Upload: truongxuyen

Post on 20-Jul-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

MINERÍA DE DATOS

¿Por qué son importantes las Bases de Datos?

2

Los diferentes mercados y tipos de organizaciones se ha requerido unmayor estudio referentes al descubrimiento de conocimiento y gracias a laintegración de tecnologías como Minería de Datos con Inteligencia deNegocios es posible ofrecer de manera automatizada e inteligenteinformación de suma importancia para ejecutar acciones para la soluciónde problemas organizacionales.

La Minería de Datos es un proceso que permite obtener conocimiento apartir de los datos almacenados, mediante un proceso no trivial deextracción de información implícita, previamente desconocida ypotencialmente útil. Descubrir conocimiento implica buscar patrones decomportamiento aún no conocidos en los datos. El conocimiento se puedemanifestar como: patrones, reglas de conocimiento, asociaciones, grupos,restricciones, tendencias, etc. Los dominios de aplicación prácticamenteabarcan cualquier campo y tipo de empresas (comercialización,producción, finanzas, energía, gobierno, tecnología, etc.)

Objetivos del curso

3

Conocer de manera general las técnicas y enfoques de Minería deDatos

Exploración y uso de fuentes de datos para análisis y toma dedecisiones

Comprender el proceso de la Minería de Datos para extraerconocimiento desde base de datos y la aplicación de estas técnicas a lasolución de problemas de reconocimiento de patrones, clasificación ypronóstico.

Desarrollo del curso

4

Durante el desarrollo del curso el instructor explicará cada uno de lostemas, proporcionará ejemplos de aplicación en diversos campos yreforzará los conocimientos mediante ejercicios desarrollados en clase.

5

Act. Sonia Yoselin Ovando Retiz

Actuario titulada por la Facultad de Ciencias de la UNAM enfocada a las áreas deEstadística, reaseguro y pensiones.

En lo laboral:

Ha impartido cátedra en la UNAM para el departamento de Matemáticas en materiascomo: Cálculo Diferencial, Geometría Analística, Estadística, Almacenes de datos yMinería de datos.Trabaja en HSBC como asesor de Análisis de Crédito, realizando las siguientesfunciones: Desarrollo de estrategias de aseguramiento de la cartera de tarjetas de crédito

basadas en el análisis estadístico, la minería de datos y mediciones de rentabilidad. Desarrollo de estrategias de gestión de cuentas para la cartera de tarjeta de

crédito: las transferencias de saldo, cheques de conveniencia, de gestión de la líneade crédito, autorizaciones, etc.

Desarrollo y automatización de seguimiento mensual para el seguimiento de lasestrategias de originación y de suscripción

Proporcionar datos para el análisis ad hoc sobre la cartera de tarjeta de crédito.

Trabaja y conoce a un excelente nivel C++, Visual Basic, R, SAS

Instructor

Temario

6

1. Introducción a minería de datos

¿Qué es minería de datos?¿Porqué minería de datos?CRISP-SEMMA

2. Datos de procesamiento

¿Porqué procesar los datos?Limpieza de datosManejo de datos missingIdentificación de errores de clasificaciónMétodos graficos y outliersTrasnformación de datosMétodos numéricos y outliers

…Temario

7

3. Análisis exploratorio de datos

Pruebas de hipótesis vs Análisis exploratorio de datosConocimiento de los datosCorrelación de variablesVariables categóricasRelaciones multivariadasSelección de subconjuntos de datosBinning

4. Estimaciones y pronósticos

Descubrimiento de conocimiento en los datpsEstimación y pronósticoMétodos univariadosInferencia estadística

…Temario

8

Intervalos de confianzaPeligros de la exploraciónRegresión multipleVerificación de los supuesto del modelo

5. Algoritmo k-nearest neighbor

Métodos supervisados vs no supervisadosMetodología para modelos supervisadosSesgo-varianzaClasificaciónk-nearest neighborFunción distanciaOtras funcionesCuantificación de relevancias

…Temario

9

Algoritmo k-nearest neighbor para estimación y pronósticoElegir k

6. Árboles de decisión

Árboles de decisión y regresiónAlgoritmo C4.5Reglas de decisiónAlgoritmo CART vs C5.0

7. Redes neuronales

Codificación de entradas y salidasRedes neuronales para estimacaión y pronósticoEjemplos simplesFunción sigmoid

…Temario

10

RetropropagaciónMétodo gradient descentReglas de retropropagaciónEjemplos de retropropagaciónCriterio de terminaciónTasa de aprendizajeAnálisis de sensibilidadAplicación

8. Clustering

ClusteringMétodo jerárquicoK-meansEjemplo

…Temario

11

9. Reglas de asociación

Affinity analysis and market basket analysisSoporte, confianza, frecuencias y propiedades a prioriGeneración de frecuenciasGeneración de reglas de asociaciónDatos categoricosMétodo de inducción de reglas generalizadasCuando no usar reglas de asociaciónReglas de asociación y aprendizaje supervisado o nosupervisadoPatrones locales vs modelos globales

10. Técnicas de evaluación

Modelos de evaluación para descripciónModelos de evaluación para estimación y pronósticoModelos de evaluación para clasificación

…Temario

12

Tasa de error, falsos positivos y falsos negativosMisclassificationAnálisis de decisión costo/beneficioLift and gains chartsValidación de modelosConclusiones

Dinámica

13

El curso se realizará en un ambiente práctico, de manera que esimportante que los participantes puedan llevar una laptop.

Información general del curso

14

Duración:

40 horas

Lugar:

Tlaxcala No. 67 1er. Piso, Col. Roma Sur, Del. Cuauhtémoc

C.P. 06760 México, D.F. (están justo en la esquina de Tlaxcala y

Medellín)

Horario:

11:00 a 15:00 horas

Inicio

Sábado 25 de octubre de 2014

Fin

Sábado 24 de enero de 2015

Ubicación

15

Tlaxcala 67 101, Col. Roma Sur,

Del. Cuauhtémoc, C.P. 06760

Inversión

16

Empresas y facturación (cualquier forma de pago)

$ 4,999 + IVA

Efectivo

$ 3,999

Aparta tu lugar con $1,000 y liquídalo antes de que comience el curso

Cupo limitado

Garantía

17

Asiste a la primera sesión y si no es de tu agrado, te

devolvemos el importe de tu apartado

Si decides tomar el curso completo, puedes pagar el importe total en laprimera sesión o pactar un esquema de pago que vaya acorde a tusposibilidades .

Limitado a disposición de lugares.

1. Solicitar por correo electrónico o vía telefónica las formas de pago.2. Enviar el comprobante de pago vía correo electrónico a la dirección de

correo [email protected] indicando el nombre completo,teléfono y datos fiscales anexando su RFC (en caso de requerir factura)

3. Una vez enviados los datos anteriores se confirmara la inscripción ydepósito vía correo electrónico.

4. El reembolso solo se realizará 15 días antes de iniciar el curso y únicamentese devolverá el 70% de la inversión realizada hasta ese momento.

Informes:

[email protected]@engineerhunters.com

Tels. 5171-6286, 4329-0443, 4331-9873

Inscripciones e Informes

18