md session1
Post on 28-May-2015
394 Views
Preview:
TRANSCRIPT
Minería de Datos
1
Minería de Datos
2
Los datos que no vemos
El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases
de datos, de manera automática o semiautomática, con el objetivo de
3
semiautomática, con el objetivo de encontrar patrones repetitivos,
tendencias o reglas que expliquen el comportamiento de los datos en un
determinado contexto.
Por qué Minería de Datos?
Análisis de Riesgo Financiero y
crediticio
Análisis de Riesgo Financiero y
crediticio
Generación de Riqueza
Generación de Riqueza
Desde una perspectiva de gestión
4
Minería de Datos
Datos
5
Criterios
Interesantes
Patrones
Ocultos
Evolución de las Necesidades de Información
Evolución Preguntas de Negocios Tecnologías permitidas Características
Colección de datos
(Años 60)
Cuales fueron los ingresos
en los últimos 5 años?
Computadoras, cintas y
discos.
Liberación de datos
estáticos
retrospectiva.
Acceso a datos.
(Años 80)
Que rebajas se tuvieron en
Nueva Inglaterra en marzo?
Bases de datos
relacionales y lenguajes de
consulta estructurados
Nivel de registro en
liberación de datos(Años 80)consulta estructurados
(SQL)
liberación de datos
dinámicos
retrospectiva.
Data Warehouse y
soporte a la toma
de decisiones.
(Años 90)
Que rebajas se tuvieron en
Nueva Inglaterra en marzo?
Repetir para Boston.
(Procesamiento analítico
en línea, bases de datos
multidimensionales y
almacenes de datos.
Niveles múltiples en
liberación de datos
dinámicos
retrospectiva.
Data Mining (1995) Que es lo más probable que
pase con las rebajas en
Boston el próximo mes?
Algoritmos avanzados,
computadoras con
multiprocesador y bases
de datos masivas.
Liberación de
información
proactiva
prospectiva
Proceso de Minería de Datos
Mediante una técnica de
El modelo representa patrones de También pueden
técnica de Minería de Datos,
se obtiene un modelo de
conocimiento.
patrones de comportamiento observados en los
valores de las variables o
relaciones de asociación.
También pueden usarse técnicas
para generar distintos modelos.
Metas de la Minería de Datos
Procesar automáticamente grandescantidades de datos crudos.
Identificar los patrones más significativos yIdentificar los patrones más significativos yrelevantes.
Presentarlos como conocimiento apropiadopara satisfacer las metas del usuario.
Proceso de Minería de Datos
Metodología: CRISP-DM
Comprensión
del negocio
Entendimiento
de los datos
Preparación de Preparación de
los datos
Modelación
Evaluación
Despliegue de
resultados
DATOS
Metodología: CRISP-DM
CRoss-Industry Standard Process for Data Mining.
Metodología para el proceso de la MD.
Valida el proceso, dispone de modelos de referencia (plantillas), ayuda a planear y administrar proyectos.proyectos.
Sin propietario. Desarrollado por algunos líderes de la industria: IBM, SAS, SPSS/ISL, NCR, Daimler-Benz, OHRA
Alienta la inter-operatividad de herramientas.
Neutral para la Industria y para la herramienta
Enfocado al negocio y al análisis técnico
Metodología: SEMMA
Sample, Explore, Modify, Modify, Model, Assess
Metodología: SEMMA
Usos de las Metodologías
Comparación
SEMMA CRISP
Orientado al desarrollo
del proceso de MD
Orientado a los objetivos
empresariales
Se inicia analizando los Se inicia analizando losSe inicia analizando los
datos
Se inicia analizando los
objetivos del negocio
Ligada a productos SAS Metodología abierta y
gratuita
Orientado a una
metodología de gestión
de proyectos
Técnicas
Arboles de
Decisión
Agrupamiento
Decisión
Redes Neuronales
Algoritmos Genéticos
top related