clustering agrupamientos

18

Click here to load reader

Upload: turing

Post on 10-Jun-2015

7.328 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Clustering Agrupamientos

Clustering Clustering AgrupamientosAgrupamientosAprendizaje automáticoAprendizaje automático

Page 2: Clustering Agrupamientos

Minería de DatosMinería de Datos• ¿Qué es ?

• ¿Para que usar Minería de Datos?

• Datawarehouse y Datamining

• Tools– ClusteringClustering

Page 3: Clustering Agrupamientos

Minería de DatosMinería de Datos• ¿Qué es?¿Qué es?

– Consiste en la extracción no trivial de información que reside de manera implícita en los datos.(wikipedia)

– El Data Mining (DM; minería de datos) es un proceso para descubrir, a partir de una base de datos, nuevos conocimientos que sean válidos, potencialmente útiles y, sobre todo, comprensibles.(ebook DataMinig)

Page 4: Clustering Agrupamientos

Minería de DatosMinería de Datos• ¿Para que usar Minería de Datos?¿Para que usar Minería de Datos?

– La minería de datos es una herramienta fundamental para la toma de decisiones. El proceso de aprendizaje de los datos juega un papel muy importante en muchas áreas de la ciencia, las finanzas y la indústria, dónde las entidades o empresas han de minimizar los riesgos en la toma de decisiones estratégicas.

Page 5: Clustering Agrupamientos

Minería de DatosMinería de Datos• Datawarehouse y Datamining

Las empresas establecen relaciones con sus clientes, recogiendo sus necesidades, recordando sus preferencias e interaccionando personalmente, lo que les debería permitir analizar cómo servirles mejor en el futuro.

Page 6: Clustering Agrupamientos

Minería de DatosMinería de Datos• Tool

• ¿Qué es Clustering?

• Algoritmos

• Ejemplo Practico

filas

columnas

Page 7: Clustering Agrupamientos

Clustering Definiciones(1/2)Clustering Definiciones(1/2)• Los algoritmos de clustering

permiten clasificar un conjunto de elementos de muestra en un determinado número de grupos basándose en las semejanzas y diferencias existentes entre los componentes de la muestra.

Page 8: Clustering Agrupamientos

Clustering Definiciones(2/2)Clustering Definiciones(2/2)• Un algoritmo de agrupamiento (en inglés, clustering) es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. Un algoritmo de clustering permite extraer representantes de un conjunto de datos, que pueden ser posteriormente usados para transmisión, para eliminación de ruido o con una fase posterior de calibración, para clasificación de vectores en diferentes conjuntos.

Page 9: Clustering Agrupamientos

AlgoritmosAlgoritmos• K-means

– Es probablemente el algoritmo de agrupamiento más conocido.

– El algoritmo está basado en la minimización de la distancia interna (la suma de las distancias de los patrones asignados a un agrupamiento al centroide de dicho agrupamiento)

Page 10: Clustering Agrupamientos

AlgoritmosAlgoritmos• K-means Ejemplo

Page 11: Clustering Agrupamientos

AlgoritmosAlgoritmos• ISODATA

– Iterative Self-Organizing Data Analysis Techniques (con la A añadida para hacer pronunciable el nombre), un iterativo método de agrupamiento que, como ya sucedía con el método de agrupamiento secuencial, requiere un considerable esfuerzo para ajustar adecuadamente todos sus parámetros. Además, éstos pueden modificarse en cada iteración del algoritmo.

Page 12: Clustering Agrupamientos

AlgoritmosAlgoritmos• Algoritmo adaptativo

– El método adaptativo es un algoritmo heurístico de agrupamiento que se puede utilizar cuando no se conoce de antemano el número de clases del problema

Page 13: Clustering Agrupamientos

AlgoritmosAlgoritmos• Algoritmo de Batchelor y Wilkins

– Como el método adaptativo, el algoritmo de Batchelor y Wilkins es un método de agrupamiento con número de clases desconocido.

Page 14: Clustering Agrupamientos

AlgoritmosAlgoritmos• Algoritmo GRASP

– GRASP es una técnica de los años 80 que tiene como objetivo resolver problemas difíciles en el campo de la optimización combinatoria. Esta técnica dirige la mayor parte de su esfuerzo a construir soluciones de alta calidad que son posteriormente procesadas para obtener otras aún mejores.

Page 15: Clustering Agrupamientos

AlgoritmosAlgoritmos• Matriz de similaridad

– Los métodos basados en grafos, igual que los algoritmos GRASP, intentan evitar este hecho pero su coste computacional los hace inaplicables en muchas ocasiones.

Page 16: Clustering Agrupamientos

Clustering Jerárquico - Clustering Jerárquico - EjemploEjemplo

clustering

clustering

clustering

clustering

clustering

Page 17: Clustering Agrupamientos

Clustering-EjemploClustering-Ejemplohttp://www.lsi.us.es/~ndiaz/proyectosFinCarrera.html

http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_html/AppletKM.html

Page 18: Clustering Agrupamientos

Clustering-EjemploClustering-Ejemplo

Un ejemplo practicoDatos para cada una de las 52 provincias. Los datos son:Nombre de la provincia Población Ratio varones/mujeres Ratio extranjeros/españoles Extensión de la provincia (en Km2) Paro Número de teléfonos fijos registrados Número de vehículos de motor matriculados Número de oficinas bancarias Precio medio del m2 de vivienda