weka. ¿qué es weka? weka es una herramienta de tipo software para el aprendizaje automático y...

15
Weka

Upload: simon-mariano

Post on 24-Jan-2016

234 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Weka

Page 2: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

¿Qué es Weka?

Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado en la universidad de Waikato en Nueva Zelanda en el año 1993, esta herramienta por su nombre en inglés (Waikato Environment for Knowledge Analysis) además es una herramienta de distribución de licencia GNU-GLP o software libre.

Page 3: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Breve Historia • Inicio del proyecto - Universidad de Waikato.

• Primer versión en C y TCL/TK.

• Reimplementación en Java.

• Cambio de nombre a JAWS (Java WEKA System).

• Incluía clasificadores, reglas de asociación, filtros y evaluación.

• Se le agregó selección de atributos.

• Se le regresó el nombre WEKA.

1993

1997

1998

1999

Page 4: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Características

• Es un software de fácil acceso por los usuarios ya que está disponible libremente bajo licencia pública GNU-GPL.

• Tiene un formato especial de entrada de datos arff. (Attribute - Relation File Format).

• Es una herramienta muy versátil que soporta muchas tareas estándar de la minería de datos en especial tareas de procesamiento de datos, regresión, clasificación, clúster entre otras, así mismo permite la visualización y la selección de los datos.

Page 5: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Ventajas

• Contiene una gran gama de técnicas para modelado y procesamiento de datos.

• Es capaz de mostrar los datos en varios tipos de gráficos, con el objetivo de una mejor comprensión y análisis.

• Funciona en la mayoría de las plataformas actúales.

Page 6: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

• A: Desde la línea de comandos

• B: Desde las interfaces de usuario

• C: Creando un programa Java

¿Como usar WEKA?

Weka comprende de 3 modos de uso

Page 7: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Campos de Aplicación

• Weka posee un grupo de técnicas que se pueden aplicar con éxito a múltiples campos, tales como el Marketing, manufactura, salud, energía, finanzas, medicina, entre otros, para su aplicación se debe de tener en cuenta el tipo de tarea que se desea realizar. Con base a la tarea se puede implementar en para dar la solución necesaria en cada uno de estos campos.

Page 8: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

GUI de WEKA Weka define 4 entornos para el análisis y extracción de conocimiento a partir de datos:

• Explorer: entorno visual que ofrece una interfaz gráfica para el uso de paquetes.

• Experimenter: entorno que permite configurar un conjunto de experimentos completos y complejos de análisis mediante distintos métodos de tratamiento y sobre distintos ficheros de datos.

• KnowledgeFlow: permite generar proyectos de minería de datos mediante la generación de diagramas de flujos de información.

• Simple CLI: entorno consola para acceder directamente con java a los paquetes de Weka.

Page 9: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

El explorador: se observa, 6 sub-entornos de ejecución: 1. Preprocess: visualización y

preprocesado de los datos (aplicación de filtros)

2. Classify: Aplicación de algoritmos de clasificación y regresión

3. Cluster: Agrupación.

4. Associate: Asociación.

5. Select Attributes: Selección de atributos.

6. Visualize: Visualización de los datos por parejas de atributos

Page 10: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Preprocesado:

Ofrece diferentes maneras para cargar las instancias (desde un archivo, proporcionando una URL y desde una base de datos)

Open File Cargar un

archivo arff CSV, C4.5

Page 11: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Preprocesado

Open Url Nos

permitirá introducir una dirección en la que definir dónde se encuentra nuestro fichero.

Page 12: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Preprocesado Open DB Con este botón se

nos da la posibilidad de obtener los datos de una base de datos.

Pasos Definir la url

La contraseña

El nombre de usuario

consulta que queremos realizar.

Page 13: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Preprocesado Aplicación de filtros

Una vez que se tienen los datos cargados se pueden aplicar filtros de preprocesamiento. Weka permite aplicar una gran diversidad de filtros sobre los datos, permitiendo realizar transformaciones sobre ellos de todo tipo.

Al pulsar el botón Choose dentro del recuadro Filter se nos despliega un árbol en el que seleccionar los atributos o instancias a escoger

Page 14: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Sistema Jerárquico

Page 15: Weka. ¿Qué es Weka? Weka es una herramienta de tipo software para el aprendizaje automático y minería de datos diseñado a base de Java y desarrollado

Conclusión

Se pudo lograr ver las características de Weka y se puede decir que es una solución muy completa que incorpora potentes características para la explotación de datos, con características muy similares a otras herramientas de venta comercial y con la ventaja sobre estos de que es una herramienta de acceso libre y completamente gratuito.