weka

22
ROSSANA DAYSI FERNANDEZ YUCRA WEKA Universidad José Carlos Mariátegui

Upload: rossanadaysi-fernandez

Post on 31-Oct-2014

30 views

Category:

Documents


3 download

DESCRIPTION

PARA EXPO

TRANSCRIPT

Page 1: WEKA

ROSSANA DAYSI FERNANDEZ YUCRA

WEKA

Universidad José Carlos Mariátegui

Page 2: WEKA

Sistemas de Información II

INTRODUCCION

2 04/08/23

WEKA se distribuye como software de libre distribución desarrollado en Java.

Está constituido por una serie de paquetes de código abierto con diferentes técnicas de preprocesado, clasificación, agrupamiento, asociación, y visualización, así como facilidades para su aplicación y análisis de prestaciones cuando son aplicadas a los datos de entrada seleccionados.

Estos paquetes pueden ser integrados en cualquier proyecto de análisis de datos, e incluso pueden extenderse con contribuciones de los usuarios que desarrollen nuevos algoritmos. Con objeto de facilitar su uso por un mayor número de usuarios, WEKA además incluye una interfaz gráfica de usuario para acceder y configurar las diferentes herramientas integradas.

Page 3: WEKA

Sistemas de Información II

WEKA (Waikato Enviroment for Knowledge Analysis)

3 04/08/23

Explorer: Entorno visual que ofrece una interfaz gráfica para el uso de los paquetes.Experimenter: Entorno centrado en la automatización de tareas de manera que se facilite la realización de experimentos a gran escala. KnowledgeFlow: Permite generar proyectos de minería de datos mediante la generación de flujos de información.Simple CLI: Entorno consola para invocar directamente con java a los paquetes de weka.

Page 4: WEKA

Sistemas de Información II

Explorer

4 04/08/23

El modo Explorador es el modo más usado y más descriptivo.El explorador permite tareas de:

Preprocesado de los datos y aplicación de filtros.Clasificación.Clustering.Búsqueda de Asociaciones.Selección de atributos.Visualización de datos.

Page 5: WEKA

Sistemas de Información II 04/08/235

FICHEROS .arff

Nativamente Weka trabaja con un formato denominado arff , acrónimo de Attribute-Relation File Format. Este formato está compuesto por una estructura claramente diferenciada en tres partes:

CABECERA. Se define el nombre de la relación. Su formato es el siguiente:

@relation <nombre-de-la-relación>

Donde <nombre-de-la-relación> es de tipo String*. Si dicho nombre contiene algún espacio será necesario expresarlo entrecomillado.

Page 6: WEKA

Sistemas de Información II 04/08/236

FICHEROS .arffDECLARACIONES DE ATRIBUTOS. En esta sección se declaran los atributos que compondrán nuestro archivo junto a su tipo. La sintaxis es la siguiente:@attribute <nombre-del-atributo> <tipo>

Donde <nombre-del-atributo> es de tipo String teniendo las mismas restricciones que el caso anterior. Weka acepta diversos tipos, estos son:NUMERIC, INTEGER, DATE, STRING, ENUMERADO

SECCIÓN DE DATOS. Declaramos los datos que componen la relación separando entre comas los atributos y con saltos de línea las relaciones.

@data4,3.2

Page 7: WEKA

Sistemas de Información II

% sobrevivientes del Titanic@RELATION relation@ATTRIBUTE class {"1st","2nd","3rd","crew"}@ATTRIBUTE age {"adult","child"}@ATTRIBUTE sex {"male","female"}@ATTRIBUTE survived {"yes","no"}@DATA1st,adult,male,yes1st,adult,male,yes1st,adult,male,yes1st,adult,male,yes1st,adult,male,yes1st,adult,male,yes

04/08/237

Ejemplo de un archivo de prueba

titanic.arff

Page 8: WEKA

Sistemas de Información II 04/08/238

Page 9: WEKA

Sistemas de Información II 04/08/239

Page 10: WEKA

Sistemas de Información II 04/08/2310

Page 11: WEKA

Sistemas de Información II 04/08/2311

Page 12: WEKA

Sistemas de Información II 04/08/23University of Waikato12

Arboles

Page 13: WEKA

Sistemas de Información II 04/08/2313

Aprendizaje por todos los registrosPermite cargar un archivo arff para ser

implemetadoAprendizaje a partir de camposQue porcentaje de registros seran

utilizados

Confiabilidad

Page 14: WEKA

Sistemas de Información II 04/08/2314

Page 15: WEKA

Sistemas de Información II 04/08/2315

Page 16: WEKA

Sistemas de Información II 04/08/2316

Page 17: WEKA

Sistemas de Información II 04/08/2317

Page 18: WEKA

Sistemas de Información II 04/08/2318

Conf=aciertos

Page 19: WEKA

Sistemas de Información II 04/08/2319

Page 20: WEKA

Sistemas de Información II 04/08/2320

Page 21: WEKA

Sistemas de Información II 04/08/2321

Page 22: WEKA

Sistemas de Información II

Bibliografía

Referencias:WEKA website:

http://www.cs.waikato.ac.nz/~ml/weka/index.html

WEKA Tutorial:

WEKA Wiki: http://weka.sourceforge.net/wiki/index.php/Main_Page

Otros:http://scalab.uc3m.es/~docweb/ad/practicas/ficherosWeka/titanic.arff

http://scalab.uc3m.es/~docweb/ad/practicas.html/tutorialWEKA.pdf

http://users.dsic.upv.es/~jorallo/docent/doctorat/weka