Download - ARBOLES DE CLASIFICACION
ÁRBOLES DE CLASIFICACIÓN
WEKA 3.6.0
Weka 3.6.0
Esta herramienta de software libre trabaja sobre una plataforma Java, por lo cual requiere el jre para funcionar correctamente.
Principales características o funcionalidades: Gran aporte a la minería de datos ya que permite
analizar los datos fácilmente, mostrando de una manera muy gráfica la correlación existente entre ellos.
Algoritmos y árboles entre otras técnicas utilizadas en inteligencia artificial para clasificación de datos.
Árboles de Clasificación
En este caso se presenta un ejemplo de la utilidad de Weka en el tema de árboles de clasificación, donde dado un conjunto de datos de entrenamiento se podrá predecir y asignar una clase específica a un nuevo registro.
El entorno del problema es el siguiente:
Se debe predecir cuál es la medicina o fármaco ideal para administrar a nuevos pacientes, cuyo historial clínico presenta las siguientes variables:
Edad (Age) Sexo (Sex) Tensión Sanguínea (BP) Nivel de colesterol (Cholesterol) Nivel de sodio en la sangre (Na) Nivel de potasio en la sangre (K)
Para los cuales se presentan cinco posibles medicinas: DrugA, DrugB, DrugC, DrugX, DrugY
Una vez conocido el problema, en la herramienta haremos lo siguiente:
1. Se escoge la opción Explorer en la primera ventana que aparece al abrir el programa.
2. Bajo la etiqueta Preprocess, hacer clic en el botón Open File… y escoger un archivo de tipo *.arff
Árboles de Clasificación
Árboles de Clasificación
3. Se visualiza una tabla con las variables y sus atributos respectivos. Se presenta además la opción para eliminar variables antes de la clasificación.
4. Nos ubicamos en la pestaña Classify y escogemos uno de los clasificadores mostrados, en este caso se utiliza el algoritmo J48
Árboles de Clasificación
5. Se muestra un informe como resumen de la clasificación generada según los datos de entrenamiento.
Árboles de Clasificación
En la pestaña Visualize se
puede observar una matriz de
correspondencia entre variables, lo cual nos permitirá
analizar la relación de
dependencia existente entre
ellas.
Árboles de Clasificación
En este ejemplo se observa a detalle la relación entre la edad de los pacientes y la medicina administrada a cada uno de ellos.
Árboles de Clasificación
Finalmente se escoge la opción visualizar el árbol desde la lista de resultados
Árboles de Clasificación
Conclusiones
Según los resultados mostrados gráficamente en la figura anterior se puede analizar una secuencia de reglas que permitirán decidir rápidamente el fármaco a administrar a cada paciente según el diagnóstico presentado.
La organización jerárquica de las variables ayudan también a ahorrar tiempo con preguntas innecesarias al paciente según los resultados que vaya presentando por cada variable.
UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA
Escuela de Ciencias de la ComputaciónInteligencia Artificial Avanzada
María Gabriela Vivanco [email protected]