adquisicion del conocimiento.pdf

Upload: cassan-hec

Post on 01-Jun-2018

234 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/9/2019 Adquisicion del conocimiento.pdf

    1/34

    ndice de contenidos

    Unidad 4 Adquisicin del conocimiento

    4.1 Introduccin a la minera de datos

    4.2 Tcnicas para el pre

    -

    procesamiento de datos: limpiado, reduccin y 4.3 Tcnicas para identificacin de conceptos, reglas y relaciones.

    4.4 Herramienta para anlisis del conocimiento, seleccin de datos, extraccin de reglas.

  • 8/9/2019 Adquisicion del conocimiento.pdf

    2/34

    Empresa, Organismo, Institucin, Dependen

    Datos Informacin Cono

  • 8/9/2019 Adquisicion del conocimiento.pdf

    3/34

  • 8/9/2019 Adquisicion del conocimiento.pdf

    4/34

    Datos Informacin

    Co

    Procesos Minera de datos

  • 8/9/2019 Adquisicion del conocimiento.pdf

    5/34

  • 8/9/2019 Adquisicion del conocimiento.pdf

    6/34

    K D D

    Descubrimiento del conocimiento en base de datos

    Es un proceso en el cual se identifican patrones tiles en los datos posteriormente conocimiento til, valido y relevante.

    El conocimiento resultante debe ser presentado de manera clara y coque de esta manera de puede decir que el trabajo de generar cocim

    xito.

  • 8/9/2019 Adquisicion del conocimiento.pdf

    7/34

    escubrimiento del conocimient

    Data

    Warehouse

    Minera dedatos

    Seleccin

    ProcesoTransformacin

    Interpretacin

    Datos

    procesados

    Minera dedatos

    Datos

    transformados

    Patrones

  • 8/9/2019 Adquisicion del conocimiento.pdf

    8/34

  • 8/9/2019 Adquisicion del conocimiento.pdf

    9/34

    co

    INFORMACION

    Se apoyan deherramientas

    comoBases de datos

    Conjunto deProcesos

    hardware ysoftware

    informtico

    Mtodosmatemticos

    Trabajan conGrandes

    cantidades dedatos

    Conjunto de tcnicas que se utilizan para la obtencin de informacin implcita de las grandesotras palabras es una tecnologa poderosa y de gran potencial que permite a las organizacioinformacin desconocida para sus propias bases (almacn de datos).

  • 8/9/2019 Adquisicion del conocimiento.pdf

    10/34

    Se seleccionan de los datos fuentes aqueadecuados a nuestro problemaSELECCIN

    Consiste en la preparacin previa de loque se va a trabajar , para eliminar erroinconsistencias, ruidos, etc.

    PRE PROCESAMIENTO

    Consiste en elegir los mejores atributos del proble

    Buscar variables independientes mediante divesensibilidad, por lo tanto esta seleccin de vgenerar patrones que son los usados para crear

    tiles para la extraccin del conocimiento

    SELECCIN DE VARIABLES

    A partir de los patrones generados por el usindependientes se crea un modelo, el cual vcomportamiento de los valores del problema.

    EXTRACCION DELCONOCIMIENTO

    El modelo representativo del problema se utilizconclusiones validas, para que de esta forma s

    conocimiento, lo cual es lo medular en la miner

    INTERPRETACION

    escubrimiento del conocimient

  • 8/9/2019 Adquisicion del conocimiento.pdf

    11/34

    1. Limpieza de datos(Crear rutinas para llenarvalores nulos, duplicados, err2. Integracin de los datos.(Consiste principalmente en modificaciones sintcticas lle

    datos, sin que supongan un cambio en el significado de l3. Transformacin de los datos..(Conversin de datos a formas mas apropiadas para traba4. Reduccin de los datos....(Consiste en decidir qu datos deben ser utilizados para el

  • 8/9/2019 Adquisicion del conocimiento.pdf

    12/34

  • 8/9/2019 Adquisicion del conocimiento.pdf

    13/34

    Redes neuronales

    rboles de decisin

    Modelos estadsticos

    Agrupamiento o Clustering

    Algoritmos supervisados (o predictivos)

    Algoritmos no supervisados (o del descubrimiento del conoc

  • 8/9/2019 Adquisicion del conocimiento.pdf

    14/34

    Redes Neuronales

    Son un paradigma de aprendizaje y procesamiento automtico iforma en que funciona el cerebro. Se trata de un sistema de intneuronas en una red que colabora para producir un estmulo de salid

  • 8/9/2019 Adquisicion del conocimiento.pdf

    15/34

  • 8/9/2019 Adquisicion del conocimiento.pdf

    16/34

    Arboles de decisin

    Es un modelo de prediccin utilizado en la inteligencia artificial, dad

    datos se construyen estos diagramas de construcciones lgicas, mlos sistemas de prediccin basados en reglas, que sirven paracategorizar una serie de condiciones que suceden de forma suresolucin de un problema.

    VENTAJAS DESVENTAJAS

    Facilita la interpretacin Explica el comportamiento Reduce las variables Gestiona

    Puede convertirse en una m Probabilstico Subjetivo

  • 8/9/2019 Adquisicion del conocimiento.pdf

    17/34

    Arboles de decisin

  • 8/9/2019 Adquisicion del conocimiento.pdf

    18/34

    Arboles de decisin

  • 8/9/2019 Adquisicion del conocimiento.pdf

    19/34

    Arboles de decisin

  • 8/9/2019 Adquisicion del conocimiento.pdf

    20/34

    Por ejemplo:

    En un escenario para predecir qu clientes van a adquirir probabicicleta,

    Si 9 de 10 clientes jvenes compran una bicicleta, pero solo

    lo hacen 2 de 10 clientes de edad mayor,

    El algoritmo infiere que laedades un buen elemento de pr

    compra de bicicletas.

    El rbol de decisin realiza predicciones basndose en la tend

    resultado concreto.

    Arboles de decisin

  • 8/9/2019 Adquisicion del conocimiento.pdf

    21/34

    Arboles de decisin

  • 8/9/2019 Adquisicion del conocimiento.pdf

    22/34

    Es una expresin simblica en forma de igualdad oque seemplea entodoslosdiseosexperimentaregresin para indicar los diferentes factores que m

    variable de respuesta.

    Mtodos estocsticos

  • 8/9/2019 Adquisicion del conocimiento.pdf

    23/34

    Proceso de dividir un conjunto de datos en grupos excluyentes de tal manera que cada miembro de un grupocercanoposible a otro, y grupos diferentes estn loms uno del otro, donde la distancia est medida con respectvariables disponibles.

    Agrupamiento o Clustering

  • 8/9/2019 Adquisicion del conocimiento.pdf

    24/34

    Agrupamiento o Clustering

    El objetivo de ste metodo es obtener grupos o conjunelementos, de tal manera que los elementos asignados alsimilares.Lo importante del agrupamiento respecto a la clasificacinprecisamente los grupos y la pertenencia a los grupos lo qdeterminar y a priori, no se sabe ni como son los grupos ni El agrupamiento se conoce muy frecuentemente tamsegmentacin y aglomeracin.

    Ejemplos:

    Algoritmo K-medias

  • 8/9/2019 Adquisicion del conocimiento.pdf

    25/34

    K-medias

    Tambin conocido como k-means o Iterative Distance-based Cluste

    que se le proporcione a priori el numero de grupos k. El algoritmo es 1. Agrupamiento:2. Seleccionar al azar k ejemplos como centros iniciales de cada g3. repetir

    asignar cada ejemplo al grupo con menor distancia a su crecalcular los nuevos centros de cada grupo;

    4. hasta (los grupos sean estables)5. Los centros de cada grupo, tambin denominados centr

    corresponderse con ejemplos o no, en ese caso se les denomin6. Los grupos se consideran estables cuando los ejemplos no cam

    respecto la iteracin anterior.7. Se pueden obtener agrupaciones jerarquizadas tomando k = 2

    mismo algoritmo de manera recursiva sobre los ejemplos de cad

  • 8/9/2019 Adquisicion del conocimiento.pdf

    26/34

    Algoritmo K-medias Mtodo de casos q

    las distanentre econjunto d

  • 8/9/2019 Adquisicion del conocimiento.pdf

    27/34

    Algoritmo K-medias

  • 8/9/2019 Adquisicion del conocimiento.pdf

    28/34

    Algoritmo K-medias

  • 8/9/2019 Adquisicion del conocimiento.pdf

    29/34

    Segn el objetivo del anlisis de los datos, los algoritmos

    clasifican en supervisados y no supervisados (Weiss y Indurkhya

    Algoritmos supervisados (o predictivos) Predicen un dato (o uellos) desconocido a priori, a partir de otros conocidos.

    Algoritmos no supervisados (o del descubrimiento del conoc

    descubren patrones y tendencias en los datos.

  • 8/9/2019 Adquisicion del conocimiento.pdf

    30/34

    Data Warehouse es una base de datos corporativa que se caracterizprocesar y depurar informacin de una o ms fuentes distintas.

  • 8/9/2019 Adquisicion del conocimiento.pdf

    31/34

    Es un conjunto discreto de elementos objetivos acerca de distintos

    pueden derivar de hechos, informacin, estadsticas o similares, tacomo derivados del clculo o de la experimentacin.

    Los datos en s mismos, carecen de sentido, ya que solo describen lode manera parcial y no proporcionan juicio o interpretacin, ni favorecdecisiones.

  • 8/9/2019 Adquisicion del conocimiento.pdf

    32/34

    Son el conjunto de datos dotados de relevancia y de propsitoconocimiento comunicado o recibido concerniente a hechos o particulares, es cualquier conocimiento adquirido mediante aprendizaje o instruccin. La informacin se construyen a travs de den cierto sentido, se le ha aplicado un control de calidad prevcontextual izado.

    Los datos se convierten en informacin cuando se les aade un sentidcontextualizacin de los mismos, es decir, conocer para qu proprecolectados

  • 8/9/2019 Adquisicion del conocimiento.pdf

    33/34

    Fusin de valores , informacin y experiencia

    Aprensin de hechos, verdades o principios com

    del estudio, investigacin o de la erudicin en ge

  • 8/9/2019 Adquisicion del conocimiento.pdf

    34/34

    Links consultados:

    1. http://msdn.microsoft.com/2. file:///C:/Users/optimus/Pictures/Mineria_Datos_Vallejos.pdf

    Libros:

    1. Base de datos de enrique Jos Reinosa, ed. alfaomega

    http://msdn.microsoft.com/http://msdn.microsoft.com/http://msdn.microsoft.com/