a.a

Upload: leyter

Post on 08-Mar-2016

214 views

Category:

Documents


0 download

DESCRIPTION

Descripcion

TRANSCRIPT

  • En ciencias de la computacin el aprendizaje automtico o aprendizaje de mquinas (del

    ingls, "Machine Learning") es una rama de la inteligencia artificial cuyo objetivo es

    desarrollar tcnicas que permitan a las computadoras aprender. De forma ms concreta,

    se trata de crear programas capaces de generalizar comportamientos a partir de una

    informacin no estructurada suministrada en forma de ejemplos. Es, por lo tanto, un

    proceso de induccin del conocimiento. En muchas ocasiones el campo de actuacin del

    aprendizaje automtico se solapa con el de la estadstica, ya que las dos disciplinas se

    basan en el anlisis de datos. Sin embargo, el aprendizaje automtico se centra ms en el

    estudio de la complejidad computacional de los problemas. Muchos problemas son de

    clase NP-hard, por lo que gran parte de la investigacin realizada en aprendizaje

    automtico est enfocada al diseo de soluciones factibles a esos problemas. El

    aprendizaje automtico puede ser visto como un intento de automatizar algunas partes

    delmtodo cientfico mediante mtodos matemticos.

    El aprendizaje automtico tiene una amplia gama de aplicaciones, incluyendo motores de

    bsqueda, diagnsticos mdicos, deteccin de fraude en el uso de tarjetas de crdito,

    anlisis del mercado de valores, clasificacin de secuencias de ADN, reconocimiento del

    habla y del lenguaje escrito, juegos y robtica.

    Resumen

    Algunos sistemas de aprendizaje automtico intentan eliminar toda necesidad de intuicin

    o conocimiento experto de los procesos de anlisis de datos, mientras otros tratan de

    establecer un marco de colaboracin entre el experto y la computadora. De todas formas,

    la intuicin humana no puede ser reemplazada en su totalidad, ya que el diseador del

    sistema ha de especificar la forma de representacin de los datos y los mtodos de

    manipulacin y caracterizacin de los mismos. Sin embargo, las computadoras son

    utilizadas por todo el mundo con fines tecnolgicos muy buenos.

    Modelos

    El aprendizaje automtico tiene como resultado un modelo para resolver una tarea dada.

    Entre los modelos se distinguen1

    los modelos geomtricos, construidos en el espacio de instancias y que pueden tener

    una, dos o mltiples dimensiones. Si hay un borde de decisin linear entre las clases,

    se dice que los datos son linearmente separables. Un lmite de decisin linear se

    define como w * x = t, donde w es un vector perpendicular al lmite de decisin, x es un

    punto arbitrario en el lmite de decisin y t es el umbral de la decisin

    los modelos probabilsticos, que intentan determinar la distribucin de probabilidades

    descriptora de la funcin que enlaza a los valores de las caractersticas con valores

    determinados. Uno de los conceptos claves para desarrollar modelos probabilsticos

    es la estadstica bayesiana.

  • los modelos lgicos, que transforman expresan las probabilidades en reglas

    organizadas en forma de rboles de decisin.

    Los modelos pueden tambin clasificarse como modelos de agrupamiento y modelos de

    gradiente. Los primeros tratan de dividir el espacio de instancias en grupos. Los segundos,

    como su nombre lo indican, representan un gradiente en el que se puede diferenciar entre

    cada instancia. Clasificadores geomtricos como las mquinas de vectores de apoyo son

    modelos de gradientes.

    Atributos

    Un atributo o caracterstica es un tipo de medida realizada sobre cualquier instancia a

    medir. Los atributos mapean el espacio de instancias a un conjunto de valores o dominio

    de atributos. Los valores del dominio pueden ser nmeros como la frecuencia de aparicin

    de las instancias, valores binarios o un conjunto cualquiera como el de meses, estaciones

    o colores.

    Tipos de algoritmos

    Una mquina de vectores de soporte

    Los diferentes algoritmos de Aprendizaje Automtico se agrupan en una taxonoma en

    funcin de la salida de los mismos. Algunos tipos de algoritmos son:

    Aprendizaje supervisado

    El algoritmo produce una funcin que establece una correspondencia entre las

    entradas y las salidas deseadas del sistema. Un ejemplo de este tipo de algoritmo

    es el problema de clasificacin, donde el sistema de aprendizaje trata de etiquetar

    (clasificar) una serie de vectores utilizando una entre varias categoras (clases). La

    base de conocimiento del sistema est formada por ejemplos de etiquetados

    anteriores. Este tipo de aprendizaje puede llegar a ser muy til en problemas de

    investigacin biolgica, biologa computacional y bioinformtica.

    Aprendizaje no supervisado

    Todo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos

    formado tan slo por entradas al sistema. No se tiene informacin sobre las

    categoras de esos ejemplos. Por lo tanto, en este caso, el sistema tiene que ser

    capaz de reconocer patrones para poder etiquetar las nuevas entradas.

  • Aprendizaje semisupervisado

    Este tipo de algoritmos combinan los dos algoritmos anteriores para poder

    clasificar de manera adecuada. Se tiene en cuenta los datos marcados y los no

    marcados.

    Aprendizaje por refuerzo

    El algoritmo aprende observando el mundo que le rodea. Su informacin de

    entrada es el feedback o retroalimentacin que obtiene del mundo exterior como

    respuesta a sus acciones. Por lo tanto, el sistema aprende a base de ensayo-error.

    Transduccin

    Similar al aprendizaje supervisado, pero no construye de forma explcita una

    funcin. Trata de predecir las categoras de los futuros ejemplos basndose en los

    ejemplos de entrada, sus respectivas categoras y los ejemplos nuevos al sistema.

    Aprendizaje multi-tarea

    Mtodos de aprendizaje que usan conocimiento previamente aprendido por el

    sistema de cara a enfrentarse a problemas parecidos a los ya vistos.

    El anlisis computacional y de rendimiento de los algoritmos de

    aprendizaje automtico es una rama de la estadstica conocida

    como teora computacional del aprendizaje.

    El aprendizaje automtico las personas lo llevamos a cabo de

    manera automtica ya que es un proceso tan sencillo para

    nosotros que ni nos damos cuenta de cmo se realiza y todo lo

    que implica. Desde que nacemos hasta que morimos los seres

    humanos llevamos a cabo diferentes procesos, entre ellos

    encontramos el de aprendizaje por medio del cual adquirimos

    conocimientos, desarrollamos habilidades para analizar y evaluar

    a travs de mtodos y tcnicas as como tambin por medio de la

    experiencia propia. Sin embargo, a las mquinas hay que

    indicarles cmo aprender, ya que si no se logra que una mquina

    sea capaz de desarrollar sus habilidades, el proceso de

    aprendizaje no se estar llevando a cabo, sino que solo ser una

    secuencia repetitiva. Tambin debemos tener en cuenta que el

    tener conocimiento o el hecho de realizar bien el proceso de

    aprendizaje automtico no implica que se sepa utilizar, es preciso

    saber aplicarlo en las actividades cotidianas, y un buen

    aprendizaje tambin implica saber cmo y cundo utilizar nuestros

    conocimientos.

    Para llevar a cabo un buen aprendizaje es necesario considerar

    todos los factores que a este le rodean, como la sociedad, la

    economa, la ciudad, el ambiente, el lugar, etc. Por lo tanto, es

    necesario empezar a tomar diversas medidas para lograr un

  • aprendizaje adecuado, y obtener una automatizacin adecuada

    del aprendizaje. As, lo primero que se debe tener en cuenta es el

    concepto de conocimiento, que es el entendimiento de un

    determinado tema o materia en el cual tu puedas dar tu opinin o

    punto de vista, as como responder a ciertas interrogantes que

    puedan surgir de dicho tema o materia.

    Enfoques rboles de decisiones

    Este tipo de aprendizaje usa un rbol de decisiones como modelo

    predictivo. Se mapean observaciones sobre un objeto con

    conclusiones sobre el valor final de dicho objeto.

    Los rboles son estructuras bsicas en la informtica. Los rboles

    de atributos son la base de las decisiones. Una de las dos formas

    principales de rboles de decisiones es la desarrollada

    por Quinlan de medir la impureza de la entropa en cada rama,

    algo que primero desarroll en el algoritmo ID3 y luego en el C4.5.

    Otra de las estrategias se basa en el ndice GINI y fue

    desarrollada por Breiman, Friedman et alia. El algoritmo de CART

    es una implementacin de esta estrategia.2

    Reglas de asociacin

    Los algoritmo de reglas de asociacin procuran descubrir

    relaciones interesantes entre variables. Entre los mtodos ms

    conocidos se hallan el algoritmo a priori, el algoritmo Eclat y el

    algoritmo de Patrn Frecuente.

    Algoritmos genticos

    Los algoritmos genticos son procesos de bsqueda heurstica

    que simulan la seleccin natural. Usan mtodos tales como la

    mutacin y el cruzamiento para generar nuevas clases que

    puedan ofrecer una buena solucin a un problema dado.

    Redes neurales artificiales

    Las redes de neuronas artificiales (RNA) son un paradigma de

    aprendizaje automtico inspirado en las neuronas de los sistemas

    nerviosos de los animales. Se trata de un sistema de enlaces de

    neuronas que colaboran entre s para producir un estmulo de

    salida. Las conexiones tienen pesos numricos que se adaptan

    segn la experiencia. De esta manera, las redes neurales se

  • adaptan a un impulso y son capaces de aprender. La importancia

    de las redes neurales cay durante un tiempo con el desarrollo de

    los vectores de soporte y clasificadores lineales, pero volvi a

    surgir a finales de la dcada de 2000 con la llegana

    del aprendizaje profundo.

    Mquinas de vectores de soporte[editar]

    Artculo principal: Mquinas de vectores de soporte

    Las MVS son una serie de mtodos de aprendizaje supervisado

    usados para clasificacin y regresin. Los algoritmos de MVS

    usan un conjunto de ejemplos de entrenamiento clasificado en

    dos categoras para construir un modelo que prediga si un nuevo

    ejemplo pertenece a una u otra de dichas categoras.

    Algoritmos de agrupamiento

    Artculo principal: Algoritmo de agrupamiento

    El anlisis por agrupamieto (clustering en ingls) es la

    clasificacin de observaciones en subgrupos - clusters - para que

    las observaciones en cada grupo se asemejen entre s segn

    ciertos criterios.

    Las tcnicas de agrupamiento hacen inferencias diferentes sobre

    la estructura de los datos; se guan usualmente por una medida

    de similaridad especfica y por un nivel de compactamiento interno

    (similarida entre los miembros de un grupo) y la separacin entre

    los diferentes grupos.

    El agrupamiento es un mtodo de aprendizaje no supervisado y

    es una tcnica muy popular de anlisis estadstico de datos.

    Redes bayesianas

    Artculo principal: Redes bayesianas

    Una red bayesiana, red de creencia o modelo acclico dirigido es

    un modelo probabilstico que representa una serie de variables de

    azar y sus independencias condicionales a travs de un grfo

    acclico dirigido. Una red bayesiana puede representar, por

    ejempo, las relaciones probabilsticas entre enfermedades y

    sntomas. Dados ciertos sntomas, la red puede usarse para

    calcular las probabilidades de que ciertas enfermedades estn

    presentes en un organismo. Hay algoritmos eficientes que infieren

    y aprenden usando este tipo de representacin.