a.a

En ciencias de la computacin el aprendizaje automtico o aprendizaje de mquinas (del

ingls, "Machine Learning") es una rama de la inteligencia artificial cuyo objetivo es

desarrollar tcnicas que permitan a las computadoras aprender. De forma ms concreta,

se trata de crear programas capaces de generalizar comportamientos a partir de una

informacin no estructurada suministrada en forma de ejemplos. Es, por lo tanto, un

proceso de induccin del conocimiento. En muchas ocasiones el campo de actuacin del

aprendizaje automtico se solapa con el de la estadstica, ya que las dos disciplinas se

basan en el anlisis de datos. Sin embargo, el aprendizaje automtico se centra ms en el

estudio de la complejidad computacional de los problemas. Muchos problemas son de

clase NP-hard, por lo que gran parte de la investigacin realizada en aprendizaje

automtico est enfocada al diseo de soluciones factibles a esos problemas. El

aprendizaje automtico puede ser visto como un intento de automatizar algunas partes

delmtodo cientfico mediante mtodos matemticos.

El aprendizaje automtico tiene una amplia gama de aplicaciones, incluyendo motores de

bsqueda, diagnsticos mdicos, deteccin de fraude en el uso de tarjetas de crdito,

anlisis del mercado de valores, clasificacin de secuencias de ADN, reconocimiento del

habla y del lenguaje escrito, juegos y robtica.

Resumen

Algunos sistemas de aprendizaje automtico intentan eliminar toda necesidad de intuicin

o conocimiento experto de los procesos de anlisis de datos, mientras otros tratan de

establecer un marco de colaboracin entre el experto y la computadora. De todas formas,

la intuicin humana no puede ser reemplazada en su totalidad, ya que el diseador del

sistema ha de especificar la forma de representacin de los datos y los mtodos de

manipulacin y caracterizacin de los mismos. Sin embargo, las computadoras son

utilizadas por todo el mundo con fines tecnolgicos muy buenos.

Modelos

El aprendizaje automtico tiene como resultado un modelo para resolver una tarea dada.

Entre los modelos se distinguen1

los modelos geomtricos, construidos en el espacio de instancias y que pueden tener

una, dos o mltiples dimensiones. Si hay un borde de decisin linear entre las clases,

se dice que los datos son linearmente separables. Un lmite de decisin linear se

define como w * x = t, donde w es un vector perpendicular al lmite de decisin, x es un

punto arbitrario en el lmite de decisin y t es el umbral de la decisin

los modelos probabilsticos, que intentan determinar la distribucin de probabilidades

descriptora de la funcin que enlaza a los valores de las caractersticas con valores

determinados. Uno de los conceptos claves para desarrollar modelos probabilsticos

es la estadstica bayesiana.

los modelos lgicos, que transforman expresan las probabilidades en reglas

organizadas en forma de rboles de decisin.

Los modelos pueden tambin clasificarse como modelos de agrupamiento y modelos de

gradiente. Los primeros tratan de dividir el espacio de instancias en grupos. Los segundos,

como su nombre lo indican, representan un gradiente en el que se puede diferenciar entre

cada instancia. Clasificadores geomtricos como las mquinas de vectores de apoyo son

modelos de gradientes.

Atributos

Un atributo o caracterstica es un tipo de medida realizada sobre cualquier instancia a

medir. Los atributos mapean el espacio de instancias a un conjunto de valores o dominio

de atributos. Los valores del dominio pueden ser nmeros como la frecuencia de aparicin

de las instancias, valores binarios o un conjunto cualquiera como el de meses, estaciones

o colores.

Tipos de algoritmos

Una mquina de vectores de soporte

Los diferentes algoritmos de Aprendizaje Automtico se agrupan en una taxonoma en

funcin de la salida de los mismos. Algunos tipos de algoritmos son:

Aprendizaje supervisado

El algoritmo produce una funcin que establece una correspondencia entre las

entradas y las salidas deseadas del sistema. Un ejemplo de este tipo de algoritmo

es el problema de clasificacin, donde el sistema de aprendizaje trata de etiquetar

(clasificar) una serie de vectores utilizando una entre varias categoras (clases). La

base de conocimiento del sistema est formada por ejemplos de etiquetados

anteriores. Este tipo de aprendizaje puede llegar a ser muy til en problemas de

investigacin biolgica, biologa computacional y bioinformtica.

Aprendizaje no supervisado

Todo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos

formado tan slo por entradas al sistema. No se tiene informacin sobre las

categoras de esos ejemplos. Por lo tanto, en este caso, el sistema tiene que ser

capaz de reconocer patrones para poder etiquetar las nuevas entradas.

Aprendizaje semisupervisado

Este tipo de algoritmos combinan los dos algoritmos anteriores para poder

clasificar de manera adecuada. Se tiene en cuenta los datos marcados y los no

marcados.

Aprendizaje por refuerzo

El algoritmo aprende observando el mundo que le rodea. Su informacin de

entrada es el feedback o retroalimentacin que obtiene del mundo exterior como

respuesta a sus acciones. Por lo tanto, el sistema aprende a base de ensayo-error.

Transduccin

Similar al aprendizaje supervisado, pero no construye de forma explcita una

funcin. Trata de predecir las categoras de los futuros ejemplos basndose en los

ejemplos de entrada, sus respectivas categoras y los ejemplos nuevos al sistema.

Aprendizaje multi-tarea

Mtodos de aprendizaje que usan conocimiento previamente aprendido por el

sistema de cara a enfrentarse a problemas parecidos a los ya vistos.

El anlisis computacional y de rendimiento de los algoritmos de

aprendizaje automtico es una rama de la estadstica conocida

como teora computacional del aprendizaje.

El aprendizaje automtico las personas lo llevamos a cabo de

manera automtica ya que es un proceso tan sencillo para

nosotros que ni nos damos cuenta de cmo se realiza y todo lo

que implica. Desde que nacemos hasta que morimos los seres

humanos llevamos a cabo diferentes procesos, entre ellos

encontramos el de aprendizaje por medio del cual adquirimos

conocimientos, desarrollamos habilidades para analizar y evaluar

a travs de mtodos y tcnicas as como tambin por medio de la

experiencia propia. Sin embargo, a las mquinas hay que

indicarles cmo aprender, ya que si no se logra que una mquina

sea capaz de desarrollar sus habilidades, el proceso de

aprendizaje no se estar llevando a cabo, sino que solo ser una

secuencia repetitiva. Tambin debemos tener en cuenta que el

tener conocimiento o el hecho de realizar bien el proceso de

aprendizaje automtico no implica que se sepa utilizar, es preciso

saber aplicarlo en las actividades cotidianas, y un buen

aprendizaje tambin implica saber cmo y cundo utilizar nuestros

conocimientos.

Para llevar a cabo un buen aprendizaje es necesario considerar

todos los factores que a este le rodean, como la sociedad, la

economa, la ciudad, el ambiente, el lugar, etc. Por lo tanto, es

necesario empezar a tomar diversas medidas para lograr un

aprendizaje adecuado, y obtener una automatizacin adecuada

del aprendizaje. As, lo primero que se debe tener en cuenta es el

concepto de conocimiento, que es el entendimiento de un

determinado tema o materia en el cual tu puedas dar tu opinin o

punto de vista, as como responder a ciertas interrogantes que

puedan surgir de dicho tema o materia.

Enfoques rboles de decisiones

Este tipo de aprendizaje usa un rbol de decisiones como modelo

predictivo. Se mapean observaciones sobre un objeto con

conclusiones sobre el valor final de dicho objeto.

Los rboles son estructuras bsicas en la informtica. Los rboles

de atributos son la base de las decisiones. Una de las dos formas

principales de rboles de decisiones es la desarrollada

por Quinlan de medir la impureza de la entropa en cada rama,

algo que primero desarroll en el algoritmo ID3 y luego en el C4.5.

Otra de las estrategias se basa en el ndice GINI y fue

desarrollada por Breiman, Friedman et alia. El algoritmo de CART

es una implementacin de esta estrategia.2

Reglas de asociacin

Los algoritmo de reglas de asociacin procuran descubrir

relaciones interesantes entre variables. Entre los mtodos ms

conocidos se hallan el algoritmo a priori, el algoritmo Eclat y el

algoritmo de Patrn Frecuente.

Algoritmos genticos

Los algoritmos genticos son procesos de bsqueda heurstica

que simulan la seleccin natural. Usan mtodos tales como la

mutacin y el cruzamiento para generar nuevas clases que

puedan ofrecer una buena solucin a un problema dado.

Redes neurales artificiales

Las redes de neuronas artificiales (RNA) son un paradigma de

aprendizaje automtico inspirado en las neuronas de los sistemas

nerviosos de los animales. Se trata de un sistema de enlaces de

neuronas que colaboran entre s para producir un estmulo de

salida. Las conexiones tienen pesos numricos que se adaptan

segn la experiencia. De esta manera, las redes neurales se

adaptan a un impulso y son capaces de aprender. La importancia

de las redes neurales cay durante un tiempo con el desarrollo de

los vectores de soporte y clasificadores lineales, pero volvi a

surgir a finales de la dcada de 2000 con la llegana

del aprendizaje profundo.

Mquinas de vectores de soporte[editar]

Artculo principal: Mquinas de vectores de soporte

Las MVS son una serie de mtodos de aprendizaje supervisado

usados para clasificacin y regresin. Los algoritmos de MVS

usan un conjunto de ejemplos de entrenamiento clasificado en

dos categoras para construir un modelo que prediga si un nuevo

ejemplo pertenece a una u otra de dichas categoras.

Algoritmos de agrupamiento

Artculo principal: Algoritmo de agrupamiento

El anlisis por agrupamieto (clustering en ingls) es la

clasificacin de observaciones en subgrupos - clusters - para que

las observaciones en cada grupo se asemejen entre s segn

ciertos criterios.

Las tcnicas de agrupamiento hacen inferencias diferentes sobre

la estructura de los datos; se guan usualmente por una medida

de similaridad especfica y por un nivel de compactamiento interno

(similarida entre los miembros de un grupo) y la separacin entre

los diferentes grupos.

El agrupamiento es un mtodo de aprendizaje no supervisado y

es una tcnica muy popular de anlisis estadstico de datos.

Redes bayesianas

Artculo principal: Redes bayesianas

Una red bayesiana, red de creencia o modelo acclico dirigido es

un modelo probabilstico que representa una serie de variables de

azar y sus independencias condicionales a travs de un grfo

acclico dirigido. Una red bayesiana puede representar, por

ejempo, las relaciones probabilsticas entre enfermedades y

sntomas. Dados ciertos sntomas, la red puede usarse para

calcular las probabilidades de que ciertas enfermedades estn

presentes en un organismo. Hay algoritmos eficientes que infieren

y aprenden usando este tipo de representacin.

a.a

Documents