3. agentes

1

Inteligencia Artificial

Tema 2Estructura de un Agente

Ivan Olmos Pineda

BUAP Inteligencia Artificial 2

Contenido

Clasificación de AgentesAgentes de Reflejo SimpleAgentes Bien Informados de lo que PasaAgentes Basados en MetasAgentes Basados en Utilidad

Tipos de Arquitectura para un AgenteAmbientes

2

Clasificación de Agentes


Importante

Antes de diseñar un agente, se tiene que considerar:

Percepciones PosiblesAcciones PosiblesMedida de desempeño u objetivos que debe lograrTipos de entorno en los que va a operar

3


Ejemplo

Considere un piloto automático para un carro (PAC)

Cantidad de variables ilimitadaCuáles serían sus:

PercepcionesAccionesMetasAmbiente


Tipos de Agente

Para el piloto automático, se pueden considerar diversos tipos de agentes:

Agentes de reflejo simpleAgentes bien informados de todo lo que pasaAgentes basados en metasAgentes basados en utilidad

4


Agentes de Reflejo Simple

Estrategia: resumir lo más importanteBasada en reglas

Reglas de condición – acciónSi el carro de adelante esta frenando, entoncesempezar a frenar

Los agentes de reflejo simple funcionan si se toma la acción correcta con base en la percepción del momento


Agentes de Reflejo Simple

Am

biente

Sensores

Como es el mundoen este momento

Reglas Condición - Acción ¿Qué acción debo emprender?

Efectores

AGENTE

5


Agentes Bien Informados

Se considera el entorno para decidir accionesPor ejemplo, para cambiar de carril, el PAC debe verificar el estado de los carros cercanosPor tanto, se requiere:

Información de cómo evoluciona el mundoInformación sobre como las acciones del agente afectan al mundo


Agentes Bien Informados

Am

biente

Sensores



Efectores

AGENTE

Estado

Como evoluciona el mundo

Que producen mis acciones

6


Agentes Basados en Metas

No basta con conocer el entorno, sino además es necesario determinar las acciones a seguir que permitan alcanzar la metaElegir las acciones correctas varia en complejidad (IA)

BúsquedaPlanificación


Agentes Basados en Metas

Este enfoque considera el “futuro”, a diferencia de las reglas “condición-acción”

¿Qué sucedería si se realiza la acción “X”? ¿ó “Y”?

Estos tipos de agente son más flexibles con respecto a su entorno

Se modifica su comportamiento con base en los estímulos recibidos

7


Agentes Basados en MetasA

mbiente

Sensores



Efectores

AGENTE

Estado

Como evoluciona el mundo

Que producen mis acciones¿Qué sucedería si

Emprendo la acción“A”?


Agentes Basados en Utilidad

Las metas no bastan para generar una conducta de alta calidad

Secuencias más óptimas para alcanzar la metaLa utilidad es una función (fU) que relaciona un estado y un número real mediante el cual se caracteriza el estado de satisfacción del agente

0: ningún avance hasta la meta1: se ha alcanzado la meta

8


Agentes Basados en Utilidad

Una correcta especificación de la función de utilidad, permite la toma de decisiones racionales en dos casos

El logro de algunas metas implica un conflicto y solo algunas de ellas se pueden obtener (define el compromiso adecuado)Cuando son varias las metas y no existe la certeza de poder lograr alguna, fU sirve para ponderar la posibilidad de tener éxito considerando la importancia de cada meta

Arquitectura para un Agente

9


Arquitectura de un Agente (1/2)

Basadas en la Lógica (agentes deliberativos).Toma de decisiones basada en la deducción lógica.

Agentes reactivosToma de decisiones basada en el mundo actual sin tomar en cuenta el pasado.


Arquitectura de un Agente (2/2)

Arquitectura creencia-deseo-intención.Toma de decisiones depende de la manipulación de estructuras de datos que representan creencias, deseos e intenciones del agente.

Arquitecturas híbridas.Toma de decisiones utilizando varias capas.

10


Agentes Deliberativos (basados en lógica)

Comportamiento inteligente:Representación simbólica del medio y del comportamiento.

Fórmulas lógicas.

Manipulación sintáctica de las representaciones.Deducción lógica o comprobación de teoremas


Agentes Deliberativos

Teoría (especificación comportamiento)Estado interno: BD fórmulas de primer orden.

Simulan creencias humanas.Son actualizadas mediante sensores.Abierto(valvula83)Temperatura(horno13,590)Presion(tanque8,35,normal)

Toma de decisiones: reglas de deducción.Regla probada = acción a realizar.Abierto(X) & Presion(Y,X,baja) -> Cerrar(X).Ninguna acción puede ser probada -> reportarlo.

11


Agentes Deliberativos

Ventajas de la arquitectura deliberativa“Elegantes”.Semántica clara (lógica).

DesventajasComplejidad computacional para la comprobación de teoremas (lenta ejecución para agentes en tiempo real).Toma de decisiones -> ambiente no cambia mientras se decide que hacer.Acción racional al iniciar toma de decisiones = racional al finalizar.


Agentes Reactivos

Nueva forma de atacar el problema:Rechazo a la representación simbólica.

Comportamiento inteligente Ligado al medio ambiente:

Producto de la interacción del agente-ambiente.Emerge de la interacción de varios comportamientos más sencillos.

12


Agentes Reactivos

Denominaciones:Basados en comportamiento (behavioural)

Desarrollo y mezcla de comportamientos individuales.

Situados (situated)Agentes situados en un ambiente, no fuera de el.

Reactivos (reactive)Reaccionan al medio ambiente sin “razonar”.


Agentes Reactivos

Arquitectura de Integración (subsumption)Dos características principales:1. Toma de decisiones: conjunto de comportamientos que

realizan tareas.Comportamiento:

Acción simple.Implementado como una máquina de estados finitos.

No hay representación simbólica compleja.Bajo o nulo procesamiento de datos de sensores.

No hay razonamiento simbólico.Situación -> acción

13


Agentes Reactivos

Arquitectura de Integración...2. Varios comportamientos pueden activarse a la vez.

Jerarquía de integración (mecanismo selección acción).Comportamientos arreglados en capas.Capas inferiores inhiben a las superiores.Capa menor

Mayor prioridad.Comportamientos sencillos.

Capa mayorMenor prioridad.Comportamiento abstracto.


Ejemplo: Explorador de Marte

Explorador de MarteSe necesita explorar un planeta para recoger muestras de roca. No se sabe donde se encuentra la roca deseada pero se conoce que se encuentra generalmente amontonada. Un conjunto de vehículos autónomos deben recorrer el planeta recolectando muestras. Al terminar deben de regresar a la nave base. No existe mapa del planeta pero se conoce que el terreno es accidentado lo que imposibilita comunicación alguna entre vehículos.

14


Explorador de Marte

Solución:Dos mecanismos esenciales:1. Campo gradiente:

Nave emite señal de radio. Esta se debilita al alejarse. No contiene información alguna.

2. Método de comunicación indirecta: Agentes cargan “moronas radioactivas”Pueden ser tiradas, levantadas y detectadas.

Dos tipos de comportamientos:Recolección individual de muestras.Solución cooperativa entre todos los agentes.


Explorador de Marte

Comportamiento individual (no cooperativo).Capa 1: Evitar obstáculos.Si se detecta un obstáculo -> cambiar direcciónCapa 2: Llevar muestras a la nave.Si lleva muestras y esta en la nave -> soltarlas.Si lleva muestras y no esta en la nave-> ir a la nave.Capa 3: Recolectar muestras.Si se detecta muestra -> recogerla.Capa 4: ExplorarSi no hay nada mejor que hacer -> moverse

aleatoriamente.

15


Explorador de Marte


Explorador de Marte

Comportamiento colaborativo.Camino hacia una muestra encontrada.

Capa 1: Evitar obstáculos.Si se detecta un obstáculo -> cambiar direcciónCapa 2: Llevar muestras a la nave.Si lleva muestras y en nave -> soltarlasSi lleva muestras y no en nave -> tirar 2 moronas e ir naveCapa 3: Recolectar muestras.Si se detecta muestra -> recogerlaCapa 4: Moronas.Si se detectan moronas -> tomar 1 y seguir camino.Capa 5: ExplorarSi no hay nada mejor que hacer -> moverse aleatoriamente

16


Explorador de Marte


Agentes Reactivos

Ventajas de la arquitectura reactiva:Velocidad: en hw provee de decisión constante.Simplicidad computacional.Economía.Seguridad en caso de falla.Elegancia (sencillez).

17


Agentes Reactivos

Desventajas:Agente sin modelo del ambiente -> suficiente información en el ambiente local.Toma de decisiones a corto plazo (info. local).Dificultad en los agentes puramente reactivospara aprender y mejorar.No existe una metodología formal para construir agentes -> prueba y error.Gran dificultad para construir agentes con muchas capas. Relaciones muy complejas


Arquitectura Creencia-Deseo-Intención

Basadas en el razonamiento práctico (usado en la vida cotidiana).

Dos procesos importantes:Deliberación: decidir que metas se desean.Planeación: decidir cómo llevar acabo las metas.

18



Ej: ser académico.Graduación -> estudio opciones: academia, industria, negocio.Selección opción -> compromiso.Opciones seleccionadas -> intenciones.Intenciones -> acciones.

Actuar (acción).Persistencia.

Intentos razonables.Intentar varias veces una acción.Cambio si se determina intención imposible.

Eliminación metas incoherentes (con intención).Relacionadas con creencias sobre el futuro.



Componentes básicos de CDI:Estructuras de datos:

Creencias.Deseos.Intenciones.

Funciones de deliberación y planeación.Intenciones:

Parte central.Permiten enfocar razonamiento práctico del agente.Estabilidad para la toma de decisiones.

19



Ventajas:Intuitiva.Descomposición funcional clara.

Desventaja: Implementación (¿cómo implementarla?)


Arquitecturas Híbridas

Comportamiento reactivo y deliberativo.Basadas en jerarquías de capas.

Capas interactúan entre si.Al menos 2 capas (reactiva y deliberativa).Mas capas -> mayor dificultad control.Dos tipos:

Horizontales.Verticales.

20





Disposición HorizontalCada capa actúa como si fuera un agente.

Sugiere acciones.

Ventaja: simplicidad conceptual.n comportamientos -> n capas.

Desventajas: competencia entre capas.Comportamiento global incoherente.

Introducción control global (mediador) -> cuello de botellaNecesidad de considerar todas las interacciones (mn).

21



Disposición VerticalPaso sencillo

Secuenciales.Paso doble

Similares a una organización.Ventaja

Complejidad menor: m2(n-1)Desventaja

Reducción en flexibilidad.Información por todas las capas.No tolerante a fallas.

Ambientes

22


Ambientes

Existen diferentes tipos de ambientes:Accesibles y no accesiblesDeterministas y no deterministasEpisódicos y no episódicosEstáticos y dinámicosDiscretos y continuos


AmbientesAccesibles y no accesibles

Si a través de los sensores, el agente tiene acceso al estado total del ambiente, entonces éste es accesibleLos ambientes accesibles son cómodos, ya que el agente no mantiene un estado interno para estar al tanto de lo que sucede en el mundo

23


AmbientesDeterministas y no deterministas

Si el estado siguiente se determina a partir del estado y las acciones elegidas por el agente

Ambiente deterministaSi el ambiente no es accesible, entonces podría parecer que no es determinista (en especial en un ambiente complejo)


AmbientesEpisódicos y no episódicos

En un ambiente episódico, la experiencia del agente se divide en “episodios”Cada episodio consta de un agente que percibe y actúaLos ambientes episódicos son más sencillos puesto que el agente no tiene que pensar por adelantado

24


AmbientesEstáticos y dinámicos

Si el ambiente cambia mientras un agente toma una acción a seguir, entonces se dice que el ambiente es “dinámico”Es más simple trabajar con ambientes estáticos puesto que no se tiene que observar y pensar al mismo tiempo


AmbientesDiscretos y continuos

Si existe una cantidad limitada de percepciones y acciones distintas y discernibles, se dice que el ambiente es discretoSi no es posible enumerarlos, entonces es un ambiente continuo

25


Trabajo

Considere el juego de dominoDiseñe un esquema de agentes simples que puedan jugar una partida de dominoSi deseamos que los agentes jueguen en pareja, ¿Qué tipo de agentes propondrías? Explica tu respuestaDiseña un conjunto de agentes basados en metas que jueguen en parejas en un torneo a 100 pts. Analiza cada posible estado y considéralo en el esquema propuesto.

3. agentes

Documents