3. agentes
TRANSCRIPT
1
Inteligencia Artificial
Tema 2Estructura de un Agente
Ivan Olmos Pineda
BUAP Inteligencia Artificial 2
Contenido
Clasificación de AgentesAgentes de Reflejo SimpleAgentes Bien Informados de lo que PasaAgentes Basados en MetasAgentes Basados en Utilidad
Tipos de Arquitectura para un AgenteAmbientes
2
Clasificación de Agentes
BUAP Inteligencia Artificial 4
Importante
Antes de diseñar un agente, se tiene que considerar:
Percepciones PosiblesAcciones PosiblesMedida de desempeño u objetivos que debe lograrTipos de entorno en los que va a operar
3
BUAP Inteligencia Artificial 5
Ejemplo
Considere un piloto automático para un carro (PAC)
Cantidad de variables ilimitadaCuáles serían sus:
PercepcionesAccionesMetasAmbiente
BUAP Inteligencia Artificial 6
Tipos de Agente
Para el piloto automático, se pueden considerar diversos tipos de agentes:
Agentes de reflejo simpleAgentes bien informados de todo lo que pasaAgentes basados en metasAgentes basados en utilidad
4
BUAP Inteligencia Artificial 7
Agentes de Reflejo Simple
Estrategia: resumir lo más importanteBasada en reglas
Reglas de condición – acciónSi el carro de adelante esta frenando, entoncesempezar a frenar
Los agentes de reflejo simple funcionan si se toma la acción correcta con base en la percepción del momento
BUAP Inteligencia Artificial 8
Agentes de Reflejo Simple
Am
biente
Sensores
Como es el mundoen este momento
Reglas Condición - Acción ¿Qué acción debo emprender?
Efectores
AGENTE
5
BUAP Inteligencia Artificial 9
Agentes Bien Informados
Se considera el entorno para decidir accionesPor ejemplo, para cambiar de carril, el PAC debe verificar el estado de los carros cercanosPor tanto, se requiere:
Información de cómo evoluciona el mundoInformación sobre como las acciones del agente afectan al mundo
BUAP Inteligencia Artificial 10
Agentes Bien Informados
Am
biente
Sensores
Como es el mundoen este momento
Reglas Condición - Acción ¿Qué acción debo emprender?
Efectores
AGENTE
Estado
Como evoluciona el mundo
Que producen mis acciones
6
BUAP Inteligencia Artificial 11
Agentes Basados en Metas
No basta con conocer el entorno, sino además es necesario determinar las acciones a seguir que permitan alcanzar la metaElegir las acciones correctas varia en complejidad (IA)
BúsquedaPlanificación
BUAP Inteligencia Artificial 12
Agentes Basados en Metas
Este enfoque considera el “futuro”, a diferencia de las reglas “condición-acción”
¿Qué sucedería si se realiza la acción “X”? ¿ó “Y”?
Estos tipos de agente son más flexibles con respecto a su entorno
Se modifica su comportamiento con base en los estímulos recibidos
7
BUAP Inteligencia Artificial 13
Agentes Basados en MetasA
mbiente
Sensores
Como es el mundoen este momento
Reglas Condición - Acción ¿Qué acción debo emprender?
Efectores
AGENTE
Estado
Como evoluciona el mundo
Que producen mis acciones¿Qué sucedería si
Emprendo la acción“A”?
BUAP Inteligencia Artificial 14
Agentes Basados en Utilidad
Las metas no bastan para generar una conducta de alta calidad
Secuencias más óptimas para alcanzar la metaLa utilidad es una función (fU) que relaciona un estado y un número real mediante el cual se caracteriza el estado de satisfacción del agente
0: ningún avance hasta la meta1: se ha alcanzado la meta
8
BUAP Inteligencia Artificial 15
Agentes Basados en Utilidad
Una correcta especificación de la función de utilidad, permite la toma de decisiones racionales en dos casos
El logro de algunas metas implica un conflicto y solo algunas de ellas se pueden obtener (define el compromiso adecuado)Cuando son varias las metas y no existe la certeza de poder lograr alguna, fU sirve para ponderar la posibilidad de tener éxito considerando la importancia de cada meta
Arquitectura para un Agente
9
BUAP Inteligencia Artificial 17
Arquitectura de un Agente (1/2)
Basadas en la Lógica (agentes deliberativos).Toma de decisiones basada en la deducción lógica.
Agentes reactivosToma de decisiones basada en el mundo actual sin tomar en cuenta el pasado.
BUAP Inteligencia Artificial 18
Arquitectura de un Agente (2/2)
Arquitectura creencia-deseo-intención.Toma de decisiones depende de la manipulación de estructuras de datos que representan creencias, deseos e intenciones del agente.
Arquitecturas híbridas.Toma de decisiones utilizando varias capas.
10
BUAP Inteligencia Artificial 19
Agentes Deliberativos (basados en lógica)
Comportamiento inteligente:Representación simbólica del medio y del comportamiento.
Fórmulas lógicas.
Manipulación sintáctica de las representaciones.Deducción lógica o comprobación de teoremas
BUAP Inteligencia Artificial 20
Agentes Deliberativos
Teoría (especificación comportamiento)Estado interno: BD fórmulas de primer orden.
Simulan creencias humanas.Son actualizadas mediante sensores.Abierto(valvula83)Temperatura(horno13,590)Presion(tanque8,35,normal)
Toma de decisiones: reglas de deducción.Regla probada = acción a realizar.Abierto(X) & Presion(Y,X,baja) -> Cerrar(X).Ninguna acción puede ser probada -> reportarlo.
11
BUAP Inteligencia Artificial 21
Agentes Deliberativos
Ventajas de la arquitectura deliberativa“Elegantes”.Semántica clara (lógica).
DesventajasComplejidad computacional para la comprobación de teoremas (lenta ejecución para agentes en tiempo real).Toma de decisiones -> ambiente no cambia mientras se decide que hacer.Acción racional al iniciar toma de decisiones = racional al finalizar.
BUAP Inteligencia Artificial 22
Agentes Reactivos
Nueva forma de atacar el problema:Rechazo a la representación simbólica.
Comportamiento inteligente Ligado al medio ambiente:
Producto de la interacción del agente-ambiente.Emerge de la interacción de varios comportamientos más sencillos.
12
BUAP Inteligencia Artificial 23
Agentes Reactivos
Denominaciones:Basados en comportamiento (behavioural)
Desarrollo y mezcla de comportamientos individuales.
Situados (situated)Agentes situados en un ambiente, no fuera de el.
Reactivos (reactive)Reaccionan al medio ambiente sin “razonar”.
BUAP Inteligencia Artificial 24
Agentes Reactivos
Arquitectura de Integración (subsumption)Dos características principales:1. Toma de decisiones: conjunto de comportamientos que
realizan tareas.Comportamiento:
Acción simple.Implementado como una máquina de estados finitos.
No hay representación simbólica compleja.Bajo o nulo procesamiento de datos de sensores.
No hay razonamiento simbólico.Situación -> acción
13
BUAP Inteligencia Artificial 25
Agentes Reactivos
Arquitectura de Integración...2. Varios comportamientos pueden activarse a la vez.
Jerarquía de integración (mecanismo selección acción).Comportamientos arreglados en capas.Capas inferiores inhiben a las superiores.Capa menor
Mayor prioridad.Comportamientos sencillos.
Capa mayorMenor prioridad.Comportamiento abstracto.
BUAP Inteligencia Artificial 26
Ejemplo: Explorador de Marte
Explorador de MarteSe necesita explorar un planeta para recoger muestras de roca. No se sabe donde se encuentra la roca deseada pero se conoce que se encuentra generalmente amontonada. Un conjunto de vehículos autónomos deben recorrer el planeta recolectando muestras. Al terminar deben de regresar a la nave base. No existe mapa del planeta pero se conoce que el terreno es accidentado lo que imposibilita comunicación alguna entre vehículos.
14
BUAP Inteligencia Artificial 27
Explorador de Marte
Solución:Dos mecanismos esenciales:1. Campo gradiente:
Nave emite señal de radio. Esta se debilita al alejarse. No contiene información alguna.
2. Método de comunicación indirecta: Agentes cargan “moronas radioactivas”Pueden ser tiradas, levantadas y detectadas.
Dos tipos de comportamientos:Recolección individual de muestras.Solución cooperativa entre todos los agentes.
BUAP Inteligencia Artificial 28
Explorador de Marte
Comportamiento individual (no cooperativo).Capa 1: Evitar obstáculos.Si se detecta un obstáculo -> cambiar direcciónCapa 2: Llevar muestras a la nave.Si lleva muestras y esta en la nave -> soltarlas.Si lleva muestras y no esta en la nave-> ir a la nave.Capa 3: Recolectar muestras.Si se detecta muestra -> recogerla.Capa 4: ExplorarSi no hay nada mejor que hacer -> moverse
aleatoriamente.
15
BUAP Inteligencia Artificial 29
Explorador de Marte
BUAP Inteligencia Artificial 30
Explorador de Marte
Comportamiento colaborativo.Camino hacia una muestra encontrada.
Capa 1: Evitar obstáculos.Si se detecta un obstáculo -> cambiar direcciónCapa 2: Llevar muestras a la nave.Si lleva muestras y en nave -> soltarlasSi lleva muestras y no en nave -> tirar 2 moronas e ir naveCapa 3: Recolectar muestras.Si se detecta muestra -> recogerlaCapa 4: Moronas.Si se detectan moronas -> tomar 1 y seguir camino.Capa 5: ExplorarSi no hay nada mejor que hacer -> moverse aleatoriamente
16
BUAP Inteligencia Artificial 31
Explorador de Marte
BUAP Inteligencia Artificial 32
Agentes Reactivos
Ventajas de la arquitectura reactiva:Velocidad: en hw provee de decisión constante.Simplicidad computacional.Economía.Seguridad en caso de falla.Elegancia (sencillez).
17
BUAP Inteligencia Artificial 33
Agentes Reactivos
Desventajas:Agente sin modelo del ambiente -> suficiente información en el ambiente local.Toma de decisiones a corto plazo (info. local).Dificultad en los agentes puramente reactivospara aprender y mejorar.No existe una metodología formal para construir agentes -> prueba y error.Gran dificultad para construir agentes con muchas capas. Relaciones muy complejas
BUAP Inteligencia Artificial 34
Arquitectura Creencia-Deseo-Intención
Basadas en el razonamiento práctico (usado en la vida cotidiana).
Dos procesos importantes:Deliberación: decidir que metas se desean.Planeación: decidir cómo llevar acabo las metas.
18
BUAP Inteligencia Artificial 35
Arquitectura Creencia-Deseo-Intención
Ej: ser académico.Graduación -> estudio opciones: academia, industria, negocio.Selección opción -> compromiso.Opciones seleccionadas -> intenciones.Intenciones -> acciones.
Actuar (acción).Persistencia.
Intentos razonables.Intentar varias veces una acción.Cambio si se determina intención imposible.
Eliminación metas incoherentes (con intención).Relacionadas con creencias sobre el futuro.
BUAP Inteligencia Artificial 36
Arquitectura Creencia-Deseo-Intención
Componentes básicos de CDI:Estructuras de datos:
Creencias.Deseos.Intenciones.
Funciones de deliberación y planeación.Intenciones:
Parte central.Permiten enfocar razonamiento práctico del agente.Estabilidad para la toma de decisiones.
19
BUAP Inteligencia Artificial 37
Arquitectura Creencia-Deseo-Intención
Ventajas:Intuitiva.Descomposición funcional clara.
Desventaja: Implementación (¿cómo implementarla?)
BUAP Inteligencia Artificial 38
Arquitecturas Híbridas
Comportamiento reactivo y deliberativo.Basadas en jerarquías de capas.
Capas interactúan entre si.Al menos 2 capas (reactiva y deliberativa).Mas capas -> mayor dificultad control.Dos tipos:
Horizontales.Verticales.
20
BUAP Inteligencia Artificial 39
Arquitecturas Híbridas
BUAP Inteligencia Artificial 40
Arquitecturas Híbridas
Disposición HorizontalCada capa actúa como si fuera un agente.
Sugiere acciones.
Ventaja: simplicidad conceptual.n comportamientos -> n capas.
Desventajas: competencia entre capas.Comportamiento global incoherente.
Introducción control global (mediador) -> cuello de botellaNecesidad de considerar todas las interacciones (mn).
21
BUAP Inteligencia Artificial 41
Arquitecturas Híbridas
Disposición VerticalPaso sencillo
Secuenciales.Paso doble
Similares a una organización.Ventaja
Complejidad menor: m2(n-1)Desventaja
Reducción en flexibilidad.Información por todas las capas.No tolerante a fallas.
Ambientes
22
BUAP Inteligencia Artificial 43
Ambientes
Existen diferentes tipos de ambientes:Accesibles y no accesiblesDeterministas y no deterministasEpisódicos y no episódicosEstáticos y dinámicosDiscretos y continuos
BUAP Inteligencia Artificial 44
AmbientesAccesibles y no accesibles
Si a través de los sensores, el agente tiene acceso al estado total del ambiente, entonces éste es accesibleLos ambientes accesibles son cómodos, ya que el agente no mantiene un estado interno para estar al tanto de lo que sucede en el mundo
23
BUAP Inteligencia Artificial 45
AmbientesDeterministas y no deterministas
Si el estado siguiente se determina a partir del estado y las acciones elegidas por el agente
Ambiente deterministaSi el ambiente no es accesible, entonces podría parecer que no es determinista (en especial en un ambiente complejo)
BUAP Inteligencia Artificial 46
AmbientesEpisódicos y no episódicos
En un ambiente episódico, la experiencia del agente se divide en “episodios”Cada episodio consta de un agente que percibe y actúaLos ambientes episódicos son más sencillos puesto que el agente no tiene que pensar por adelantado
24
BUAP Inteligencia Artificial 47
AmbientesEstáticos y dinámicos
Si el ambiente cambia mientras un agente toma una acción a seguir, entonces se dice que el ambiente es “dinámico”Es más simple trabajar con ambientes estáticos puesto que no se tiene que observar y pensar al mismo tiempo
BUAP Inteligencia Artificial 48
AmbientesDiscretos y continuos
Si existe una cantidad limitada de percepciones y acciones distintas y discernibles, se dice que el ambiente es discretoSi no es posible enumerarlos, entonces es un ambiente continuo
25
BUAP Inteligencia Artificial 49
Trabajo
Considere el juego de dominoDiseñe un esquema de agentes simples que puedan jugar una partida de dominoSi deseamos que los agentes jueguen en pareja, ¿Qué tipo de agentes propondrías? Explica tu respuestaDiseña un conjunto de agentes basados en metas que jueguen en parejas en un torneo a 100 pts. Analiza cada posible estado y considéralo en el esquema propuesto.