7/17/2019 SISTINT 002new9
http://slidepdf.com/reader/full/sistint-002new9 1/5
1
Sistemas InteligentesSesión 02
Ing. CIP Renzo I. Vergara Quiche
Universidad Nacional “José Faustino Sánchez Carrión”
Facultad de Ingeniería Industrial, Sistemas e Informática
Escuela Profesional de Ingeniería Informática
Los Agentes y su entorno
Agente (Diccionario RAE):
Que obra o tiene virtud de obrar.
Persona que actúa en representación de otro (agente artístico, comercial,
inmobiliario, de seguros, de bolsa, etc).
Un agente es cualquier cosa capaz de percibir su medioambiente con la ayuda desensores y actuar en ese medio utili zando actuadores.
Un agente es un sistema conformado por hardware y/o software que basa sucomportamiento en las percepciones que tiene del medio ambiente mediantesus sensores y en las reglas de comportamiento incorporadas en el software.
Agentes software (softbots): Aplicaciones informáticas con capacidad paradecidir cómo deben actuar para alcanzar sus objetivos
Agentes inteligentes: Agentes software que pueden funcionar fiablemente en unentorno rápidamente cambiante e impredecible
Ejemplos: Labores diarias realizadas en internet, Comprar por internet (la tienda encasa), Sistema de diagnóstico médico, Análisis de imágenes satelitales, Robot ensambladorde partes, Controlador de una refinería
Tipificando a un agente
Comprensión/intencionalidad
Comportamiento
VeOyeTocaGusta
Huele
ENTRADAS Procesos INTERNOS
SALIDAS
Sensor del ambiente
Razona
Conoce
Agente
Agente según Wooldridge - 1995
Un agente es un sistema de computación capaz de actuar de
forma autónoma y flexible en un entorno, entendiendopor flexible que sea:
– Reactivo: El agente es capaz de responder a cambios en el entornoen que se encuentra situado.
– Pro-activo: El agente debe ser capaz de intentar cumplir suspropios planes u objetivos.
– Social: Debe poder comunicarse con otros agentes mediante algúntipo de lenguaje de comunicación de agentes.
Reactivo
Si se garantiza que el ambiente de un programa es fijo, esteno necesita preocuparse por su propio éxito o fracaso elprograma simplemente se ejecuta ciegamente.
Ejemplo ambiente fijo: Un compilador
El mundo real no es fijo: las cosas cambian y la informaciónes incompleta. La mayoría de los ambientes interesantesson dinámicos.
El software para dominios dinámicos es difícil de construir:los programas deben tener en cuenta la posibilidad defalla preguntarse a sí mismos si vale la pena realizar unaacción.
Un sistema reactivo es aquel que mantiene una interacción
constante con su ambiente, y responde a los cambios queocurren en este (en un tiempo es que la respuesta es útil)
7/17/2019 SISTINT 002new9
http://slidepdf.com/reader/full/sistint-002new9 2/5
2
Pro-Activo
Reaccionar ante un ambiente es fácil (por ejemplo:reglas estímulo-respuesta)
Pero, generalmente queremos agentes que hagancosas por nosotros.
Esto requiere: comportamientos orientados a metas
Pro-actividad = generar y tratar de alcanzar metas; noguiarse solamente por los eventos; tomar la iniciativa
Reconocer oportunidades.
Habilidad Social
El mundo real es un ambiente multi-agente: no podemos ir
por ahí tratando de alcanzar metas sin tomar en cuenta alos otros.
Algunas metas sólo pueden ser alcanzadas con lacooperación de otros.
Lo mismo ocurre con muchos ambientes computacionales,ejemplo: Internet.
La habilidad social en agentes es la habilidad deinteractuar con otros agentes (y posiblemente conhumanos) por medio de algún tipo de lenguaje decomunicación de agentes, y quizás cooperar con otros.
Otras Propiedades de Agentes - Franklin
Continuidad Temporal: se considera un agente un proceso sin fin, ejecutándosecontinuamente y desarrollando su función.
Autonomía: un agente es completamente autónomo si es capaz de actuar basándose en su experiencia, es capaz de adaptarse aunque el entorno cambieseveramente. Una definición menos estricta de autonomía sería cuando el agentepercibe el entorno.
Sociabilidad: permite a un agente comunicar con otros agentes o incluso con otrasentidades.
Racionalidad: el agente siempre realiza “lo correcto” a partir de los datos quepercibe del entorno.
Reactividad: un agente actúa como resultado de cambios en su entorno. En estecaso, un agente percibe el entorno y esos cambios dirigen el comportamiento delagente.
Pro-actividad: un agente es pro-activo cuando es capaz de controlar sus propiosobjetivosa pesar de cambios en el entorno.
Adaptatividad: está relacionado con el aprendizaje que un agente es capaz derealizary si puede cambiar su comportamiento basándose en ese aprendizaje.
Movilidad: capacidad de un agente de trasladarsea través de una red telemática.
Veracidad: asunción de que un agente no comunica información falsa a propósito.
Benevolencia: asunción de que un agente está dispuesto a ayudar a otros agentessi esto no entra en conflicto con sus propios objetivos.
Otras Propiedades de Agentes – Navajasuiza de Parunak
Otras propiedades de Agentes - Nwana Buen comportamiento:¿Qué es un agente racional?
En cada posible secuencia de percepciones, un agente racional deberáemprender aquella acción que supuestamente maximice su medida derendimiento, basándose en las evidencias aportadas por la secuencia depercepciones y en el conocimiento que el agente mantiene almacenado
Considerar:
Ser Racional (maximiza el rendimiento esperado) no significa ser omnisciente(maximiza el resultado real)
Ser Racional no es ser clarividente
Ser Racional ideal entra en conflicto con el PRR (Principio de RacionalidadRestringida).
Un agente es algo que razona, un agente informático debe tener otros atributosque los distingan de los “programas convencionales” (dotados de controlesautónomos, perciban su entorno, que persistan durante un periodo de tiempoprolongado, que se adapten a los cambios, y que sean capaces de alcanzar objetivosdiferentes” .
Un Agente Racional es aquel que actúa con la intención de alcanzar elmejor resultado o, cuando hay incertidumbre, el mejor resultado esperado
7/17/2019 SISTINT 002new9
http://slidepdf.com/reader/full/sistint-002new9 3/5
3
De qué depende la Racionalidad
La medida de rendimiento que define el criterio de éxito
Cuánto conoce el agente del ambiente en que opera
Las acciones que el agente esté en condiciones de realizar
La secuencia de percepciones - todo lo que el agente ha percibido hastaahora (gestión de la memoria).
La naturaleza del entorno de trabajo
Ejemplo: REAS de un agente “taxista automático”
Rendimiento: Seguro, rápido, legal, viaje confortable, maximización del beneficio
Entorno: Carreteras, otro tráfico, peatones, clientes
Actuadores: Dirección, acelerador, freno, señal, bocina, visualizador
Sensores: Cámaras, sonar, velocímetro, GPS, tacómetro, visualizador de laaceleración, sensores del motor, teclado
Percepciones: Video, acelerómetro, instrumental del tablero, sensores del motor,teclado
Acciones: gestión del volante, acelerar y frenar, bocina, hablar/graficar
Metas: seguridad, llegar a destino, maximizar ganancias, obedecer las leyes,satisfacción del cliente
Ambiente: calles urbanas, avenidas, tráfico, peatones, clima, tipo de cliente
Ejemplo: PAMA de un agente “taxista automático”
Otros ejemplos de REASPropiedades de los entornos de trabajo
Accesible (totalmente observable) / Inaccesible(parcialmente observable)
Si los sensores proporcionan todo lo que hay que saber sobre el estadocompleto del ambiente - necesario para elegir una acción - entonces elambiente es accesible al agente. Esos ambiente resultan convenientes,ya que liberan al agente de la tarea de mantener actualizado suinventario del mundo.
Determinístico / No-determinístico (estocástico)
Si el estado siguiente del ambiente está determinado plenamente por elestado presente del mismo, y por la acción del agente - se trata de unambiente determinístico. Así el agente escapa de la incertidumbre.
Episódico / No-episódico (secuencial)
Un ambiente episódico implica que los episodios siguientes no dependende las acciones que ocurrían en episodios previos (como en las clásicascadenas de Markov). Esto le autoriza al agente que no se debapreocupar por la planificación de lo que puede ocurrir.
Propiedades de los entornos de trabajo
Estático / Dinámico
Será estático todo ambiente que no cambie mientras el agente estápensando. No tiene importancia el tiempo que se usa en pensar y nonecesita monitorear el mundo mientras piensa. El tiempo carece de valor mientras se computa una buena estrategia. En el otro caso serádinámico.
Discreto / Continuo
Discreto - con escaso número de percepciones y acciones en elambiente.
Continuo - el otro caso.
Sin adversario / con adversarios racionales
Sin adversario - ausencia de otros agentes racionales adversarios: laconsecuencia es que el agente se libera de la preocupación de laestrategia de dichos adversariosen el mismo juego.
Los ambientes ingenieriles suelen ser sin adversario.
Los ambientes sociales y económicos aumentan en su complejidad por lapresencia de interacciones entre uno o más adversarios (por ejemplo enla Bolsa).
Ejemplos de los entornos de trabajo
7/17/2019 SISTINT 002new9
http://slidepdf.com/reader/full/sistint-002new9 4/5
4
Estructura de los Agentes
El cometido de la IA es el diseño de un Programa de Agente: una función que permitaimplantar el mapeo del agente para pasar por el “sandwich” de percepciones a
acciones. Este programa se ejecutará en algún tipo de dispositivo de cómputo, al que sedenominará arquitectura (puede ser una computadora sencilla o hardware especial). En
algunos ámbitos se utilizan agentes de software (o robots de software o softbots).
Agente = arquitectura + programa
Tipos de Agentes
No Bien informados de lo que pasa
Tabla-intensivos
para encontrar la acción siguiente usar una tabla en memoria deltipo “secuencia de percepciones”/acción . Se trata de una tabla
bastante voluminosapara repetirla acción ya experimentada antes. Agentes reactivo simple
se basan en reglas condición/acción y se implementan con unsistema de PRODUCCIÓN. Carecen de memoria referente a estadospasados del mundo.
Bien informados de lo que pasa
Agentes reactivo simple con memoria
con un estado interno usado para seguirle la pista a los estadospasados del mundo.
Agentes meta-intensivos
además de disponer de información sobre el estado, tienen una clasede información sobre la meta que describe situaciones deseables.Agentes de este tipo tienen bajo consideración eventos del futuro.
Utilidad-intensivos
basan su decisión en la teoría axiomática clásica de la utilidad paraactuar racionalmente.
sensores
efectores
Cómo es el mundoen este momento ?
Qué acción deboemprender en estemomento ?
Reglas de condición-acción
Agente reactivo simple
sensores
efectores
Cómo es el mundoen este momento ?
Qué acción deboemprender en estemomento ?
Reglas de condición-acción
Qué producen mis acciones ?
Cómo evoluciona el mundo ?
Estado
Agente reactivo simple con estado interno
sensores
efectores
Cómo es el mundoen este momento ?
Qué acción deboemprender en estemomento ?
Metas
Qué producen mis acciones ?
Cómo evoluciona el mundo ?
Estado
Qué sucedería siemprendo la acción A ?
Agentes basado en metas
sensores
efectores
Cómo es el mundoen este momento ?
Qué acción deboemprender ahora ?
Utilidad
Qué producen mis acciones ?
Cómo evoluciona el mundo ?
Estado
Qué sucedería siemprendo la acción A ?
Qué tan a gusto meencontraré en talestado ?
Agentes basado en utilidad
7/17/2019 SISTINT 002new9
http://slidepdf.com/reader/full/sistint-002new9 5/5
5
Agentes que aprenden
M e d i oA m b i en t e
Elemento deaprendizaje
Elementode actuación
cambios
conocimiento
Nivel de actuación
Critica
Retroalimentación
Actuadores
Sensor
Generador deproblema
Objetivos aaprender
Resumen Un agente percibe y actúa en un cierto ambiente, posee una dada arquitectura
y está implementado a través de un programa de agente.
Un agente ideal (omnisciente) siempre elige aquella acción mediante la cual semaximiza su logro esperado, sujeta a la secuencia de percepciones recibidahasta ese momento.
Un agente autónomo usa su experiencia propia en lugar de usar conocimientoincorporado por su diseñador referente al ambiente.
Un programa de agente mapea la ruta entre percepción y acción y actualiza elestado interno de dicho agente.
Un agente reflejo (o reactivo)responde de inmediatoa las percepciones.
Un agente meta-intensivo (o basado en metas) actúa de tal manera de obtener el logro de su meta internalizada.
Un agente utilidad – intensivo (o basado en utilidad) maximiza su propia funciónde utilidad.
Poder representar el conocimiento (y a veces lograr que ese conocimientopueda ser legiblepor el humano) es importantepara que el diseño tenga éxito.
Los ambientes cambian y se presentan como dramáticamente más difíciles paraunos agentes que para otros. Los más difíciles son los ambientes inaccesibles, no-determinísticos, no-episódicos, dinámicos y continuos. Un ambiente fácil es elrepresentado por un robot encargado de hacer tostadas.