Download - SISTINT 002new9

7/17/2019 SISTINT 002new9

http://slidepdf.com/reader/full/sistint-002new9 1/5

1

Sistemas InteligentesSesión 02

Ing. CIP Renzo I. Vergara Quiche

[email protected]

Universidad Nacional “José Faustino Sánchez Carrión”

Facultad de Ingeniería Industrial, Sistemas e Informática

Escuela Profesional de Ingeniería Informática

Los Agentes y su entorno

Agente (Diccionario RAE):

Que obra o tiene virtud de obrar.

Persona que actúa en representación de otro (agente artístico, comercial,

inmobiliario, de seguros, de bolsa, etc).

Un agente es cualquier cosa capaz de percibir su medioambiente con la ayuda desensores y actuar en ese medio utili zando actuadores.

Un agente es un sistema conformado por hardware y/o software que basa sucomportamiento en las percepciones que tiene del medio ambiente mediantesus sensores y en las reglas de comportamiento incorporadas en el software.

Agentes software (softbots): Aplicaciones informáticas con capacidad paradecidir cómo deben actuar para alcanzar sus objetivos

Agentes inteligentes: Agentes software que pueden funcionar fiablemente en unentorno rápidamente cambiante e impredecible

Ejemplos: Labores diarias realizadas en internet, Comprar por internet (la tienda encasa), Sistema de diagnóstico médico, Análisis de imágenes satelitales, Robot ensambladorde partes, Controlador de una refinería

Tipificando a un agente

Comprensión/intencionalidad

Comportamiento

VeOyeTocaGusta

Huele

ENTRADAS Procesos INTERNOS

SALIDAS

Sensor del ambiente

Razona

Conoce

Agente

Agente según Wooldridge - 1995

Un agente es un sistema de computación capaz de actuar de

forma autónoma y flexible en un entorno, entendiendopor flexible que sea:

– Reactivo: El agente es capaz de responder a cambios en el entornoen que se encuentra situado.

– Pro-activo: El agente debe ser capaz de intentar cumplir suspropios planes u objetivos.

– Social: Debe poder comunicarse con otros agentes mediante algúntipo de lenguaje de comunicación de agentes.

Reactivo

Si se garantiza que el ambiente de un programa es fijo, esteno necesita preocuparse por su propio éxito o fracaso elprograma simplemente se ejecuta ciegamente.

Ejemplo ambiente fijo: Un compilador

El mundo real no es fijo: las cosas cambian y la informaciónes incompleta. La mayoría de los ambientes interesantesson dinámicos.

El software para dominios dinámicos es difícil de construir:los programas deben tener en cuenta la posibilidad defalla preguntarse a sí mismos si vale la pena realizar unaacción.

Un sistema reactivo es aquel que mantiene una interacción

constante con su ambiente, y responde a los cambios queocurren en este (en un tiempo es que la respuesta es útil)

mailto:[email protected]

mailto:[email protected]



2

Pro-Activo

Reaccionar ante un ambiente es fácil (por ejemplo:reglas estímulo-respuesta)

Pero, generalmente queremos agentes que hagancosas por nosotros.

Esto requiere: comportamientos orientados a metas

Pro-actividad = generar y tratar de alcanzar metas; noguiarse solamente por los eventos; tomar la iniciativa

Reconocer oportunidades.

Habilidad Social

El mundo real es un ambiente multi-agente: no podemos ir

por ahí tratando de alcanzar metas sin tomar en cuenta alos otros.

Algunas metas sólo pueden ser alcanzadas con lacooperación de otros.

Lo mismo ocurre con muchos ambientes computacionales,ejemplo: Internet.

La habilidad social en agentes es la habilidad deinteractuar con otros agentes (y posiblemente conhumanos) por medio de algún tipo de lenguaje decomunicación de agentes, y quizás cooperar con otros.

Otras Propiedades de Agentes - Franklin

Continuidad Temporal: se considera un agente un proceso sin fin, ejecutándosecontinuamente y desarrollando su función.

Autonomía: un agente es completamente autónomo si es capaz de actuar basándose en su experiencia, es capaz de adaptarse aunque el entorno cambieseveramente. Una definición menos estricta de autonomía sería cuando el agentepercibe el entorno.

Sociabilidad: permite a un agente comunicar con otros agentes o incluso con otrasentidades.

Racionalidad: el agente siempre realiza “lo correcto” a partir de los datos quepercibe del entorno.

Reactividad: un agente actúa como resultado de cambios en su entorno. En estecaso, un agente percibe el entorno y esos cambios dirigen el comportamiento delagente.

Pro-actividad: un agente es pro-activo cuando es capaz de controlar sus propiosobjetivosa pesar de cambios en el entorno.

Adaptatividad: está relacionado con el aprendizaje que un agente es capaz derealizary si puede cambiar su comportamiento basándose en ese aprendizaje.

Movilidad: capacidad de un agente de trasladarsea través de una red telemática.

Veracidad: asunción de que un agente no comunica información falsa a propósito.

Benevolencia: asunción de que un agente está dispuesto a ayudar a otros agentessi esto no entra en conflicto con sus propios objetivos.

Otras Propiedades de Agentes – Navajasuiza de Parunak

Otras propiedades de Agentes - Nwana Buen comportamiento:¿Qué es un agente racional?

En cada posible secuencia de percepciones, un agente racional deberáemprender aquella acción que supuestamente maximice su medida derendimiento, basándose en las evidencias aportadas por la secuencia depercepciones y en el conocimiento que el agente mantiene almacenado

Considerar:

Ser Racional (maximiza el rendimiento esperado) no significa ser omnisciente(maximiza el resultado real)

Ser Racional no es ser clarividente

Ser Racional ideal entra en conflicto con el PRR (Principio de RacionalidadRestringida).

Un agente es algo que razona, un agente informático debe tener otros atributosque los distingan de los “programas convencionales” (dotados de controlesautónomos, perciban su entorno, que persistan durante un periodo de tiempoprolongado, que se adapten a los cambios, y que sean capaces de alcanzar objetivosdiferentes” .

Un Agente Racional es aquel que actúa con la intención de alcanzar elmejor resultado o, cuando hay incertidumbre, el mejor resultado esperado



3

De qué depende la Racionalidad

La medida de rendimiento que define el criterio de éxito

Cuánto conoce el agente del ambiente en que opera

Las acciones que el agente esté en condiciones de realizar

La secuencia de percepciones - todo lo que el agente ha percibido hastaahora (gestión de la memoria).

La naturaleza del entorno de trabajo

Ejemplo: REAS de un agente “taxista automático”

Rendimiento: Seguro, rápido, legal, viaje confortable, maximización del beneficio

Entorno: Carreteras, otro tráfico, peatones, clientes

Actuadores: Dirección, acelerador, freno, señal, bocina, visualizador

Sensores: Cámaras, sonar, velocímetro, GPS, tacómetro, visualizador de laaceleración, sensores del motor, teclado

Percepciones: Video, acelerómetro, instrumental del tablero, sensores del motor,teclado

Acciones: gestión del volante, acelerar y frenar, bocina, hablar/graficar

Metas: seguridad, llegar a destino, maximizar ganancias, obedecer las leyes,satisfacción del cliente

Ambiente: calles urbanas, avenidas, tráfico, peatones, clima, tipo de cliente

Ejemplo: PAMA de un agente “taxista automático”

Otros ejemplos de REASPropiedades de los entornos de trabajo

Accesible (totalmente observable) / Inaccesible(parcialmente observable)

Si los sensores proporcionan todo lo que hay que saber sobre el estadocompleto del ambiente - necesario para elegir una acción - entonces elambiente es accesible al agente. Esos ambiente resultan convenientes,ya que liberan al agente de la tarea de mantener actualizado suinventario del mundo.

Determinístico / No-determinístico (estocástico)

Si el estado siguiente del ambiente está determinado plenamente por elestado presente del mismo, y por la acción del agente - se trata de unambiente determinístico. Así el agente escapa de la incertidumbre.

Episódico / No-episódico (secuencial)

Un ambiente episódico implica que los episodios siguientes no dependende las acciones que ocurrían en episodios previos (como en las clásicascadenas de Markov). Esto le autoriza al agente que no se debapreocupar por la planificación de lo que puede ocurrir.

Propiedades de los entornos de trabajo

Estático / Dinámico

Será estático todo ambiente que no cambie mientras el agente estápensando. No tiene importancia el tiempo que se usa en pensar y nonecesita monitorear el mundo mientras piensa. El tiempo carece de valor mientras se computa una buena estrategia. En el otro caso serádinámico.

Discreto / Continuo

Discreto - con escaso número de percepciones y acciones en elambiente.

Continuo - el otro caso.

Sin adversario / con adversarios racionales

Sin adversario - ausencia de otros agentes racionales adversarios: laconsecuencia es que el agente se libera de la preocupación de laestrategia de dichos adversariosen el mismo juego.

Los ambientes ingenieriles suelen ser sin adversario.

Los ambientes sociales y económicos aumentan en su complejidad por lapresencia de interacciones entre uno o más adversarios (por ejemplo enla Bolsa).

Ejemplos de los entornos de trabajo



4

Estructura de los Agentes

El cometido de la IA es el diseño de un Programa de Agente: una función que permitaimplantar el mapeo del agente para pasar por el “sandwich” de percepciones a

acciones. Este programa se ejecutará en algún tipo de dispositivo de cómputo, al que sedenominará arquitectura (puede ser una computadora sencilla o hardware especial). En

algunos ámbitos se utilizan agentes de software (o robots de software o softbots).

Agente = arquitectura + programa

Tipos de Agentes

No Bien informados de lo que pasa

Tabla-intensivos

para encontrar la acción siguiente usar una tabla en memoria deltipo “secuencia de percepciones”/acción . Se trata de una tabla

bastante voluminosapara repetirla acción ya experimentada antes. Agentes reactivo simple

se basan en reglas condición/acción y se implementan con unsistema de PRODUCCIÓN. Carecen de memoria referente a estadospasados del mundo.

Bien informados de lo que pasa

Agentes reactivo simple con memoria

con un estado interno usado para seguirle la pista a los estadospasados del mundo.

Agentes meta-intensivos

además de disponer de información sobre el estado, tienen una clasede información sobre la meta que describe situaciones deseables.Agentes de este tipo tienen bajo consideración eventos del futuro.

Utilidad-intensivos

basan su decisión en la teoría axiomática clásica de la utilidad paraactuar racionalmente.

sensores

efectores

Cómo es el mundoen este momento ?

Qué acción deboemprender en estemomento ?

Reglas de condición-acción

Agente reactivo simple

sensores

efectores



Reglas de condición-acción

Qué producen mis acciones ?

Cómo evoluciona el mundo ?

Estado

Agente reactivo simple con estado interno

sensores

efectores



Metas



Estado

Qué sucedería siemprendo la acción A ?

Agentes basado en metas

sensores

efectores


Qué acción deboemprender ahora ?

Utilidad



Estado

Qué sucedería siemprendo la acción A ?

Qué tan a gusto meencontraré en talestado ?

Agentes basado en utilidad



5

Agentes que aprenden

M e d i oA m b i en t e

Elemento deaprendizaje

Elementode actuación

cambios

conocimiento

Nivel de actuación

Critica

Retroalimentación

Actuadores

Sensor

Generador deproblema

Objetivos aaprender

Resumen Un agente percibe y actúa en un cierto ambiente, posee una dada arquitectura

y está implementado a través de un programa de agente.

Un agente ideal (omnisciente) siempre elige aquella acción mediante la cual semaximiza su logro esperado, sujeta a la secuencia de percepciones recibidahasta ese momento.

Un agente autónomo usa su experiencia propia en lugar de usar conocimientoincorporado por su diseñador referente al ambiente.

Un programa de agente mapea la ruta entre percepción y acción y actualiza elestado interno de dicho agente.

Un agente reflejo (o reactivo)responde de inmediatoa las percepciones.

Un agente meta-intensivo (o basado en metas) actúa de tal manera de obtener el logro de su meta internalizada.

Un agente utilidad – intensivo (o basado en utilidad) maximiza su propia funciónde utilidad.

Poder representar el conocimiento (y a veces lograr que ese conocimientopueda ser legiblepor el humano) es importantepara que el diseño tenga éxito.

Los ambientes cambian y se presentan como dramáticamente más difíciles paraunos agentes que para otros. Los más difíciles son los ambientes inaccesibles, no-determinísticos, no-episódicos, dinámicos y continuos. Un ambiente fácil es elrepresentado por un robot encargado de hacer tostadas.