Agentes Inteligentes

Agentes Inteligentes
Prof. Polyana Fonseca Nascimento

Agentes
Capaz de perceber seu ambiente por meio de sensores
Capaz de agir sobre o ambiente por meio de atuadores
Agentes
Agente humano
Sensores: cinco sentidos
Atuadores: mos, pernas, boca, etc
Agente robtico
Sensores: cmeras, infravermelho, etc.
Atuadores: motores
Agente de software
Sensores: seqncia de teclas digitadas, arquivos e entradas
de rede
Atuadores: exibio na tela, gravar e enviar arquivos
Agente
sensores

atuadores

?

A
m
b
i
e
n
t
e

Percepes
Aes
Agentes
Agentes
O agente capaz de perceber suas prprias aes
Nem sempre seus efeitos
Percepo: as entradas do agente em qualquer
momento
Seqncia de percepes: histria de tudo o que
ele j percebeu
Comportamento do agente depende da funo
de agente que mapeia uma seqncia de
percepes para agir
Agentes
Tabela de funo: (mundo do aspirador de p)
Seqncia de Percepes
[posio,estado]
Ao
[A, limpo]
[A, sujo]
[B, limpo]
[B, sujo]
Direita
Aspirar
Esquerda
Aspirar
Agentes
Programa de agente: implementao
computacional da funo de agente

funo agente_aspirador_de_po ([posio, estado]) retorna ao
se estado = sujo ento retorna ao = aspirar
seno se posio = A ento retorna ao = direita
seno se posio = B ento retorna ao = esquerda
Agentes Racionais
Agente bem comportado: faz tudo certo
Fazer tudo certo melhor que fazer tudo errado
O que fazer tudo certo? Obter maior sucesso
Como medir o sucesso Medida de Desempenho
Critrios para medir o sucesso
Seqncia de aes seqncia de estados do ambiente
Seqncia desejvel = agente funcionou bem
Perguntar ao agente?
Uns seriam incapazes de responder
Outros se iludiriam (eu nem queria mesmo)
Agentes Racionais
Medida de Desempenho
Definida pelo Projetista
Medida p/ aspirador: quantidade de sujeira limpa
E se ele limpa e joga no cho p/ limpar de novo?
Deixar o cho limpo
Medida de desempenho de acordo com o
resultado no ambiente e no no comportamento
do agente
Agentes Racionais
Racionalidade
Depende de 4 fatores
Medida de desempenho
Conhecimento do ambiente
Aes possveis
Seqncia de percepes

Para cada seqncia de percepes possveis o
agente deve selecionar a ao que maximize o
desempenho
Agentes Racionais
Fatores do agente aspirador:
Medida de desempenho: 1 ponto para cada quadrado limpo
em cada perodo de tempo
Conhecimento do ambiente: geografia do ambiente
conhecida, mas o estado (sujeira) e a posio inicial no
so.
Aes possveis: esquerda, direita e aspirar
Seqncia de percepes: sabe a sua posio e sabe se o
local est sujo
E se ele ficar indo de um lado para outro?
Descontamos pontos para cada movimento?
E se ele souber que os quadrados esto limpos?
E se os quadrados voltarem a ficar sujos?
Agentes Racionais
Oniscincia
Saber o resultado real das aes
Impossvel na realidade
Racionalidade = desempenho esperado
Perfeio = desempenho real
Coleta de informaes (olhar para os dois lados)
Aprendizado
Quanto mais aes realiza, mais clculos deve fazer
(experincia)
Agentes Racionais
Racionalidade + Aprendizado = Autonomia

Autonomia
Basear-se no s no conhecimento anterior do
projetista, mas tambm em suas prprias
percepes
Compensar o conhecimento prvio parcial ou
incorreto
Variar o ambiente no significa fracasso
Ambientes de Agentes Inteligentes
A natureza dos ambientes
PEAS (Performance, Environment, Actuators, Sensors desempenho,
ambiente, atuadores e sensores)
Ambientes reais x artificiais (esteira de produo x simulador de vo)
Tipo de
Agente
Medida de
Desempenho
Ambiente Atuadores Sensores
Motorista
de Txi
Viagem segura,
rpida, dentro da
lei, confortvel,
maximizar lucros
Estradas,
outros
carros,
pedestres,
clientes
Direo,
acelerador,
sinal, buzina,
freio, visor
Cmeras, sonar,
velocmetro,
GPS,
acelermetro,
sensores de
motor, teclado
Tipo de
Agente
Ambiente
Percepes
(Sensores)
Aes (Atuadores)
Medida de
Desempenho
(Objetivo)
Sistema de
Diagnstico
Mdico
Paciente,
hospital,
equipe
Sintomas, exames,
respostas do paciente
Perguntas, testes,
exames,
diagnsticos,
tratamentos
Paciente saudvel,
custos baixos
Anlise de
imagens de
satlite
Imagens de
satlites em
rbita
Pixels de cores e
intensidade variadas
Classificar a imagem
Classificar
corretamente
Rob seletor
de peas
Linha de
montagem
com as peas
Pixels de cores e
intensidade variadas
Pegar as peas e
coloc-las em
bandejas
Colocar peas nas
bandejas corretas
Controlador
de refinaria
Refinaria
Leituras de presso,
temperatura,
contaminao
Abrir e fechar
vlvulas, controlar
temperatura, etc
Pureza do produto,
custo, segurana
Instrutor
interativo de
idiomas
Alunos
Teclado (palavras
digitadas)
Exerccios,
sugestes, correes
Maximizar resultado
do aluno
Qual a natureza dos ambientes abaixo?
Atividade
Jogar uma partida decente de ping-pong
Comprar mantimentos para 1 semana na Web
Comprar mantimentos para 1 semana no
supermercado
Escrever uma histria intencionalmente engraada
Dar conselhos jurdicos idneos numa rea
especializada do Direito
Traduzir ingls falado para portugus falado em
tempo real
Conversar com uma pessoa por uma hora
Realizar uma operao cirrgica sozinho
Tirar e guardar louas de uma lavadora automtica
Propriedades dos ambientes
Completamente observvel x parcialmente observvel
Sensor permite descrio completa do ambiente, sempre?
Detectar todos os aspectos relevantes para a ao
Determinstico x Estocstico
Se o prximo estado do ambiente pode ser completamente
determinado pelo estado atual + ao
Determinstico do ponto de vista do agente (parcialmente observvel
pode parecer estocstico)
Estratgico: Determinstico exceto por outros agentes
Episdico x Seqencial
Experincia do agente dividida em episdios
Episdio = percepo + ao
No existe passado nem futuro
Peas de montagem (episdico)
Jogos (seqenciais) curto prazo longo prazo
Esttico x Dinmico
O ambiente no muda enquanto o agente est pensando
Semidinmico: ambiente no muda, mas a demora afeta o
desempenho
Discreto x Contnuo
De acordo com o nmero de estados possveis do ambiente,
tempo, aes do agente (limitado x ilimitado)
Agente nico x Multiagente
Taxista (carro A) agente nico ou multiagente?
O outro objeto (carro B) vai ser tratado como um agente ou
como parte do ambiente (folhas, pedras, lombadas)?

Agente nico x Multiagente
O comportamento de B ou no determinado por uma medida
de desempenho cujo valor depende do comportamento de A?
Multiagente Competitivo
Quando a maximizao da medida de desempenho de A
implica na minimizao da de B e vice-versa (xadrez)
Multiagente Cooperativo
Quando a maximizao da medida de desempenho de um
agente maximiza a de todos os demais agentes (taxista)
Parcialmente Cooperativo (parcialmente competitivo pois h
disputa por espao)

Propriedades dos Ambientes
Ambiente Observvel Determinstico Episdico Esttico Discreto Agentes
Palavras Cruzadas SIM SIM NO SIM SIM NICO
Xadrez com relgio SIM SEMI NO SEMI SIM MULTI
Xadrez sem relgio SIM SEMI NO SIM SIM MULTI
Poker NO NO NO SIM SIM MULTI
Gamo SIM NO NO SIM SIM MULTI
Taxista NO NO NO NO NO MULTI
Diagnstico Mdico NO NO NO? NO NO NICO?
Anlise de Imagens SIM SIM SIM SEMI NO NICO
Rob Manipulador NO NO SIM NO NO NICO
Controle de Refinaria NO NO NO NO NO NICO
Defina as propriedades destes ambientes
Atividade
Jogar uma partida decente de ping-pong
Comprar mantimentos para 1 semana na Web
Comprar mantimentos para 1 semana no supermercado
Escrever uma histria intencionalmente engraada
Dar conselhos jurdicos idneos numa rea especializada
do Direito
Traduzir ingls falado para portugus falado em tempo
real
Conversar com uma pessoa por uma hora
Realizar uma operao cirrgica sozinho
Tirar e guardar louas de uma lavadora automtica
Estrutura de Agentes
Estrutura = arquitetura + programa de agente
Programas de agentes em tabelas (para cada
percepo ou seqncia de percepes, uma
ao) Tabelas gigantescas
Objetivo da IA:
produzir comportamento racional baseado em
cdigo, no em tabelas, baseado em regras de
comportamento, de acordo com a
complexidade do problema complexidade do
agente
Complexidade de Agentes
Agentes reflexivos ou reativos
Selecionam aes com base na percepo atual
Ignoram o histrico de aes
Txi que freia se vir a luz de freio do carro frente
Os mais simples, mas de inteligncia limitada
Funciona somente se a deciso puder ser tomada com base
na percepo atual
Ambiente precisa ser completamente observvel
Aspirador de p num ambiente parcialmente observvel
Sem sensor de posio (s o sensor de sujeira) = Looping infinito
Aleatoriedade (funciona em poucos casos)
Agentes reflexivos ou reativos
AGENTE

A

M

B

I

E

N

T

E

Sensores
Atuadores
Qual a aparncia
atual do mundo?
Que ao devo
executar agora?
Regra-condio-ao
Informao suplementar
Processo de
Deciso
Legenda:
Agente com estado interno ou baseados em
modelos
Observao parcial
Controlar a parte do mundo que ele no pode ver agora
Criar um modelo interno do mundo (como o
mundo funciona):
Histrico de percepes: estado interno
Deteco de luzes na borda do carro ao mesmo tempo
Como o mundo evolui independente do agente
O carro freando estar mais prximo
Como as aes afetam o mundo
Pisar no freio baixa a velocidade do carro
Agente com estado interno

A

M

B

I

E

N

T

E

AGENTE
Sensores
Atuadores
Qual a aparncia
atual do mundo?
Que ao devo
executar agora?
Estad
o
Como o mundo evolui
O que minhas aes fazem
Regras-condio-ao
Agente baseado em metas
Conhecer o estado atual nem sempre suficiente para
decidir o que fazer
Virar para a esquerda ou direita depende de onde o txi quer chegar
Objetivos: situaes desejveis
Meta em uma nica ao x Meta em seqncias de aes
Busca e Planejamento
Se o carro da frente acende as luzes, diminuir a velocidade:
portanto, dada a forma de evoluo do mundo,para atingir o
objetivo (no bater) eu devo frear
Parece menos eficiente, mas mais flexvel
Conhecimento de apoio deciso explcito e pode ser
modificado (Saber por que estou fazendo)
Agente baseado em metas

A

M

B

I

E

N

T

E

AGENTE
Sensores
Atuadores
Qual a aparncia
atual do mundo?
Qual ser a aparncia se
a ao A for executada?
Que ao devo
executar agora?
Estad
o
Como o mundo evolui
Metas
Agente baseado em utilidade
Objetivos podem no ser suficientes para definir
uma ao
Seqncias de ao mais rpidas, mais seguras,
mais confiveis, etc. (txi)
Comparao entre estados de felicidade do
agente
Probabilidade de sucesso (incerteza)
Importncia dos objetivos
Objetivos conflitantes
Preferncias entre os estados do mundo
Agente baseado em utilidade

A

M

B

I

E

N

T

E

AGENTE
Sensores
Atuadores
Qual a aparncia
atual do mundo?
Qual ser a aparncia se
a ao A for executada?
O quanto serei feliz
em tal estado?
Que ao devo
executar agora?
Estad
o
Como o mundo evolui
Utilidade
Objetivos
Agente com aprendizagem
Mquinas programadas para aprender a resolver o
problema em vez de programar para resolver o
problema
Agente se torna competente medida que interage
com o ambiente
Aprendizado um processo de modificao dos
componentes do agente
Modificaes so direcionadas pelo crtico para
melhorar o desempenho global do agente

A

M

B

I

E

N

T

E

AGENTE
Sensores
Atuadores
Gerador de
problemas
Padro de desempenho
Elemento de desempenho
Crtico
realimentao
conhecimento
mudanas
Elemento de
Aprendizado
objetivos de
aprendizado
aes
exploratrias
Agente completo:
responsvel por receber
as percepes e
selecionar aes
Responsvel por fazer
aperfeioamentos no
agente com as
informaes do crtico
Informa como o agente
est se saindo em
relao ao padro de
comportamento
Sugere aes que
levaro a experincias
novas (podem no ser
timas a curto prazo,
mas sim a longo prazo)

A

M

B

I

E

N

T

E

AGENTE
Sensores
Atuadores
Gerador de
problemas
Padro de desempenho
Elemento de desempenho
Crtico
realimentao
conhecimento
mudanas
Elemento de
Aprendizado
objetivos de
aprendizado
aes
exploratrias

Agentes Inteligentes

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Agentes Inteligentes

Caricato da

Copyright:

Formati disponibili

Agentes Inteligentes

Prof. Polyana Fonseca Nascimento

Potrebbero piacerti anche