Agentes Capaz de perceber seu ambiente por meio de sensores Capaz de agir sobre o ambiente por meio de atuadores Agentes Agente humano Sensores: cinco sentidos Atuadores: mos, pernas, boca, etc Agente robtico Sensores: cmeras, infravermelho, etc. Atuadores: motores Agente de software Sensores: seqncia de teclas digitadas, arquivos e entradas de rede Atuadores: exibio na tela, gravar e enviar arquivos Agente sensores
atuadores
?
A m b i e n t e
Percepes Aes Agentes Agentes O agente capaz de perceber suas prprias aes Nem sempre seus efeitos Percepo: as entradas do agente em qualquer momento Seqncia de percepes: histria de tudo o que ele j percebeu Comportamento do agente depende da funo de agente que mapeia uma seqncia de percepes para agir Agentes Tabela de funo: (mundo do aspirador de p) Seqncia de Percepes [posio,estado] Ao [A, limpo] [A, sujo] [B, limpo] [B, sujo] Direita Aspirar Esquerda Aspirar Agentes Programa de agente: implementao computacional da funo de agente
funo agente_aspirador_de_po ([posio, estado]) retorna ao se estado = sujo ento retorna ao = aspirar seno se posio = A ento retorna ao = direita seno se posio = B ento retorna ao = esquerda Agentes Racionais Agente bem comportado: faz tudo certo Fazer tudo certo melhor que fazer tudo errado O que fazer tudo certo? Obter maior sucesso Como medir o sucesso Medida de Desempenho Critrios para medir o sucesso Seqncia de aes seqncia de estados do ambiente Seqncia desejvel = agente funcionou bem Perguntar ao agente? Uns seriam incapazes de responder Outros se iludiriam (eu nem queria mesmo) Agentes Racionais Medida de Desempenho Definida pelo Projetista Medida p/ aspirador: quantidade de sujeira limpa E se ele limpa e joga no cho p/ limpar de novo? Deixar o cho limpo Medida de desempenho de acordo com o resultado no ambiente e no no comportamento do agente Agentes Racionais Racionalidade Depende de 4 fatores Medida de desempenho Conhecimento do ambiente Aes possveis Seqncia de percepes
Para cada seqncia de percepes possveis o agente deve selecionar a ao que maximize o desempenho Agentes Racionais Fatores do agente aspirador: Medida de desempenho: 1 ponto para cada quadrado limpo em cada perodo de tempo Conhecimento do ambiente: geografia do ambiente conhecida, mas o estado (sujeira) e a posio inicial no so. Aes possveis: esquerda, direita e aspirar Seqncia de percepes: sabe a sua posio e sabe se o local est sujo E se ele ficar indo de um lado para outro? Descontamos pontos para cada movimento? E se ele souber que os quadrados esto limpos? E se os quadrados voltarem a ficar sujos? Agentes Racionais Oniscincia Saber o resultado real das aes Impossvel na realidade Racionalidade = desempenho esperado Perfeio = desempenho real Coleta de informaes (olhar para os dois lados) Aprendizado Quanto mais aes realiza, mais clculos deve fazer (experincia) Agentes Racionais Racionalidade + Aprendizado = Autonomia
Autonomia Basear-se no s no conhecimento anterior do projetista, mas tambm em suas prprias percepes Compensar o conhecimento prvio parcial ou incorreto Variar o ambiente no significa fracasso Ambientes de Agentes Inteligentes A natureza dos ambientes PEAS (Performance, Environment, Actuators, Sensors desempenho, ambiente, atuadores e sensores) Ambientes reais x artificiais (esteira de produo x simulador de vo) Tipo de Agente Medida de Desempenho Ambiente Atuadores Sensores Motorista de Txi Viagem segura, rpida, dentro da lei, confortvel, maximizar lucros Estradas, outros carros, pedestres, clientes Direo, acelerador, sinal, buzina, freio, visor Cmeras, sonar, velocmetro, GPS, acelermetro, sensores de motor, teclado Ambientes de Agentes Inteligentes Tipo de Agente Ambiente Percepes (Sensores) Aes (Atuadores) Medida de Desempenho (Objetivo) Sistema de Diagnstico Mdico Paciente, hospital, equipe Sintomas, exames, respostas do paciente Perguntas, testes, exames, diagnsticos, tratamentos Paciente saudvel, custos baixos Anlise de imagens de satlite Imagens de satlites em rbita Pixels de cores e intensidade variadas Classificar a imagem Classificar corretamente Rob seletor de peas Linha de montagem com as peas Pixels de cores e intensidade variadas Pegar as peas e coloc-las em bandejas Colocar peas nas bandejas corretas Controlador de refinaria Refinaria Leituras de presso, temperatura, contaminao Abrir e fechar vlvulas, controlar temperatura, etc Pureza do produto, custo, segurana Instrutor interativo de idiomas Alunos Teclado (palavras digitadas) Exerccios, sugestes, correes Maximizar resultado do aluno Qual a natureza dos ambientes abaixo? Atividade Jogar uma partida decente de ping-pong Comprar mantimentos para 1 semana na Web Comprar mantimentos para 1 semana no supermercado Escrever uma histria intencionalmente engraada Dar conselhos jurdicos idneos numa rea especializada do Direito Traduzir ingls falado para portugus falado em tempo real Conversar com uma pessoa por uma hora Realizar uma operao cirrgica sozinho Tirar e guardar louas de uma lavadora automtica Ambientes de Agentes Inteligentes Propriedades dos ambientes Completamente observvel x parcialmente observvel Sensor permite descrio completa do ambiente, sempre? Detectar todos os aspectos relevantes para a ao Determinstico x Estocstico Se o prximo estado do ambiente pode ser completamente determinado pelo estado atual + ao Determinstico do ponto de vista do agente (parcialmente observvel pode parecer estocstico) Estratgico: Determinstico exceto por outros agentes Episdico x Seqencial Experincia do agente dividida em episdios Episdio = percepo + ao No existe passado nem futuro Peas de montagem (episdico) Jogos (seqenciais) curto prazo longo prazo Ambientes de Agentes Inteligentes Propriedades dos ambientes Esttico x Dinmico O ambiente no muda enquanto o agente est pensando Semidinmico: ambiente no muda, mas a demora afeta o desempenho Discreto x Contnuo De acordo com o nmero de estados possveis do ambiente, tempo, aes do agente (limitado x ilimitado) Agente nico x Multiagente Taxista (carro A) agente nico ou multiagente? O outro objeto (carro B) vai ser tratado como um agente ou como parte do ambiente (folhas, pedras, lombadas)?
Ambientes de Agentes Inteligentes Propriedades dos ambientes Agente nico x Multiagente O comportamento de B ou no determinado por uma medida de desempenho cujo valor depende do comportamento de A? Multiagente Competitivo Quando a maximizao da medida de desempenho de A implica na minimizao da de B e vice-versa (xadrez) Multiagente Cooperativo Quando a maximizao da medida de desempenho de um agente maximiza a de todos os demais agentes (taxista) Parcialmente Cooperativo (parcialmente competitivo pois h disputa por espao)
Propriedades dos Ambientes Ambiente Observvel Determinstico Episdico Esttico Discreto Agentes Palavras Cruzadas SIM SIM NO SIM SIM NICO Xadrez com relgio SIM SEMI NO SEMI SIM MULTI Xadrez sem relgio SIM SEMI NO SIM SIM MULTI Poker NO NO NO SIM SIM MULTI Gamo SIM NO NO SIM SIM MULTI Taxista NO NO NO NO NO MULTI Diagnstico Mdico NO NO NO? NO NO NICO? Anlise de Imagens SIM SIM SIM SEMI NO NICO Rob Manipulador NO NO SIM NO NO NICO Controle de Refinaria NO NO NO NO NO NICO Defina as propriedades destes ambientes Atividade Jogar uma partida decente de ping-pong Comprar mantimentos para 1 semana na Web Comprar mantimentos para 1 semana no supermercado Escrever uma histria intencionalmente engraada Dar conselhos jurdicos idneos numa rea especializada do Direito Traduzir ingls falado para portugus falado em tempo real Conversar com uma pessoa por uma hora Realizar uma operao cirrgica sozinho Tirar e guardar louas de uma lavadora automtica Estrutura de Agentes Estrutura = arquitetura + programa de agente Programas de agentes em tabelas (para cada percepo ou seqncia de percepes, uma ao) Tabelas gigantescas Objetivo da IA: produzir comportamento racional baseado em cdigo, no em tabelas, baseado em regras de comportamento, de acordo com a complexidade do problema complexidade do agente Complexidade de Agentes Agentes reflexivos ou reativos Selecionam aes com base na percepo atual Ignoram o histrico de aes Txi que freia se vir a luz de freio do carro frente Os mais simples, mas de inteligncia limitada Funciona somente se a deciso puder ser tomada com base na percepo atual Ambiente precisa ser completamente observvel Aspirador de p num ambiente parcialmente observvel Sem sensor de posio (s o sensor de sujeira) = Looping infinito Aleatoriedade (funciona em poucos casos) Complexidade de Agentes Agentes reflexivos ou reativos AGENTE
A
M
B
I
E
N
T
E
Sensores Atuadores Qual a aparncia atual do mundo? Que ao devo executar agora? Regra-condio-ao Informao suplementar Processo de Deciso Legenda: Complexidade de Agentes Agente com estado interno ou baseados em modelos Observao parcial Controlar a parte do mundo que ele no pode ver agora Criar um modelo interno do mundo (como o mundo funciona): Histrico de percepes: estado interno Deteco de luzes na borda do carro ao mesmo tempo Como o mundo evolui independente do agente O carro freando estar mais prximo Como as aes afetam o mundo Pisar no freio baixa a velocidade do carro Complexidade de Agentes Agente com estado interno
A
M
B
I
E
N
T
E
AGENTE Sensores Atuadores Qual a aparncia atual do mundo? Que ao devo executar agora? Estad o Como o mundo evolui O que minhas aes fazem Regras-condio-ao Complexidade de Agentes Agente baseado em metas Conhecer o estado atual nem sempre suficiente para decidir o que fazer Virar para a esquerda ou direita depende de onde o txi quer chegar Objetivos: situaes desejveis Meta em uma nica ao x Meta em seqncias de aes Busca e Planejamento Se o carro da frente acende as luzes, diminuir a velocidade: portanto, dada a forma de evoluo do mundo,para atingir o objetivo (no bater) eu devo frear Parece menos eficiente, mas mais flexvel Conhecimento de apoio deciso explcito e pode ser modificado (Saber por que estou fazendo) Complexidade de Agentes Agente baseado em metas
A
M
B
I
E
N
T
E
AGENTE Sensores Atuadores Qual a aparncia atual do mundo? Qual ser a aparncia se a ao A for executada? Que ao devo executar agora? Estad o Como o mundo evolui O que minhas aes fazem Metas Complexidade de Agentes Agente baseado em utilidade Objetivos podem no ser suficientes para definir uma ao Seqncias de ao mais rpidas, mais seguras, mais confiveis, etc. (txi) Comparao entre estados de felicidade do agente Probabilidade de sucesso (incerteza) Importncia dos objetivos Objetivos conflitantes Preferncias entre os estados do mundo Complexidade de Agentes Agente baseado em utilidade
A
M
B
I
E
N
T
E
AGENTE Sensores Atuadores Qual a aparncia atual do mundo? Qual ser a aparncia se a ao A for executada? O quanto serei feliz em tal estado? Que ao devo executar agora? Estad o Como o mundo evolui O que minhas aes fazem Utilidade Objetivos Complexidade de Agentes Agente com aprendizagem Mquinas programadas para aprender a resolver o problema em vez de programar para resolver o problema Agente se torna competente medida que interage com o ambiente Aprendizado um processo de modificao dos componentes do agente Modificaes so direcionadas pelo crtico para melhorar o desempenho global do agente Complexidade de Agentes Agente com aprendizagem
A
M
B
I
E
N
T
E
AGENTE Sensores Atuadores Gerador de problemas Padro de desempenho Elemento de desempenho Crtico realimentao conhecimento mudanas Elemento de Aprendizado objetivos de aprendizado aes exploratrias Agente completo: responsvel por receber as percepes e selecionar aes Responsvel por fazer aperfeioamentos no agente com as informaes do crtico Informa como o agente est se saindo em relao ao padro de comportamento Sugere aes que levaro a experincias novas (podem no ser timas a curto prazo, mas sim a longo prazo) Complexidade de Agentes Agente com aprendizagem
A
M
B
I
E
N
T
E
AGENTE Sensores Atuadores Gerador de problemas Padro de desempenho Elemento de desempenho Crtico realimentao conhecimento mudanas Elemento de Aprendizado objetivos de aprendizado aes exploratrias