Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2. Bsqueda
Restriccin: A B C
un disco mayor nunca
debe reposar sobre
uno de menor tamao
cuatro discos en A
disco 1 de A a C / disco 2 de A a B / disco 1 de C a B /
disco 3 de A a C / disco 1 de B a A / disco 2 de B a C /
disco 1 de A a C / disco 4 de A a B / disco 1 de C a B /
disco 2 de C a A / disco 1 de B a A / disco 3 de C a B /
disco 1 de A a C / disco 2 de A a B / disco 1 de C a B
mayor flexibilidad:
el diseador no necesita conocer la solucin de antemano
es ms fcil adaptar el mtodo a nuevas caractersticas del problema
2. Bsqueda
configuracin de n bloques
C
Operadores:
apilar(X,Y): poner X encima de Y A B
Prec.: bloques X e Y estn libres
Post.: bloque X est encima de Y
quitar(Y): poner Y en la mesa Estado meta
Prec.: bloque Y est libre
Post.: bloque Y est en la mesa A
Coste: B
la aplicacin de cada operador vale C
una unidad
A A C C B B
B C C B B A A B C A A C
C B A B A C
A A C C B B
B C B A C A
a) Modele este problema como un problema de bsqueda. Con tal fin, defina el
estado inicial, el conjunto de estados meta, los operadores (especificando sus
precondiciones y post-condiciones), as como el coste de cada operador.
b) Caracterice el conocimiento a priori del agente de resolucin del problema
correspondiente? Facilite ejemplos de los resultados de la funcin expandir.
c) Encuentre una solucin al problema.
Inteligencia Artificial 3 ITIS
2010/11
Mtodo de bsqueda
Mtodo de bsqueda: Arbol de bsqueda:
estrategia para explorar el
espacio de estados C
A B
en cada paso se expande un
estado
se desarrolla sucesivamente C
B
C A B C
un rbol de bsqueda B A A
Soluciones:
ignorarlo
evitar ciclos simples:
no aadir el padre de un nodo al conjunto de sucesores
evitar ciclos generales:
no aadir un antecesor de un nodo al conjunto de sucesores
evitar todos los estados repetidos:
no aadir ningn nodo existente en el rbol al conjunto de sucesores
(iii) Bsqueda
profundidad
iterativa
(ii) bsqueda
(v) bsqueda
en
avara
profundidad
2. Bsqueda
C
Nivel 1 A B
B
C
Nivel 2 B A
C A B C
A
Nivel 3 A
A A B C B
C A B C
B B C C B C A B A A C
B B A
C C C C A B C
B A A B C A B C
A A B
A
A B C C A B C
A B
C A A B C B
A B C B C C B C A B A A C
B
A
C A A B C B
A B C B C C B C A B A A C
B
A
C
B A
B
A C ... B
A C
B
C
...
Inteligencia Artificial 3 ITIS
2010/11
Complejidad
Complejidad en tiempo y espacio:
proporcional al nmero de nodos expandidos
Ventajas:
completo:
siempre se encuentra un nodo meta si existe
Problemas:
complejidad
exponencial incluso en el mejor caso
los problemas de espacio son an ms graves que los
problemas de tiempo
Bsqueda en profundidad:
ingls: depth first search
Estrategia:
expandir los nodos ms
profundos primero
si se llega a un nodo sin
sucesores, dar vuelta atrs y
expandir el siguiente nodo ms
profundo
Resultado:
el mtodo va explorando un
camino actual
no siempre se encuentra el
nodo de profundidad mnima
B
C C
B A A B C
A
A
C A B C
B
B A A C B
C A C B B C B A A C
A
B B
C A C
Inteligencia Artificial 3 ITIS
2010/11
Bsqueda en profundidad
Algoritmo: {bsqueda en profundidad}
usar el algoritmo general de abierta s0
bsqueda Repetir
aadir nuevos sucesores en la Si vaca?(abierta) entonces
cabeza de la lista abierta devolver(negativo)
abierta funciona como pila nodo primero(abierta)
insercin en la cabeza de la lista Si meta?(nodo) entonces
recuperacin desde la cabeza devolver(nodo)
estructura LIFO: sucesores expandir(nodo)
siempre expandir primero el Para cada n sucesores hacer
nodo ms reciente (es decir: n.padre nodo
el ms profundo) ordInsertar(n,abierta,cabeza)
al guardar todos los sucesores de Fin {repetir}
un nodo expandido en abierta, se
permite la vuelta atrs
Inteligencia Artificial 3 ITIS
2010/11
rbol de bsqueda en profundidad
Lista abierta:
C
A B
C
A B
B C
C A B C B C
A B A C A B C
A B A
A C
B A A B C
C A B C
B
A
C A B C A B C
B
B A A C B
C A C B B C B A A C
A B C A B C
A B B A A C B
B C A C B B C B A A C A B C
C A C
A B A A C B
B A C C B B C B A A C A B C
C
Solucin:
bsqueda en profundidad limitada:
ingls: depth limited search
bsqueda en profundidad con lmite de profundidad d*
expandir slo nodos con profundidad d d*
incompleto si la profundidad del mejor nodo meta es mayor
...
que d*
Complejidad en espacio:
slo los nodos del camino actual y sus vecinos (sucesores) necesitan
almacenarse en la memoria
lineal en la profundidad del rbol de bsqueda
mejor caso: O(bd) / peor caso: O(bd*)
Problemas:
no es ptima: el nodo meta que se encuentra puede no ser de
profundidad mnima
es comn que unos lmites buenos de profundidad slo pueden
establecerse cuando el problema ya haya sido resuelto
en general, no se puede asegurar que la profundidad d de un nodo
meta sea d d*, es decir no se puede garantizar la completitud.
Estrategia:
enumerar todos los lmites de profundidad d, empezando por 0
realizar bsqueda de profundidad limitada hasta d
Algoritmo:
{bsqueda de profundizacin iterativa}
abierta s0
desde d 0 hasta hacer
si bsqueda-en-prof-limitada(problema, d) = xito entonces
devolver(nodo-meta)
fin {desde}
Inteligencia Artificial 3 ITIS
2010/11
Bsqueda de profundizacin iterativa
fallo fallo
xito
Complejidad en tiempo:
normalmente el coste adicional es relativamente pequeo
argumento intuitivo:
suponga un rbol de bsqueda de profundidad d
los nodos interiores (prof. <d) se expanden varias veces
los nodos hoja (prof. = d) se expanden slo una vez
en un rbol de bsqueda exponencial casi todos los nodos son hojas
en consecuencia, para rboles de bsqueda grandes, la bsqueda de
profundizacin iterativa no expande muchos ms nodos que la bsqueda en
profundidad limitada
b d +2 2b bd + d +1 b 1
= 2 d +1
(b 1) b 1
b d +2 2b bd + d +1
=
b d +2 b d +1 b +1
=
(
b d +1 b b2bd +1 bbdd +1 + b dd +1 + b d1+1 )
b d +1
(b b d +1
b d +1
b db+1 + b d1+1 )
b b2d bdd + b dd +1 + b d1+1
=
b 1 b1d + b d1+1
Bsqueda en prof. iterativa: complejidad en
tiempo
Coste adicional de tiempo de la bsqueda de profundizacin iterativa:
para d se obtiene:
Ejemplo: b= 10
Mtodo no
informado
preferido
Oradea
Neamt 87
Zerind 71
75 151 Iasi
Arad
92
140 Sibiu 99
Fagaras Vaslui
118 80
Rimnicu
97 142
Timisoara 211
111 Pitesti
Lugoj 98
101 85 Hirsova
70 146 Urziceni
Mehadia Bucarest 86
75 138
90 Eforie
Dobreta 120
Craiova
Giurgiu
Problema:
los mtodos de bsqueda no informados encuentran el nodo meta de
menor profundidad; ste puede no ser el nodo meta de coste mnimo
prof.(Bp1) = 3 < 4 = prof.(Bp2) / c(p1) = 450 > 418=c(p2)
Inteligencia Artificial 3 ITIS
2010/11
Bsqueda de coste uniforme
Bsqueda de coste uniforme:
{bsqueda de coste uniforme}
Ingls: uniform cost search abierta s0
Idea: Repetir
guiar la bsqueda por el coste de los Si vaco?(abierta) entonces
operadores devolver(negativo)
nodo primero(abierta)
Mtodo:
Si meta?(nodo) entonces
g(n): coste mnimo para llegar
devolver(nodo)
del nodo inicial al nodo n
sucesores expandir(nodo)
expandir siempre el nodo de menor
coste g primero Para cada n sucesores hacer
n.padre nodo
Algoritmo:
ordInsertar(n,abierta,g)
almacenar cada nodo con su valor g
Fin {repetir}
insertar los nuevos nodos en abierta
en orden ascendente segn su valor g
Inteligencia Artificial 3 ITIS
2010/11
Ejemplo: Bsqueda de coste uniforme
g=0
R A O F L A O g=146
A g=150
g=220 g=280 g=291 g =239 g=229 g=236
B O A O A
g=283 g=287 g=296 g=300
...
Inteligencia Artificial 3 ITIS
2010/11
Lgica de la bsqueda de coste uniforme
O
N 87
Z 71
75 151 I
A 92
S 99
140 F
118 V
80
T R 97 142
211
111 P H
L 98
70 146 101 85
U
M B 86
75 138
90 E
D 120
C
G
g = 80 g = 120 g = 160
2. Bsqueda
2.1. Agentes de resolucin
de problemas
Inteligencia Artificial:
compila conocimiento emprico sobre un problema / un entorno
Interpretacin fuerte:
una heurstica suele facilitar la resolucin de un problema, pero no garantiza
que se resuelva
una heurstica es una regla de tres para un problema
bsqueda: optimalidad o incluso completitud no garantizados
Interpretacin dbil:
mtodo riguroso + informacin heurstica
informacin heurstica puede mejorar el rendimiento medio de un mtodo de
resolucin de problemas, pero no garantiza una mejora en el peor caso
bsqueda: mejora de complejidad no garantizado
Inteligencia Artificial 3 ITIS
2010/11
Funciones heursticas
Funciones heursticas para bsqueda en el espacio de estados:
estiman de adecuacin de un nodo para ser expandido
mtodos de bsqueda el mejor primero eligen el nodo ms
prometedor para expandir
A F O R
h* = 366 h* = 178 h* = 380 h* = 193
Solucin subptima:
c(A-S-F-B) = 450
S h* = 253 B h* =0 c(A-S-R-P-B) = 418
hF* = 226
Ejemplo:
Nodo inicial: I (Iasi)
Nodo meta: F (Fagaras) N hF* = 201 V hF* =246
hF* estima la distancia hasta F
hF* = 226
hF*
F 0
I 226
N 201 N hF* = 201 V hF* =246
V 246
...
hF* = 226
...
Inteligencia Artificial 3 ITIS
2010/11
Bsqueda avara: anlisis
Anlisis:
en general, la bsqueda avara sufre los mismos problemas que la bsqueda en
profundidad
no es ptima (ejemplo 1)
no es completa (ejemplo 2)
sin embargo, suele encontrar una solucin aceptable de forma rpida
Comentarios:
problema fundamental de la bsqueda avara:
slo considera el coste para llegar al nodo actual
no se fija en la distancia restante desde el nodo actual
para asegurar la completitud habra que evitar todos los estados repetidos
el mtodo es ptimo slo en aquellos espacios de estados en los que el coste de un
nodo n es independiente del camino por el que se llega hasta l
Comentario:
si concebimos cada fila como una
variable, podemos replantear el ejercicio
como un problema de satisfaccin de
restricciones Inteligencia Artificial 3 ITIS
2010/11
Bsqueda A*
Idea:
Estrategia A* :
entre las hojas del rbol de bsqueda, elegir el nodo de valor f * mnimo
A F O R f * = 220+193
= 413
f * = 280+366 f * = 239+178 f * = 291+380
= 646 = 417 = 671
S B C f * = 366+160
= 526
P f * = 317+98
= 415
S f * = 300+253
= 533
f * = 338+253 f * = 450+0
= 591 = 450
N fF * = 87+201 V fF * = 92+246
= 288 = 338
f* f*
f *(nj) f *(nj)
n1 nj n1 nj
nj
Interpretacin intuitiva:
h*(nj )
h* es consistente si cumple la c(ni,nj)
desigualdad triangular ni h*(ni )
ng
Prueba:
h*(nj ) h*(ni ) c(ni,nj)
h*(nj ) + g(nj ) h*(ni ) + g(nj ) c(ni,nj)
h*(nj ) + g(nj ) h*(ni ) + g(ni ) + c(ni,nj) c(ni,nj)
f *(nj ) f *(ni )
f *(nj) f *(nj)
n1 nj n1 nj
(a) variable (b) montono creciente
Prueba:
1. Debido a la consistencia de h*, la bsqueda se realiza por las curvas de nivel correspondientes a
f * (lema 1). Se expanden sucesivamente los nodos de menor a mayor valor de f *
4. En consecuencia, el camino en el rbol de bsqueda desde la raz hasta el primer nodo meta n es
de coste mnimo, y A* es ptimo
Prueba:
sea ng un nodo meta con f *(ng) = k. Suponga que ng no es encontrado por el mtodo
A*
ya que el nmero de sucesores de un nodo es finito, debe haber un camino infinito p
debido al lema 1 (monotona de f *) todos los nodos ni de p han de cumplir f *(ni) k
pero la secuencia de valores de g a lo largo de p no tiene lmite
(vase la prueba de completitud de la bsqueda de coste uniforme)
por definicin h *(n) 0, por lo que la secuencia de f *(ni) = g(ni) + h*(ni) tampoco tiene
lmite para los nodos ni a lo largo de p
contradiccin; en consecuencia, el mtodo A* encuentra el nodo meta ng
Mtodo:
Inicialmente, se realiza una bsqueda con h*(n) = 0 para todos los nodos n
En cada paso de ni a nj: h * (n i ) min [h (n ) + c(n ,n )]
n j expandir(n i )
*
j i j
Problema:
Hay que almacenar los valores h* de todos los nodos en una tabla (memoria!)
Inteligencia Artificial
3 ITIS 2010/11
Ejemplo: A* con Aprendizaje de una Funcin
Heurstica
A fL * = 0+0 Ejemplo: ir de A a L
=0
140 Inicialmente hL*(n) = 0 para todo nodo n
118 75
n A B C D E F G H I L M N O P R S T U V Z
hL* 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
75 142 97 80 111 71
146
Inteligencia Artificial
3 ITIS 2010/11
Ejemplo: A* con Aprendizaje de una Funcin
Heurstica
Ejemplo: ir de Z a L
Z fL * = 0+71
= 71 Inicialmente hL*(n) aprendido anteriormente
71
75
O fL * = 71+142
A fL * = 75+146 = 213
= 221
151
140 118 75 71
L A
fL *=229+0 fL *=236+229
=229 =465
n A B C D E F G H I L M N O P R S T U V Z
hL* 220 0 0 0 0 0 0 0 0 0 0 0 231 0 97 99 111 0 0 213
229 111
Inteligencia Artificial
3 ITIS 2010/11
Encontrar de Funciones Heursticas:
Diseo
El problema del 8-puzzle:
Estado inicial
Estados:
posicin de cada una de las piezas 2 7 3
1 8 4
Operadores:
6 5
mover pieza adyacente a la posicin
del hueco
de 2 a 4 operadores aplicables, Estado meta
segn el estado
1 2 3
Coste:
8 4
La aplicacin de cada operador vale
una unidad
7 6 5
Ejemplo:
en el 8-puzzle, hc* es ms informada que ha*
las piezas bien colocadas no cuenta en ha* ni en hc*
la distancia Manhattan de cada pieza descolocada es al menos 1
en consecuencia, en toda posible configuracin n del 8-puzzle la suma de
las distancias distancias es igual o mayor que la suma de piezas
descolocadas
para todas las configuraciones n se cumple hc*(n ) ha*(n )
Nota:
Se puede demostrar que el lema 2 tambin se cumple si se
asume slo que h1* y h2* sean funciones heursticas optimistas.
Conclusin:
preferir grandes valores de h*, siempre que se mantenga
optimista
si hay varias funciones heursticas optimistas:
( )
h * ( n ) = max h *1 ( n ),h2* ( n ),,hm* ( n )
Complejidad de A*
El nmero de nodos expandidos por A* depende de la precisin de h*:
si h*(n) = h(n) para todos los nodos n:
informacin completa: complejidad lineal (sin contar la complejidad de computar h*!)
calcular h*(n) suele equivaler a resolver el problema completo
si h*(n) = 0 para todos los nodos n:
A* degenera a la bsqueda de coste uniforme
resultados generales [Russell, pg. 101]:
en el peor caso, A* es lineal slo si para todos los nodos n,
| h (n) h*(n) | O(c)
en el peor caso, A* es polinomial slo si para todos los nodos n,
| h (n) h*(n) | O(log h(n))
en escenarios reales, el error heurstico |h (n) h*(n) | crece, al menos, de forma
proporcional al coste h (n)
an as, suele haber una mejora notable en comparacin con mtodos no informados
Idea:
aplicar bsqueda de profundizacin iterativa, pero en vez de usar sucesivos
lmites de profundidad, usar sucesivos lmites f *
Estrategia:
usar inicialmente el valor f * de la raz como limite f *
realiza bsqueda en profundidad estndar hasta llegar al limite f * actual
(es decir: los valores f * no influyen en el orden de expandir los nodos)
curiosear encima del lmite f * por el nodo con el siguiente valor f * ms
bajo
repetir el proceso con dicho valor f * como nuevo limite f *
Caractersticas:
al igual que la bsqueda en profundidad, IDA* desarrolla un camino
actual
slo los nodos vecinos de dicho camino actual se mantienen en le memoria
Inteligencia Artificial 3 ITIS
2010/11
Bsqueda IDA*: Ejemplo (1)
f * = 0+366
= 366
lmite f * = 366
A F O R f * = 220+193
= 413
f * = 280+366 f * = 239+178 f * = 146+380
= 646 = 417 = 526
S B C f * = 366+160
= 526
P f * = 317+98
= 415
S f * = 300+253
= 533
f * = 338+253 f * = 450+0
= 591 = 450
S f* = 140+253
T f * = 118+329 Z f * = 75+374
= 393 = 447 = 449
A F O R f * = 220+193
= 413
f * = 280+366 f * = 239+178 f * = 146+380
= 646 = 417 = 526
S B C f * = 366+160
= 526
P f * = 317+98
= 415
S f * = 300+253
= 533
f * = 338+253 f * = 450+0
= 591 = 450
S f* = 140+253
T f * = 118+329 Z f * = 75+374
= 393 = 447 = 449
A F O R f * = 220+193
= 413
f * = 280+366 f * = 239+178 f * = 146+380
= 646 = 417 = 526
S B C f * = 366+160
= 526
P f * = 317+98
= 415
S f * = 300+253
= 533
f * = 338+253 f * = 450+0
= 591 = 450
S f* = 140+253
T f * = 118+329 Z f * = 75+374
= 393 = 447 = 449
A F O R f * = 220+193
= 413
f * = 280+366 f * = 239+178 f * = 146+380
= 646 = 417 = 526
S B C f * = 366+160
= 526
P f * = 317+98
= 415
S f * = 300+253
= 533
f * = 338+253 f * = 450+0
= 591 = 450
S f* = 140+253
T f * = 118+329 Z f * = 75+374
= 393 = 447 = 449
A F O R f * = 220+193
= 413
f * = 280+366 f * = 239+178 f * = 146+380
= 646 = 417 = 526
S B C f * = 366+160
= 526
P f * = 317+98
= 415
S f * = 300+253
= 533
f * = 338+253 f * = 450+0
= 591 = 450
S f* = 140+253
T f * = 118+329 Z f * = 75+374
= 393 = 447 = 449
A F O R f * = 220+193
= 413
f * = 280+366 f * = 239+178 f * = 146+380
= 646 = 417 = 526
S B C f * = 366+160
= 526
P f * = 317+98
= 415
S f * = 300+253
= 533
f * = 338+253 f * = 450+0
= 591 = 450
Algoritmo IDA* :
complejidad en tiempo:
muchos valores diferentes de f * (p.e. bsqueda de rutas):
puede elevar la complejidad en tiempo de A* al cuadrado
pocos valores diferentes de f * (p.e. 8 puzzle):
proporcional a la complejidad en tiempo de A*
Resultado clave:
algoritmos A* e IDA* la informacin heurstica puede mejorar la
eficiencia de un mtodo de bsqueda sin sacrificar su optimalidad
Extensiones:
Bsqueda aproximada:
acotar el espacio de bsqueda con informacin heurstica fuerte (e.d. sacrificando
las garantas de optimalidad y completitud
bsqueda guiada por subobjetivos (island-driven search), bsqueda jerrquica,
Bsqueda en lnea:
engranar bsqueda (eleccin de acciones) y accin/percepcin ejemplos
bsqueda de horizonte (limited-horizon search), A* en tiempo real (RTA*),
2. Bsqueda
2.1. Agentes de resolucin de problemas
Situacin:
Mltiples agentes de resolucin de problemas actan en el mismo entorno
Las acciones de los dems agentes influyen en la medida de rendimiento
de cada agente
Ningn agente puede controlar las acciones de los dems agentes
Hasta cierto punto, un agente puede predecir las acciones de los dems
Actuacin simultnea:
los agentes pueden actuar en paralelo (de modo sncrono)
las acciones (planes) pueden ejecutarse simultneamente, siempre que no accedan
al mismo bloque a la vez
el coste de un plan viene dado por el tiempo necesario para ejecutarlo
Inteligencia Artificial 3 ITIS
2010/11
Escenarios cooperativos
1 Estado inicial 2 1 Estados meta 2
1 2 4 3 4 3
4 3 1 2 1 2
los dos agentes sacan provecho si se ejecuta un plan conjunto, pero dependiendo del plan un
agente gana ms que otro Inteligencia Artificial 3 ITIS
2010/11
Escenarios antagnicos: Juegos
Juegos:
ejemplo clsico de escenarios antagnicos (juegos de suma nula)
el escenario est totalmente definido por las reglas del juego, y los agentes
jugadores los conocen completamente
Tipos de juegos:
nmero de jugadores :
bipersonales (damas) / mltiples jugadores (Monopoly)
elementos de azar:
con elementos de azar (backgammon) / juegos bipersonales con
sin elementos de azar (damas)
informacin perfecta y
informacin: sin elementos de azar
informacin perfecta (damas) /
informacin incompleta (pker)
Inteligencia Artificial 3 ITIS
2010/11
Ejemplo: Tres en Raya
Tres en Raya:
dos jugadores (min y max)
los jugadores van poniendo fichas en las casillas gana max
de un tablero 3x3
max usa las fichas X / min usa las fichas O
una casilla puede contener como mucho una ficha
Reglas:
gana min
Inicialmente el tablero est vaco
max empieza y los jugadores se van alternando en
poner sus fichas
max gana si obtiene una raya de tres fichas X
min gana si obtiene una raya de tres fichas O
si todas las casillas estn ocupadas sin que haya empate
una raya de 3 fichas del mismo tipo, hay empate
Ntese:
la funcin expandir
min
...
max
...
min
... ... ...
terminal
0 + utilidad
Inteligencia Artificial 3 ITIS
2010/11
rboles de juego
Definicin:
Sea N un conjunto de nodos, E NN, L = { max, min }, y G = ( N, E, L ) un
rbol etiquetado. G es un rbol de juego si
G no es vaco
la raz est etiquetada max
todos los sucesores de max son etiquetados min
todos los sucesores de min son etiquetados max
Observaciones:
cada nivel del rbol de juego representa un ply (media jugada)
en los nodos etiquetados max, es el turno del agente max
en los nodos etiquetados min, es el turno del agente min
las hojas de un rbol de juego (completamente desarrollado)
representan las posiciones terminales del juego
Estrategia:
define las jugadas de max para cada posible jugada de min
un subrbol del rbol de juego
max 0
a1 a2 a3
min 0 - -
a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3
terminal
utilidad 0 0 + + + 0 0
Mtodo Minimax:
1. Generar el rbol de juego completo
2. Aplicar la funcin de utilidad en cada nodo terminal
3. Propagar las utilidades hacia arriba
en los nodos max, usar la utilidad mxima de los sucesores
en los nodos min, usar la utilidad mnima de los sucesores
4. Eventualmente los valores de utilidad llegan al nodo raz (max)
5. La jugada ptima de max es la que lleva al sucesor de utilidad mxima
Solucin: Heursticas
sustituir la prueba terminal por una prueba suspensin que detiene la
bsqueda an sin llegar a una posicin terminal:
lmite de profundidad fijo (nmero de plys fijo)
posiciones en reposo
max 3
a1 a2 a3
min 3 2 2
a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3
evaluacin e 3 12 8 2 4 6 14 5 2
min
...
...
...
... 2
max
1 + +
0 1 1 1 1 + 1 1 +
Inteligencia Artificial 3 ITIS
2010/11
Ejercicio 2.11
Considrese el siguiente rbol de juego desarrollado hasta ply 3. Los nodos
estn etiquetados con los valores de la funcin de evaluacin e.
a) Evale el rbol del juego en base al algoritmo minimax.
b) Cul es la mejor jugada para el agente max?
7 6 8 5 2 3 0 2 6 2 5 8 9 2
Inteligencia Artificial 3 ITIS
2010/11
Poda -
Ntese:
a veces es posible calcular la utilidad de un nodo sin tener que evaluar
todos sus sucesores
max 3
a1 a2 a3
min 3 2 2
a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3
3 12 8 2 14 5 2
7 6 8 5 2 3 0 2 6 2 5 8 9 2