Sei sulla pagina 1di 2

GIOCHI tlATEMATICI

di Martin Gardner
Come St costruisce una macchina che impara
a gwcare e a vtncere.
Mi intendevo poco di scacchi, ma
quando sulla scacchiera furono rimasti
S% pochi pezzi apparve evidente che il
gioco era prossimo alla conclusione.
... il viso [di Mcxon] era spaventosa
mente pallido, e gli occhi rilucevano co
me diamanti. Del suo avversario pote
vo vedere solo la schiena, ma era suffi
ciente; non avrei avuto bisogno di guar
darlo in laccia.
..
E
una citazione di un classico rac--
conto di fantascienza di Ambra
se Bierce, Il campione di Moxon.
L'Inventore Mcxon ha costruito un ro
bot che gioca a scacchi. Moxon vince
una partita. Il robot lo strangola.
Il racconto di Bierce rifette quello
che un timore crescente: un giorno o
l'altro i calcolatori ci sfuggiranno di
mano sviluppando una volont propria.
Non pensiate che sia una questione che
si pongono solo coloro che non cono
scono i calcolatori. Qualche anno fa
Norbert Wiener guardava con appren
sione crescente al giorno in cui com
piesse decisioni di governo sarebbero
state afdate a macchine rafnate fun
zionanti in base alle teoria dei giochi,
Prima che ce ne possiamo accorgere,
avvertiva Wiener, le macchine potran-
Il gioco deU'esapedina.
106
no spingerci oltre l'orlo di una guerra.
La minaccia maggiore in fatto di
comportamento imprevedibile proviene
dalle macchine che imparano, cio dai
calcolatori che si perfezionano in base
all'esperienza. Macchine di questo tipo
non fanno quellI che stato loro detto
di fare, ma quello che hanno imparato
a fare. Esse raggiungono in fretta il
momento in cui il programmatore non
sa piu che tipo di circuiti contenga la
macchina. La maggior parte di questi
calcolatori contengono degli apparati
che rendono casuali le decisioni; se que
sti funzionano, per esempio, in base al
decadimento casuale degli atomi di un
materiale radioattivo, il comportamen
to della macchina - COSI ritiene la mag
gior parte dei fsici - non prevedi bile
neppure in linea di principio.
Buona parte della ricerca attuale sul
le macchine che imparano riguarda cal
colatori che migliorano in continuazio
ne la propria abilit nel gioco. Parte
delle ricerche sono segrete: anche la
guerra un gioco, almeno cosi dicono.
La prima importante macchina di que
sto tipo stata un calcolatore IBM 704
programmato da Arthur L Samuel del
ccntro studi dell'IBM a Poughkeepsie,
negli USA. Nel 1959 Samuel predispo
se il calcolatore in modo tale che non
solo era capace di giocare bene a da
ma ma era anche in grado di analizzare
le partite precedenti e di modifcare la
strategia alla luce dell'esperienza. Al
l'inizio per Samuel era facile batterlo;
invece di strangolarlo la macchina mi
glior rapidamente, raggiungendo ben
presto il momento nel quale poteva
sconfggere sempre il proprio inventore.
Qualche anno fa stata attribuita al
grande campione di scacchi russo Mik
hail Botvinik l'affermazione che arrive
r il giorno in cui un calcolatore gio
cher come un campione di scacchi.
c Questo ovviamente assurdo:, ha
scritto l'esperto di scacchi americano
Edward Lasker in un articolo relativo
alle macchine che giocano a scacchi ap-
parso nella flvlsta c The American
Chess Quarterly >. Ma Lasker cbe
dice delle assurdit. Un calcolatore
c scacchista: ha tre enormi vantaggi
su di un avversario umano: I) non fa
mai un errore di distrazione; 2) pu
analizzare le mosse future a una velo
cit molto maggiore di quella di un gio
catore umano; 3) pu migliorare la pro
pria abilit al di l di ogni limite. Vi
sono quindi tutte le ragioni per ritenere
che una macchina c scacchista : in gra
do di imparare sviluppi col tempo, do
po aver giocato migliaia di partite con
degli esperti, l'abilit di un campione.
t anche possibile programmare una
macchina scacchista che giochi conti
nuamente e furiosamente con se stes
sa. La sua velocit le permetterebb di
acquisire in breve tempo un 'es
p
erienza
di gran lunga superiore a quella di qual
siasi giocatore umano.
Non necessario per il lettore che
voglia fare degli esperimenti con mac
chine che imparano a giocare acquista
re un calcolatore elettronico. Basta pro
curarsi una scorta di scatole di fiam
miferi vuote e di palline colorate. Que
sto metodo per costruire una semplice
macchina che impara la felice inven
zione di Donald Michie, un biologo del
l'Universit di Edimburgo.
In un articolo intitolato Prova ed
errore apparso nel Penguin Science Sur
vey 196/, val. Il, Michie descrive una
macchina che impara il filetto chiamata
c Menace : (dalle iniziali dei corrispon
denti termini inglesi per c macchina co
stituita da scatole di fammiferi educa
bile per il fletto,) costruita con 300
scatole di fammiferi.
c Menace: funziona in maniera me
ravigliosamente semplice. Su ogni sca
tola attaccato uno schema di una del
le possibili posizioni del fletto. La mac
china compie sempre la prima mossa,
cosi bast:no gli schemi che si riferisco
no alle mosse dispari. Ogni scatola con
tiene delle piccole palline colorate di
diversi colori, ognuno dei quali indica
una delle possibili mosse della macchi
na. Sul fondo di ogni scatola viene in
collato un orlo di cartoncino a forma
di V, in modo che quando si agita la
scatola e la si rovescia le palline roto
lano nella V. Il colore della pallina che
rotola nell'angolo della V determinato
dal caso. Le scatole della prima mossa
contengono quattro palline di ciascun
colore, quelle della terza mossa tre di
ogni colore, quelle della quinta due pal
line per colore, e le scatole della setti
ma mossa una pallina per colore.
La mossa dell'automa viene stabilita
scuotendo e ribaltando una scatola,
aprendo il cassettino e notando il co
lore della pallina c apicale:, ossia di
quella che va a porsi nel vertice della
V. Le scatole che partecipano a una
partita vengono lasciate aperte finch
questa non fnisce. Se la macchina vin
ce, viene ricompensata aggiungendo tre
pal1ine del colore apicale a ognuna del
le scatole aperte. Se il risultato un pa
reggio la ricompensa di una pallina
per scatola. Se la macchina perde vie
ne punita estraendo la pallina apicale
da tutte le scatole aperte. Il sistema del
la ricompensa e della punizione mostra
un forte parallelismo col modo in cui
gli animali e anche gli uomini appren
dono e acquistano disciplina. - ovvio
che piu gioca, piu c Menace , tende ad
adottare linee di gioco vincenti e a evi
tare linee perdenti. Questo la rende le
gittimamente una macchina che impa-
00
2 2
4
4 6
o .
6 6
ra, anche se di tipo estremamente sem
plice. Non compie (come fa la macchi
na per la dama di Samuel) alcuna auto
analisi delle partite gi giocate che ]a
induca a escogitare nuove strategie.
Il primo torneo di Michie con c Me
nace: consistette di duecentoventi par
tite nello spazio di due giorni. In un
primo momento fu facile battere la
macchina. Dopo 17 mosse la macchina
aveva abbandonato tutte le aperture ec
cetto quella d'angolo. Dopo la ventesi
ma partita arrivava con frequenza al pa
reggio, cosicch Michie cominci a pro
vare varianti insolite nella speranza di
indurla in errore. Questo si dimostr ef
fcace fno a quando la macchina non
impar a tener testa a tutte queste va
rianti. Quando Michie si ritir dopo
4 4
4 4

o O

. ,
6 6




6 6
Simboli per le Matole di c Her .
aver perso otto partite su dieci c Me
nace. era diventata un campione.
Dato che probabilmente pochi let
tori saranno disposti a tentare di co
struire una macchina che impara for
mata di 300 scatole di fammiferi, ho
progettato l'esapedina, un gioco molto
piu semplice che richiede solo 24 sca
tole. Il gioco facile da analizzare -
in efetti banale-ma il lettore pre
gato di non analizzarlo. E molto piu
divertente costruire la macchina e poi
imparare a giocarci, mentre anche la
macchina impara.
L'esapedina si gioca su una scacchie
ra 3 X 3, con tre pedine degli scacchi da
ambo le parti come nella fgura di pa
gina 106. Al posto dei pezzi degli scac
chi si possono usare monetine da cin-
O O
4 4
O
4 4
6 6
6 6
107
L'AUTOMA DIVENTA UN GIOCATORE PERFETTO I
DOPO AVER PERSO 11 PARTITE
\

o 10 20 : 40 5
PARTITE
Curva cii apprendimento di c Her, per le prime SO partite (la direzione verso il basso
indica sconftta, quella verso l'alto vittorj(t).
que e da dieci lire. Sono permessi solo
due tipi di mosse: l) una pedina pu
avanzare di un quadrato fno a un qua
drato vuoto; 2) una pedina pu cattu
rare una pedina nemica muovendosi
diagonalmente di un quadrato, a destra
o a sinistra. Il pezzo catturato viene
tolto dalla scacchiera. Queste sono le
stesse mosse delle pedine degli scacchi,
anche se non sono permesse mosse dop
pie, cattura di pedine o avanzamento
en pasant.
Si vince la partita in uno dei seguen
ti tre modi:
1. Facendo avanzare una pedina fno
alla terza riga.
2. Catturando tutti i pezzi avversari.
3. Arrivando a una situazione nella
quale l'avversario non pu muovere.
Le mosse dei giocatori si alternano,
e ognuno muove un pezzo alla volta.
Vo pareggio evidentemente impossi
bile, ma non immediatamente chiaro
se sia avvantaggiato il primo o il se
condo che muove.
Per costruire . Her. (dalle iniziali
delle corrispondenti parole inglesi per
c automa educabile per esapedina .) so-

Si po.sono COj'ruire macchine a fammiferi per la dama jemplifcola (a sinistra), ma non


per gli scacchi (a destralo
108
no necessarie 24 scatole di fammiferi
vuote e una provvista di palline colo
rate. Ogni scatola di fammiferi reca
su di s uno dei diagrammi che si
vedono nell'illustrazione della pagina
a fronte. L'automa fa sempre la se
conda mossa. Gli schemi indicati con
c 2 rappresentano le due posizioni
per . Her. alla seconda mossa. Si pu
scegliere tra un'apertura centrale oppu
re una d'angolo, ma si considera solo
il lato sinistro dato che una apertura
a destra comporterebbe linee di gioco
identiche (anche se simmetriche). Gli
schemi indicati con c 4. mostrano le
Il posizioni disponibili per c Her. alla
quarta mossa (la sua seconda). Gli sche
mi segnati con c 6 sono le I l posi
zioni che c Her. ha a disposizione alla
sesta mossa (la sua ultima).
Si metta in ogni scatola na sola
pallina in corrispondenza di ogni frec
cia dello schema. L'automa ora pron
to per giocare. Ogni mossa lecita rap
presentata da una freccia; l'automa pu
quindi compiere tutte le mosse possi
bili e insieme lecite. Esso non possiede
una strategia. Di fatto un idiota.
Il procedimento di apprendimento
il seguente. Fate la vostra prima mos
sa, Prendete la scatola che indica ]a
posizione sulla scacchiera. Scuotetela,
chiudete gli occhi, aprite il tirante e to
gliete una pallina. Chiudete il tirante,
mettete giu la scatola, mettete la pallina
sopra la scatola. Aprite gli occhi, os
servate il colore del1a pa11ina, trovate
la freccia corrispondente e muovete di
conseguenza. Ora di nuovo il vostro
turno di muovere. Continuate con que
sto procedimento sino alla fne della
partita: se l'automa vince rimettete a
posto tutte le palline e giocate di nuo
vo; se perde punitelo requisendo solo
la pallina che rappresenta l'ultima mos
sa. Rimettete a posto le altre pal1ine e
ricominciate a giocare. Se doveste tro
vare una scatola vuota (il che accade
raramente) signifca che la macchina
non ha a disposizione mosse che non
siano fatali e si ritira. In questo caso
confscate la pa11ina della mossa pre
cedente .
Registrate le vittorie e le perdite in
modo da poter fare un diagramma"del1e
prime cinquanta partite. L'illustrazione
qui sopra mostra i risultati di un ti
pico torneo di 50 partite. Dopo 36 par
tite (che comprendevano 1 t sconftte
per l'automa), questo ha imparato a
giocare una partita perfetta. Il sistema
di punizione progettato in modo da
minimizzare il tempo necessario per im
parare la partita perfetta, ma il tempo
varia con l'abilit dell'avversario del1a
macchina. Migliore l'avversario, piu in
fretta la macchina impara.
L'automa pu essere progettato in al-
lri modi. Cosi con lo scopo di massi
mizzare il numero di partite che la
macchina vince in un torneo di 25 par
tite, per esempio, pu essere meglio ri
compensare (pur continuando a punire)
aggiungendo una pallina di colore op
portuno a ogni scatola quando la mac
china vince, Le mosse cattive non ver
rebbero eliminate altrettanto rapidamen
te, ma sarebbe meno propensa a com
pierle. Un progetto interessante sarebbe
la costruzione di un secondo automa,
c Him (dal1e iniziali dei corrispondenti
termini inglesi per c scatole istruibili
per esapedina ), progettato con un di
verso sistema di ricompensa e punizio
ne ma altrettanto incompetente all'ini
zio del torneo. Entrambe le macchine
dovrebbero essere ingrandite in modo
da poter fare sia la prima sia la se
conda mossa. Si potrebbe allora fare
un torneo tra c Him e c Her ., alter
nando la prima mossa, per vedere qua
le delle due macchine vince piu par
tite su 50.
Automi di questo tipo possono venir
facilmente costruiti per altri giochi.
Stuarl C, Hight, direttore del1e ricerche
dei BeH Te]ephone Laboratories, ha co
struito con delle scatole di fiammiferi
una macchina che impara chiamata
c Nimble. (da11e iniziali dei corrispon
denti termini inglesi per c macchina lo
gica a scatole per nim ) che gioca al
nim con tre pile di tre pezzi ciascuna.
L'automa pu giocare sia per primo sia
per secondo. Per Nimble sono state
sufcienti 18 scatole, anche se questa
macchina gioca pressoch perfettamen
te dopo 30 partite.
Riducendo le dimensioni della scac
chiera si pu minimizzare la comples
sit di molti giochi ben noti fno a ri
durli alla portata di un automa costrui
to con scatole. Il gioco del1a tria, per
esempio, si pu giocare sulle intersezio
ni di una scacchiera di 2 X 2.
L'illustrazione a sinistra in basso di
pagina 108 mostra la piu piccola scac
chiera non banale per la dama. Non do
vrebbe essere difcile costruire una
macchina a scatole che impari a gio
carvi. I lettori che non abbiano interes
se a farlo possono divertirsi ad analiz
zare il gioco. Una delle due parti ha la
vittoria assicurata oppure due gioatori
perfetti verranno a pareggiare?
Quando gli scacchi vengono ridotti
alla scacchiera piu piccola sulla quale
sono possibili tutte le mosse ammesse,
come si vede nell'illustrazione in basso
a destra a pagina 108, la complessit
del gioco di gran lunga superiore alle
capacit di una macchina a scatole.
L a fgura a destra mostra come
vanno ombreggiati i tre cerchi di
Venn per risolvere il problema del me-
se scorso relativo ai tre uomini d'af
fari che pranzano assieme. Ciascuno dei
primi quattro diagrammi ombreggiato
in modo da rappresentare una delle
quattro premesse del problema. Sovrap
ponendo i quattro diagrammi si ottiene
il diagramma in basso, il quale mostra
che. se le quattro premesse sono vere,
la sola possibile combinazione dei va
lori di verit a, b, - c, cio a vero, b
vero e c falso. Poich abbiamo conve
nuto di identifcare la verit con l'ordi
nare l'aperitivo, se ne conclude che Al
tieri e Bianchi bevono sempre l'aperi
tivo, mentre Cisotti non lo beve mai.
li semplice metodo per generare in
siemi di 21! numeri in modo che formi
no sistemi booleani e di cui si parlato
il mese scorso, stato segnalato su
cThe American Mathematical Monthly.
1 c
3
c
5 c
(marzo 1960) da Franeis D. Parker.
Consideriamo un insieme di un numero
qualsiasi di numeri primi distinti, per
esempio (2, 3, 5 l. Per ogni possibile
sottoinsieme (compresi O, l'insieme vuo
to, e l'insieme originario) di questo in
sieme facciamo il prodotto dei rispettivi
elementi. Sostituiamo poi l a O e otte
niamo cOSI l'insieme { l, 2, 3, 5, 6, 10,
15, 30 l, il primo nell'esempio visto il
mese scorso. In maniera analoga, con
l'insieme costituito dai primi quattro nu
meri primi {2, 3, 5, 7}, si ha il secondo
esempio, quello che d i 24 = J 6 divi
sori di 210. La dimostrazione che tutti
questi insiemi costituiscono algebre boo
leane, nel senso inteso il mese scorso, si
pu trovare in Boolean Algebra di R.L.
Goodstein (Pergamon, 1963) a pagina
126 come risposta al problema n. IO.
2
c
4
c
Soluzione (I problema dell'aperitivo mediante i cerchi di Venn.
109