Sei sulla pagina 1di 292

Pagina 1

Testo originale
Contribuisci a una traduzione migliore

Pagina 3
2

Inizia a leggere

Sommario

Riguardo agli Autori

Pagina Copyright

Pagina 4

Grazie per aver acquistato questo


Ebook di Henry Holt and Company.

Per ricevere offerte speciali, contenuti bonus,


e informazioni su nuove uscite e altre ottime letture,
Iscriviti alla nostra newsletter.
Pagina 5

Oppure visitaci online su


us.macmillan.com/newslettersignup

Per aggiornamenti via e-mail su Brian Christian, fare clic qui.


Per aggiornamenti via e-mail su Tom Griffiths, fare clic qui.
Pagina 6

L'autore e l'editore ti hanno fornito questo e-book per tuo uso personale
solo. Non puoi rendere questo e-book pubblicamente disponibile in alcun modo. Diritto d'autore
la violazione è contro la legge. Se credi alla copia di questo e-book tu
stai leggendo viola il copyright dell'autore, si prega di avvisare l'editore
su: us.macmillanusa.com/piracy .
Pagina 7

Per le nostre famiglie

Pagina 8

introduzione
Algoritmi di cui vivere

Immagina di cercare un appartamento a San Francisco, probabilmente il più


straziante città americana in cui farlo. Il settore tecnologico in forte espansione e stretto
le leggi sulla zonizzazione che limitano le nuove costruzioni hanno cospirato per rendere la città altrettanto
costoso come New York e per molti versi più competitivo. Nuovi elenchi
salgono e scendono in pochi minuti, le case aperte sono assalite, e spesso il
le chiavi finiscono nelle mani di chiunque possa fisicamente rifilare un assegno di deposito sul
padrone di casa prima.
Un mercato così selvaggio lascia poco spazio al tipo di accertamento dei fatti e
deliberazione che teoricamente dovrebbe caratterizzare le azioni della
consumatore razionale. A differenza, ad esempio, di un mecenate di un centro commerciale o di un acquirente online, chi può farlo
confrontare le opzioni prima di prendere una decisione, deve farlo l'aspirante San Francescano
decidi subito in entrambi i casi: puoi prendere l'appartamento che stai cercando
a, abbandonando tutti gli altri, o puoi andartene, per non tornare mai più.
Supponiamo per un momento, per semplicità, che ti interessi solo
di massimizzare le tue possibilità di ottenere il miglior appartamento disponibile. Il tuo
l'obiettivo è ridurre i rimpianti gemelli, Scilla e Cariddi di “quello che ha avuto
lontano ”e la“ pietra lasciata non girata ”al minimo assoluto. Ti imbatti in un file
dilemma subito: come fai a sapere che un appartamento è davvero il
meglio a meno che tu non abbia una linea di base per giudicarlo? E come puoi stabilirlo
base a meno che non guardi (e perdi ) un numero di appartamenti? Più
informazioni raccolte, meglio conoscerai la giusta opportunità quando tu
guardalo, ma più è probabile che tu lo abbia già superato.

Pagina 9

Allora cosa fai? Come prendi una decisione informata quando il file
atto di informare ne compromette il risultato? È una situazione crudele, al limite
paradosso.
Quando si trova di fronte a questo tipo di problema, la maggior parte delle persone lo dirà intuitivamente
qualcosa per l'effetto che richiede una sorta di equilibrio tra guardare e
balzando: che devi guardare abbastanza appartamenti per stabilire uno standard, allora
prendi tutto ciò che soddisfa lo standard che hai stabilito. Questa nozione di equilibrio
è, infatti, precisamente corretto. Quello che la maggior parte delle persone non dice con certezza è
qual è questo equilibrio. Fortunatamente, c'è una risposta.
Trentasette per cento.
Se vuoi le migliori probabilità di ottenere il miglior appartamento, spendi il 37% del tuo
caccia all'appartamento (undici giorni, se ti sei dato un mese per la ricerca)
opzioni esplorative senza impegno. Lascia il libretto degli assegni a casa; sei solo
calibrazione. Ma dopo quel punto, preparati a impegnarti immediatamente: depositare
e tutto - al primo posto in cui vedi che batte tutto ciò che hai già visto.
Questo non è solo un compromesso intuitivamente soddisfacente tra guardare e
saltando. È la soluzione provabilmente ottimale .
Lo sappiamo perché trovare un appartamento appartiene a una classe di
problemi matematici noti come problemi di "arresto ottimale". La regola del 37%
definisce una semplice serie di passaggi, ciò che gli informatici chiamano un "algoritmo" -
per risolvere questi problemi. E a quanto pare, la caccia all'appartamento è solo uno dei
i modi in cui l'arresto ottimale alza la testa nella vita quotidiana. Impegnarsi in o
rinunciare a una successione di opzioni è una struttura che riappare nella vita e
di nuovo, in incarnazioni leggermente diverse. Quante volte fare il giro del blocco
prima di entrare in un parcheggio? Fino a che punto spingere la fortuna con un rischio
impresa commerciale prima di incassare? Quanto tempo aspettare per un'offerta migliore
quella casa o quella macchina?
La stessa sfida appare anche in un contesto ancora più complicato: gli appuntamenti.
L'arresto ottimale è la scienza della monogamia seriale.
Semplici algoritmi offrono soluzioni non solo alla ricerca di un appartamento ma a tutti
tali situazioni nella vita in cui ci confrontiamo con la questione dell'arresto ottimale.
Le persone affrontano questi problemi ogni giorno, anche se sicuramente i poeti hanno parlato
più inchiostro sulle tribolazioni del corteggiamento che del parcheggio - e lo fanno con,
in alcuni casi, notevole angoscia. Ma l'angoscia non è necessaria.

Pagina 10

Matematicamente, almeno, questi sono problemi risolti.


Ogni affittuario, autista e corteggiatore tormentato che vedi intorno a te mentre procedi
una settimana tipica sta essenzialmente reinventando la ruota. Non hanno bisogno di un terapista;
hanno bisogno di un algoritmo. Il terapeuta dice loro di trovare il giusto, comodo
equilibrio tra impulsività e pensiero eccessivo.
L'algoritmo dice loro che il saldo è del trentasette percento.

C'è un particolare insieme di problemi che tutte le persone devono affrontare, problemi che sono a
risultato diretto del fatto che le nostre vite si svolgono in uno spazio e un tempo finiti.
Cosa dovremmo fare e lasciare incompiuto in un giorno o in un decennio? Che grado di
disordine dovremmo abbracciare - e quanto ordine è eccessivo? Che equilibrio
tra nuove esperienze e quelle favorite rende la vita più appagante?
Questi potrebbero sembrare problemi unici per l'uomo; loro non sono. Per più
per mezzo secolo gli scienziati informatici sono stati alle prese con, e in molti
risoluzione di casi, gli equivalenti di questi dilemmi quotidiani. Come dovrebbe un file
il processore alloca la sua “attenzione” per eseguire tutto ciò che l'utente gli chiede, con l'estensione
overhead minimo e nel minor tempo possibile? Quando dovrebbe cambiare
tra le diverse attività e quante attività dovrebbe assumere in primo luogo?
Qual è il modo migliore per utilizzare le sue risorse di memoria limitate? Dovrebbe raccogliere
più dati o intraprendere un'azione in base ai dati già presenti? Cogliere l'attimo
potrebbe essere una sfida per gli esseri umani, ma i computer intorno a noi stanno afferrando
millisecondi con facilità. E c'è molto che possiamo imparare da come lo fanno.
Parlare di algoritmi per vite umane potrebbe sembrare strano
giustapposizione. Per molte persone, la parola "algoritmo" evoca l'arcano e
macchinazioni imperscrutabili di big data, big government e big business:
sempre più parte dell'infrastruttura del mondo moderno, ma difficilmente una fonte
di saggezza pratica o guida per gli affari umani. Ma un algoritmo è solo un file
sequenza finita di passaggi utilizzati per risolvere un problema e gli algoritmi sono molti
più ampio e di gran lunga più vecchio del computer. Molto prima che esistessero gli algoritmi
mai usati dalle macchine, erano usati dalle persone.
La parola "algoritmo" deriva dal nome del matematico persiano al-
Khwārizmī, autore di un libro di tecniche per fare matematica del IX secolo
a mano. (Il suo libro si chiamava al-Jabr wa'l-Muqābala - e "al-jabr" del

Pagina 11

il titolo a sua volta fornisce la fonte della nostra parola "algebra.") La prima conosciuta
algoritmi matematici, tuttavia, sono anteriori anche al lavoro di al-Khwārizmī: un quattro
Una tavoletta di argilla sumera di mille anni trovata vicino a Baghdad descrive uno schema
per divisione lunga.
Ma gli algoritmi non si limitano alla sola matematica. Quando cucini il pane
da una ricetta, stai seguendo un algoritmo. Quando lavori a maglia un maglione da a
pattern, stai seguendo un algoritmo. Quando metti un bordo affilato su un pezzo di
selce eseguendo una precisa sequenza di colpi con l'estremità di un corno, una chiave
passo nella creazione di strumenti in pietra fine: stai seguendo un algoritmo. Algoritmi
hanno fatto parte della tecnologia umana sin dall'età della pietra.

In questo libro esploriamo l'idea della progettazione di algoritmi umani: la ricerca di


soluzioni migliori alle sfide che le persone incontrano ogni giorno. Applicare l'obiettivo
dell'informatica alla vita di tutti i giorni ha conseguenze su molte scale. Maggior parte
subito ci offre suggerimenti pratici e concreti su come risolvere specifiche
i problemi. L'arresto ottimale ci dice quando guardare e quando saltare. Il
Il compromesso tra esplorazione e sfruttamento ci dice come trovare l'equilibrio tra provare qualcosa di nuovo
cose e godersi i nostri preferiti. La teoria dell'ordinamento ci dice come (e se)
organizzare i nostri uffici. La teoria della cache ci dice come riempire i nostri armadi. Pianificazione
la teoria ci dice come riempire il nostro tempo.
Al livello successivo, l'informatica ci fornisce un vocabolario per la comprensione
i principi più profondi in gioco in ciascuno di questi domini. Come ha detto Carl Sagan,
"La scienza è un modo di pensare molto più che un insieme di conoscenze." Anche
nei casi in cui la vita è troppo disordinata per aspettarci una rigida analisi numerica o a
risposta pronta, utilizzando intuizioni e concetti affinati sulle forme più semplici di questi
problemi ci offre un modo per comprendere le questioni chiave e fare progressi.
Più in generale, guardare attraverso la lente dell'informatica può insegnarci
sulla natura della mente umana, il significato di razionalità e il più antico
questione di tutti: come vivere. Esaminare la cognizione come mezzo per risolvere il problema
fondamentalmente i problemi computazionali posti dal nostro ambiente possono assolutamente
cambiare il modo in cui pensiamo alla razionalità umana.
L'idea che studiare il funzionamento interno dei computer potrebbe rivelare come
pensare e decidere, cosa credere e come comportarsi, potrebbe colpire molti

Pagina 12

le persone non sono solo estremamente riduttive, ma anche fuorvianti. Anche se computer
la scienza aveva cose da dire su come pensare e come agire, vorremmo
ascoltare? Guardiamo le intelligenze artificiali e i robot della fantascienza, e sembra
la loro non è una vita che nessuno di noi vorrebbe vivere.
In parte è perché quando pensiamo ai computer, pensiamo con freddezza
sistemi meccanici, deterministici: macchine che applicano una logica deduttiva rigida,
prendere decisioni enumerando esaurientemente le opzioni e macinando il file
risposta esatta esatta, non importa quanto tempo e difficile devono pensare. In effetti, il
La persona che per prima ha immaginato i computer aveva in mente qualcosa di essenzialmente simile.
Alan Turing ha definito la nozione stessa di calcolo tramite un'analogia con un essere umano
matematico che lavora attentamente attraverso le fasi di un lungo calcolo,
dando una risposta inconfondibilmente giusta.
Quindi potrebbe sorprendere che questo non sia ciò che sono i computer moderni
effettivamente facendo quando devono affrontare un problema difficile. Aritmetica semplice, di
ovviamente, non è particolarmente impegnativo per un computer moderno. Piuttosto, sono compiti
come conversare con persone, riparare un file danneggiato o vincere una partita a Go—
problemi in cui le regole non sono chiare, alcune delle informazioni richieste lo sono
mancante o trovare esattamente la risposta giusta richiederebbe la considerazione di un file
numero astronomico di possibilità, che ora pongono le maggiori sfide in
Informatica. E gli algoritmi che i ricercatori hanno sviluppato per risolvere
le classi di problemi più difficili hanno allontanato i computer da un estremo
affidarsi a calcoli esaustivi. Invece, affrontare le attività del mondo reale richiede
sentirsi a proprio agio con il caso, scambiare il tempo con precisione e usare
approssimazioni.
Man mano che i computer si adattano meglio ai problemi del mondo reale, non lo forniscono
solo algoritmi che le persone possono prendere in prestito per la propria vita, ma uno standard migliore
con cui confrontare la stessa cognizione umana. Negli ultimi dieci o dieci anni,
l'economia comportamentale ha raccontato una storia molto particolare sugli esseri umani: quella
siamo irrazionali e inclini all'errore, in gran parte a causa del buggy, idiosincratico
hardware del cervello. Questa storia autoironica è diventata sempre più
familiare, ma alcune domande rimangono fastidiose. Perché i bambini di quattro anni, per
Ad esempio, ancora meglio di supercomputer da un milione di dollari in una serie di cognitive
compiti, inclusi visione, linguaggio e ragionamento causale?
Le soluzioni ai problemi quotidiani che provengono dall'informatica raccontano a

Pagina 13

storia diversa sulla mente umana. La vita è piena di problemi che sono, abbastanza
semplicemente, difficile . E gli errori commessi dalle persone spesso dicono di più su
difficoltà intrinseche del problema rispetto alla fallibilità del cervello umano.
Pensare in modo algoritmico al mondo, apprendere i fondamentali
strutture dei problemi che affrontiamo e sulle proprietà delle loro soluzioni,
può aiutarci a vedere quanto siamo bravi effettivamente e a capire meglio gli errori che
facciamo.
In effetti, gli esseri umani finiscono per confrontarsi costantemente con alcuni dei più difficili
casi dei problemi studiati dagli informatici. Spesso le persone hanno bisogno di fare
decisioni mentre si tratta di incertezza, vincoli di tempo, informazioni parziali,
e un mondo in rapida evoluzione. In alcuni di quei casi, anche all'avanguardia
l'informatica non ha ancora messo a punto algoritmi efficienti e sempre corretti.
Per alcune situazioni sembra che tali algoritmi potrebbero non esistere affatto.
Anche dove non sono stati trovati algoritmi perfetti, tuttavia, la battaglia
tra generazioni di informatici e il mondo reale più intrattabile
problemi ha prodotto una serie di intuizioni. Questi precetti conquistati a fatica sono in disaccordo
con le nostre intuizioni sulla razionalità, e non suonano per niente come il
prescrizioni ristrette di un matematico che cerca di costringere il mondo a essere pulito,
linee formali. Dicono: non considerare sempre tutte le tue opzioni. Non farlo
andare necessariamente per il risultato che sembra migliore ogni volta. Fai un pasticcio
occasione. Luce da viaggio. Lascia che le cose aspettino. Fidati del tuo istinto e non pensare anche tu
lungo. Rilassare. Lancia una moneta. Perdona, ma non dimenticare. Sii te stesso.
Vivere secondo la saggezza dell'informatica non suona poi così male, dopotutto.
E a differenza della maggior parte dei consigli, è supportato da prove.

Proprio come la progettazione di algoritmi per computer era originariamente un argomento in cui cadde
le crepe tra le discipline: uno strano ibrido di matematica e ingegneria
- così anche la progettazione di algoritmi per gli esseri umani è un argomento che non ha una naturalezza
casa disciplinare. Oggi, la progettazione di algoritmi si basa non solo sull'informatica,
matematica e ingegneria, ma su campi affini come statistiche e operazioni
ricerca. E mentre consideriamo come potrebbero relazionarsi gli algoritmi progettati per le macchine
per le menti umane, dobbiamo anche guardare alla scienza cognitiva, alla psicologia,
economia e oltre.
Pagina 14

Noi, i vostri autori, conosciamo questo territorio interdisciplinare. Brian


ha studiato informatica e filosofia prima di laurearsi in
Inglese e una carriera all'incrocio dei tre. Tom ha studiato psicologia e
statistiche prima di diventare professore all'Università di Berkeley, dove trascorre la maggior parte
il suo tempo a pensare alla relazione tra cognizione umana e
calcolo. Ma nessuno può essere un esperto in tutti i campi che sono rilevanti
progettare algoritmi migliori per gli esseri umani. Quindi, come parte della nostra ricerca di algoritmi per
live by, abbiamo parlato con le persone che hanno inventato alcuni dei più famosi
algoritmi degli ultimi cinquant'anni. E abbiamo chiesto loro, alcuni dei più intelligenti
persone nel mondo, come la loro ricerca ha influenzato il modo in cui si sono avvicinate al loro
proprie vite, dal trovare i loro coniugi allo smistare i loro calzini.
Le pagine successive iniziano il nostro viaggio attraverso alcune delle più grandi sfide
affrontato da computer e menti umane allo stesso modo: come gestire lo spazio finito, finito
tempo, attenzione limitata, incognite sconosciute, informazioni incomplete e un file
futuro imprevedibile; come farlo con grazia e fiducia; e come farlo
in una comunità con altri che stanno tutti contemporaneamente cercando di fare lo stesso.
Impareremo la struttura matematica fondamentale di queste sfide
e su come i computer sono progettati, a volte in contrasto con ciò che noi
immagina, per trarne il massimo. E impareremo come funziona la mente
opere, sui suoi modi distinti ma profondamente correlati di affrontare lo stesso insieme di
problemi e far fronte agli stessi vincoli. In definitiva, ciò che possiamo ottenere non lo è
solo una serie di spunti concreti per i problemi che ci circondano, non solo un modo nuovo
per vedere le strutture eleganti dietro anche i dilemmi umani più pelosi, non solo a
riconoscimento dei travagli di esseri umani e computer come profondamente congiunti, ma
qualcosa di ancora più profondo: un nuovo vocabolario per il mondo che ci circonda e a
possibilità di imparare qualcosa di veramente nuovo su noi stessi.

Pagina 15

1 Arresto ottimale
Quando smettere di guardare
Anche se tutti i cristiani iniziano un invito a nozze dichiarando solennemente
il loro matrimonio è dovuto a una speciale disposizione divina, io, come filosofo,
vorrei parlare più dettagliatamente di questo ...

—JOHANNES KEPLER
Se preferisci il signor Martin a ogni altra persona; se lo pensi di più
uomo simpatico con cui sei mai stato in compagnia, perché dovresti
esitare?
—JANE AUSTEN, EMMA

È un fenomeno così comune che i consulenti di orientamento universitario hanno persino un file
termine gergale per esso: "goccia di tacchino". Gli innamorati del liceo tornano a casa
Ringraziamento del loro primo anno di college e, quattro giorni dopo, ritorno a
campus singolo.
Un Brian angosciato andò dal suo consulente universitario, il suo
anno da matricola. La sua ragazza del liceo era stata diverse volte in un college diverso
stati di distanza, e hanno lottato con la distanza. Hanno anche lottato con a
domanda più strana e più filosofica: quanto era buono un rapporto
avere? Non avevano un vero punto di riferimento di altre relazioni con cui giudicarlo.
Il consulente di Brian ha riconosciuto il loro come un classico dilemma da matricola, e lo era
sorprendentemente disinvolto nel suo consiglio: "Raccogli dati".
La natura della monogamia seriale, scritta in grande, è che i suoi praticanti lo sono

Pagina 16

di fronte a un problema fondamentale e inevitabile. Quando ti sei incontrato


abbastanza persone per sapere qual è il tuo miglior partner? E se si acquisissero i dati
ti costa proprio quella partita? Sembra l'ultimo Catch-22 del cuore.
Come abbiamo visto, questo Catch-22, questa angosciosa matricola cri de coeur, è ciò che
i matematici chiamano un problema di "arresto ottimale" e potrebbe effettivamente avere un
risposta: 37%.
Naturalmente, tutto dipende dalle ipotesi che sei disposto a fare
amore.

Il problema del segretario


In qualsiasi problema di arresto ottimale, il dilemma cruciale non è quale opzione scegliere
scegliere , ma quante opzioni anche considerare . Questi problemi risultano avere
implicazioni non solo per gli amanti e gli affittuari, ma anche per i conducenti, i proprietari di case,
ladri e oltre.
La regola del 37% * deriva dal puzzle più famoso dell'arresto ottimale, che
è diventato noto come il "problema della segreteria". La sua configurazione è molto simile a
dilemma del cacciatore di appartamenti che abbiamo considerato in precedenza. Immagina di essere
intervistare una serie di candidati per una posizione come segretaria e il tuo obiettivo è farlo
massimizzare le possibilità di assumere il miglior candidato singolo nel pool. Mentre tu
non hai idea di come assegnare i punteggi ai singoli candidati, puoi facilmente giudicare
quale preferisci. (Un matematico potrebbe dire che hai accesso solo al file
numeri ordinali - i ranghi relativi dei richiedenti l'uno rispetto all'altro -
ma non per i numeri cardinali , le loro valutazioni su una sorta di scala generale.)
Intervistate i candidati in ordine casuale, uno alla volta. Puoi decidere di farlo
offrire il lavoro a un candidato in qualsiasi momento e gli è garantito che accetterà,
terminare la ricerca. Ma se passi oltre un candidato, decidendo di non assumere
loro, se ne sono andati per sempre.
Si ritiene che il problema della segretaria abbia fatto la sua prima apparizione
in stampa - senza menzionare esplicitamente i segretari - nel numero di febbraio 1960 del
Scientific American , come uno dei tanti enigmi posti in Martin Gardner
amata colonna sulla matematica ricreativa. Ma le origini del problema sono
sorprendentemente misterioso. La nostra ricerca iniziale ha prodotto poco ma speculazioni,

Pagina 17

prima di trasformarsi in un lavoro di investigazione inaspettatamente fisico: un viaggio fino al


archivio delle carte di Gardner a Stanford, per tirare fuori scatole della sua metà del secolo
corrispondenza. Leggere la corrispondenza cartacea è un po 'come origliare
qualcuno che è al telefono: stai ascoltando solo un lato dello scambio, e
deve dedurre l'altro. Nel nostro caso, abbiamo avuto solo le risposte a quanto apparentemente
La ricerca di Gardner sulle origini del problema ha origine cinquant'anni fa. Più
leggiamo, più la storia diventava intricata e poco chiara.
Il matematico di Harvard Frederick Mosteller ha ricordato di aver sentito parlare del
problema nel 1955 dal suo collega Andrew Gleason, che ne aveva sentito parlare
da qualcun altro. Leo Moser ha scritto dall'università di Alberta per dirlo
ha letto del problema in "alcune note" di RE Gaskell della Boeing, che
egli stesso ha accreditato un collega. Roger Pinkham di Rutgers ha scritto di aver sentito per la prima volta
del problema nel 1955 dal matematico della Duke University J. Shoenfield, “e
Credo che abbia detto di aver sentito il problema da qualcuno del Michigan ".
"Qualcuno al Michigan" era quasi certamente qualcuno di nome Merrill Flood.
Anche se è in gran parte sconosciuto al di fuori della matematica, l'influenza di Flood su
l'informatica è quasi impossibile da evitare. È accreditato di aver reso popolare
il problema del venditore ambulante (di cui parleremo più in dettaglio nel capitolo 8),
ideare il dilemma del prigioniero (di cui parleremo nel capitolo 11), e anche con
possibilmente coniando il termine "software". È Flood che ha fatto conoscere il primo
scoperta della regola del 37%, nel 1958, e afferma di aver preso in considerazione la
problema dal 1949, ma lui stesso ne indica molti altri
matematici.
Basti pensare che da qualunque parte provenisse, il problema della segretaria si è rivelato
essere un puzzle matematico quasi perfetto: semplice da spiegare, diabolico da risolvere,
succinto nella sua risposta e intrigante nelle sue implicazioni. Di conseguenza, si è spostato
come un incendio attraverso i circoli matematici degli anni '50, diffondendosi a parole
bocca, e grazie alla colonna di Gardner nel 1960 è venuto ad afferrare l'immaginazione di
il pubblico in generale. Negli anni '80 il problema e le sue variazioni lo avevano prodotto
molte analisi che erano state discusse nei giornali come un sottocampo a sé stante.
Per quanto riguarda le segretarie, è affascinante vedere ogni cultura mettere la propria
spin antropologico sui sistemi formali. Pensiamo agli scacchi, ad esempio, come
medievale europea nel suo immaginario, ma in realtà le sue origini sono nell'VIII secolo
India; fu pesantemente "europeizzato" nel XV secolo, come il suo

Pagina 18

gli shah divennero re, i suoi visir si trasformarono in regine e i suoi elefanti divennero
vescovi. Allo stesso modo, i problemi di arresto ottimale hanno avuto una serie di
incarnazioni, ciascuna riflettendo le preoccupazioni predominanti del suo tempo. Nel
Tali problemi del diciannovesimo secolo furono caratterizzati da lotterie barocche e da
donne che scelgono corteggiatori maschi; all'inizio del XX secolo in vacanza
automobilisti in cerca di hotel e da corteggiatori uomini che scelgono donne; e nel
spacciatore di carta, dominato dagli uomini della metà del ventesimo secolo, scelto dai capi maschi
assistenti femminili. La prima esplicita menzione per nome di “segretario
problema "sembra essere in un giornale del 1964, e da qualche parte lungo la strada il nome
incollato.

Da dove viene il 37%?


Nella tua ricerca di una segretaria, ci sono due modi in cui puoi fallire: fermarti presto
e fermarsi tardi. Quando ti fermi troppo presto, lasci il miglior candidato
da scoprire. Quando ti fermi troppo tardi, tieni duro per un candidato migliore che
non esiste. La strategia ottimale richiederà chiaramente la ricerca del giusto equilibrio
tra i due, camminando sul filo del rasoio tra guardare troppo e non
abbastanza.
Se il tuo obiettivo è trovare il candidato migliore, accontentandoti di niente di meno, lo è
chiaro che durante il processo di intervista non dovresti nemmeno prendere in considerazione
assumere qualcuno che non è il migliore che hai visto finora. Tuttavia, semplicemente essere
il meglio non è ancora abbastanza per un'offerta; il primo candidato, ad esempio, lo farà
ovviamente essere il migliore per definizione. Più in generale, è ovvio che
la velocità con cui incontriamo i candidati "migliori ancora" diminuirà man mano che procediamo
nelle nostre interviste. Ad esempio, il secondo richiedente ha una probabilità del 50/50 di esserlo
il migliore che abbiamo mai visto, ma il quinto candidato ha solo 1 possibilità su 5 di esserlo
il migliore finora, il sesto ha 1 possibilità su 6 e così via. Di conseguenza, ancora meglio
i candidati diventeranno sempre più impressionanti man mano che la ricerca continua (da
definizione, ancora una volta, sono migliori di tutti quelli che sono venuti prima), ma lo faranno
diventano anche sempre più rari.
Ok, quindi sappiamo che prendendo il primo candidato migliore che incontriamo (aka
il primo richiedente, punto) è avventato. Se ci sono cento candidati, sembra anche

Pagina 19

si affretta a fare un'offerta alla prossima che è la migliore ... ancora, solo perché era migliore
rispetto al primo. Allora come procediamo?
Intuitivamente, ci sono alcune potenziali strategie. Ad esempio, fare un'offerta
la terza volta che un candidato vince su tutti quelli visti finora, o forse la quarta
tempo. O forse prendere il prossimo migliore, ancora candidato, a venire dopo molto tempo
"Siccità": una lunga serie di poveri.
Ma come accade, nessuna di queste strategie relativamente sensate viene fuori
superiore. Invece, la soluzione ottimale assume la forma di ciò che chiameremo Look-
Regola del salto : hai impostato una quantità di tempo predeterminata per "guardare", questo
è esplorare le tue opzioni, raccogliere dati, cosa che categoricamente non fai
scegli chiunque, non importa quanto sia impressionante. Dopo quel punto, inserisci il "salto"
fase, pronto a impegnarsi immediatamente con chiunque offenda il miglior candidato
hai visto in fase di look.
Possiamo vedere come emerge la regola Look-Then-Leap considerando come il
Il problema della segretaria si manifesta nei pool di candidati più piccoli. Con uno solo
candidato il problema è facile da risolvere: assumila! Con due candidati, hai
una possibilità di successo del 50/50, qualunque cosa tu faccia. Puoi assumere il primo richiedente
(che risulterà essere la migliore metà delle volte), o respingerà il primo e per impostazione predefinita
assumere il secondo (che è anche il migliore per la metà del tempo).
Aggiungi un terzo candidato e all'improvviso le cose si fanno interessanti. Le probabilità se
che assumiamo a caso sono un terzo, o il 33%. Con due candidati potremmo fare no
meglio del caso; con tre, possiamo? Si scopre che possiamo, e tutto arriva
fino a quello che facciamo con il secondo intervistato. Quando vediamo il primo
richiedente, non abbiamo informazioni: sembrerà sempre la migliore.
Quando vediamo il terzo richiedente, non abbiamo alcuna agenzia: dobbiamo fare un'offerta
al candidato finale, poiché abbiamo licenziato gli altri. Ma quando vediamo il file
secondo candidato, abbiamo un po 'di entrambi: sappiamo se sta meglio o
peggio del primo, e abbiamo la libertà di assumerla o licenziarla. Che cosa
succede quando la assumiamo solo se è migliore del primo candidato e la licenziamo
lei se non lo è? Questa risulta essere la migliore strategia possibile quando si affrontano tre
candidati; utilizzando questo approccio è possibile, sorprendentemente, fare altrettanto bene in
problema di tre candidati come con due, scegliendo il miglior candidato esattamente la metà
tempo. *
Enumerare questi scenari per quattro candidati ci dice che dovremmo ancora

Pagina 20

iniziare a saltare non appena il secondo richiedente; con cinque candidati in piscina, noi
non dovrebbe saltare prima del terzo.
Man mano che il pool di candidati cresce, il punto esatto in cui tracciare il confine tra guardare
e saltando si assesta al 37% del pool, ottenendo la regola del 37%: guarda il primo
Il 37% dei candidati, * scegliendone nessuno, sii pronto a saltare per qualcuno migliore
di tutti quelli che hai visto finora.

Come scegliere in modo ottimale una segretaria.

A quanto pare, seguire questa strategia ottimale ci dà alla fine un 37%


possibilità di assumere il miglior candidato; è uno dei problemi curiosi
simmetrie matematiche che la strategia stessa e le sue possibilità di successo funzionano
allo stesso numero. La tabella sopra mostra la strategia ottimale per
problema di segreteria con un numero diverso di candidati, dimostrando come il
la possibilità di successo, come il punto per passare dal guardare al balzo, converge
sul 37% all'aumentare del numero di richiedenti.
Pagina 21

Un tasso di fallimento del 63%, quando si segue la migliore strategia possibile , fa riflettere
fatto. Anche quando agiamo in modo ottimale nel problema del segretario, falliremo ancora di più
delle volte, cioè, non ci ritroveremo con il miglior candidato singolo nel pool.
Questa è una brutta notizia per quelli di noi che vorrebbero inquadrare il romanticismo come una ricerca di "il
uno." Ma ecco il rivestimento d'argento. L'intuizione suggerirebbe che le nostre possibilità di
scegliere il miglior candidato singolo dovrebbe diminuire costantemente con il pool di candidati
cresce. Se assumessimo a caso, per esempio, in un pool di cento
candidati avremmo una probabilità dell'1% di successo e in un pool di un milione
candidati avremmo una probabilità dello 0,0001%. Tuttavia, sorprendentemente, la matematica del
il problema della segretaria non cambia. Se ti fermi in modo ottimale, hai la possibilità di
trovare il miglior candidato singolo in un pool di cento è del 37%. E in una pozza di
un milione, che tu ci creda o no, la tua possibilità è ancora del 37%. Quindi più grande è il file
ottiene il pool di candidati, più diventa preziosa la conoscenza dell'algoritmo ottimale.
È vero che è improbabile che trovi l'ago la maggior parte delle volte, ma
l'arresto ottimale è la tua migliore difesa contro il pagliaio, non importa quanto sia grande.

Lover's Leap
La passione tra i sessi è apparsa in ogni epoca così vicina
lo stesso che si può sempre considerare, in linguaggio algebrico, come a
data quantità.

—THOMAS MALTHUS
Ho sposato il primo uomo che abbia mai baciato. Quando lo dico ai miei figli loro
quasi vomitare.

—BARBARA BUSH
Prima di diventare professore di ricerca operativa alla Carnegie Mellon,
Michael Trick era uno studente laureato, in cerca di amore. “Mi ha colpito che il
problema è stato studiato: è il problema segretario! Avevo una posizione da ricoprire
[e] una serie di candidati e il mio obiettivo era quello di scegliere il miglior candidato per il

Pagina 22

posizione." Quindi ha controllato i numeri. Non sapeva quante donne poteva


aspettarsi di incontrarsi durante la sua vita, ma c'è una certa flessibilità nella Regola del 37%: it
può essere applicato al numero di candidati o al tempo in cui uno è
ricerca. Supponendo che la sua ricerca durasse dai diciotto ai quaranta anni, il
La regola del 37% indicava l'età di 26,1 anni come punto in cui passare dal guardare a
saltando. Un numero che, come accadde, all'epoca corrispondeva esattamente all'età di Trick. Così
quando aveva trovato una donna migliore di tutte quelle con cui era uscito così
fino a quel momento sapeva esattamente cosa fare. Ha saltato. "Non sapevo se fosse perfetta (il
le ipotesi del modello non mi consentono di determinarlo), ma non c'era
dubbio che abbia soddisfatto i requisiti per questo passaggio dell'algoritmo. Così io
proposto ", scrive.
"E lei mi ha rifiutato."
I matematici hanno avuto problemi con l'amore almeno dal
diciassettesimo secolo. Il leggendario astronomo Johannes Kepler è oggi
forse meglio ricordato per aver scoperto che le orbite planetarie sono ellittiche e
per essere una parte cruciale della "Rivoluzione Copernicana" che includeva Galileo e
Newton e sconvolto il senso dell'umanità del suo posto nei cieli. Ma Keplero
aveva anche preoccupazioni terrestri. Dopo la morte della sua prima moglie nel 1611, Keplero
ha intrapreso una ricerca lunga e ardua per risposarsi, corteggiando infine un totale di
undici donne. Dei primi quattro, a Keplero è piaciuto di più il quarto (“grazie a lei
corporatura alta e fisico atletico ”) ma non cessò la sua ricerca. "Sarebbe stato
stabilì ", scrisse Keplero," che l'amore e la ragione non avessero costretto una quinta donna
me. Questo mi ha conquistato con amore, umile lealtà, economia domestica,
la diligenza e l'amore che ha dato ai figliastri. "
"Tuttavia", ha scritto, "ho continuato".
Gli amici e i parenti di Keplero continuarono a fare presentazioni per lui, e lui
continuò a cercare, ma a malincuore. I suoi pensieri rimasero al numero cinque.
Dopo undici corteggiamenti in totale, decise che non avrebbe cercato oltre. "Mentre
preparandomi a recarmi a Ratisbona, tornai dalla quinta donna, dichiarò
me stesso, ed è stato accettato. " Kepler e Susanna Reuttinger si erano sposati e avevano avuto
sei figli insieme, insieme ai figli del primo matrimonio di Keplero.
Le biografie descrivono il resto della vita domestica di Keplero come particolarmente pacifica
e tempo gioioso.
Sia Kepler che Trick, in modi opposti, ne hanno sperimentato in prima persona alcuni

Pagina 23

i modi in cui il problema della segretaria semplifica eccessivamente la ricerca dell'amore. Nel
classico problema segretario, i candidati accettano sempre la posizione, impedendo il
rifiuto sperimentato da Trick. E non possono essere "richiamati" una volta superati,
contrariamente alla strategia seguita da Keplero.
Nei decenni trascorsi dalla prima introduzione del problema segretario, una vasta gamma
di varianti dello scenario sono state studiate, con strategie ottimali
l'arresto ha funzionato in una serie di condizioni diverse. La possibilità di
il rifiuto, per esempio, ha una semplice soluzione matematica: proporre
presto e spesso. Se hai, diciamo, una probabilità del 50/50 di essere rifiutato, allora lo stesso
tipo di analisi matematica che ha prodotto la regola del 37% dice che dovresti iniziare
fare offerte dopo solo un quarto della tua ricerca. Se rifiutato, continua a fare
offre a ogni persona migliore che vedi fino a quando qualcuno non accetta. Con un tale file
strategia, la tua possibilità di successo generale, cioè proporre ed essere accettato
dal miglior candidato nel pool, sarà anche il 25%. Probabilità non così terribili,
forse, per uno scenario che coniuga l'ostacolo del rigetto con il generale
difficoltà di stabilire i propri standard in primo luogo.
Keplero, da parte sua, denunciava "l'irrequietezza e il dubbio" che lo spingevano
lui per continuare a cercare. «Non c'era altro modo per il mio cuore inquieto
contento della sua sorte ", si lamentava in una lettera a un confidente," che rendendosi conto
l'impossibilità di soddisfare tanti altri desideri? " Ancora qui,
La teoria dell'arresto ottimale fornisce una certa consolazione. Piuttosto che
essere segni di degenerazione morale o psicologica, irrequietezza e dubbiosità
in realtà risultano essere parte della migliore strategia per scenari in cui secondo
possibilità sono possibili. Se riesci a richiamare i candidati precedenti, l'algoritmo ottimale
dà una svolta alla familiare regola Guarda-poi-Salta: un non impegno più lungo
periodo e un piano di riserva.
Ad esempio, supponi che una proposta immediata sia una cosa sicura ma tardiva
le proposte vengono rifiutate la metà delle volte. Poi la matematica dice che dovresti continuare a cercare
senza impegno finché non hai visto il 61% dei candidati, e poi salta solo se
qualcuno nel restante 39% del pool si dimostra ancora il migliore. Se tu sei
ancora single dopo aver considerato tutte le possibilità - come lo era Keplero - poi torna indietro
al migliore che è scappato. La simmetria tra strategia e risultato
in questo caso vale ancora una volta, con le tue possibilità di finire con il migliore
candidato in questo scenario di seconde possibilità consentite è anche il 61%.

Pagina 24

Per Keplero, la differenza tra la realtà e il classico problema del segretario


portato con sé un lieto fine. In effetti, la svolta sul problema classico ha funzionato
bene anche per Trick. Dopo il rifiuto, ha completato la sua laurea e ha preso un
lavoro in Germania. Lì, “entrò in un bar, si innamorò di una bella
donna, si trasferirono insieme tre settimane dopo, [e] la invitarono a vivere in
Stati Uniti "per un po '". Lei acconsentì e sei anni dopo si sposarono.

Conoscere una buona cosa quando la vedi: completa


Informazione
La prima serie di varianti che abbiamo considerato, rifiuto e richiamo, ha modificato il
i classici presupposti del problema del segretario che le proposte tempestive sono sempre
proposte accettate e tardive, mai. Per queste varianti, l'approccio migliore
è rimasto lo stesso dell'originale: guarda per un po 'senza impegno, poi sii
pronto a saltare.
Ma c'è un presupposto ancora più fondamentale del problema del segretario
che potremmo mettere in discussione. Vale a dire, nel problema della segretaria che conosciamo
niente sui candidati tranne come si confrontano tra loro. Noi
non hai un'idea oggettiva o preesistente di ciò che fa bene o male
richiedente; inoltre, confrontandone due, sappiamo quale dei due
è meglio, ma non di quanto. È questo fatto che dà origine all'inevitabile
Fase di "sguardo", in cui rischiamo di far passare un eccellente candidato in anticipo mentre noi
calibrare le nostre aspettative e standard. I matematici si riferiscono a questo genere di
problemi di arresto ottimale come "giochi senza informazione".
Questa configurazione è probabilmente molto lontana dalla maggior parte delle ricerche di un appartamento, a
partner, o anche una segretaria. Immagina invece di avere una sorta di obiettivo
criterio - se ogni segretaria, ad esempio, avesse sostenuto un esame di dattilografia con punteggio
percentile, alla maniera del SAT o GRE o LSAT. Cioè, di ogni candidato
punteggio ci dirà dove cadono tra tutte le dattilografe che hanno sostenuto il test: un 51 °
un dattilografo percentile è appena sopra la media, un dattilografo del 75 ° percentile è meglio di tre
partecipanti al test su quattro e così via.
Supponiamo che il nostro pool di candidati sia rappresentativo della popolazione in generale
e non è distorto o auto-selezionato in alcun modo. Inoltre, supponiamo di decidere

Pagina 25
che la velocità di battitura è l'unica cosa che conta per i nostri candidati. Allora noi
avere ciò che i matematici chiamano "informazione completa" e tutto cambia. "No
è necessario accumulare esperienza per stabilire uno standard ”, come si legge nel documento fondamentale del 1966
dice il problema, “ea volte si può fare una scelta redditizia
subito." In altre parole, se un candidato al 95 ° percentile è il
il primo che valutiamo, lo sappiamo immediatamente e possiamo assumerla con sicurezza sul
spot - questo è, ovviamente, supponendo che non pensiamo che ci sia un 96 ° percentile
richiedente in piscina.
E c'è il problema. Se il nostro obiettivo è, ancora una volta, ottenere la singola persona migliore per il
lavoro, dobbiamo ancora valutare la probabilità che ci sia un candidato più forte
Là. Tuttavia, il fatto di avere informazioni complete ci dà tutto ciò che abbiamo
è necessario calcolare direttamente tali quote. La possibilità che il nostro prossimo candidato sia nel
Ad esempio, il 96 ° percentile o superiore sarà sempre 1 su 20. Così la decisione
se fermarsi dipende interamente dal numero di candidati che ci rimangono
vedere. L'informazione completa significa che non abbiamo bisogno di guardare prima di saltare. Noi possiamo
usa invece la regola della soglia , in cui accettiamo immediatamente un richiedente se
lei è al di sopra di un certo percentile. Non abbiamo bisogno di guardare un gruppo iniziale di
candidati a fissare questa soglia, ma dobbiamo comunque esserne pienamente consapevoli
quanto aspetto resta disponibile.
La matematica mostra che quando ci sono molti candidati rimasti in piscina, tu
dovrebbe rinunciare anche a un ottimo candidato nella speranza di trovare qualcuno ancora
meglio di così, ma man mano che le opzioni diminuiscono, dovresti essere pronto ad assumere
chiunque sia semplicemente migliore della media. È un familiare, se non proprio stimolante,
messaggio: a fronte di guadagni esigui, abbassate i vostri standard. Inoltre rende chiaro
viceversa: con più pesci nel mare, allevali. In entrambi i casi, soprattutto, il
la matematica ti dice esattamente di quanto.
Il modo più semplice per comprendere i numeri di questo scenario è iniziare da
finire e pensare a ritroso. Se sei all'ultimo candidato, ovviamente, lo sei
necessariamente costretto a sceglierla. Ma quando si guarda al penultimo candidato,
la domanda diventa: è al di sopra del 50 ° percentile? Se sì, allora assumila; Se
no, vale la pena tirare i dadi sull'ultima candidata, dato che le sue probabilità di
essendo al di sopra del 50 ° percentile sono 50/50 per definizione. Allo stesso modo, dovresti
scegliere il terzultimo candidato se è al di sopra del 69 ° percentile, il quarto al
ultima candidata se è sopra il 78 ° e così via, essendo più esigente più

Pagina 26

i candidati vengono lasciati. Non importa cosa, non assumere mai qualcuno che è al di sotto della media
a meno che tu non abbia completamente esaurito le opzioni. (E poiché sei ancora interessato solo a
trovare la persona migliore nel pool di candidati, non assumere mai qualcuno che non lo sia
il meglio che hai visto finora.)
La possibilità di finire con il singolo miglior candidato in questo pieno-
la versione informativa del problema della segretaria arriva al 58%, ancora lontana dall'essere a
garanzia, ma notevolmente migliore del tasso di successo del 37% offerto dal 37%
Regola nel gioco della non informazione. Se hai tutti i fatti, puoi avere più successo
spesso, anche se il pool di candidati cresce arbitrariamente.
Soglie di arresto ottimali nel problema della segreteria a piena informazione.

Il gioco full information offre quindi un inaspettato e un po 'bizzarro


porta via. È più probabile che la ricerca dell'oro abbia successo rispetto alla ricerca dell'amore. Se tu sei
valutare i tuoi partner in base a qualsiasi tipo di criterio oggettivo, ad esempio il loro
percentile di reddito: allora hai molte più informazioni a tua disposizione di
se stai cercando una nebulosa risposta emotiva ("amore") che potrebbe richiedere entrambe le cose
esperienza e confronto da calibrare.
Ovviamente, non c'è motivo per quel valore netto o, se è per questo, la velocità di battitura

Pagina 27

- deve essere la cosa che stai misurando. Qualsiasi metro che fornisce pieno
informazioni su dove si trova un richiedente rispetto alla popolazione in generale
modificare la soluzione dalla regola Look-Then-Leap alla regola di soglia e
aumenterà notevolmente le tue possibilità di trovare il miglior candidato singolo nel
gruppo.
Ci sono molte altre varianti del problema della segretaria che ne modificano l'altro
ipotesi, forse portandolo maggiormente in linea con le sfide del mondo reale di
trovare l'amore (o una segretaria). Ma le lezioni da trarre dall'arresto ottimale
non si limitano agli appuntamenti o alle assunzioni. In effetti, cercando di fare la scelta migliore quando
le opzioni si presentano solo una per una è anche la struttura di base della vendita a
casa, parcheggiare una macchina e smettere quando sei davanti. E sono tutti, per alcuni
laurea o altro, problemi risolti.

Quando vendere
Se alteriamo altri due aspetti del classico problema della segretaria, troviamo noi stessi
catapultato dal regno della datazione al regno degli immobili. Prima abbiamo parlato
sul processo di affitto di un appartamento come problema di arresto ottimale, ma
Anche possedere una casa non manca di fermarsi in modo ottimale.
Immagina di vendere una casa, per esempio. Dopo aver consultato diversi immobili
agenti, metti il ​tuo posto sul mercato; una nuova mano di vernice, alcuni paesaggi,
e poi è solo questione di aspettare che arrivino le offerte. Come ogni offerta
arriva, in genere devi decidere se accettarlo o rifiutarlo. Ma
rifiutare un'offerta ha un costo: un'altra settimana (o mese) di mutuo
pagamenti in attesa della prossima offerta, che non è garantita essere alcuna
meglio.
Vendere una casa è simile al gioco di informazioni complete. Conosciamo il
valore oggettivo in dollari delle offerte, indicandoci non solo quali sono migliori di
quale, ma anche di quanto. Inoltre, abbiamo informazioni sul
stato più ampio del mercato, che ci consente di prevedere almeno approssimativamente l'intervallo
di offerte da aspettarsi. (Questo ci fornisce le stesse informazioni "percentili" su ciascuno
offerta che abbiamo avuto con l'esame di digitazione sopra). La differenza qui, tuttavia, è
che il nostro obiettivo non è in realtà quello di garantire la migliore offerta singola, ma di ottenere il massimo

Pagina 28

denaro attraverso il processo in generale. Dato che l'attesa ha un costo misurato


dollari, una buona offerta oggi batte una leggermente migliore tra diversi mesi.
Avendo queste informazioni, non è necessario cercare senza impegno per impostare un file
soglia. Invece, possiamo impostarne uno in entrata, ignorare tutto ciò che c'è sotto e prendere
la prima opzione per superarlo. Certo, se abbiamo una quantità limitata di risparmi che
si esaurirà se non vendiamo entro un certo periodo di tempo o se ci aspettiamo di ottenere solo un
numero limitato di offerte e nessun interesse successivo, quindi dovremmo abbassare
i nostri standard come tali limiti si avvicinano. (C'è un motivo per cui gli acquirenti di case guardano
per venditori "motivati".) Ma se nessuna delle due preoccupazioni ci porta a credere che le nostre spalle
sono contro il muro, quindi possiamo semplicemente concentrarci su un'analisi costi-benefici del
gioco d'attesa.
Qui analizzeremo uno dei casi più semplici: dove conosciamo per certo il file
fascia di prezzo in cui arriveranno le offerte e dove si trovano tutte le offerte all'interno di quella fascia
ugualmente probabile. Se non dobbiamo preoccuparci delle offerte (o dei nostri risparmi)
esaurendo, quindi possiamo pensare puramente in termini di ciò che possiamo aspettarci di ottenere o
perdere aspettando un accordo migliore. Se rifiutiamo l'offerta attuale, ci sarà la possibilità
di uno migliore, moltiplicato per quanto molto meglio ci aspettiamo che sia, più di
compensare il costo dell'attesa? A quanto pare, la matematica qui è abbastanza pulita,
dandoci una funzione esplicita per fermare il prezzo in funzione del costo di
in attesa di un'offerta.
A questo particolare risultato matematico non importa se stai vendendo un file
palazzo del valore di milioni o un capannone sgangherato. L'unica cosa a cui tiene è
la differenza tra le offerte più alte e quelle più basse che probabilmente riceverai. Di
inserendo alcune cifre concrete, possiamo vedere come questo algoritmo ci offre un file
notevole quantità di indicazioni esplicite. Ad esempio, diciamo l'intervallo di
le offerte che ci aspettiamo vanno da $ 400.000 a $ 500.000. Innanzitutto, se il costo di
l'attesa è banale, siamo in grado di essere quasi infinitamente esigenti. Se il costo per ottenere
un'altra offerta è solo un dollaro, massimizzeremo i nostri guadagni aspettando
qualcuno disposto a offrirci $ 499.552,79 e non un centesimo in meno. Se l'attesa costa
$ 2.000 per un'offerta, dovremmo resistere anche per $ 480.000. In un mercato lento
dove l'attesa costa $ 10.000 per un'offerta, dovremmo accettare qualsiasi cosa oltre $ 455.279.
Infine, se l'attesa costa la metà o più della nostra gamma di offerte prevista, in questo
caso, $ 50.000 - allora non c'è alcun vantaggio nel resistere; faremo
meglio prendere la prima offerta che arriva e chiamarla fatta. Mendicanti

Pagina 29

non possiamo essere selettori.


Soglie di arresto ottimali nel problema delle vendite di case.

La cosa fondamentale da notare in questo problema è che la nostra soglia dipende solo da
il costo della ricerca. Poiché le possibilità che la prossima offerta sia buona, e il
costo di scoprirlo - non cambiare mai, il nostro prezzo di arresto non ha motivo di ottenere mai
più in basso man mano che la ricerca va avanti, indipendentemente dalla nostra fortuna. Lo abbiamo impostato una volta, prima di noi
anche iniziare, e poi semplicemente teniamo duro.
Laura Albert McLay dell'Università del Wisconsin-Madison, an
esperto di ottimizzazione, ricorda di essersi rivolto alla sua conoscenza dell'arresto ottimale
problemi quando è arrivato il momento di vendere la propria casa. “La prima offerta che abbiamo ricevuto è stata
fantastico ", spiega," ma ha avuto un costo enorme perché volevano che ci trasferissimo
un mese prima che fossimo pronti. C'era un'altra offerta competitiva ... [ma]
abbiamo resistito finché non abbiamo ottenuto quello giusto. " Per molti venditori, girando
una buona offerta o due può essere una proposta snervante, soprattutto se il
quelli che seguono immediatamente non sono migliori. Ma McLay ha tenuto la sua posizione e
è rimasto calmo. “Sarebbe stato davvero, davvero difficile”, ammette, “se non l'avessi fatto
so che la matematica era dalla mia parte. "
Questo principio si applica a qualsiasi situazione in cui ricevi una serie di offerte e

Pagina 30

pagare un costo per cercare o aspettare il prossimo. Di conseguenza, è rilevante per i casi
che vanno ben oltre la vendita di una casa. Ad esempio, gli economisti hanno usato questo
algoritmo per modellare il modo in cui le persone cercano lavoro, dove spiega facilmente il
altrimenti fatto apparentemente paradossale di lavoratori disoccupati e non qualificati
posti vacanti esistenti contemporaneamente.
In effetti, queste variazioni sul problema di arresto ottimale ne hanno un altro, pari
proprietà più sorprendente. Come abbiamo visto, la capacità di “ricordare” un'opportunità passata
era vitale nella ricerca dell'amore di Keplero. Ma vendita interna e ricerca di lavoro, anche se
è possibile riconsiderare un'offerta precedente e anche se tale offerta è garantita
essere ancora sul tavolo, tuttavia non dovresti mai farlo. Se non fosse al di sopra del tuo
soglia allora, non sarà al di sopra della tua soglia ora. Quello che hai pagato per mantenere
la ricerca è un costo irrecuperabile. Non scendere a compromessi, non indovinare. E non guardare
indietro.

Quando parcheggiare
Trovo che i tre principali problemi amministrativi in ​un campus siano per il sesso
gli studenti, atletica per gli alumni e parcheggio per la facoltà.
—CLARK KERR, PRESIDENTE DELLA UC BERKELEY, 1958-1967

Un altro dominio in cui abbondano i problemi di arresto ottimale e dove guardare


anche il retro è generalmente sconsiderato: è l'auto. Gli automobilisti sono presenti in alcuni
la prima letteratura sul problema del segretario e il quadro del costante
il movimento in avanti rende quasi ogni decisione di viaggio in macchina un problema di arresto:
la ricerca di un ristorante; la ricerca di un bagno; e, soprattutto per
driver urbani, la ricerca di un parcheggio. Con chi è meglio parlare degli ins
e fuori dal parcheggio dell'uomo descritto dal Los Angeles Times come “il
rock star del parcheggio ", Donald Distinguished Professor di Urbanistica della UCLA
Shoup? Siamo scesi in macchina dalla California settentrionale per fargli visita, rassicurando Shoup
che avremmo lasciato molto tempo per il traffico imprevisto. “Per quanto riguarda la pianificazione
"traffico imprevisto", penso che dovresti pianificare il traffico previsto ", ha risposto.
Shoup è forse meglio conosciuto per il suo libro The High Cost of Free Parking , e
ha fatto molto per far avanzare la discussione e la comprensione di ciò che realmente
succede quando qualcuno guida a destinazione.

Pagina 31

Dovremmo compatire il povero guidatore. Il parcheggio ideale, come lo modella Shoup,


è quella che ottimizza un preciso equilibrio tra il "prezzo dell'adesivo" dello spazio,
il tempo e il disagio del camminare, il tempo impiegato per cercare lo spazio (che
varia notevolmente con la destinazione, l'ora del giorno, ecc.) e il gas bruciato in tal modo.
L'equazione cambia con il numero di passeggeri nell'auto, che possono dividere il file
costo monetario di uno spazio ma non il tempo di ricerca o la passeggiata. Allo stesso tempo,
il conducente deve considerare che anche l'area con la maggior disponibilità di parcheggio può
essere l'area con la maggior richiesta; il parcheggio ha una componente teorica del gioco, come
cerchi di superare in astuzia gli altri conducenti sulla strada mentre loro a loro volta ci provano
superarti in astuzia. * Detto questo, molte delle sfide del parcheggio si riducono a un file
numero unico: il tasso di occupazione. Questa è la proporzione di tutti i parcheggi
attualmente occupati. Se il tasso di occupazione è basso, è facile trovare un bene
parcheggio. Se è alto, trovare un posto dove parcheggiare è una sfida.
Shoup sostiene che molti dei mal di testa del parcheggio sono conseguenze di
città che adottano politiche che si traducono in tassi di occupazione estremamente elevati. Se il costo
del parcheggio in una particolare posizione è troppo basso (o - orrori! - niente), quindi
c'è un forte incentivo a parcheggiare lì, piuttosto che parcheggiare un po 'più lontano e
camminare. Quindi tutti cercano di parcheggiare lì, ma la maggior parte di loro scopre che gli spazi lo sono
già pieno, e le persone finiscono per perdere tempo e bruciare combustibili fossili come loro
crociera per un posto.
La soluzione di Shoup prevede l'installazione di parchimetri digitali in grado di farlo
prezzi adattivi che aumentano con la domanda. (Questo è stato ora implementato in
centro di San Francisco.) I prezzi sono fissati con un tasso di occupazione target in
mente, e Shoup sostiene che questo tasso dovrebbe essere intorno all'85% —a
calo radicale dai cordoli quasi al 100% della maggior parte delle principali città. Come lui
osserva, quando l'occupazione passa dal 90% al 95%, ne ospita solo il 5% in più
macchine ma raddoppia la durata della ricerca di tutti.
L'impatto chiave che il tasso di occupazione ha sulla strategia dei parcheggi diventa chiaro
una volta che ci rendiamo conto che il parcheggio è un problema di arresto ottimale. Mentre guidi
lungo la strada, ogni volta che vedi qualche angolo vuoto che devi fare
una decisione: dovresti prendere questo posto, o avvicinarti un po 'alla tua destinazione e
tenta la fortuna?
Supponi di trovarti su una strada infinitamente lunga, con parcheggi equidistanti,
e il tuo obiettivo è ridurre al minimo la distanza che finisci per raggiungere a piedi

Pagina 32
destinazione. Allora la soluzione è la regola Look-Then-Leap. In modo ottimale
fermare il conducente dovrebbe ignorare tutti i posti liberi che si verificano più di un certo
distanza dalla destinazione e quindi prendere il primo spazio che appare in seguito.
E la distanza alla quale passare dal guardare al saltare dipende da
percentuale di posti che è probabile che vengano riempiti: il tasso di occupazione. Il tavolo
la pagina successiva fornisce le distanze per alcune proporzioni rappresentative.

Come trovare parcheggio in modo ottimale.

Se questa strada infinita ha un tasso di occupazione delle grandi città del 99%, con solo l'1% di
posti liberi, quindi dovresti prendere il primo posto che vedi a partire da quasi 70
spot, a più di 400 metri, dalla tua destinazione. Ma se Shoup ha il suo
modo e il tasso di occupazione scende a solo l'85%, non è necessario iniziare seriamente
cercando finché non sei a mezzo isolato di distanza.
La maggior parte di noi non guida su strade perfettamente dritte e infinitamente lunghe. Così come con
altri problemi di arresto ottimali, i ricercatori hanno considerato una varietà di

Pagina 33

modifiche a questo scenario di base. Ad esempio, hanno studiato il parcheggio ottimale


strategia per i casi in cui il conducente può fare inversioni a U, dove un minor numero di parcheggi
gli spazi sono disponibili quanto più ci si avvicina alla destinazione e dove si trova l'autista
in competizione anche con piloti rivali diretti nella stessa destinazione. Ma
qualunque siano i parametri esatti del problema, ci sono sempre più posti liberi
renderà la vita più facile. È una specie di promemoria politico per il municipio
governi: parcheggiare non è semplice come avere una risorsa (spot) e
massimizzandone l'utilizzo (occupazione). Anche il parcheggio è un processo , ottimale
fermare il problema, ed è uno che consuma attenzione, tempo e carburante, e
genera sia inquinamento che congestione. La giusta politica si rivolge a tutto
problema. E, controintuitivamente, possono esserlo punti vuoti su blocchi altamente desiderabili
il segno che le cose funzionano correttamente.
Abbiamo chiesto a Shoup se la sua ricerca gli consente di ottimizzare il proprio tragitto giornaliero,
attraverso il traffico di Los Angeles fino al suo ufficio alla UCLA. Probabilmente il file
il massimo esperto mondiale di parcheggi ha qualche tipo di arma segreta?
Lo fa: "Vado in bicicletta".

Quando smettere
Nel 1997, la rivista Forbes ha identificato Boris Berezovsky come l'uomo più ricco di
Russia, con una fortuna di circa 3 miliardi di dollari. Solo dieci anni prima lo era stato
vivere con lo stipendio di un matematico dell'Accademia delle scienze dell'URSS. Lui
fece i suoi miliardi attingendo ai rapporti industriali che aveva formato attraverso i suoi
ricerca per fondare una società che ha facilitato l'interazione tra stranieri
case automobilistiche e la casa automobilistica sovietica AvtoVAZ. La compagnia di Berezovky
poi è diventato un grande rivenditore per le auto prodotte da AvtoVAZ, utilizzando a
Schema di pagamento rateale per sfruttare l'iperinflazione del rublo.
Utilizzando i fondi di questa partnership ha acquistato la proprietà parziale di AvtoVAZ
stessa, poi la rete televisiva ORT e infine la compagnia petrolifera Sibneft.
Diventando uno di una nuova classe di oligarchi, ha partecipato alla politica, sostenendo
La rielezione di Boris Eltsin nel 1996 e la scelta di Vladimir Putin come suo
successore nel 1999.
Ma è allora che la fortuna di Berezovsky è cambiata. Poco dopo l'elezione di Putin,

Pagina 34

Berezovsky si oppose pubblicamente alle proposte di riforme costituzionali che lo avrebbero fatto
espandere il potere del presidente. La sua continua critica pubblica a Putin ha portato a
il deterioramento della loro relazione. Nell'ottobre 2000, quando fu chiesto a Putin
sulle critiche di Berezovsky, ha risposto: “Lo Stato ha un randello nelle sue mani
che usi per colpire solo una volta, ma in testa. Non abbiamo ancora usato questo randello ...
Il giorno in cui ci arrabbieremo davvero, non esiteremo. " Berezovsky ha lasciato la Russia
definitivamente il mese successivo, andando in esilio in Inghilterra, dove continuò
criticare il regime di Putin.
Come ha deciso Berezovsky che era ora di lasciare la Russia? C'è un modo
forse, pensare matematicamente al consiglio di "smettere finché sei avanti"?
Berezovsky, in particolare, avrebbe potuto considerare questa stessa domanda da allora
l'argomento su cui aveva lavorato tutti quegli anni prima come matematico non era nessuno
diverso dall'arresto ottimale; è autore del primo (e, finora, l'unico) libro
interamente dedicato al problema della segreteria.
Il problema di smettere mentre sei avanti è stato analizzato in diversi
forme diverse, ma forse le più adatte al caso di Berezovsky: con
scuse agli oligarchi russi: è noto come il "problema dei ladri". In questo
problema, un ladro ha la possibilità di effettuare una sequenza di rapine. Ogni
la rapina fornisce una ricompensa e c'è la possibilità di farla franca
tempo. Ma se il ladro viene catturato, viene arrestato e perde tutto il suo accumulato
guadagni. Quale algoritmo dovrebbe seguire per massimizzare la sua presa prevista?
Il fatto che questo problema abbia una soluzione è una cattiva notizia per il film sulla rapina
sceneggiature: quando la squadra sta cercando di attirare il vecchio ladro dal ritiro per
un ultimo lavoro, il ladro astuto deve solo scrutare i numeri. Inoltre, i risultati
sono piuttosto intuitivi: il numero di rapine da eseguire è approssimativamente
pari alla possibilità di scappare, divisa per la possibilità di essere scoperti. Se
sei un abile ladro e hai il 90% di possibilità di portare a termine ogni rapina (e
una probabilità del 10% di perdere tutto), quindi ritirarsi dopo 90/10 = 9 rapine. Un pugno di prosciutto
dilettante con 50/50 possibilità di successo? La prima volta che non hai niente da perdere
ma non sfidare la fortuna più di una volta.
Nonostante la sua esperienza nell'arresto ottimale, la storia di Berezovsky finisce tristemente. Lui
è morto nel marzo 2013, trovato da una guardia del corpo nel bagno chiuso a chiave di casa sua
nel Berkshire con una legatura al collo. La conclusione ufficiale di a
l'esame post mortem è stato che si era suicidato, impiccandosi

Pagina 35

dopo aver perso gran parte della sua ricchezza a causa di una serie di casi legali di alto profilo
coinvolgendo i suoi nemici in Russia. Forse avrebbe dovuto smettere prima ...
ammassando solo poche decine di milioni di dollari, diciamo, e non entrare in politica.
Ma, ahimè, quello non era il suo stile. Uno dei suoi amici matematici, Leonid
Boguslavsky, ha raccontato una storia su Berezovsky da quando erano entrambi giovani
ricercatori: durante un viaggio di sci nautico in un lago vicino a Mosca, la barca che avevano
pianificato di utilizzare si è rotto. Ecco come lo racconta David Hoffman nel suo libro The
Oligarchi :

Mentre i loro amici andavano in spiaggia e accendevano un falò, Boguslavsky e Berezovsky si dirigevano verso il
attraccare per cercare di riparare il motore ... Tre ore dopo avevano smontato e rimontato il motore.
Era ancora morto. Avevano perso la maggior parte della festa, ma Berezovsky insistette che dovevano continuare a provare.
"Abbiamo provato questo e quello", ha ricordato Boguslavsky. Berezovsky non si sarebbe arreso.

Sorprendentemente, non arrendersi - mai - fa anche la sua comparsa nell'ottimale


fermare la letteratura. Potrebbe non sembrare così dalla vasta gamma di problemi che abbiamo
hanno discusso, ma ci sono problemi decisionali sequenziali per i quali
non v'è alcuna regola d'arresto ottimale. Un semplice esempio è il gioco del “triplo o
Niente." Immagina di avere $ 1,00 e di poter giocare al seguente gioco come molti
volte che vuoi: scommetti tutti i tuoi soldi e hai il 50% di possibilità di ricevere
triplica l'importo e una probabilità del 50% di perdere l'intera puntata. Quante volte
dovresti giocare? Nonostante la sua semplicità, non esiste una regola di arresto ottimale per questo
problema, poiché ogni volta che giochi, i tuoi guadagni medi sono un po 'più alti. Di partenza
con $ 1,00, riceverai $ 3,00 metà delle volte e $ 0,00 metà, così via
media ti aspetti di concludere il primo round con $ 1,50 in tasca. Quindi, se tu
sono stati fortunati al primo round, le due possibilità dai $ 3,00 che hai appena
sono $ 9,00 e $ 0,00, per un rendimento medio di $ 4,50 dalla seconda scommessa.
La matematica mostra che dovresti sempre continuare a giocare. Ma se segui questo
strategia, alla fine perderai tutto. Alcuni problemi sono meglio evitati
che risolto.

Fermati sempre

Pagina 36

Mi aspetto di attraversare questo mondo ma una volta. Qualsiasi bene quindi che posso
fare, o qualsiasi gentilezza che posso mostrare a qualsiasi altra creatura, lasciamelo fare ora.
Non permettetemi di differirlo o trascurarlo, perché non passerò più da questa parte.
—STEPHEN GRELLET
Passa il pomeriggio. Non puoi portarlo con te.

—ANNIE DILLARD
Abbiamo esaminato casi specifici di persone che affrontano problemi di arresto nei loro file
vive, ed è chiaro che la maggior parte di noi incontra questo tipo di problemi, in uno
forma o altro, ogni giorno. Che si tratti di segretarie, fidanzati o appartamenti,
la vita è piena di arresto ottimale. Quindi la domanda irresistibile è se ...
evoluzione o educazione o intuizione: in realtà seguiamo le migliori strategie.
A prima vista, la risposta è no. Circa una dozzina di studi hanno prodotto il
stesso risultato: le persone tendono a smettere presto, lasciando invisibili i candidati migliori. Prendere un
più sensato per questi risultati, abbiamo parlato con Amnon Rapoport di UC Riverside,
chi ha condotto esperimenti di arresto ottimali in laboratorio per ulteriori informazioni
di quarant'anni.
È stato condotto lo studio che più da vicino segue il classico problema della segretaria
negli anni '90 da Rapoport e dal suo collaboratore Darryl Seale. In questo studio le persone
ha ripetuto numerose ripetizioni del problema della segretaria, con 40 o 80
candidati ogni volta. La velocità complessiva con cui le persone hanno trovato il meglio possibile
il candidato era abbastanza buono: circa il 31%, non lontano dall'ottimo 37%. Maggior parte
le persone hanno agito in un modo coerente con la regola Guarda-poi-Salta, ma
saltarono prima di quanto avrebbero dovuto più di quattro quinti del tempo.
Rapoport ci ha detto che lo tiene a mente quando risolve l'arresto ottimale
problemi nella sua vita. Nella ricerca di un appartamento, ad esempio, combatte
la sua stessa voglia di impegnarsi rapidamente. “Nonostante il fatto che per natura sono molto
impaziente e voglio prendere il primo appartamento, cerco di controllarmi! "
Ma quell'impazienza suggerisce un'altra considerazione che non viene presa in considerazione
conto nel classico problema del segretario: il ruolo del tempo. Dopo tutto, il tutto
volta che cerchi una segretaria, non hai una segretaria. Cosa c'è di più,

Pagina 37

passi la giornata a condurre interviste invece di ottenere il tuo lavoro


fatto.
Questo tipo di costo offre una potenziale spiegazione del motivo per cui le persone si fermano presto
quando si risolve un problema di segretaria in laboratorio. Seale e Rapoport hanno dimostrato che se
si immagina che il costo per vedere ogni candidato sia, ad esempio, l'1% del valore
di trovare la migliore segretaria, allora la strategia ottimale si allineerebbe perfettamente
dove le persone sono effettivamente passate dal guardare al saltare nel loro esperimento.
Il mistero è che nello studio di Seale e Rapoport non c'era un costo per
ricerca. Allora perché le persone in laboratorio potrebbero comportarsi come se ce ne fosse uno?
Perché per le persone c'è sempre un costo in termini di tempo. Non proviene da
progettazione dell'esperimento. Viene dalla vita delle persone.
I costi di tempo "endogeni" della ricerca, che di solito non vengono catturati da
modelli di arresto ottimali, potrebbero quindi fornire una spiegazione del perché umano
il processo decisionale si discosta abitualmente dalle prescrizioni di tali modelli. Come
Neil Bearden, ricercatore di arresto ottimale, afferma: "Dopo aver cercato per un po ',
noi umani tendiamo ad annoiarci. Non è irrazionale annoiarsi, ma è difficile
modello che rigorosamente. "
Ma questo non rende meno importanti i problemi di arresto ottimale; in realtà
li rende più importanti, perché il flusso del tempo trasforma tutto il processo decisionale
in un arresto ottimale.
“La teoria dell'arresto ottimale riguarda il problema della scelta di un
tempo per intraprendere una determinata azione ", apre il libro di testo definitivo sull'arresto ottimale,
ed è difficile pensare a una descrizione più concisa della condizione umana. Noi
decidere il momento giusto per acquistare azioni e il momento giusto per venderle, certo; ma anche
il momento giusto per aprire la bottiglia di vino che ci teniamo in giro per uno speciale
occasione, il momento giusto per interrompere qualcuno, il momento giusto per baciarlo.
Visto in questo modo, il problema del segretario è il più fondamentale ma anche il più importante
presupposto incredibile - la sua rigorosa serialità, la sua inesorabile marcia a senso unico - lo è
rivelato essere la natura del tempo stesso. In quanto tale, la premessa esplicita di
Il problema dell'arresto ottimale è la premessa implicita di ciò che significa essere vivi. È questo
che ci costringe a decidere in base a possibilità che non abbiamo ancora visto, questo che forza
ad abbracciare alti tassi di fallimento anche quando si agisce in modo ottimale. Nessuna scelta
ricorre. Potremmo avere di nuovo scelte simili , ma mai quella esatta. Esitazione-
inazione: è irrevocabile quanto l'azione. Quello che l'automobilista, bloccato su quello-

Pagina 38

way road, è allo spazio, siamo alla quarta dimensione: passiamo veramente da questa parte ma
una volta.
Intuitivamente, pensiamo che prendere decisioni razionali significhi esaustivamente
enumerando le nostre opzioni, valutandole attentamente e quindi selezionando il file
migliore. Ma in pratica, quando l'orologio - o il ticchettio - ticchetta, pochi aspetti
il processo decisionale (o il pensiero più in generale) sono importanti quanto questo:
quando fermarsi.
Pagina 39

2 Esplora / Sfrutta
L'ultimo contro il più grande

Il tuo stomaco brontola. Vai al ristorante italiano che conosci e


amore, o il nuovo locale thailandese che ha appena aperto? Prendi il tuo migliore amico, o
entrare in contatto con una nuova conoscenza che vorresti conoscere meglio? Anche questo è
difficile, forse resterai a casa. Cucini una ricetta che sai essere
andando a lavorare o setacciare Internet alla ricerca di nuove ispirazioni? Non importa, che ne dici
hai appena ordinato una pizza? Ottieni il tuo "solito" o chiedi informazioni sulle offerte speciali?
Sei già esausto prima di arrivare al primo morso. E il pensiero di
mettere su un disco, guardare un film o leggere un libro: quale? -no
sembra più così rilassante.
Ogni giorno siamo costantemente costretti a prendere decisioni tra le opzioni che
differiscono in una dimensione molto specifica: proviamo cose nuove o restiamo fedeli al nostro
quelli preferiti? Comprendiamo intuitivamente che la vita è un equilibrio tra novità
e tradizione, tra le ultime e le più grandi, tra l'assunzione di rischi e
assaporando ciò che conosciamo e amiamo. Ma proprio come con il dilemma del look-or-leap di
la caccia all'appartamento, la domanda senza risposta è: quale equilibrio?
Nel classico del 1974 Zen and the Art of Motorcycle Maintenance , Robert Pirsig
denuncia chi apre la conversazione "Cosa c'è di nuovo?", sostenendo che la domanda "se
perseguito esclusivamente, si traduce solo in una sfilata infinita di curiosità e moda, il
limo di domani. " Appoggia un'alternativa di gran lunga superiore: "Cosa è meglio?"
Ma la realtà non è così semplice. Ricordando che ogni canzone "migliore" e
ristorante tra i tuoi preferiti è iniziato umilmente come qualcosa di semplicemente "nuovo"
sei un promemoria che potrebbero esserci dei migliori ancora sconosciuti là fuori - e quindi
che il nuovo è davvero degno di almeno parte della nostra attenzione.

Pagina 40

Gli aforismi consumati dall'età riconoscono questa tensione ma non la risolvono. "Crea nuovo
amici, ma tenete i vecchi Quelli sono d'argento, questi sono d'oro "e" Non c'è vita
così ricco e raro Ma un altro amico potrebbe entrare lì ”sono abbastanza veri;
certamente la loro scansione è ineccepibile. Ma non ci dicono niente di utile
circa il rapporto tra, diciamo, "argento" e "oro" che rende bene la migliore lega di una vita
vissuto.
Gli informatici hanno lavorato per trovare questo equilibrio per più di
cinquant'anni. Hanno persino un nome per questo: il compromesso esplorare / sfruttare.

Esplora / Sfrutta
In inglese, le parole "explore" e "exploit" vengono caricate completamente
connotazioni opposte. Ma per uno scienziato informatico, queste parole hanno molto di più
significati specifici e neutri. In poche parole, l'esplorazione è raccogliere informazioni,
e lo sfruttamento sta usando le informazioni che hai per ottenere un buon risultato noto.
È abbastanza intuitivo che non esplorare mai non sia il modo di vivere. Ma vale anche la pena
menzionando che non sfruttare mai può essere altrettanto negativo. Nell'informatica
definizione, lo sfruttamento arriva a caratterizzare molti di ciò che consideriamo
per essere i momenti migliori della vita. Una riunione di famiglia insieme durante le vacanze è
sfruttamento. Così è un topo di biblioteca che si sistema su una sedia da lettura con una tazza calda di
caffè e un amato preferito, o una band che suona i loro più grandi successi davanti a una folla di
fan adoranti o una coppia che ha resistito alla prova del tempo ballando al ritmo della "loro canzone".
Inoltre, l'esplorazione può essere una maledizione.
Parte di ciò che è bello della musica, ad esempio, è che ce ne sono costantemente nuove
cose da ascoltare. Oppure, se sei un giornalista musicale, parte di ciò che è terribile
la musica è che ci sono sempre cose nuove da ascoltare. Essere un giornalista musicale
significa ruotare il quadrante di esplorazione fino a 11, dove non è altro che nuovo
cose tutto il tempo. Gli amanti della musica potrebbero immaginare di lavorare nel giornalismo musicale
essere il paradiso, ma quando devi costantemente esplorare il nuovo non puoi mai
goditi i frutti della tua conoscenza, un tipo particolare di inferno. Poca gente
conosco questa esperienza tanto profondamente quanto Scott Plagenhoef, l'ex redattore capo di
Forcone . “Cerchi di trovare spazi quando lavori per ascoltare qualcosa
che vuoi solo ascoltare ", dice della vita di un critico. I suoi disperati impulsi a

Pagina 41

smettila di guadare melodie inascoltate di dubbia qualità e ascolta semplicemente quello che lui
amato erano così forti che Plagenhoef avrebbe messo solo nuova musica sul suo iPod, a
rendersi fisicamente incapace di abbandonare i propri doveri in quei momenti
quando voleva davvero, davvero, davvero ascoltare gli Smiths. I giornalisti lo sono
martiri, esplorando in modo che altri possano sfruttare.
Nell'informatica, la tensione tra esplorazione e sfruttamento prende
la sua forma più concreta in uno scenario chiamato "problema dei banditi multi-armati".
Il nome strano deriva dal termine colloquiale per una slot machine da casinò, il
"Bandito con un braccio solo." Immagina di entrare in un casinò pieno di slot differenti
macchine, ognuna con le proprie probabilità di vincita. Il problema, ovviamente, sei tu
non vengono comunicate quelle probabilità in anticipo: finché non inizi a giocare, non ne avrai
idea di quali macchine sono le più redditizie ("sciolte", come gli appassionati di slot machine
chiamatelo) e quali sono solo dei soldi.
Naturalmente, sei interessato a massimizzare le tue vincite totali. Ed è chiaro
che questo comporterà una combinazione di tirare le braccia in modo diverso
macchine per testarle (esplorando) e privilegiando le più promettenti
macchine che hai trovato (sfruttando).
Per avere un'idea delle sottigliezze del problema, immagina di essere affrontato solo con
due macchine. Uno che hai giocato un totale di 15 volte; 9 volte è stato pagato e 6
volte no. L'altro hai giocato solo due volte, e una volta ha pagato e
una volta no. Qual è più promettente?
Dividendo semplicemente le vincite per il numero totale di tiri otterrai il
il "valore atteso" della macchina, e con questo metodo arriva chiaramente la prima macchina
avanti. Il suo record di 9–6 rappresenta un valore atteso del 60%, mentre il
il record di 1–1 della seconda macchina produce un valore atteso di solo il 50%. Ma c'è
più di quello. Dopotutto, solo due tiri non sono davvero molti. Quindi c'è un file
senso in cui non sappiamo ancora quanto potrebbe essere buona la seconda macchina
essere effettivamente.
La scelta di un ristorante o di un album è, in effetti, una questione di decidere quale
braccio per tirare nel casinò della vita. Ma capire il compromesso tra esplorazione e sfruttamento non lo è
solo un modo per migliorare le decisioni su dove mangiare o cosa ascoltare. Anche
fornisce informazioni fondamentali su come i nostri obiettivi dovrebbero cambiare con l'avanzare dell'età e
perché la linea d'azione più razionale non è sempre cercare di scegliere il meglio.
E risulta essere al centro, tra le altre cose, del web design e della clinica

Pagina 42

processi: due argomenti che normalmente non vengono menzionati nella stessa frase.
Le persone tendono a trattare le decisioni in modo isolato, a concentrarsi sul trovare ogni volta il
risultato con il valore atteso più alto. Ma le decisioni non sono quasi mai
isolato e il valore atteso non è la fine della storia. Se stai pensando non solo
sulla decisione successiva , ma su tutte le decisioni che prenderete
le stesse opzioni in futuro, il compromesso esplorare / sfruttare è cruciale per il
processi. In questo modo, scrive il matematico Peter Whittle, il problema dei banditi
"Incarna in forma essenziale un conflitto evidente in tutte le azioni umane."
Quindi quale di quelle due braccia dovresti tirare? È una domanda trabocchetto. It
dipende completamente da qualcosa che non abbiamo ancora discusso: quanto tempo pianifichi
essere al casinò.

Cogli l'intervallo
"Carpe diem", esorta Robin Williams in una delle scene più memorabili del film
1989 film Dead Poets Society . “Cogli l'attimo, ragazzi. Crea le tue vite
straordinario."
È un consiglio incredibilmente importante. È anche un po 'contraddittorio.
Cogliere un giorno e cogliere una vita sono due imprese completamente diverse. Noi
hanno l'espressione "Mangia, bevi e sii felice, perché domani moriremo", ma
forse dovremmo anche avere il suo inverso: “Inizia ad imparare una nuova lingua o una lingua
strumento, e fare chiacchiere con uno sconosciuto, perché la vita è lunga, e chi
sa quale gioia potrebbe sbocciare nel corso di molti anni. " Quando si bilancia il preferito
esperienze e nuove, niente conta quanto l'intervallo durante il quale
abbiamo in programma di goderne.
“Ho più probabilità di provare un nuovo ristorante quando mi trasferisco in una città rispetto a quando lo sono
lasciandolo ", spiega il data scientist e blogger Chris Stucchio, un veterano di
alle prese con il compromesso tra esplorazione e sfruttamento sia nel suo lavoro che nella sua vita. "IO
per lo più vado nei ristoranti che conosco e amo adesso, perché so che lo sarò
lasciando New York abbastanza presto. Mentre un paio di anni fa mi sono trasferito a Pune,
India, e mangiavo dannatamente ovunque che non sembrava che sarebbe andato
uccidimi. E mentre lasciavo la città sono tornato a tutti i miei vecchi preferiti, piuttosto
piuttosto che provare cose nuove ... Anche se trovo un posto leggermente migliore, ci vado

Pagina 43

andarci una o due volte, quindi perché correre il rischio? "


Una proprietà che fa riflettere di provare cose nuove è che il valore dell'esplorazione, di
trovare un nuovo preferito, non può che diminuire nel tempo, come il restante
le occasioni per assaporarlo diminuiscono. Alla scoperta di un caffè incantevole all'ultimo
la notte in città non ti dà la possibilità di tornare.
Il rovescio della medaglia è che il valore dello sfruttamento può solo aumentare nel tempo. Il
Il caffè più bello che conosci oggi è, per definizione, almeno tanto adorabile quanto il
il più bel caffè che conoscessi il mese scorso. (E se hai trovato un altro preferito
da allora, potrebbe essere ancora di più.) Quindi esplora quando avrai il tempo di usarlo
la conoscenza risultante, sfrutta quando sei pronto per incassare. L'intervallo
fa la strategia.
È interessante notare che, poiché l'intervallo fa la strategia, quindi osservando il
possiamo anche dedurre l'intervallo. Prendi Hollywood, ad esempio: tra i
dieci film di maggior incasso del 1981, solo due sono stati sequel. Nel 1991 lo era
tre. Nel 2001 erano cinque. E nel 2011, otto dei primi dieci incassi più alti
i film erano sequel. In effetti, il 2011 ha stabilito un record per la più alta percentuale di
sequel tra le principali uscite in studio. Poi il 2012 ha immediatamente battuto quel record;
l'anno successivo lo spezzerebbe di nuovo. Nel dicembre 2012, il giornalista Nick Allen
guardava avanti con palpabile stanchezza all'anno a venire:

Il pubblico riceverà una sesta porzione di X-Men più Fast and Furious 6 , Die Hard 5 , Scary Movie
5 e attività paranormale 5 . Ci saranno anche Iron Man 3 , The Hangover 3 e seconde uscite per
I Muppets , I Puffi , GI Joe e Bad Santa .

Dal punto di vista di uno studio, un sequel è un film con una base di fan garantita: a
cash cow, una cosa sicura, un exploit. E un sovraccarico di cose sicure segnala un breve
approccio termista, come con Stucchio in uscita dalla città. I sequel sono di più
Probabilmente di nuovi film per essere successi quest'anno, ma dove sarà l'amato
da dove vengono i franchise del futuro? Un simile diluvio non è solo deplorevole
(certamente i critici la pensano così); è anche un po 'toccante. Entrando in un quasi
fase puramente incentrata sull'exploit, l'industria cinematografica sembra segnalare una convinzione
che è vicino alla fine del suo intervallo.
Uno sguardo all'economia di Hollywood conferma questa intuizione. I profitti di
i più grandi studi cinematografici sono diminuiti del 40% tra il 2007 e il 2011 e le vendite dei biglietti

Pagina 44

sono diminuiti in sette degli ultimi dieci anni. Come dice l' Economist , “Squeezed
tra costi in aumento e ricavi in ​calo, i grandi studi hanno risposto
cercando di fare più film che pensano saranno dei successi: di solito sequel, prequel o
qualsiasi cosa includa caratteri con riconoscimento del nome. " In altre parole, lo sono
tirando le braccia delle migliori macchine che hanno prima che il casinò le trasformi
su.

Win-Stay
Trovare algoritmi ottimali che ci dicano esattamente come gestire il multi-armato
Il problema dei banditi si è dimostrato incredibilmente impegnativo. Infatti, come Peter Whittle
racconta, durante la seconda guerra mondiale gli sforzi per risolvere la questione “così indebolirono il
energie e menti degli analisti alleati ... che è stato suggerito che il
problema essere lasciato cadere sulla Germania, come l'ultimo strumento intellettuale
sabotaggio."
I primi passi verso una soluzione furono compiuti negli anni del dopoguerra, quando
Il matematico della Columbia Herbert Robbins ha dimostrato che esiste una strategia semplice
che, sebbene non perfetto, viene fornito con alcune buone garanzie.
Robbins ha considerato specificamente il caso in cui ci sono esattamente due slot
macchine e ha proposto una soluzione chiamata algoritmo Win-Stay, Lose-Shift :
scegli un braccio a caso e continua a tirarlo finché continua a dare i suoi frutti. Se
il braccio non paga dopo un particolare tiro, quindi passa all'altro.
Sebbene questa semplice strategia sia lungi dall'essere una soluzione completa, Robbins lo ha dimostrato
1952 che funziona in modo affidabile meglio del caso.
Dopo Robbins, una serie di documenti ha esaminato il "rimanere su un vincitore"
principio ulteriormente. Intuitivamente, se fossi già disposto a tirare un braccio, e questo
ha appena dato i suoi frutti, questo dovrebbe solo aumentare la stima del suo valore, e tu
dovrebbe essere solo più disposto a tirarlo di nuovo. E infatti, win-stay si rivela
un elemento della strategia ottimale per bilanciare esplorazione e sfruttamento
in un'ampia gamma di condizioni.
Ma perdere turno è un'altra storia. Cambiare le armi ogni volta che uno fallisce è carino
mossa avventata. Immagina di andare in un ristorante cento volte, ogni volta con un
pasto meraviglioso. Basterebbe una delusione per indurti a rinunciare

Pagina 45

su di essa? Le buone opzioni non dovrebbero essere penalizzate troppo per essere imperfette.
Più significativamente, Win-Stay, Lose-Shift non ha alcuna nozione di
intervallo su cui si sta ottimizzando. Se il tuo ristorante preferito è rimasto deluso
l'ultima volta che hai mangiato lì, quell'algoritmo dice sempre che dovresti andare a
un altro posto, anche se è la tua ultima notte in città.
Tuttavia, il lavoro iniziale di Robbins sul problema dei banditi multi-armati ha dato il via a
letteratura sostanziale e i ricercatori hanno compiuto progressi significativi nel corso del prossimo
pochi anni. Richard Bellman, un matematico della RAND Corporation, ha scoperto
una soluzione esatta al problema per i casi in cui sappiamo in anticipo esattamente
quante opzioni e opportunità avremo in totale. Come con il full-
problema della segretaria dell'informazione, il trucco di Bellman era essenzialmente quello di funzionare
all'indietro, iniziando immaginando il tiro finale e considerando quale slot
macchina da scegliere visti tutti i possibili esiti delle decisioni precedenti.
Dopo averlo capito, allora dovresti passare alla penultima opportunità
il precedente, e quello prima ancora, fino all'inizio.
Le risposte che emergono dal metodo di Bellman sono ferree, ma molte
opzioni e una lunga visita al casinò può richiedere un importo vertiginoso o impossibile
di lavoro. Inoltre, anche se siamo in grado di calcolare tutti i possibili futuri, noi di
Ovviamente non sempre si sa esattamente quante opportunità (o anche quante
opzioni) avremo. Per questi motivi, il problema dei banditi multi-armati
rimase effettivamente irrisolto. Nelle parole di Whittle, "è diventato rapidamente un classico,
e sinonimo di intransigenza. "

L'indice di Gittins
Come spesso accade in matematica, però, il particolare è la porta d'accesso a
universale. Negli anni '70, la Unilever Corporation ha chiesto a un giovane matematico
ha chiamato John Gittins per aiutarli a ottimizzare alcuni dei loro test sui farmaci.
Inaspettatamente, quello che hanno ottenuto è stata la risposta a un enigma matematico che aveva
rimasto irrisolto per una generazione.
Gittins, che ora è professore di statistica a Oxford, ha riflettuto sulla questione
poste da Unilever. Dati diversi composti chimici diversi, qual è il file
modo più rapido per determinare quale composto è probabile che sia efficace contro a
Pagina 46

patologia? Gittins ha cercato di esprimere il problema nella forma più generale possibile:
più opzioni da perseguire, una diversa probabilità di ricompensa per ciascuna opzione e
una certa quantità di sforzo (o denaro, o tempo) da assegnare tra di loro. It
era, ovviamente, un'altra incarnazione del problema dei banditi multi-armati.
Sia le compagnie farmaceutiche a scopo di lucro che la professione medica che servono lo sono
costantemente confrontato con le esigenze concorrenti del compromesso esplorare / sfruttare.
Le aziende vogliono investire soldi in R & S nella scoperta di nuovi farmaci, ma
vogliono anche assicurarsi che le loro attuali linee di prodotti redditizie siano fiorenti.
I medici vogliono prescrivere i migliori trattamenti esistenti in modo che i pazienti ottengano il
cure di cui hanno bisogno, ma vogliono anche incoraggiare studi sperimentali che potrebbero presentarsi
anche migliori.
In entrambi i casi, in particolare, non è del tutto chiaro quale dovrebbe essere l'intervallo rilevante
essere. In un certo senso, sia le aziende farmaceutiche che i medici sono interessati all'indefinito
futuro. Le aziende vogliono essere in giro teoricamente per sempre e in campo medico
lato una svolta potrebbe continuare per aiutare le persone che non sono ancora nate.
Tuttavia, il presente ha una priorità più alta: oggi viene portato un paziente guarito
essere più prezioso di uno curato tra una settimana o un anno da oggi, e certamente il
lo stesso vale per i profitti. Gli economisti fanno riferimento a questa idea, di valorizzare il presente
più importante del futuro, come "sconto".
A differenza dei ricercatori precedenti, Gittins si è avvicinato al bandito multi-armato
problema in quei termini. Ha concepito l'obiettivo come massimizzare i payoff non per a
intervallo di tempo fisso, ma per un futuro infinito eppure scontato.
Tale sconto non ci è estraneo dalla nostra vita. Dopotutto, se tu
visitare una città per una vacanza di dieci giorni, quindi dovresti fare il tuo ristorante
decisioni con un intervallo fisso in mente; ma se vivi in ​città, questo no
ha molto senso. Invece, potresti immaginare che il valore dei payoff diminuisca
più sono nel futuro: ci tieni di più al pasto che stai per mangiare
mangia stasera rispetto al pasto che mangerai domani, e altro ancora
il pasto di domani di uno all'anno da adesso, con le specifiche di quanto
più a seconda della tua particolare "funzione di sconto". Gittins, da parte sua,
ipotizzato che il valore assegnato ai payoff diminuisca geometricamente:
cioè, ogni visita al ristorante che fai vale una frazione costante dell'ultima.
Se, diciamo, credi che ci sia una probabilità dell'1% di essere investito da un autobus in un dato momento
giorno, allora dovresti valutare la cena di domani al 99% del valore di quella di stasera, se

Pagina 47

solo perché potresti non mangiarlo mai.


Lavorando con questa ipotesi di sconto geometrico, Gittins ha studiato a
strategia che pensava "almeno sarebbe una buona approssimazione": a
pensa a ciascun braccio del bandito multibraccio separatamente dagli altri, e
prova a calcolare da solo il valore di quel braccio. Lo ha fatto immaginando
qualcosa di piuttosto ingegnoso: una tangente.
Nel popolare programma televisivo Deal or No Deal , un concorrente sceglie
una delle ventisei valigette, che contengono premi che vanno da un penny a un
milioni di dollari. Man mano che il gioco procede, un misterioso personaggio chiamato
Il
perbanchiere chiamerà
non aprire periodicamente
la valigetta e offrirà
scelta. Spetta al concorrente
al concorrente varie
decidere somme
a quale di denaro
prezzo
sono disposti a prendere una cosa sicura sull'incertezza del premio valigetta.
Gittins (anche se molti anni prima della messa in onda del primo episodio di Deal or No Deal )
capito che il problema dei banditi multi-armati non è diverso. Per ogni slot
macchina di cui sappiamo poco o nulla, c'è una certa percentuale di pagamento garantita
che, se offerto a noi al posto di quella macchina, non ci renderà mai abbastanza contenti
per tirare di nuovo la maniglia. Questo numero, che Gittins chiamava "dinamico
indice di allocazione ", e che il mondo ora conosce come indice di Gittins -
suggerisce una strategia ovvia al piano del casinò: gioca sempre il braccio con il
indice più alto.*
In effetti, la strategia dell'indice si è rivelata più che una buona approssimazione. It
risolve completamente il bandito multi-armato con payoff scontati geometricamente.
La tensione tra esplorazione e sfruttamento si risolve in un compito più semplice
di massimizzare una singola quantità che tiene conto di entrambi. Gittins è modesto riguardo
il risultato: "Non è proprio l'ultimo teorema di Fermat", dice con a
ridacchiare, ma è un teorema che ha messo a tacere una serie significativa di domande
il dilemma esplora / sfrutta.
Ora, calcolando effettivamente l'indice di Gittins per una macchina specifica, data la sua
track record e il nostro tasso di sconto, è ancora abbastanza coinvolto. Ma una volta che i Gittins
indice per un particolare insieme di ipotesi è noto, può essere utilizzato per qualsiasi
problema di quella forma. Fondamentalmente, non importa nemmeno quante braccia siano
coinvolti, poiché l'indice per ogni braccio è calcolato separatamente.
Nella tabella nella pagina successiva forniamo i valori dell'indice Gittins fino a
nove successi e fallimenti, supponendo che valga la pena di un guadagno al nostro prossimo tiro

Pagina 48

90% di un guadagno ora. Questi valori possono essere utilizzati per risolvere una varietà di situazioni quotidiane
problemi di banditi multi-armati. Ad esempio, in base a questi presupposti dovresti:
infatti, scegli la slot machine che ha un track record di 1–1 (e un file
valore del 50%) rispetto a quello con un track record di 9–6 (e un valore atteso di
60%). La ricerca delle coordinate rilevanti nella tabella mostra che il minore
la macchina conosciuta ha un indice di 0.6346, mentre la macchina più giocata segna
solo uno 0.6300. Problema risolto: questa volta tenta la fortuna ed esplora.
Guardando i valori dell'indice di Gittins nella tabella, ce ne sono alcuni altri
osservazioni interessanti. In primo luogo, puoi vedere il principio del soggiorno vincente al lavoro: come te
andare da sinistra a destra in qualsiasi riga, i punteggi dell'indice aumentano sempre. Quindi se un braccio lo è
mai quello corretto da tirare, e quel tiro è un vincitore, quindi (seguendo la tabella a
a destra) può solo avere più senso tirare di nuovo lo stesso braccio. Secondo, tu
può vedere dove perdere il turno ti metterebbe nei guai. Avere nove vittorie iniziali
seguito da una perdita ottieni un indice di 0,8695, che è ancora superiore alla maggior parte di
gli altri valori nella tabella, quindi probabilmente dovresti rimanere con quel braccio per at
almeno un altro tiro.
I valori dell'indice di Gittins in funzione delle vincite e delle perdite, assumendo che un payoff la volta successiva valga il 90% di a
ripagare adesso.

Ma forse la parte più interessante della tabella è la voce in alto a sinistra. UN


record di 0-0, un braccio che è completamente sconosciuto, ha un valore atteso di
0,5000 ma un indice di Gittins di 0,7029. In altre parole, qualcosa che non hai

Pagina 49

l'esperienza con qualsiasi cosa è più attraente di una macchina che conosci
paga sette volte su dieci! Mentre scendi lungo la diagonale, nota che a
record di 1–1 restituisce un indice di 0,6346, un record di 2–2 restituisce 0,6010, e così
sopra. Se tale rendimento del 50% persiste, l'indice alla fine lo farà
convergono su 0,5000, in quanto l'esperienza conferma che la macchina è davvero nulla
speciale e toglie il “bonus” che stimola ulteriori esplorazioni. Ma il
la convergenza avviene abbastanza lentamente; il bonus di esplorazione è una forza potente.
Infatti, nota che anche un fallimento al primo tiro, producendo un record di 0-1,
crea un indice di Gittins che è ancora superiore al 50%.
Possiamo anche vedere come cambia il compromesso esplora / sfrutta quando cambiamo il file
modo in cui stiamo scontando il futuro. La tabella seguente presenta esattamente lo stesso
informazioni come quella precedente, ma presume che valga la pena di ottenere un guadagno la volta successiva
99% di uno adesso, invece del 90%. Con il futuro pesato quasi quanto
il presente, il valore di fare una scoperta casuale, relativo al prendere una sicurezza
cosa, sale ancora di più. Qui, una macchina totalmente non testata con un record 0–0 è
vale una probabilità garantita dell'86,99% di un pagamento!

I valori dell'indice di Gittins in funzione delle vincite e delle perdite, assumendo che un payoff la prossima volta valga il 99% di a
ripagare adesso.

L'indice di Gittins, quindi, fornisce una giustificazione formale e rigorosa


preferendo l'ignoto, a patto di avere qualche opportunità di sfruttare il

Pagina 50
risultati di ciò che apprendiamo esplorando. Il vecchio adagio ci dice che "l'erba è
sempre più verde dall'altra parte del recinto ”, ma la matematica ci dice il motivo: il
sconosciuto ha una possibilità di essere migliore, anche se in realtà ci aspettiamo che sia no
diverso, o se è altrettanto probabile che sia peggio. Il rookie non testato vale di più
(all'inizio della stagione, comunque) rispetto al veterano di abilità apparentemente uguali,
proprio perché sappiamo meno di lui. L'esplorazione in sé ha valore, da allora
provare cose nuove aumenta le nostre possibilità di trovare il meglio. Quindi, prendendo il futuro
tenere conto che, piuttosto che concentrarsi solo sul presente, ci spinge verso la novità.
L'indice di Gittins fornisce quindi una soluzione sorprendentemente semplice al
problema dei banditi multi-armati. Ma non chiude necessariamente il libro su
o aiutaci a navigare tra tutti i compromessi di esplorazione / sfruttamento della vita quotidiana. Per
uno, l'indice di Gittins è ottimale solo sotto alcune forti ipotesi. Si basa
sull'attualizzazione geometrica della ricompensa futura, valutando ogni attrazione come costante
frazione del precedente, che è qualcosa in cui una varietà di esperimenti
l'economia e la psicologia comportamentale suggeriscono che le persone non lo fanno. E se c'è un file
costo per il passaggio tra le opzioni, la strategia Gittins non è più ottimale.
(L'erba dall'altra parte del recinto può sembrare un po 'più verde, ma non è così
garantisce necessariamente di scalare la recinzione, figuriamoci di sottoscrivere una seconda ipoteca.)
Forse ancora più importante, è difficile calcolare l'indice di Gittins al volo.
Se porti in giro una tabella di valori indice puoi ottimizzare la tua cena
scelte, ma il tempo e lo sforzo necessari potrebbero non valerne la pena. ("Aspetta, posso
risolvere questo argomento. Quel ristorante era buono 29 volte su 35, ma quest'altro
uno è stato buono 13 volte su 16, quindi gli indici di Gittins sono ... Ehi, dove
sono andati tutti? ")
Nel tempo trascorso dallo sviluppo dell'indice Gittins, tali preoccupazioni hanno
ha inviato informatici e statistici alla ricerca di soluzioni più semplici e flessibili
strategie per affrontare i banditi multi-armati. Queste strategie sono più facili per
gli esseri umani (e le macchine) da applicare in una serie di situazioni rispetto allo scricchiolio del file
indice di Gittins ottimale, pur fornendo prestazioni relativamente buone. Essi
impegnarsi anche con una delle nostre più grandi paure umane riguardo alle decisioni in merito
quali possibilità cogliere.

Rammarico e ottimismo

Pagina 51

Si rammarica, ne ho avuti alcuni. Ma poi di nuovo, troppo pochi per menzionarli.

—FRANK SINATRA
Per me sono ottimista. Non sembra essere molto utile essere qualcosa
altro.

-WINSTON CHURCHILL
Se l'indice di Gittins è troppo complicato o se non sei in una situazione buona
caratterizzato dallo sconto geometrico, allora hai un'altra opzione: concentrarti su
rimpianto . Quando scegliamo cosa mangiare, con chi trascorrere del tempo o in quale città vivere
in, il rimpianto incombe: presentato con una serie di buone opzioni, è facile torturarlo
noi stessi con le conseguenze di fare la scelta sbagliata. Questi sono rimpianti
spesso delle cose che non siamo riusciti a fare, delle opzioni che non abbiamo mai provato. Nel
parole memorabili del teorico del management Chester Barnard: “Provare e fallire è tutto
almeno per imparare; non riuscire a tentare significa subire la perdita inestimabile di ciò che potrebbe avere
stato. "
Il rimpianto può anche essere molto motivante. Prima che decidesse di iniziare
Amazon.com, Jeff Bezos aveva una posizione sicura e ben pagata nell'investimento
azienda DE Shaw & Co. a New York. Avvio di una libreria online a Seattle
sarebbe stato un grande balzo in avanti, qualcosa che il suo capo (che è DE Shaw) gli aveva consigliato
lui a pensare attentamente. Dice Bezos:

Il quadro che ho trovato, che ha reso la decisione incredibilmente facile, era quello che ho chiamato, che solo a
nerd chiamerebbe "un quadro di minimizzazione del rimpianto". Quindi volevo proiettarmi in avanti per invecchiare
80 e dire: "Ok, ora sto guardando indietro alla mia vita. Voglio ridurre al minimo il numero di rimpianti
Io ho." Sapevo che quando avevo 80 anni non mi sarei pentito di averlo provato. Non stavo per farlo
rimpiango di aver provato a partecipare a questa cosa chiamata Internet che pensavo sarebbe stata davvero grande
affare. Sapevo che se avessi fallito non me ne sarei pentito, ma sapevo che l'unica cosa di cui avrei potuto pentirmi non è mai stato
aver provato. Sapevo che questo mi avrebbe perseguitato ogni giorno, e così, quando ci ho pensato in quel modo, è stato
è stata una decisione incredibilmente facile.

L'informatica non può offrirti una vita senza rimpianti. Ma può, potenzialmente,
offrirti proprio quello che Bezos stava cercando: una vita con il minimo rimpianto.

Pagina 52

Il rimpianto è il risultato del confronto tra ciò che abbiamo effettivamente fatto e ciò che avremmo avuto
stato il migliore con il senno di poi. In un bandito multi-armato, la "perdita inestimabile" di Barnard può
infatti va misurato con precisione, e al rimpianto viene assegnato un numero: è la differenza
tra il payoff totale ottenuto seguendo una particolare strategia e il totale
payoff che teoricamente si sarebbe potuto ottenere semplicemente tirando il braccio migliore
ogni singola volta (se avessimo saputo dall'inizio quale fosse). Noi possiamo
calcola questo numero per strategie diverse e cerca quelle che riducono al minimo
esso.
Nel 1985, Herbert Robbins ha sparato un secondo colpo al bandito multi-armato
problema, una trentina di anni dopo il suo lavoro iniziale su Win-Stay, Lose-Shift. Lui
e il collega matematico della Columbia Tze Leung Lai furono in grado di provarne diversi
punti chiave sul rimpianto. Primo, supponendo che tu non sia onnisciente, l'importo totale
di rimpianto probabilmente non smetterà mai di aumentare, anche se scegli il meglio possibile
strategia, perché anche la migliore strategia non è sempre perfetta. Secondo, rimpianto
aumenterà a un ritmo più lento se scegli la strategia migliore rispetto a se scegli altre;
inoltre, con una buona strategia il tasso di crescita del rimpianto diminuirà
tempo, man mano che impari di più sul problema e sei in grado di fare scelte migliori.
Terzo, e più specificamente, il minimo rimpianto possibile, sempre assumendo
onniscienza: è il rimpianto che aumenta a un ritmo logaritmico con ogni richiamo del
maniglia.
L'aumento logaritmico del rimpianto significa che faremo il maggior numero di errori
i nostri primi dieci tiri come nei novanta successivi, e tanti nel nostro primo anno quanti ne
il resto del decennio combinato. (Gli errori del primo decennio, a loro volta, sono come
molti quanti ne faremo per il resto del secolo.) Questa è una certa misura
consolazione. In generale non possiamo realisticamente aspettarci di non averne mai uno
più rimpianti. Ma se stiamo seguendo un algoritmo che minimizza i rimpianti, ogni anno
possiamo aspettarci di avere meno nuovi rimpianti rispetto all'anno precedente.
A partire da Lai e Robbins, i ricercatori degli ultimi decenni si sono messi in moto
alla ricerca di algoritmi che offrano la garanzia del minimo rimpianto. Di quelli
hanno scoperto, i più popolari sono conosciuti come Upper Confidence Bound
algoritmi.
Le visualizzazioni visive delle statistiche spesso includono le cosiddette barre di errore che si estendono
sopra e sotto qualsiasi punto dati, indicando l'incertezza nella misurazione; il
le barre di errore mostrano l'intervallo di valori plausibili della quantità misurata

Pagina 53

potrebbe effettivamente avere. Questo intervallo è noto come "intervallo di confidenza" e come noi
ottenere più dati su qualcosa che l'intervallo di confidenza si ridurrà, riflettendo un
valutazione sempre più accurata. (Ad esempio, una slot machine che ha pagato
una volta su due pull avrà un intervallo di confidenza più ampio, anche se lo stesso
valore atteso, come una macchina che ha pagato cinque volte su dieci tiri.) In a
problema di banditi multi-armati, dice un algoritmo Upper Confidence Bound, abbastanza
semplicemente, per scegliere l'opzione per cui la parte superiore dell'intervallo di confidenza è più alta.
Come l'indice di Gittins, quindi, gli algoritmi Upper Confidence Bound assegnano
un solo numero per ogni braccio del bandito multibraccio. E quel numero è impostato su
il valore più alto che il braccio potrebbe ragionevolmente avere, in base alle informazioni
disponibile finora. Quindi un algoritmo Upper Confidence Bound non si cura di quale
il braccio si è comportato meglio finora; invece, sceglie il braccio che potrebbe ragionevolmente
dare il meglio in futuro. Se non sei mai stato in un ristorante prima, per
esempio, quindi per quanto ne sai potrebbe essere fantastico. Anche se ci sei andato
una o due volte e hai provato un paio dei loro piatti, potresti non averne abbastanza
informazioni per escludere la possibilità che possa ancora rivelarsi migliore della tua
preferito normale. Come l'indice di Gittins, il limite di fiducia superiore è sempre
maggiore del valore atteso, ma sempre meno man mano che acquisiamo più esperienza
con un'opzione particolare. (Un ristorante con una sola recensione mediocre conserva ancora
un potenziale di grandezza che è assente in un ristorante con centinaia di tali
recensioni.) Le raccomandazioni fornite dagli algoritmi Upper Confidence Bound
saranno simili a quelli forniti dall'indice Gittins, ma lo sono in modo significativo
più facili da calcolare e non richiedono l'assunzione di geometrie
attualizzazione.
Gli algoritmi Upper Confidence Bound implementano un principio che è stato
soprannominato "ottimismo di fronte all'incertezza". L'ottimismo, mostrano, può essere
perfettamente razionale. Concentrandosi sul meglio che un'opzione potrebbe essere, data la
prove ottenute finora, questi algoritmi danno un impulso alle possibilità che conosciamo
meno circa. Di conseguenza, iniettano naturalmente una dose di esplorazione nel file
processo decisionale, saltando a nuove opzioni con entusiasmo perché qualsiasi
uno di loro potrebbe essere la prossima grande novità. Lo stesso principio è stato utilizzato, per
ad esempio, da Leslie Kaelbling del MIT, che costruisce "robot ottimisti" che esplorano
lo spazio intorno a loro aumentando il valore del terreno inesplorato. E chiaramente
ha implicazioni anche per le vite umane.

Pagina 54

Il successo degli algoritmi Upper Confidence Bound offre un formale


giustificazione a beneficio del dubbio. Seguendo il consiglio di questi
algoritmi, dovresti essere entusiasta di incontrare nuove persone e provare nuove cose - a
assumere il meglio di loro, in assenza di prove contrarie. Nel
a lungo termine, l'ottimismo è la migliore prevenzione per il rimpianto.
Banditi online
Nel 2007, il product manager di Google Dan Siroker ha preso un periodo di aspettativa per entrare a far parte del gruppo
la campagna presidenziale dell'allora senatore Barack Obama a Chicago. Intestazione
il team "New Media Analytics", Siroker ha portato uno dei web di Google
pratiche da applicare al pulsante D ONATE rosso acceso della campagna . Il risultato è stato
niente di meno che sorprendente: 57 milioni di dollari di donazioni aggiuntive sono stati raccolti come a
risultato diretto del suo lavoro.
Cosa ha fatto esattamente a quel pulsante?
L'ha testato A / B.
Il test A / B funziona come segue: un'azienda redige diverse versioni di un file
particolare pagina web. Forse provano colori o immagini diversi o diversi
titoli di un articolo di notizie o diverse disposizioni di elementi sullo schermo.
Quindi assegnano casualmente gli utenti in arrivo a queste varie pagine, di solito in
numeri uguali. Un utente può vedere un pulsante rosso, mentre un altro utente può vedere un
quello blu; uno può vedere D ONATE e un altro può vedere C ONTRIBUTE . Il pertinente
le metriche (ad es. percentuale di clic o entrate medie per visitatore) sono
monitorato. Dopo un periodo di tempo, se si osservano effetti statisticamente significativi,
la versione "vincente" è tipicamente bloccata o diventa il controllo per
un altro giro di esperimenti.
Nel caso della pagina delle donazioni di Obama, i test A / B di Siroker erano rivelatori.
Per i visitatori la prima volta al sito della campagna, un D Onate E G ET A G IFT pulsante
si è rivelato essere il migliore interprete, anche dopo il costo dell'invio dei regali
preso in considerazione. Per gli iscritti alla newsletter di lunga data che non avevano mai dato
soldi, P LEASE D ONATE ha funzionato al meglio, forse facendo appello alla loro colpa. Per
visitatori che avevano già donato in passato, C ONTRIBUTE ha funzionato meglio
garantire donazioni di follow-up - la logica è forse che la persona aveva

Pagina 55

già “donato” ma potrebbe sempre “contribuire” di più. E in tutti i casi, al


stupore del team della campagna, una semplice foto in bianco e nero del
La famiglia Obama ha superato qualsiasi altra foto o video che la squadra potesse inventare
con. L'effetto netto di tutte queste ottimizzazioni indipendenti è stato gigantesco.
Se hai praticamente utilizzato Internet negli ultimi dieci anni, allora l'hai fatto
fatto parte del problema di esplorazione / sfruttamento di qualcun altro. Le aziende vogliono
scoprire le cose che rendono loro più soldi contemporaneamente
facendone quanto più possibile: esplorare, sfruttare. Grandi aziende tecnologiche come
Amazon e Google hanno iniziato a eseguire test A / B live sui propri utenti a partire dal
circa 2000, e negli anni successivi Internet è diventato il mondo
più grande esperimento controllato. Cosa stanno esplorando queste aziende e
sfruttando? In una parola, tu: qualunque cosa ti faccia muovere il mouse e
apri il tuo portafoglio.
Le aziende A / B testano la navigazione del loro sito, l'oggetto e la tempistica del loro
e-mail di marketing e talvolta anche le loro effettive caratteristiche e prezzi. Anziché
di "l '" algoritmo di ricerca di Google e "il" flusso di pagamento di Amazon, ci sono
permutazioni ora indicibili e insondabilmente sottili. (Google infamemente testato
quarantuno sfumature di blu per una delle sue barre degli strumenti nel 2009.) In alcuni casi, è
improbabile che qualsiasi coppia di utenti abbia la stessa identica esperienza.
Il data scientist Jeff Hammerbacher, ex manager del gruppo Data presso
Facebook, una volta disse a Bloomberg Businessweek che “le migliori menti del mio
generazione sta pensando a come indurre le persone a fare clic sugli annunci ". Consideralo il
Howl dei millennial - quello di cui è immortale Allen Ginsberg "ho visto le menti migliori
la mia generazione distrutta dalla follia ”era per la Beat Generation.
Il punto di vista di Hammerbacher sulla situazione era che questo stato di cose "fa schifo". Ma
indipendentemente da ciò che se ne fa, il web consente una sperimentazione
scienza del clic che non era mai stata nemmeno sognata
marketing del passato.
Sappiamo cosa è successo a Obama nelle elezioni del 2008, ovviamente. Ma cosa
è successo al suo direttore dell'analisi, Dan Siroker? Dopo l'inaugurazione,
Siroker è tornato a ovest, in California, e con il collega googler Pete Koomen co-
ha fondato la società di ottimizzazione di siti Web Optimizely. Entro il 2012 presidenziale
ciclo elettorale, la loro azienda annovera tra i suoi clienti sia il presidente Obama
campagna elettorale e campagna dello sfidante repubblicano Mitt Romney.

Pagina 56

Entro un decennio circa dopo il suo primo utilizzo provvisorio, il test A / B non era più a
arma segreta. È diventato una parte così profondamente radicata nel modo in cui il business e
la politica è condotta online in modo da essere effettivamente data per scontata. La prossima volta
apri il browser, puoi essere sicuro che i colori, le immagini, il testo, forse
anche i prezzi che vedi, e certamente gli annunci, provengono da un
esplora / sfrutta l'algoritmo, sintonizzandosi sui tuoi clic. In questo particolare multi-
problema bandito armato, non sei il giocatore d'azzardo; sei il jackpot.
Il processo di test A / B stesso è diventato sempre più raffinato nel tempo.
La configurazione A / B più canonica, che suddivide il traffico in modo uniforme tra due opzioni,
eseguire il test per un determinato periodo di tempo e successivamente inviare tutto il traffico a
vincitore: potrebbe non essere necessariamente il miglior algoritmo per risolvere il problema,
poiché significa che metà degli utenti è bloccata nell'ottenere l'opzione inferiore fintanto che il file
il test continua. E le ricompense per trovare un approccio migliore sono potenzialmente molto
alto. Oltre il 90% dei circa $ 50 miliardi di entrate annuali di Google
attualmente proviene dalla pubblicità a pagamento e comprende il commercio online
centinaia di miliardi di dollari all'anno. Ciò significa che esplora / sfrutta gli algoritmi
effettivamente alimenta, sia economicamente che tecnologicamente, una frazione significativa
di Internet stesso. I migliori algoritmi da utilizzare rimangono fortemente contestati, con
statistici rivali, ingegneri e blogger che combattono all'infinito sull'ottimale
modo per bilanciare esplorazione e sfruttamento in ogni possibile scenario aziendale.
Discutere le precise distinzioni tra le varie interpretazioni dell'esplorazione / exploit
il problema può sembrare irrimediabilmente arcano. In effetti, queste distinzioni risultano
importa immensamente, e non si tratta solo di elezioni presidenziali e Internet
economia che sono in gioco.
Sono anche vite umane.

Sperimentazioni cliniche in prova


Tra il 1932 e il 1972, diverse centinaia di uomini afroamericani con la sifilide
nella contea di Macon, in Alabama, non sono stati curati deliberatamente dai medici
professionisti, come parte di un esperimento quarantennale del Servizio Sanitario Pubblico statunitense
noto come Tuskegee Syphilis Study. Nel 1966, dipendente del servizio sanitario pubblico
Peter Buxtun ha presentato una protesta. Ha presentato una seconda protesta nel 1968. Ma non è stato così

Pagina 57
fino a quando non ha divulgato l'articolo alla stampa: è apparso sul Washington Star a luglio
25, 1972, e il giorno dopo era l'articolo in prima pagina sul New York Times - quello
il governo degli Stati Uniti ha infine interrotto lo studio.
Ciò che è seguito alla protesta pubblica e alla successiva udienza del Congresso,
è stata un'iniziativa per formalizzare i principi e gli standard dell'etica medica. UN
commissione tenutasi presso il Pastoral Belmont Conference Center nel Maryland
risultò in un documento del 1979 noto come Rapporto Belmont. Il rapporto Belmont
stabilisce una base per la pratica etica degli esperimenti medici, in modo che il
Esperimento di Tuskegee: una violazione egregia e inequivocabilmente inappropriata del
il dovere della professione sanitaria nei confronti dei suoi pazienti potrebbe non ripetersi mai. Ma anche
rileva la difficoltà, in molti altri casi, di determinare esattamente dove si trova la linea
dovrebbe essere disegnato.
“La massima ippocratica 'non nuocere' è stata a lungo un principio fondamentale
di etica medica ", sottolinea il rapporto. “[Il fisiologo] Claude Bernard
lo estese al regno della ricerca, dicendo che non si dovrebbe ferire una persona
indipendentemente dai vantaggi che potrebbero derivarne agli altri. Tuttavia, anche evitando
il danno richiede l'apprendimento di ciò che è dannoso; e, nel processo di ottenimento di questo
informazioni, le persone possono essere esposte al rischio di danni. "
Il Rapporto Belmont riconosce quindi, ma non risolve, la tensione che questo
esiste tra agire in base alle proprie migliori conoscenze e raccogliere di più. Anche
rende chiaro che la raccolta di conoscenze può essere così preziosa che alcuni aspetti di
la normale etica medica può essere sospesa. Test clinici di nuovi farmaci e
trattamenti, osserva il rapporto, spesso richiedono il rischio di danni ad alcuni pazienti, anche se
vengono prese misure per ridurre al minimo tale rischio.

Il principio di beneficenza non è sempre così univoco. Rimane un difficile problema etico, per
esempio, sulla ricerca [sulle malattie infantili] che presenta un rischio più che minimo senza
prospettiva immediata di beneficio diretto per i bambini coinvolti. Alcuni hanno sostenuto che tale ricerca è
inammissibile, mentre altri hanno sottolineato che questo limite escluderebbe molte ricerche promettenti
grande vantaggio per i bambini in futuro. Anche in questo caso, come in tutti i casi difficili, sono state coperte le diverse richieste
dal principio di beneficenza può entrare in conflitto e costringere a scelte difficili.

Una delle domande fondamentali sorte nei decenni successivi al


Belmont Report è se l'approccio standard alla conduzione di studi clinici

Pagina 58

minimizza davvero il rischio per i pazienti. In uno studio clinico convenzionale, i pazienti lo sono
diviso in gruppi e ogni gruppo è assegnato a ricevere un trattamento diverso per
la durata dello studio. (Solo in casi eccezionali un processo viene interrotto
presto.) Questa procedura si concentra sulla risoluzione decisiva della questione
il trattamento è migliore, piuttosto che fornire il miglior trattamento a ciascun paziente in
il processo stesso. In questo modo funziona esattamente come il test A / B di un sito web, con a
certa frazione di persone che ricevono un'esperienza durante l'esperimento che lo farà
alla fine essere dimostrato inferiore. Ma i medici, come le aziende tecnologiche, stanno guadagnando
alcune informazioni su quale opzione è migliore durante il processo -
informazioni che potrebbero essere utilizzate per migliorare i risultati non solo per i futuri pazienti
oltre il processo, ma per i pazienti attualmente coinvolti.
Milioni di dollari sono in gioco negli esperimenti per trovare l'ottimale
configurazione di un sito web, ma in studi clinici, sperimentando per trovare ottimale
i trattamenti hanno conseguenze dirette sulla vita o sulla morte. E una comunità in crescita di
medici e statistici pensano che stiamo sbagliando: che dovremmo essere
trattare la selezione dei trattamenti come un problema di banditi multi-armati e provare
per ottenere i trattamenti migliori alle persone anche mentre è in corso un esperimento.
Nel 1969 Marvin Zelen, un biostatistico che ora è ad Harvard, propose
condurre prove "adattive". Una delle idee che ha suggerito era casuale
Algoritmo "gioca il vincitore", una versione di Win-Stay, Lose-Shift, in cui il
la possibilità di utilizzare un determinato trattamento aumenta di ogni vittoria e diminuisce di
ogni perdita. Nella procedura di Zelen, inizi con un cappello che contiene una palla per
ciascuna delle due opzioni di trattamento studiate. Il trattamento per il primo
il paziente viene selezionato estraendo una palla a caso dal cappello (la palla viene rimessa
in seguito). Se il trattamento scelto ha successo, metti un'altra palla per quello
trattamento nel cappello: ora hai tre palle, due delle quali sono per il
trattamento di successo. Se fallisce, metti un'altra palla per l' altro trattamento
nel cappello, rendendo più probabile che sceglierai l'alternativa.
L'algoritmo di Zelen è stato utilizzato per la prima volta in uno studio clinico sedici anni dopo, per a
studio dell'ossigenazione extracorporea della membrana, o "ECMO", un audace
approccio al trattamento dell'insufficienza respiratoria nei neonati. Sviluppato negli anni '70 da
Robert Bartlett dell'Università del Michigan, ECMO prende il sangue che sta dirigendo
per i polmoni e lo indirizza invece fuori dal corpo, dove viene ossigenato da a
macchina e tornato al cuore. È una misura drastica, con rischi propri

Pagina 59

(inclusa la possibilità di embolia), ma offriva un possibile approccio in


situazioni in cui non rimanevano altre opzioni. Nel 1975 ECMO ha salvato la vita a un
neonata a Orange County, California, per la quale nemmeno un ventilatore era
fornire abbastanza ossigeno. Quella ragazza ha ormai festeggiato il suo quarantesimo compleanno e
è sposata con figli suoi. Ma nei suoi primi giorni la tecnologia ECMO
e la procedura sono stati considerati altamente sperimentali e primi studi negli adulti
non ha mostrato alcun beneficio rispetto ai trattamenti convenzionali.
Dal 1982 al 1984, Bartlett e i suoi colleghi dell'Università del Michigan
ha eseguito uno studio su neonati con insufficienza respiratoria. Il team lo ha detto chiaramente
volevano affrontare, come dicevano, “la questione etica del trattenere un
trattamento non provato ma potenzialmente salvavita "ed erano" riluttanti a rifiutare a
trattamento salvavita da pazienti alternativi semplicemente per soddisfare i convenzionali random
tecnica di assegnazione. " Quindi si sono rivolti all'algoritmo di Zelen. La strategia
ha portato un bambino a ricevere il trattamento "convenzionale" e a morire,
e undici bambini di fila a cui è stato assegnato il trattamento ECMO sperimentale,
tutti loro sopravvivono. Tra aprile e novembre 1984, dopo la fine del
studio ufficiale, altri dieci neonati soddisfacevano i criteri per il trattamento ECMO. Otto
sono stati trattati con ECMO e tutti e otto sono sopravvissuti. Due sono stati trattati
convenzionalmente, ed entrambi sono morti.
Questi sono numeri accattivanti, ma poco dopo l'Università del Michigan
Lo studio sull'ECMO è stato completato ed è diventato oggetto di controversie. Avendo così pochi
i pazienti in uno studio ricevono il trattamento convenzionale deviato in modo significativo da
metodologia standard e la procedura stessa era altamente invasiva e
potenzialmente rischioso. Dopo la pubblicazione dell'articolo, Jim Ware, professore di
biostatistica alla Harvard School of Public Health e ai suoi colleghi medici
ha esaminato attentamente i dati e ha concluso che “non giustificavano l'uso di routine
di ECMO senza ulteriori studi. " Così Ware e i suoi colleghi ne hanno progettato un secondo
sperimentazione clinica, cercando ancora di bilanciare l'acquisizione di conoscenze con il
trattamento efficace dei pazienti ma utilizzando un design meno radicale. Loro dovrebbero
assegnare in modo casuale i pazienti all'ECMO o al trattamento convenzionale fino a quando a
numero prespecificato di decessi è stato osservato in uno dei gruppi. Allora loro
sposterebbe tutti i pazienti nello studio al trattamento più efficace del
Due.
Nella prima fase dello studio di Ware, quattro dei dieci bambini in trattamento convenzionale

Pagina 60

il trattamento è morto e tutti i nove dei nove bambini che hanno ricevuto l'ECMO sono sopravvissuti. Il quattro
sono bastati i morti per innescare un passaggio alla seconda fase, dove tutti e venti
i pazienti sono stati trattati con ECMO e diciannove sono sopravvissuti. Ware e colleghi
erano convinti, concludendo che “è difficile difendere un'ulteriore randomizzazione
eticamente."
Ma alcuni l'avevano già concluso prima dello studio Ware, e si erano espressi
a proposito. I critici includevano Don Berry, uno dei massimi esperti mondiali in materia
banditi multi-armati. In un commento che è stato pubblicato insieme allo studio Ware
in Statistical Science , Berry ha scritto che "randomizzare i pazienti a non-ECMO
la terapia come nello studio Ware non era etica ... A mio avviso, lo studio Ware
non avrebbe dovuto essere condotto. "
Eppure anche lo studio Ware non è stato conclusivo per tutti in campo medico
Comunità. Negli anni '90 è stato condotto un altro studio sull'ECMO, con l'iscrizione
quasi duecento neonati nel Regno Unito. Invece di usare adattivo
algoritmi, questo studio ha seguito i metodi tradizionali, dividendo i bambini
casualmente in due gruppi uguali. I ricercatori hanno giustificato l'esperimento
dicendo che l'utilità di ECMO “è controversa a causa della variazione
interpretazione delle prove disponibili. " Come si è scoperto, la differenza tra
i trattamenti non erano così pronunciati nel Regno Unito come lo erano stati nel
due studi americani, ma i risultati sono stati comunque dichiarati “in accordo con
i primi risultati preliminari che una politica di supporto ECMO riduce il rischio
di morte." Il costo di quella conoscenza? Altri ventiquattro bambini morirono nel
Gruppo "convenzionale" rispetto al gruppo che riceve il trattamento ECMO.
La diffusa difficoltà nell'accettare i risultati di studi clinici adattativi
potrebbe sembrare incomprensibile. Ma considera quella parte di ciò di cui l'avvento
la statistica fatta per la medicina, all'inizio del ventesimo secolo, doveva trasformarsi
da un campo in cui i medici dovevano persuadersi a vicenda in modi ad hoc
ogni nuovo trattamento in uno in cui avevano linee guida chiare su che tipo di
le prove erano e non erano persuasive. Modifiche alle statistiche standard accettate
la pratica ha il potenziale per sconvolgere questo equilibrio, almeno temporaneamente.
Dopo la polemica sull'ECMO, Don Berry è passato dalle statistiche
dipartimento dell'Università del Minnesota al MD Anderson Cancer Center di
Houston, dove ha utilizzato metodi sviluppati studiando banditi multi-armati
progettare studi clinici per una varietà di trattamenti contro il cancro. Mentre lui rimane uno

Pagina 61

dei critici più accesi di studi clinici randomizzati, non è affatto l'unico
uno. Negli ultimi anni, le idee per cui ha lottato stanno finalmente cominciando
entrare nel mainstream. Nel febbraio 2010, la FDA ha rilasciato una "guida"
documento, "Prove cliniche di progettazione adattiva per farmaci e prodotti biologici", che
suggerisce, nonostante una lunga storia di attenzioni a un'opzione di cui si fidano, che loro
potrebbe finalmente essere disposto a esplorare alternative.

Il mondo inquieto
Una volta acquisita familiarità con loro, è facile vedere solo banditi con più armi
ovunque ci voltiamo. È raro che prendiamo una decisione isolata, dove il file
il risultato non ci fornisce alcuna informazione che utilizzeremo per crearne altri
decisioni future. Quindi è naturale chiedersi, come abbiamo fatto con l'arresto ottimale,
quanto bene le persone generalmente tendono a risolvere questi problemi - una domanda che ha
stato ampiamente esplorato in laboratorio da psicologi e comportamentali
economisti.
In generale, sembra che le persone tendano a esplorare troppo, per favorire il nuovo
sproporzionatamente rispetto ai migliori. In una semplice dimostrazione di questo fenomeno,
pubblicato nel 1966, Amos Tversky e Ward Edwards condussero esperimenti
dove alle persone veniva mostrata una scatola con due luci su di essa e veniva detto che ogni luce
attiverebbe una percentuale fissa (ma sconosciuta) del tempo. Allora lo erano
ha dato 1.000 opportunità di osservare quale luce si accendeva o di piazzare una scommessa
sul risultato senza arrivare ad osservarlo. (A differenza di un bandito più tradizionale
configurazione del problema, qui non si poteva fare un "pull" che fosse sia scommessa che
osservazione in una volta; i partecipanti non avrebbero saputo se le loro scommesse erano state ripagate
fino alla fine.) Questa è pura esplorazione contro sfruttamento, contrapponendola al guadagno
informazioni contro il loro utilizzo. Per la maggior parte, le persone hanno adottato un file
strategia sensata di osservare per un po ', quindi scommettere su ciò che sembrava
il miglior risultato, ma hanno costantemente dedicato molto più tempo all'osservazione di
dovrebbero avere. Quanto tempo ancora? In un esperimento si è accesa una luce
Il 60% delle volte e il restante 40% delle volte, una differenza né particolarmente
palese né particolarmente sottile. In quel caso, le persone hanno scelto di osservare 505 volte,
in media, piazzando le altre scommesse 495 volte. Ma la matematica dice che avrebbero dovuto

Pagina 62

ha iniziato a scommettere dopo appena 38 osservazioni, lasciando 962 possibilità di incassare.


Altri studi hanno prodotto conclusioni simili. Negli anni '90, Robert Meyer
e Yong Shi, i ricercatori di Wharton, hanno condotto uno studio in cui alle persone veniva data una
scelta tra due opzioni, una con una probabilità di vincita nota e una sconosciuta
—Specificamente due compagnie aeree, un vettore affermato con un tasso di puntualità noto e
una nuova azienda senza ancora un track record. Dato l'obiettivo di massimizzare il
numero di arrivi puntuali in un certo periodo di tempo, matematicamente ottimale
La strategia è quella di volare inizialmente solo con la nuova compagnia aerea, a condizione che quella stabilita non lo sia
chiaramente meglio. Se in qualsiasi momento è evidente che il noto vettore è migliore -
ovvero, se l'indice di Gittins della nuova opzione scende al di sotto del tasso di puntualità di
portatore familiare, allora dovresti passare a quello familiare e non guardare mai
indietro. (Poiché in questa configurazione non è possibile ottenere ulteriori informazioni sul nuovo
una volta che smetti di volare, non c'è alcuna possibilità che si riscatti.)
Ma nell'esperimento, le persone tendevano a usare troppo poco la compagnia aerea non provata quando lo faceva
era buono e troppo quando era cattivo. Inoltre non hanno fatto pause nette
lontano da esso, spesso continuando ad alternarsi, in particolare quando nessuna delle due compagnie aeree lo era
in partenza in tempo. Tutto ciò è coerente con la tendenza a sovra-esplorare.
Infine, gli psicologi Mark Steyvers, Michael Lee e E.-J. Wagenmakers
hanno condotto un esperimento con un bandito a quattro braccia, chiedendo a un gruppo di persone di farlo
scegli quale braccio giocare in una sequenza di quindici opportunità. Allora
ha classificato le strategie che i partecipanti sembravano utilizzare. I risultati suggerivano
che il 30% era il più vicino alla strategia ottimale, il 47% somigliava di più a Win-Stay,
Lose-Shift, e il 22% sembrava muoversi a caso tra la selezione di un nuovo braccio
e suonare il miglior braccio trovato finora. Ancora una volta, questo è coerente con
esplorare, come sono Win-Stay, Lose-Shift e occasionalmente provare un braccio a caso
entrambi porteranno le persone a provare cose diverse dall'opzione migliore alla fine del
gioco, quando dovrebbero essere puramente sfruttando.
Quindi, anche se tendiamo a impegnarci troppo presto con una nuova segretaria, sembra che siamo noi
tendono a smettere di provare nuove compagnie aeree troppo tardi. Ma proprio come non avere un file
segretaria, impegnarsi troppo presto per una particolare compagnia aerea: il mondo ha un costo
potrebbe cambiare.
Il problema standard dei banditi multi-armati presuppone che le probabilità con
che le armi ripagano si fissano nel tempo. Ma questo non è necessariamente vero
compagnie aeree, ristoranti o altri contesti in cui le persone devono fare ripetizioni

Pagina 63

scelte. Se le probabilità di un guadagno sui diversi bracci cambiano nel tempo—


quello che è stato definito un "bandito irrequieto" - il problema diventa molto più difficile.
(Tanto più difficile, infatti, che non esiste un algoritmo trattabile per completamente
risolverlo, e si crede che non ci sarà mai). Parte di questa difficoltà è che lo è
non è più solo questione di esplorare per un po 'e poi sfruttare: quando il
il mondo può cambiare, continuare ad esplorare può essere la scelta giusta. Può essere
vale la pena tornare in quel ristorante deludente che non visiti da pochi
anni, nel caso sia sotto una nuova gestione.
Nel suo celebre saggio "Walking", Henry David Thoreau ha riflettuto su come lui
preferiva viaggiare vicino a casa, come non si stancava mai del suo
dintorni e ho sempre trovato qualcosa di nuovo o sorprendente in
Paesaggio del Massachusetts. “C'è infatti una sorta di armonia rilevabile
tra le capacità del paesaggio entro un cerchio di un raggio di dieci miglia, o
i limiti di una passeggiata pomeridiana, e i sessant'anni e dieci di vita umana ",
ha scritto. "Non ti diventerà mai abbastanza familiare."
Vivere in un mondo inquieto richiede una certa irrequietezza in se stessi. Così lungo
mentre le cose continuano a cambiare, non devi mai smettere completamente di esplorare.
Tuttavia, le tecniche algoritmiche perfezionate per la versione standard del multi-
I problemi dei banditi armati sono utili anche in un mondo inquieto. Strategie come il
L'indice di Gittins e il limite superiore di fiducia forniscono ragionevolmente buoni
soluzioni approssimative e regole pratiche, in particolare se i guadagni non cambiano
molto nel tempo. E molti dei guadagni del mondo sono probabilmente più statici
oggi di quanto non lo siano mai stati. Una macchia di bacche potrebbe essere matura per una settimana e marcia
il prossimo, ma come ha detto Andy Warhol, "A Coke is a Coke." Avere gli istinti sintonizzati
dall'evoluzione per un mondo in costante mutamento non è necessariamente utile in un'era di
standardizzazione industriale.
Forse la cosa più importante, pensando alle versioni del bandito multi-armato
problema che ha soluzioni ottimali non offre solo algoritmi, ma anche
offre approfondimenti. Il vocabolario concettuale derivato dalla forma classica di
problema - la tensione di esplorare / sfruttare, l'importanza dell'intervallo, l'alto
valore dell'opzione 0-0, la minimizzazione del rimpianto, ci offre un nuovo modo di
dare un senso non solo ai problemi specifici che ci stanno di fronte, ma all'intero
arco della vita umana.
Pagina 64

Esplorare …
Mentre gli studi di laboratorio possono essere illuminanti, l'intervallo di molti dei più
i problemi importanti che le persone devono affrontare sono troppo lunghi per essere studiati in laboratorio. Apprendimento
la struttura del mondo che ci circonda e la formazione di relazioni sociali durature sono
entrambi i compiti per tutta la vita. Quindi è istruttivo vedere come il modello generale dei primi
l'esplorazione e lo sfruttamento tardivo appaiono nel corso di una vita.
Una delle cose curiose degli esseri umani, che qualsiasi sviluppo
lo psicologo aspira a capire e spiegare, è che ci vogliono anni per diventare
competente e autonomo. Caribù e gazzelle devono essere preparati a scappare
predatori il giorno in cui nascono, ma gli esseri umani impiegano più di un anno per crearli
primi passi. Alison Gopnik, professore di psicologia dello sviluppo presso l'UC
Berkeley e autore di The Scientist in the Crib , ha una spiegazione del perché
gli esseri umani hanno un periodo di dipendenza così lungo: “ti dà a
modo evolutivo di risolvere il compromesso tra esplorazione e sfruttamento. " Come abbiamo
visto, buoni algoritmi per suonare banditi multi-armati tendono a esplorare di più
all'inizio, sfruttando la conoscenza risultante in seguito. Ma come sottolinea Gopnik, "il
lo svantaggio di ciò è che non si ottengono buoni guadagni quando si è in
fase di esplorazione. " Da qui l'infanzia: “L'infanzia ti regala un periodo in cui
puoi semplicemente esplorare le possibilità e non devi preoccuparti dei guadagni
perché i guadagni sono curati dalle mamme, dai papà e dai
le nonne e le babysitter. "
Pensare ai bambini come semplicemente allo stadio di esplorazione transitoria di
un algoritmo permanente potrebbe fornire un certo conforto ai genitori dei bambini in età prescolare.
(Tom ha due figlie in età prescolare altamente esplorative, e spera che lo siano
seguendo un algoritmo che ha il minimo rimpianto). Ma fornisce anche nuove
intuizioni sulla razionalità dei bambini. Gopnik sottolinea che "se guardi
la storia del modo in cui le persone hanno pensato ai bambini, l'hanno fatta
tipicamente sostenuto che i bambini sono cognitivamente carenti in vari modi, perché
se guardi alle loro capacità di exploit, sembrano terribili. Non possono legare il loro
scarpe, non sono brave a pianificare a lungo termine, non sono brave a concentrarsi
Attenzione. Queste sono tutte cose in cui i bambini sono davvero orribili. " Ma premendo i pulsanti
a caso, essendo molto interessato ai nuovi giocattoli e saltandone rapidamente uno
cosa per un'altra sono tutte cose in cui i bambini sono davvero bravi. E quelli sono esattamente

Pagina 65

cosa dovrebbero fare se il loro obiettivo è l'esplorazione. Se sei un bambino, mettere


ogni oggetto della casa nella tua bocca è come tirare diligentemente tutto il
maniglie al casinò.
Più in generale, le nostre intuizioni sulla razionalità sono troppo spesso informate da
sfruttamento piuttosto che esplorazione. Quando parliamo di processo decisionale, noi
di solito si concentra solo sul risultato immediato di una singola decisione e se si tratta
ogni decisione come se fosse l'ultima, allora davvero solo lo sfruttamento ha un senso.
Ma nel corso della vita, prenderai molte decisioni. Ed è in realtà
razionale per enfatizzare l'esplorazione: il nuovo piuttosto che il migliore, l'eccitante
piuttosto che la cassaforte, il casuale piuttosto che il considerato, per molti di loro
scelte, soprattutto all'inizio della vita.
Quello che consideriamo il capriccio dei bambini potrebbe essere più saggio di quanto sappiamo.
... E sfruttare
Avevo raggiunto un momento della mia vita di lettura familiare a coloro che
ci sono stato: nel tempo che mi è stato assegnato sulla terra, dovrei leggere di più
e ancora libri nuovi, o dovrei smetterla con quel consumo vano - vano
perché è infinito e comincio a rileggere quei libri che mi aveva dato
il piacere più intenso del mio passato.

—LYDIA DAVIS
All'altro estremo dei bambini piccoli abbiamo gli anziani. E pensando
anche l'invecchiamento dal punto di vista del dilemma esplorare / sfruttare ne fornisce alcuni
intuizioni sorprendenti su come dovremmo aspettarci che le nostre vite cambino col passare del tempo
sopra.
Laura Carstensen, professoressa di psicologia a Stanford, ha trascorso la sua carriera
sfidando i nostri preconcetti sull'invecchiamento. In particolare, l'ha fatto
ha studiato esattamente come e perché le relazioni sociali delle persone cambiano man mano che esse
età. Il modello di base è chiaro: la dimensione dei social network delle persone (ovvero, il file
numero di relazioni sociali in cui si impegnano) diminuisce quasi invariabilmente
tempo. Ma la ricerca di Carstensen ha trasformato il modo in cui dovremmo pensarci

Pagina 66

fenomeno.
La spiegazione tradizionale per gli anziani che hanno reti sociali più piccole è
che è solo un esempio della diminuzione della qualità della vita che deriva dall'invecchiamento
—Il risultato di una minore capacità di contribuire alle relazioni sociali, maggiore
fragilità e disimpegno generale dalla società. Ma Carstensen ha sostenuto
che, infatti, gli anziani hanno meno relazioni sociali per scelta. Come dice lei,
queste diminuzioni sono “il risultato di processi di selezione permanente attraverso i quali le persone
coltivare strategicamente e in modo adattivo i propri social network per massimizzare il social
e guadagni emotivi e ridurre al minimo i rischi sociali ed emotivi ".
Ciò che Carstensen e i suoi colleghi hanno scoperto è che il restringimento del sociale
reti con l'invecchiamento è dovuto principalmente a relazioni periferiche "potatura" e
concentrare l'attenzione invece su un nucleo di amici intimi e familiari. Questo
processo sembra essere una scelta deliberata: quando le persone si avvicinano alla fine del loro
vite, vogliono concentrarsi maggiormente sulle connessioni più significative.
In un esperimento che verificava questa ipotesi, Carstensen e il suo collaboratore
Barbara Fredrickson ha chiesto alle persone di scegliere chi preferirebbero spendere trenta
minuti con: un parente stretto, l'autore di un libro che avevano recentemente
leggere, o qualcuno che avevano incontrato di recente che sembrava condividere i loro interessi.
Le persone anziane preferivano il membro della famiglia; i giovani erano altrettanto entusiasti
incontrare l'autore o fare un nuovo amico. Ma in una svolta critica, se i giovani
è stato chiesto loro di immaginare che stessero per trasferirsi attraverso il paese, loro
preferivo anche il familiare. In un altro studio, Carstensen e lei
i colleghi hanno trovato lo stesso risultato anche nell'altra direzione: se le persone anziane
è stato chiesto di immaginare che una svolta medica avrebbe permesso loro di vivere
vent'anni in più, le loro preferenze divennero indistinguibili da quelle di
giovani. Il punto è che queste differenze nella preferenza sociale non lo sono
sull'età in quanto tale - riguardano dove le persone si percepiscono di essere sul
intervallo rilevante per la loro decisione.
Essere sensibili a quanto tempo ti rimane è esattamente ciò che il computer
suggerisce la scienza del dilemma esplora / sfrutta. Pensiamo ai giovani come
stereotipicamente volubile; il vecchio, stereotipato nei loro modi. In effetti, lo sono entrambi
comportarsi in modo completamente appropriato rispetto ai loro intervalli. Il deliberato
l'affinamento di un social network fino alle relazioni più significative è il
risposta razionale per avere meno tempo per goderseli.

Pagina 67

Riconoscere che la vecchiaia è un periodo di sfruttamento aiuta a fornire nuovo


prospettive su alcuni dei classici fenomeni di invecchiamento. Ad esempio, while
andare al college: un nuovo ambiente sociale pieno di persone che non hai incontrato
—È tipicamente un periodo positivo ed emozionante, andare in una casa di riposo — un nuovo
l'ambiente sociale pieno di persone che non hai incontrato può essere doloroso. E quello
la differenza è in parte il risultato di dove siamo nel continuum esplorare / sfruttare
in quelle fasi della nostra vita.
Il compromesso esplorare / sfruttare ci dice anche come pensare ai consigli del nostro
anziani. Quando tuo nonno ti dice quali ristoranti sono buoni, dovresti farlo
ascolta: queste sono perle raccolte da decenni di ricerche. Ma quando lui solo
va nello stesso ristorante alle 17:00 tutti i giorni, dovresti sentirti libero
esplora altre opzioni, anche se probabilmente saranno peggiori.
Forse l'intuizione più profonda che deriva dal pensare alla vita futura come a
la possibilità di sfruttare le conoscenze acquisite in decenni è questa: la vita dovrebbe migliorare
col tempo. Ciò che un esploratore scambia con la conoscenza è il piacere. I Gittins
index e Upper Confidence Bound, come abbiamo visto, aumentano l'attrattiva di
opzioni meno conosciute oltre a quanto effettivamente ci aspettiamo, visto che piacevoli sorprese
può ripagare molte volte. Ma allo stesso tempo, questo significa che l'esplorazione
porta necessariamente ad essere deluso nella maggior parte delle occasioni. Spostando il grosso di uno
l'attenzione alle proprie cose preferite dovrebbe aumentare la qualità della vita. E sembra
così: Carstensen ha scoperto che le persone anziane sono generalmente più soddisfatte
con i loro social network e spesso riportano livelli di benessere emotivo che
sono superiori a quelle dei giovani adulti.
Quindi c'è molto da aspettarsi in quel ristorante del tardo pomeriggio
regolare, assaporando i frutti delle esplorazioni di una vita.

Pagina 68
3 Ordinamento
Fare ordine

Ora, se la parola che desideri trovare, inizia con (a) allora


guarda all'inizio di questa tabella, ma se con (v) guarda verso la fine.
Againe, se la tua parola inizia con (ca) looke all'inizio della lettera (c)
ma se con (cu) allora guarda verso la fine di quella lettera. E così di tutti i
riposo. & c.
—ROBERT CAWDREY, UN ALFABETICO DA TAVOLA (1604)

Prima che Danny Hillis fondasse la società Thinking Machines, prima di lui
ha inventato il famoso supercomputer parallelo Connection Machine, era un
Studente del MIT, che vive nel dormitorio studentesco e inorridito dal suo
calzini del compagno di stanza.
Ciò che terrorizzava Hillis, a differenza di molti studenti universitari, non era suo
igiene del compagno di stanza. Non era che il compagno di stanza non avesse lavato i calzini; lui ha fatto.
Il problema era quello che veniva dopo.
Il coinquilino ha tirato fuori un calzino dal cesto della biancheria pulita. Poi ha tirato
un altro calzino a caso. Se non corrispondeva al primo, lo rigettava dentro.
Quindi ha continuato questo processo, tirando fuori i calzini uno per uno e gettandoli
indietro finché non ha trovato una corrispondenza per il primo.
Con solo 10 diverse paia di calzini, seguirai questo metodo
in media 19 pull solo per completare la prima coppia e altri 17 pull per completare
il secondo. In totale, il coinquilino può aspettarsi di andare a pescare nella cesta 110
volte solo per accoppiare 20 calzini.
Era abbastanza per fare in modo che qualsiasi scienziato informatico in erba richiedesse una stanza

Pagina 69

trasferimento.
Ora, come dovrebbero essere ordinati i calzini è un buon modo per ottenere scienziati informatici
parlando a una lunghezza sorprendente. Una domanda sui calzini inserita nella programmazione
sito web Stack Overflow nel 2013 ha richiesto circa dodicimila parole di
discussione.
"I calzini mi confondono!" ha confessato il leggendario crittografo e Turing
Il pluripremiato scienziato informatico Ron Rivest a noi due quando abbiamo portato
argomento.
All'epoca indossava sandali.
Pagina 70

L'estasi dello smistamento


L'ordinamento è al centro di ciò che fanno i computer. In effetti, in molti modi lo era
ordinamento che ha dato vita al computer.
Alla fine del XIX secolo, la popolazione americana cresceva del 30%
ogni decennio, e il numero di "soggetti di indagine" nel censimento degli Stati Uniti aveva
passati da appena cinque nel 1870 a più di duecento nel 1880. La tabulazione di
il censimento del 1880 impiegò otto anni, appena terminato nel 1890
iniziò il censimento. Come disse uno scrittore all'epoca, era una meraviglia “gli impiegati chi
ha lavorato duramente per gli irritanti foglietti di carta ... non è diventato cieco e pazzo. " Il
l'intera impresa minacciava di crollare sotto il suo stesso peso. Qualcosa
doveva essere fatto.
Ispirato ai biglietti ferroviari perforati dell'epoca, un inventore di nome
di Herman Hollerith ha ideato un sistema di carte manila perforate da conservare
informazioni e una macchina, che ha chiamato la macchina di Hollerith, per contare e
ordinarli. Hollerith ottenne un brevetto nel 1889 e il governo lo adottò
la macchina Hollerith per il censimento del 1890. Nessuno aveva mai visto niente di simile
esso. Ha scritto un osservatore sbalordito: "L'apparato funziona in modo infallibile come il
mulini degli dei, ma li batte a vuoto come velocità. " Un altro, tuttavia,
ragionò che l'invenzione era di utilità limitata: “Poiché nessuno la userà mai ma
governi, l'inventore probabilmente non diventerà molto ricco ". Questa previsione, quale
Hollerith ritagliato e salvato, non si sarebbe rivelato del tutto corretto. L'azienda di Hollerith
si è fusa con molti altri nel 1911 per diventare il Computing-Tabulating-
Società di registrazione. Pochi anni dopo è stato ribattezzato: International
Business Machines o IBM.
L'ordinamento ha continuato a stimolare lo sviluppo del computer attraverso il successivo
secolo. Il primo codice mai scritto per un computer "programma memorizzato" è stato un file
programma per uno smistamento efficiente. In effetti, era la capacità del computer di esternalizzare
Le macchine per lo smistamento delle carte dedicate di IBM che hanno convinto il governo degli Stati Uniti
un enorme investimento finanziario in una macchina di uso generale era giustificato. Di
Negli anni '60, uno studio ha stimato che più di un quarto dei computer
risorse del mondo venivano spese per lo smistamento. E non c'è da stupirsi: lo smistamento lo è
Pagina 71

essenziale per lavorare con quasi ogni tipo di informazione. Che si tratti di trovare
il più grande o il più piccolo, il più comune o il più raro, conteggio, indicizzazione,
contrassegnare i duplicati o semplicemente cercare la cosa che desideri, tutti
generalmente iniziano sotto il cofano con una sorta.
Ma l'ordinamento è anche più pervasivo di così. Dopotutto, uno dei principali
le ragioni per cui le cose si sistemano devono essere mostrate in una forma utile agli occhi umani, che
significa che l'ordinamento è anche la chiave per l'esperienza umana delle informazioni. smistato
le liste sono così onnipresenti che, come il pesce che chiede: "Che cos'è l'acqua?", dobbiamo
lavorare consapevolmente per percepirli affatto. E poi li percepiamo
ovunque.
La nostra casella di posta elettronica in genere mostra i primi cinquanta messaggi di potenzialmente
migliaia, ordinati per ora di ricezione. Quando cerchiamo ristoranti su Yelp
ci viene mostrata la prima dozzina di centinaia, ordinati per vicinanza o per valutazione.
Un blog mostra un elenco ridotto di articoli, ordinati per data. Il feed di notizie di Facebook,
Lo stream di Twitter e la homepage di Reddit si presentano tutti come elenchi, ordinati per
qualche misura proprietaria. Ci riferiamo a cose come Google e Bing come "ricerca
motori ", ma questo è un termine improprio: sono davvero motori ordinati . Che cosa
rende Google così dominante come mezzo per accedere alle informazioni del mondo
meno che trovi il nostro testo all'interno di centinaia di milioni di pagine web: sono gli anni '90
concorrenti potrebbero generalmente farlo parte abbastanza, ma bene che ordina quelli
pagine web così bene e ci mostra solo le dieci più rilevanti.
La parte superiore troncata di un immenso elenco ordinato è per molti versi universale
interfaccia utente.
L'informatica ci offre un modo per capire cosa sta succedendo dietro
scene in tutti questi casi, che a loro volta possono offrirci alcuni spunti per quelli
volte in cui siamo bloccati a fare ordini, con i nostri conti, i nostri documenti, i nostri
libri, i nostri calzini, probabilmente più volte ogni giorno di quanto pensiamo. Quantificando
il vizio (e la virtù) del pasticcio, ci mostra anche i casi in cui ci troviamo effettivamente
non dovrebbe assolutamente fare ordine.
Inoltre, quando iniziamo a cercare, vediamo che l'ordinamento non è solo qualcosa
facciamo con le informazioni. È qualcosa che facciamo con le persone. Forse il posto
dove l'informatica per stabilire il grado è più inaspettatamente utile è
sul campo sportivo e sul ring di boxe, ecco perché sapere un po 'di più
l'ordinamento potrebbe aiutare a spiegare come gli esseri umani sono in grado di vivere insieme mentre

Pagina 72

solo occasionalmente viene alle mani. Vale a dire, l'ordinamento offre alcune sorprendenti
indizi sulla natura della società, quell'altro, più ampio e più importante tipo di
ordine che facciamo.
Pagina 73

L'agonia dello smistamento


“Per abbassare i costi per unità di prodotto, le persone di solito aumentano la dimensione del loro
operazioni ", scrisse JC Hosken nel 1955, nel primo articolo scientifico pubblicato
sullo smistamento. Questa è l'economia di scala familiare a qualsiasi studente di affari. Ma
con l'ordinamento, la dimensione è una ricetta per il disastro: perversamente, man mano che una specie cresce, "il
il costo unitario dello smistamento, invece di diminuire, aumenta ". L'ordinamento comporta ripida
dis economie di scala, violando le nostre normali intuizioni sulle virtù del fare
cose alla rinfusa. Cucinare per due in genere non è più difficile che cucinare per uno, e
è certamente più facile che cucinare due volte per una persona. Ma ordinare, diciamo, uno scaffale
di cento libri ti richiederà più tempo rispetto allo smistamento di due scaffali di cinquanta
a testa: hai il doppio delle cose da organizzare e ce ne sono il doppio
posti in cui ognuno di loro potrebbe andare. Più ti impegni, peggio diventa.
Questa è la prima e più fondamentale intuizione della teoria dello smistamento. La scala fa male.
Da ciò potremmo dedurre che minimizzando il nostro dolore e la sofferenza quando è
arriva all'ordinamento significa minimizzare il numero di cose che dobbiamo ordinare.
È vero: uno dei migliori preventivi contro la difficoltà computazionale del calzino
lo smistamento è solo fare il bucato più spesso. Fare il bucato tre volte
spesso, diciamo, potrebbe ridurre le spese generali di smistamento di un fattore nove. Infatti,
se il compagno di stanza di Hillis fosse rimasto fedele alla sua procedura peculiare ma fosse rimasto tredici giorni
tra lavaggi invece di quattordici, quello da solo gli avrebbe salvato ventotto
tira dalla cesta. (E passare un solo giorno in più tra i lavaggi
gli costerebbe trenta tiri in più.)
Anche in un ambito così modesto e quindicinale possiamo vedere la scala dello smistamento
cominciando a diventare insostenibile. I computer, tuttavia, devono ordinarne regolarmente milioni di file
oggetti in una sola volta. Per questo, come dice la frase di Jaws , avremo bisogno di un file
barca più grande e un algoritmo migliore.
Ma per rispondere alla domanda su come dovremmo smistare e quali
i metodi vengono fuori, dobbiamo prima capire qualcos'altro: come siamo
andando a tenere il punteggio.

Big-O: un metro per il caso peggiore

Pagina 74

Big-O: un metro per il caso peggiore


Il Guinness dei primati attribuisce il record per l'ordinamento di un mazzo di
carte al mago ceco Zdeněk Bradáč. Il 15 maggio 2008 Bradáč ha ordinato a
Mazzo da 52 carte in soli 36,16 secondi. * Come ha fatto? Quale tecnica di smistamento
gli ha consegnato il titolo? Anche se la risposta farebbe luce interessante
teoria dell'ordinamento, Bradáč ha rifiutato di commentare.
Anche se non abbiamo altro che rispetto per l'abilità e la destrezza di Bradáč, lo siamo
100% certo di quanto segue: possiamo battere personalmente il suo record. In effetti, noi
siamo certi al 100% che possiamo raggiungere un record indistruttibile . Tutto ciò di cui abbiamo bisogno lo è
di
80.658.175.170.943.878.571.660.636.856.403.766.975.289.505.440.883.277.824.000.000.000
tentativi al titolo. Questo numero, un po 'più di 80 unvigintillion, è 52 fattoriale, o
"52!" in notazione matematica: il numero di modi in cui può farlo un mazzo di 52 carte
possibilmente essere ordinato. Facendo all'incirca tanti tentativi, prima o poi noi
sono destinati a iniziare con un mazzo mescolato che in realtà è completamente ordinato per
opportunità. A quel punto possiamo inserire con orgoglio Christian-Griffiths in The Guinness
Prenota insieme a un tempo di smistamento non troppo misero di 0m00s.
Per essere onesti, quasi sicuramente ci proveremo fino alla morte termica dell'universo
prima di ottenere il nostro tentativo di record perfetto. Tuttavia, questo evidenzia il più grande
differenza fondamentale tra detentori di record e scienziati informatici. La multa
Alla Guinness interessano solo le prestazioni (e la birra) migliori . Loro sono
difficilmente biasimevole, ovviamente: tutti i record nello sport riflettono il migliore singolo
prestazione. L'informatica, tuttavia, non si preoccupa quasi mai del meglio
Astuccio. Invece, gli informatici potrebbero voler conoscere il tempo medio di ordinamento di
qualcuno come Bradáč: fagli ordinare tutti gli 80 ordini di mazzo unvigintillion, o un file
campione di dimensioni ragionevoli e assegnargli un punteggio sulla sua velocità media in tutti i tentativi.
(Puoi capire perché non lasciano che gli informatici eseguano queste cose.)
Inoltre, uno scienziato informatico vorrebbe conoscere il momento peggiore .
L'analisi del caso peggiore ci consente di dare garanzie concrete: che un processo critico lo farà
finire in tempo, le scadenze non verranno saltate. Quindi per il resto di questo capitolo - e
il resto di questo libro, in realtà, discuteremo solo dei peggiori algoritmi
prestazioni del case, se non diversamente specificato.
L'informatica ha sviluppato una scorciatoia specifica per la misurazione
scenari algoritmici peggiori: si chiama notazione "Big-O". Notazione Big-O

Pagina 75

ha una particolarità, che è inesatto in base alla progettazione. Cioè, piuttosto che
esprimere le prestazioni di un algoritmo in minuti e secondi, notazione Big-O
fornisce un modo per parlare del tipo di relazione che esiste tra le dimensioni
del problema e il tempo di esecuzione del programma. Perché la notazione Big-O
getta deliberatamente dettagli fini, ciò che emerge è uno schema per dividere i problemi
in diverse ampie classi.
Immagina di organizzare una cena con n ospiti. Il tempo necessario per
pulire la casa all'arrivo non dipende affatto dal numero degli ospiti.
Questa è la classe di problemi più rosea che ci sia: chiamata "Big-O of one", scritta O (1),
è anche noto come "tempo costante". In particolare, alla notazione Big-O non interessa un briciolo
quanto tempo impiega effettivamente la pulizia, solo che è sempre la stessa, totalmente
invariante della lista degli invitati. Hai lo stesso lavoro da fare se hai un ospite
come se avessi dieci, cento o qualsiasi altro n .
Ora, il tempo necessario per far passare l'arrosto intorno al tavolo sarà "Big-O of
n ", scritto O ( n ), noto anche come" tempo lineare ", con il doppio degli ospiti, aspetterai
il doppio del tempo per il piatto. E ancora, la notazione Big-O non poteva
preoccuparsi meno del numero di portate che vengono servite o se vanno in giro
per seconde porzioni. In ogni caso, il tempo dipende ancora linearmente dalla lista degli invitati
dimensione: se disegnassi un grafico del numero di ospiti rispetto al tempo impiegato, sarebbe
una linea retta. Inoltre, l'esistenza di qualsiasi fattore tempo lineare, in Big-
O notazione, annulla tutti i fattori a tempo costante. Vale a dire, passando l'arrosto
una volta intorno al tavolo, o ristrutturare la tua sala da pranzo per tre mesi e poi
passando l'arrosto una volta intorno al tavolo, sono entrambi, per un informatico,
effettivamente equivalente. Se sembra assurdo, ricorda che i computer si occupano di
valori di n che potrebbero facilmente essere di migliaia, milioni o miliardi. In altro
parole, gli informatici stanno pensando a feste molto, molto grandi. Con un ospite
elenco a milioni, passare l'arrosto una volta in giro sarebbe davvero la casa
rimodellare sembrano sminuiti al punto da diventare insignificanti.
E se, all'arrivo degli ospiti, ognuno si abbracciasse in segno di saluto? Il tuo
il primo ospite ti abbraccia; il tuo secondo ospite ha due abbracci da dare; il tuo terzo ospite,
tre. Quanti abbracci ci saranno in totale? Questo risulta essere "Big-O of n -
al quadrato ", scritto O ( n 2 ) e noto anche come" tempo quadratico ". Anche in questo caso, solo noi
cura i contorni di base del rapporto tra n e tempo. Non c'è
O (2 n 2 ) per due abbracci ciascuno, o O ( n 2 + n ) per abbracci più il passaggio del cibo,

Pagina 76

o O ( n 2 + 1) per abbracci e pulizie domestiche. È tutto tempo quadratico, quindi O ( n 2 ) copre


qualunque cosa.

2
Tempo costante, scritto O (1); tempo lineare, scritto O (n); e tempo quadratico, scritto O (n ).

Da lì diventa peggio. C'è "tempo esponenziale", O (2 n ), dove ciascuno


un ospite aggiuntivo raddoppia il tuo lavoro. Ancora peggio è il "tempo fattoriale", O ( n !), A
classe di problemi così infernali che gli informatici ne parlano solo quando
stanno scherzando - come stavamo immaginando di mescolare un mazzo finché non viene ordinato - o
quando davvero, davvero vorrebbero esserlo.
I quadrati: Bubble Sort e Insertion Sort
Quando l'allora senatore Obama visitò Google nel 2007, il CEO Eric Schmidt scherzò
ha iniziato la sessione di domande e risposte come un colloquio di lavoro, chiedendogli: "Qual è il modo migliore per ordinare un
milioni di interi a trentadue bit? " Senza perdere un colpo, Obama ha fatto una battuta
sorrise e rispose: "Penso che il Bubble Sort sarebbe la strada sbagliata." Il
una folla di ingegneri di Google è esplosa in applausi. "Mi aveva a Bubble Sort", uno
successivamente ricordato.
Obama aveva ragione a evitare Bubble Sort, un algoritmo che è diventato
una specie di sacco da boxe per studenti di informatica: è semplice, è
intuitivo ed è estremamente inefficiente.
Immagina di voler alfabetizzare la tua raccolta di libri non ordinata. Un naturale
l'approccio sarebbe solo quello di scansionare attraverso lo scaffale alla ricerca di coppie fuori ordine -
Wallace seguito da Pynchon, per esempio, e girandoli. Mettere
Pynchon davanti a Wallace, quindi continua la scansione, girando intorno al

Pagina 77

all'inizio dello scaffale ogni volta che si raggiunge la fine. Quando fai un completo
passare senza trovare più coppie fuori servizio sull'intero scaffale, poi tu
sapere che il lavoro è finito.
Questo è Bubble Sort e ci atterra in tempo quadratico. Sono usciti n libri
di ordine, e ogni scansione attraverso lo scaffale può spostare ciascuna al massimo una
posizione. (Individuiamo un piccolo problema, facciamo una piccola correzione.) Quindi nel peggiore dei casi, dove
lo scaffale è perfettamente arretrato, bisognerà spostare almeno un libro n
posizioni. Quindi un massimo di n passa attraverso n libri, che ci dà O ( n 2 ) in
il caso peggiore. * Non è terribile, per prima cosa, sono mondi migliori del nostro O ( n !)
shuffle-till-it's-ordinato idea da prima (nel caso avessi bisogno dell'informatica per
confermare che). Tuttavia, quel termine al quadrato può diventare scoraggiante rapidamente. Per
ad esempio, significa che lo smistamento di cinque scaffali di libri non richiederà cinque volte di più
tanto quanto lo smistamento di un unico scaffale, ma venticinque volte più a lungo.
Potresti prendere una strada diversa: tirare tutti i libri dallo scaffale e
rimetterli a posto uno per uno. Metteresti il ​primo libro a metà
il ripiano, quindi prendi il secondo e confrontalo con il primo, inserendolo o al
a destra oa sinistra. Prendendo il terzo libro, dovresti scorrere i libri sul
ripiano da sinistra a destra finché non trovi il punto giusto per riporlo. Ripetendo questo
processo, gradualmente tutti i libri sarebbero finiti sullo scaffale e tu saresti stato
fatto.
Gli informatici lo chiamano, in modo abbastanza appropriato, Insertion Sort . Il bene
la notizia è che è probabilmente ancora più intuitivo di Bubble Sort e non ha
piuttosto la cattiva reputazione. La cattiva notizia è che in realtà non è molto più veloce.
Devi ancora fare un inserimento per ogni libro. E ogni inserzione ancora
implica spostare in media oltre la metà dei libri sullo scaffale per trovare il file
posto giusto. Anche se in pratica l'ordinamento di inserzione funziona un po 'più velocemente di
Bubble Sort, ancora una volta atterriamo esattamente, se vuoi, in tempo quadratico. Ordinamento
qualcosa di più di una singola libreria è ancora una prospettiva ingombrante.

Rompere la barriera quadratica: dividi e conquista


A questo punto, avendo visto cadere due approcci del tutto sensati
tempo quadratico insostenibile, è naturale chiedersi se lo smistamento sia più veloce
Pagina 78

anche possibile.
La domanda sembra riguardare la produttività. Ma parla con un computer
scienziato e risulta essere più vicino alla metafisica, simile al pensare al
velocità della luce, viaggio nel tempo, superconduttori o entropia termodinamica. Che cosa
sono le regole ei limiti fondamentali dell'universo? Cosa è possibile? Cosa è
permesso? In questo modo gli scienziati informatici scorgono ogni progetto di Dio
un po 'quanto i fisici delle particelle e i cosmologi. Qual è il minimo
sforzo richiesto per effettuare l'ordine?
Potremmo trovare un ordinamento a tempo costante, O (1), che (come pulire la casa
prima dell'arrivo dello stuolo di ospiti) può ordinare un elenco di qualsiasi dimensione nella stessa quantità di
tempo? Bene, anche solo la conferma che uno scaffale di n libri è ordinato non può essere fatto
in tempo costante, poiché richiede il controllo di tutti gli n . Quindi in realtà l'ordinamento del file
libri in tempo costante sembra fuori questione.
Che ne dici di un ordinamento tempo lineare, O ( n ), efficiente come passare una parabola attorno a un file
tabella, dove il raddoppio del numero di elementi da ordinare raddoppia semplicemente il lavoro?
Pensando agli esempi sopra, è difficile immaginare come potrebbe funzionare
o. L' n 2 in ogni caso deriva dal fatto che devi spostare n libri,
e anche il lavoro richiesto in ogni mossa scala con n . Come avremmo ottenuto
da n mosse di dimensione n fino a solo n da solo? In Bubble Sort, il nostro O ( n 2 )
il tempo di esecuzione veniva dalla gestione di ciascuno degli n libri e dal loro spostamento
come n posti ciascuno. In Ordinamento di inserzione, il tempo di esecuzione quadratico deriva dalla gestione
ciascuno degli n libri e confrontandoli con altri n prima di inserirli
loro. Un ordinamento in tempo lineare significa gestire ogni libro per un tempo costante a prescindere
di quanti altri ha bisogno di trovare il suo posto tra. Non sembra probabile.
Quindi sappiamo che possiamo fare almeno quanto il tempo quadratico, ma probabilmente
non così come il tempo lineare. Forse il nostro limite sta da qualche parte tra il tempo lineare
e tempo quadratico. Esistono algoritmi tra lineare e quadratico,
tra n e n × n ?
Ci sono ... e si nascondevano in bella vista.
Come accennato in precedenza, l'elaborazione delle informazioni è iniziata nei censimenti statunitensi di
il diciannovesimo secolo, con lo sviluppo, da Herman Hollerith e successivamente da
IBM, di dispositivi fisici di smistamento di schede perforate. Nel 1936, IBM iniziò a produrre un file
linea di macchine denominate “raccoglitrici” che potevano unire due ordinate separatamente
pile di carte in una. Finché le due pile stesse sono state ordinate, il file

Pagina 79

la procedura per unirli in un unico stack ordinato è stata incredibile


semplice e ha richiesto un tempo lineare: è sufficiente confrontare le due carte in cima a ciascuna
altro, sposta il più piccolo di loro nella nuova pila che stai creando e ripeti
fino al termine.
Il programma che John von Neumann scrisse nel 1945 per dimostrare il potere
del computer del programma memorizzato ha preso l'idea di collazionare alla sua bellezza e
conclusione finale. Ordinare due carte è semplice: basta mettere quella più piccola sopra.
E data una coppia di pile di due carte, entrambe ordinate, puoi facilmente fascicolare
in una pila ordinata di quattro. Ripetendo questo trucco un paio di volte, costruirai
pile sempre più grandi, ognuna già smistata. Ben presto, tu
potresti raccogliere un mazzo completo perfettamente ordinato, con un'unione culminante finale,
come il gemello che crea l'ordine di un fucile mescolato, producendo il risultato desiderato.
Questo approccio è noto oggi come Mergesort , uno dei leggendari algoritmi
in informatica. Come afferma un documento del 1997, "Mergesort è importante in
storia dell'ordinamento come ordinamento nella storia dell'informatica. "
Il potere di Mergesort deriva dal fatto che in effetti finisce con un file
complessità tra tempo lineare e quadratico, in particolare O ( n log n ), nota
come tempo “linearitmico”. Ogni passaggio attraverso le carte raddoppia la dimensione del ordinato
pile, quindi per ordinare completamente n carte dovrai fare tanti passaggi quanti sono
prende per il numero 2, moltiplicato per se stesso, uguale a n : il logaritmo in base due,
in altre parole. Puoi ordinare fino a quattro carte in due passaggi di fascicolazione, fino a otto
carte con un terzo passaggio e fino a sedici carte con un quarto. La divisione di Mergesort
L'approccio and-conquer ha ispirato una serie di altri algoritmi di ordinamento linearitmico
che seguì rapidamente sulle sue tracce. E dire che la complessità linearitmica è un
il miglioramento della complessità quadratica è un eufemismo titanico. In caso di
ordinare, diciamo, un numero di elementi a livello di censimento, è la differenza tra fare
ventinove passa attraverso il tuo set di dati ... e trecento milioni. No
meraviglia che sia il metodo di scelta per i problemi di smistamento industriale su larga scala.
Mergesort ha anche applicazioni reali nello smistamento domestico su piccola scala
i problemi. Parte del motivo per cui è così ampiamente utilizzato è che può essere facilmente
parallelizzato. Se stai ancora strategizzando su quella libreria, il Mergesort
la soluzione sarebbe ordinare una pizza e invitare alcuni amici. Dividi il file
libri in modo uniforme e chiedi a ogni persona di ordinare la propria pila. Quindi accoppia le persone
e fagli unire le loro pile. Ripeti questo processo finché non ce ne sono solo due

Pagina 80

pile rimaste e unirle un'ultima volta sullo scaffale. Cerca solo di evitare di ottenere
macchie di pizza sui libri.

Oltre il confronto: superare in astuzia il logaritmo


In un parco industriale poco appariscente vicino alla città di Preston, Washington,
nascosto dietro un anonimo ingresso grigio di molti, si trovano il 2011 e il 2013
Campione di smistamento della Biblioteca nazionale. Si muove un lungo nastro trasportatore segmentato
167 libri al minuto - 85.000 al giorno - tramite uno scanner di codici a barre, dove si trovano
deviato automaticamente nelle porte del vano bombe che cadono in uno dei 96 contenitori.
Pagina 81

Un Mergesort in azione. Dato uno scaffale di otto libri non ordinati, inizia mettendo i libri adiacenti in ordinati
coppie. Quindi fascicola le coppie in set ordinati di quattro e infine fascicola quei set per ottenere un ordinamento completo
mensola.

Il Preston Sort Center è uno dei più grandi ed efficienti smistamenti di libri
strutture nel mondo. È gestito dal King County Library System, che ha

Pagina 82
ha iniziato una sana rivalità con la New York Public Library, altrettanto attrezzata,
con il titolo che va avanti e indietro per quattro anni strettamente contestati. "Re
La biblioteca della contea ci sta battendo quest'anno? " ha detto il vicedirettore della NYPL
BookOps, Salvatore Magaddino, prima della resa dei conti del 2014. "Fuhgeddaboutit."
C'è qualcosa di particolarmente impressionante nel Preston Sort Center di
anche il punto di vista di un teorico. I libri che passano attraverso il suo sistema vengono ordinati
in O ( n ): tempo lineare.
In un senso importante, il tempo linearitmico O ( n log n ) offerto da Mergesort
è davvero il meglio che possiamo sperare di ottenere. È stato dimostrato che se lo vogliamo completamente
ordina n elementi tramite una serie di confronti diretti, non c'è modo di farlo
confrontali meno di O ( n log n ) volte. È una legge fondamentale del
universo, e non ci sono due modi per aggirarlo.
Ma questo, in senso stretto, non chiude il libro sull'ordinamento. Perché
a volte non è necessario un set completamente ordinato, ea volte può esserlo l'ordinamento
fatto senza alcun confronto da articolo a articolo. Questi due principi, presi
insieme, consentono ordinamenti pratici approssimativi in ​un tempo più veloce del linearitmico. Questo è
splendidamente dimostrato da un algoritmo noto come Bucket Sort , di cui il
Preston Sort Center è un'illustrazione perfetta.
In Bucket Sort, gli elementi vengono raggruppati in una serie di categorie ordinate,
senza riguardo per uno smistamento più fine e intracategoria; che può venire più tardi. (Nel computer
scienza il termine "secchio" si riferisce semplicemente a un blocco di dati non ordinati, ma alcuni di
gli usi più potenti del mondo reale di Bucket Sort, come al KCLS, prendono il nome
letteralmente.) Ecco il kicker: se vuoi raggruppare n elementi in m bucket,
il raggruppamento può essere fatto in tempo O ( nm ), ovvero il tempo è semplicemente proporzionale
al numero di articoli moltiplicato per il numero di bucket. E finché il numero
di bucket è relativamente piccolo rispetto al numero di elementi, notazione Big-O
lo arrotonderà a O ( n ), o tempo lineare.
La chiave per rompere effettivamente la barriera linearitmica è conoscere il
distribuzione da cui vengono estratti gli elementi che stai ordinando. Scelto male
i secchi ti lasceranno un po 'meglio di quando hai iniziato; se tutti i libri finiscono
nello stesso cestino, ad esempio, non hai fatto alcun progresso. Ben scelto
secchi, tuttavia, divideranno i tuoi articoli in gruppi di dimensioni più o meno uguali, che
- data la natura fondamentale dell'ordinamento "la scala fa male" - è un enorme passo avanti verso a
ordinamento completo. Al Preston Sort Center, il cui compito è ordinare i libri in base al loro

Pagina 83

ramo di destinazione, piuttosto che in ordine alfabetico, la scelta dei bucket è guidata da
statistiche sulla circolazione. Alcuni rami hanno un volume di circolazione maggiore di
altri, quindi possono avere due contenitori assegnati loro, o anche tre.
Una simile conoscenza del materiale è utile anche ai selezionatori umani. Vedere
selezionando gli esperti in azione, abbiamo fatto una gita all'UC Berkeley's Doe and Moffitt
Biblioteche, dove ci sono non meno di cinquantadue miglia di scaffali da tenere
ordine, ed è tutto fatto a mano. I libri restituiti alla biblioteca vengono prima inseriti
un'area dietro le quinte, assegnata agli scaffali designati dalla Library of Congress
chiamare i numeri. Ad esempio, un set di scaffali contiene un miscuglio di tutti i file
libri restituiti di recente con numeri di chiamata PS3000 – PS9999. Poi studente
gli assistenti caricano quei libri sui carrelli, mettendo fino a 150 libri nell'ordine corretto
possono essere restituiti agli scaffali della biblioteca. Gli studenti ricevono una formazione di base
nell'ordinamento, ma sviluppano le proprie strategie nel tempo. Dopo un po 'di esperienza,
possono ordinare un carrello pieno di 150 libri in meno di 40 minuti. E una grande parte di
quell'esperienza implica sapere cosa aspettarsi.
Jordan Ho, studente di Berkeley, laureato in chimica e selezionatore di stelle, ha parlato
noi attraverso il suo processo mentre esaminava un'impressionante pila di libri sul
Ripiani PS3000 – PS9999:

So per esperienza che ci sono molti 3500, quindi voglio cercare tutti i libri che sono sotto
3500 e risolverli in modo approssimativo. E una volta che lo faccio, li ordino in modo più fine. Dopo aver ordinato quelli
sotto i 3500, so che il 3500 stesso è una grande sezione, 3500-3599, quindi voglio renderlo una sezione stessa.
Se ce ne sono molti, potrei volerlo perfezionare ancora di più: 3510, 3520, 3530.

Jordan mira a mettere un gruppo di circa 25 libri sul carrello prima di metterli dentro
ordine finale, che fa utilizzando un ordinamento di inserzione. E il suo sviluppato con cura
è esattamente il modo giusto per arrivarci: un Bucket Sort, con il suo
previsione informata di quanti libri avrà con i vari numeri di telefono
dicendogli quali dovrebbero essere i suoi secchi.

Pagina 84

L'ordinamento è la profilassi per la ricerca


La conoscenza di tutti questi algoritmi di ordinamento dovrebbe tornare utile la prossima volta che decidi
per alfabetizzare la tua libreria. Come il presidente Obama, saprai di non usarlo
Bubble Sort. Invece, una buona strategia, ratificata da bibliotecari umani e meccanici
allo stesso modo, è quello di Bucket Sort fino a quando non si arriva a pile abbastanza piccole da inserire
L'ordinamento è ragionevole, o per fare una pizza party Mergesort.
Ma se hai effettivamente chiesto a uno scienziato informatico di aiutarti a implementare questo processo,
la prima domanda che ti farebbero è se dovresti fare l'ordinamento.
L'informatica, come viene insegnato agli studenti universitari, è tutta una questione di compromessi. Noi abbiamo
già visto nelle tensioni tra guardare e saltare, tra esplorare
e sfruttando. E uno dei compromessi più importanti è tra l' ordinamento e
ricerca . Il principio di base è questo: lo sforzo speso per lo smistamento dei materiali è
solo un colpo preventivo contro lo sforzo che ci vorrà per cercare in un secondo momento.
Quale dovrebbe essere il bilanciamento preciso dipende dai parametri esatti del file
situazione, ma considerare l'ordinamento come prezioso solo per supportare la ricerca futura
ci dice qualcosa di sorprendente:
Err dalla parte del disordine.
Ordinare qualcosa che non cercherete mai è un completo spreco; ricerca
qualcosa che non hai mai risolto è semplicemente inefficiente.
La domanda, ovviamente, diventa come stimare in anticipo ciò che il tuo
l'uso futuro sarà.
Il bambino poster per i vantaggi dello smistamento sarebbe una ricerca su Internet
motore come Google. Sembra sbalorditivo pensare che Google possa accettare la ricerca
frase che hai digitato e setacciare l'intera Internet per trovarla in meno di mezzo secondo.
Beh, non può, ma non è necessario. Se sei Google, ne sei quasi certo
che (a) i tuoi dati saranno cercati, (b) non solo una volta ma
ripetutamente, e (c) il tempo necessario per lo smistamento è in qualche modo "meno prezioso" del file
tempo necessario per la ricerca. (Qui, l'ordinamento viene eseguito dalle macchine prima del tempo, prima
i risultati sono necessari e la ricerca viene eseguita da utenti per i quali il tempo è scadente
essenza.) Tutti questi fattori puntano a favore di un eccezionale smistamento iniziale,
che è effettivamente ciò che fanno Google e i suoi colleghi motori di ricerca.

Pagina 85

Quindi, se si alfabetizzare i vostri scaffali? Per la maggior parte domestica


scaffali, quasi nessuna delle condizioni che rendono utile lo smistamento lo sono
vero. È abbastanza raro che ci troviamo alla ricerca di un titolo particolare. Il
i costi di una ricerca non ordinata sono piuttosto bassi: per ogni libro, se lo sappiamo approssimativamente
dov'è possiamo metterci le mani sopra velocemente. E la differenza tra i file
ci vorrebbero due secondi per trovare il libro su uno scaffale ordinato ei dieci secondi
ci vorrebbe per scansionarlo su uno non ordinato non è certo un rompicapo. Raramente
bisogno di trovare un titolo così urgentemente che valga la pena spendere le ore preparatorie in anticipo
per radersi pochi secondi dopo. Inoltre, cerchiamo con i nostri occhi veloci e
ordinare con le mani lente.
Il verdetto è chiaro: ordinare la tua libreria richiederà più tempo ed energia
che scrutare attraverso di essa mai.
La tua libreria non ordinata potrebbe non essere una preoccupazione quotidiana, ma la tua
la posta in arrivo quasi certamente lo è, ed è un altro dominio in cui la ricerca batte
smistamento facilmente. L'archiviazione manuale dei messaggi elettronici nelle cartelle richiede circa il
la stessa quantità di tempo necessaria per archiviare documenti fisici nel mondo reale, ma le e-mail possono farlo
essere ricercati in modo molto più efficiente rispetto alle loro controparti fisiche. Come il costo
delle gocce di ricerca, l'ordinamento diventa meno prezioso.
Steve Whittaker è uno degli esperti mondiali su come le persone gestiscono i propri
e-mail. Un ricercatore presso IBM e professore presso UC Santa Cruz, Whittaker,
da quasi due decenni studia come le persone gestiscono il personale
informazione. (Ha scritto un articolo sul "sovraccarico di posta elettronica" nel 1996, prima di molte persone
aveva anche la posta elettronica.) Nel 2011, Whittaker ha condotto uno studio sulla ricerca e l'ordinamento
abitudini degli utenti di posta elettronica, risultando in un documento intitolato "Sto sprecando il mio tempo
Organizzare la posta elettronica? " Avviso spoiler: la conclusione è stata un enfatico sì . "Suo
empirico, ma è anche esperienziale ", sottolinea Whittaker. “Quando intervisto
persone su questo tipo di problemi organizzativi, questo è qualcosa che loro
tipicamente parlando, è che in un certo senso hanno sprecato una parte della loro vita ".
L'informatica mostra che i rischi del disordine e quelli dell'ordine lo sono
quantificabili e che i loro costi possano essere misurati nella stessa valuta: il tempo.
Lasciare qualcosa di non ordinato potrebbe essere pensato come un atto di procrastinazione -
passare il dollaro al proprio sé futuro, che dovrà pagare con interessi cosa
abbiamo scelto di non pagare in anticipo. Ma l'intera storia è più sottile di così. Qualche volta
il disordine è più che una semplice scelta. È la scelta ottimale.

Pagina 86

Tipi e sport
Il compromesso tra ricerca e ordinamento suggerisce che spesso è più efficiente lasciare un pasticcio.
Il risparmio di tempo non è l'unico motivo per cui sistemiamo le cose: a volte produciamo un file
l'ordine finale è fine a se stesso. E da nessuna parte è più chiaro che sullo sport
campo.
Nel 1883, Charles Lutwidge Dodgson sviluppò sentimenti incredibilmente forti
sullo stato del tennis sull'erba britannico. Come spiega:

In un torneo di tennis su prato, dove ho avuto la possibilità, qualche tempo fa, di essere uno spettatore, il presente
il metodo di assegnazione dei premi è stato portato alla mia attenzione dai lamenti di uno dei giocatori, che
era stato battuto (e aveva quindi perso tutte le possibilità di un premio) all'inizio del concorso, e chi aveva il
mortificazione di vedere il 2 ° premio portato via da un giocatore a cui sapeva essere molto inferiore
lui stesso.

Gli spettatori normali potrebbero attribuire tali "lamenti" a poco più del
pungiglione della sconfitta, ma Dodgson non era un normale orecchio comprensivo. Era un Oxford
professore di matematica, e le lamentele dello sportivo lo mandarono in profondità
indagine sulla natura dei tornei sportivi.
Dodgson era più di un semplice matematico di Oxford, in effetti lo è a malapena
ricordato come se fosse stato uno. Oggi è meglio conosciuto con il suo pseudonimo, Lewis
Carroll, sotto il quale ha scritto Le avventure di Alice nel paese delle meraviglie e molti altri
amate opere della letteratura ottocentesca. Fondendo la sua matematica e
talento letterario, Dodgson ha prodotto una delle sue opere meno conosciute: “Lawn
Tornei di tennis: il vero metodo per assegnare i premi con una prova di
Fallacia del metodo attuale ".
La denuncia di Dodgson era diretta alla struttura del Single Elimination
torneo, in cui i giocatori vengono accoppiati tra loro ed eliminati
non appena perde una singola partita. Come Dodgson ha sostenuto con forza,
il vero secondo miglior giocatore potrebbe essere uno dei giocatori eliminati dal migliore—
non solo l'ultimo eliminato. Ironia della sorte, alle Olimpiadi teniamo il bronzo
partite di medaglia, con le quali ci sembra di riconoscere che il Single Elimination
formato non ci fornisce informazioni sufficienti per determinare il terzo posto. * Ma in effetti

Pagina 87

questo formato non ci dice abbastanza per determinare il secondo posto o, in effetti,
qualsiasi cosa tranne il vincitore. Come ha detto Dodgson, "Il metodo attuale di
l'assegnazione dei premi è, tranne nel caso del primo premio, del tutto priva di senso. "
Detto chiaramente, la medaglia d'argento è una bugia.
"Come un fatto matematico", ha continuato, "la possibilità che il 2 ° miglior giocatore
otterrà il premio che si merita è di soli 16/31; mentre la possibilità che i migliori 4
riceveranno i loro premi adeguati è così piccolo, che le probabilità sono 12 a 1 contro i suoi
sta accadendo! "
Nonostante i poteri della sua penna, sembra che Dodgson abbia avuto scarso impatto
il mondo del tennis sull'erba. La sua soluzione, una scomoda interpretazione della tripla eliminazione
dove la sconfitta di qualcuno che ti aveva sconfitto poteva anche eliminare te,
mai preso piede. Ma se la soluzione di Dodgson era macchinosa, la sua critica al
il problema era comunque azzeccato. (Ahimè, le medaglie d'argento vengono ancora distribuite
nei tornei a eliminazione diretta fino ad oggi.)
Ma c'è anche una visione più profonda nella logica di Dodgson. Noi umani ordiniamo di più
dei nostri dati, più dei nostri beni. Noi risolviamo noi stessi .
La Coppa del Mondo, le Olimpiadi, NCAA, NFL, NHL, NBA e MLB: tutto
di questi implementano implicitamente procedure di smistamento. Le loro stagioni, scale e
i playoff sono algoritmi per produrre l'ordine di classifica.
Uno degli algoritmi più familiari nello sport è il formato Round-Robin ,
dove ciascuna delle n squadre alla fine gioca ognuna delle altre n - 1 squadre.
Sebbene sia probabilmente il più completo, è anche uno dei più laboriosi.
Avere ogni squadra alle prese con ogni altra squadra è come avere uno scambio di ospiti
abbracci alla nostra cena: la temuta O ( n 2 ), tempo quadratico.
Tornei ladder — popolari in sport come badminton, squash e
racquetball: metti i giocatori in una classifica lineare, con ogni giocatore autorizzato a emettere un
sfida diretta al giocatore immediatamente sopra di loro, scambiando i posti se loro
prevalere. Le scale sono i tipi di bolle del mondo atletico e lo sono anche
quadratico, che richiede O ( n 2 ) partite per raggiungere una classifica stabile.
Forse il formato di torneo più diffuso, tuttavia, è una parentesi
torneo, come nel famoso basket NCAA "March Madness", tra
molti altri. Il torneo March Madness procede dal "Round di
64 "e il" Round di 32 "fino a" Sweet 16 "," Elite Eight "," Final Four "e
le finali. Ogni round divide il campo a metà: suona familiare

Pagina 88

logaritmico? Questi tornei sono effettivamente Mergesort, a cominciare da


coppie di squadre non ordinate e raccolta, raccolta, fascicolazione.
Sappiamo che Mergesort opera in tempo linearitmico - O ( n log n ) - e quindi,
dato che ci sono 64 squadre, possiamo aspettarci di aver bisogno solo di qualcosa come 6
round (192 partite), piuttosto che gli enormi 63 round (2.016 partite)
prendere per fare una scala o un round-robin. Questo è un enorme miglioramento: algoritmo
progettazione al lavoro.
Sei round di March Madness sembrano giusti, ma aspetta un secondo: 192
Giochi? Il torneo NCAA dura solo 63 partite.
In effetti, March Madness non è un Mergesort completo: non produce un
ordinamento completo di tutte le 64 squadre. Per classificare veramente le squadre, avremmo bisogno di un set aggiuntivo di
giochi per determinare il secondo posto, un altro per il terzo e così via, prendendo a
numero linearitmico di giochi in somma. Ma March Madness non lo fa.
Invece, proprio come il torneo di tennis sull'erba di cui si lamentava Dodgson, esso
utilizza un formato a eliminazione diretta in cui le squadre eliminate non vengono ordinate.
Il vantaggio è che funziona in tempo lineare: poiché ogni partita elimina esattamente
una squadra, per avere una squadra rimasta in piedi servono solo n - 1 partite: a
numero lineare. Lo svantaggio è che, beh, non capisci mai veramente il file
classifica a parte il primo posto.
Ironia della sorte, in Single Elimination nessuna struttura di torneo è effettivamente
assolutamente necessario. Qualsiasi 63 partite produrrà un unico campione imbattuto. Per
Ad esempio, potresti semplicemente far affrontare una singola squadra del "re della collina"
sfidanti uno per uno fino a quando non viene detronizzato, a quel punto chiunque lo abbia sconfitto
prende il suo posto e continua. Questo formato avrebbe lo svantaggio di
bisogno di 63 turni separati, tuttavia, poiché i giochi non potevano svolgersi in parallelo; anche,
una squadra potrebbe potenzialmente dover giocare fino a 63 partite di fila, che
potrebbe non essere l'ideale dal punto di vista della fatica.
Sebbene sia nato ben più di un secolo dopo Dodgson, forse nessuno lo porta
avanti la sua interpretazione matematica dello sport nel ventunesimo secolo come
fortemente come Michael Trick. Abbiamo incontrato Trick nella nostra discussione sull'ottimale
fermandosi, ma nei decenni trascorsi dalla sua sfortunata applicazione della regola del 37% alla sua
ama la vita è diventato non solo un marito e un professore di ricerca operativa
- ora è anche uno dei principali programmatori della Major League Baseball e
per conferenze NCAA come Big Ten e ACC, utilizzando l'informatica per
Pagina 89

decidere gli abbinamenti dell'anno.


Come sottolinea Trick, le leghe sportive non si preoccupano di determinare il
classifiche il più rapidamente e rapidamente possibile. Invece, i calendari sportivi lo sono
progettato esplicitamente per mantenere la tensione per tutta la stagione, qualcosa che
raramente è stata una preoccupazione per la teoria dell'ordinamento.

Ad esempio, nella Major League Baseball, hai spesso gare per vedere chi vincerà la divisione.
Ora, se ignorassimo l'impostazione della divisione, alcune di queste gare potrebbero essere risolte abbastanza presto nel
stagione. Ma invece quello che facciamo è assicurarci che nelle ultime cinque settimane tutti giochino con tutti
altro all'interno della loro divisione. Lo scopo è che non importa chi sia in una corsa divisionale: lo sono
dovrà giocare il prossimo avversario più vicino almeno sei partite nelle ultime cinque settimane del
stagione. Ciò consente un maggiore interesse per il programma o l'interesse per la stagione perché in questo caso,
l'incertezza è ritardata nella sua risoluzione.

Inoltre, gli sport non sono, ovviamente, sempre progettati rigorosamente per ridurre al minimo
il numero di giochi. Senza ricordarlo, alcuni aspetti dello sport
altrimenti la programmazione sembrerebbe misteriosa a un informatico. As Trick
dice della stagione regolare di baseball di 2.430 partite, "Sappiamo che n log n è il
giusto numero di confronti per eseguire un ordinamento completo. Questo può farti ottenere tutti . Perché
fanno n 2 solo per ottenere, in un certo senso, il massimo , se è tutto ciò che gli interessa
di?" In altre parole, perché fare un round-robin O ( n 2 ) completo e poi alcuni, se noi
sappiamo che possiamo fare un ordinamento completo in tempo linearitmico e possiamo incoronare un imbattuto
Campione a eliminazione diretta in meno di n partite? Bene, riducendo al minimo il file
numero di partite in realtà non è nell'interesse della lega. In informatica
i confronti inutili sono sempre cattivi, una perdita di tempo e fatica. Ma in
sport che sono lontani dal caso. Per molti aspetti, dopotutto, i giochi stessi
sono il punto.

Diritti di presa: rumore e robustezza


Un altro modo, forse ancora più importante, di addestrare una lente algoritmica
Lo sport è chiedersi non che fiducia dovremmo avere nella medaglia d'argento, ma che cosa
fiducia che dovremmo avere nell'oro .
Come spiega Michael Trick, in alcuni sport, “per esempio il baseball, una squadra è

Pagina 90

perderà il 30% delle proprie partite e una squadra vincerà il 30% delle proprie partite
praticamente non importa chi siano ". Ciò ha implicazioni inquietanti per
Formato a eliminazione singola. Se le partite di basket NCAA, ad esempio, vengono vinte dal
squadra più forte il 70% delle volte e vincere il torneo implica la vittoria
in 6 partite consecutive, la squadra migliore ha solo 0,70 alla 6a potenza, meno
più del 12%: possibilità di vincere il torneo! In altre parole, il torneo
incoronerebbe la migliore squadra del campionato solo una volta ogni dieci anni.
Può darsi che in alcuni sport si abbia persino il 70% di fiducia in un gioco
il risultato potrebbe essere un bilancio eccessivo del punteggio finale. Fisico UCSD
Tom Murphy ha applicato tecniche di modellazione numerica al calcio e ha concluso
che i punteggi bassi del calcio rendono i risultati del gioco molto più vicini al casuale rispetto alla maggior parte
i fan preferirebbero immaginare. “Un punteggio di 3: 2 dà alla squadra vincente solo un 5 su 8
possibilità di essere effettivamente una squadra migliore ... Personalmente, non trovo che sia molto
degno di nota. Anche uno scoppio di 6: 1 lascia una probabilità del 7% che fosse una statistica
colpo di fortuna."
Gli informatici chiamano questo fenomeno rumore . Tutti gli algoritmi di ordinamento
che abbiamo considerato finora presuppongono confronti perfetti, impeccabili e infallibili,
quelli che non rovinano mai e giudicano erroneamente la minore tra due quantità
il maggiore. Dopo aver consentito un "comparatore rumoroso", un po 'di computer
gli algoritmi più sacri della scienza escono dalla finestra e alcuni dei più
diffamato hanno il loro giorno di redenzione.
Dave Ackley, professore di informatica presso l'Università di New
Il Messico, lavora all'incrocio tra informatica e "vita artificiale" —he
ritiene che i computer possano sopportare di imparare alcune cose dalla biologia. Per i principianti,
organismi vivono in un mondo in cui pochi processi si avvicinano al livello di
affidabilità da cui dipendono i computer, per cui sono costruiti da zero
ciò che i ricercatori chiamano robustezza . È ora, sostiene Ackley, di iniziare
riconoscere le virtù della robustezza anche negli algoritmi.
Così, mentre l'autorevole programmazione tome Sorting and Searching
dichiara coraggiosamente che "il bubble sort non ha apparenti caratteristiche di riscatto", il
le ricerche di Ackley e dei suoi collaboratori suggeriscono che potrebbe esserci un posto per
algoritmi come Bubble Sort, dopo tutto. La sua stessa inefficienza: spostare solo gli oggetti
una posizione alla volta, lo rende abbastanza robusto contro il rumore, molto più robusto di
algoritmi più veloci come Mergesort, in cui ogni confronto potenzialmente sposta un file

Pagina 91

oggetto molto lontano. La stessa efficienza di Mergesort lo rende fragile. Un primo errore in a
Mergesort è come una perdita di fortuna nel primo round di una singola eliminazione
torneo, che non solo può infrangere le speranze di campionato di una squadra favorita ma
Inoltre li relegano definitivamente nella metà inferiore della classifica. * In una scala
il torneo, d'altra parte, come in un Bubble Sort, una perdita di fortuna determinerebbe solo un
giocatore torna un solo posto in classifica.
Ma in realtà non è Bubble Sort a emergere come il miglior algoritmo in
volto di un comparatore rumoroso. Il vincitore di quel particolare onore è un algoritmo
chiamato Ordinamento conteggio confronto . In questo algoritmo, ogni elemento viene confrontato con
tutti gli altri, generando un conteggio di quanti elementi è più grande di. Questo
number può quindi essere utilizzato direttamente come rango dell'articolo. Poiché confronta tutte le coppie,
L'ordinamento del conteggio del confronto è un algoritmo in tempo quadratico, come Bubble Sort. Così
non è una scelta popolare nelle applicazioni informatiche tradizionali, ma lo è
eccezionalmente tollerante ai guasti.
Il funzionamento di questo algoritmo dovrebbe suonare familiare. Ordinamento conteggio confronto
funziona esattamente come un torneo Round Robin. In altre parole, fortemente
assomiglia alla stagione regolare di una squadra sportiva, giocando con tutte le altre squadre nel
divisione e costruire un record di vittorie-sconfitte in base al quale sono classificati.
Quell'ordinamento conteggio del confronto è il singolo algoritmo di ordinamento più robusto
noto, quadratico o meglio, dovrebbe offrire qualcosa di molto specifico agli appassionati di sport: se
la tua squadra non fa i playoff, non lamentarti. La postseason di Mergesort è
rischioso, ma la stagione regolare del conteggio del confronto non lo è; anelli di campionato
non sono robusti, ma le classifiche divisionali sono letteralmente robuste come si arriva. Mettere
diversamente, se la tua squadra viene eliminata all'inizio della stagione successiva, è sfortuna.
Ma se la tua squadra non riesce ad arrivare alla postseason, è dura la verità. Potresti ottenere
simpatia da bar sportivo da parte dei tuoi compagni fan delusi, ma non ne avrai
da uno scienziato informatico.
Sangue:
Gerarchieordini di becco e dominio
In tutti gli esempi che abbiamo considerato finora, il processo di ordinamento in ogni caso ha
stato imposto dall'alto verso il basso: un bibliotecario che accantona libri, racconta la NCAA

Pagina 92

squadre con chi giocare e quando. Ma cosa succederebbe se si verificassero confronti testa a testa
solo volontariamente? Che aspetto ha lo smistamento quando emerge organicamente, da
dal basso verso l'alto?
Potrebbe sembrare qualcosa di simile al poker online.
A differenza della maggior parte degli sport, che sono governati da un organo dirigente di qualche tipo, il poker
rimane un po 'anarchico nonostante l'esplosione di popolarità negli ultimi dieci anni.
Sebbene alcuni tornei di alto profilo ordinino esplicitamente i loro concorrenti (e
remunerarli di conseguenza), una parte sostanziale del poker è ancora giocata
quelli che sono noti come "cash game", dove due o più giocatori spontaneamente
accetta di giocare con soldi veri sulla linea con ogni mano.
Praticamente nessuno conosce questo mondo più profondamente di Isaac Haxton, uno dei
migliori giocatori di poker cash game al mondo. Nella maggior parte degli sport è sufficiente essere altrettanto bravi
il più possibile, e meno si è consapevoli delle proprie capacità, meglio è. Ma,
Haxton spiega: “Per certi versi l'abilità più importante come poker professionista
giocatore deve essere in grado di valutare quanto sei bravo. Se sei qualcosa a corto di
il miglior giocatore di poker del mondo, puoi essere certo di andarci
rotto se sei infinitamente disposto a interpretare le persone migliori di te. "
Haxton è uno specialista heads-up, no-limit: "heads-up" significa uno contro uno
poker, e "no-limit" significa proprio questo: la posta in gioco più alta, limitata solo da
quello che possono finanziare e stomaco. Nei cash game a più mani, lì
sarà spesso un giocatore debole, ad esempio un ricco dilettante, che alimenta un tavolo
pieno di professionisti, a cui poi non importa molto chi di loro sia il migliore di
chi. Nel mondo dell'heads-up, è diverso. “Deve esserci un disaccordo
tra te e loro su chi è meglio, o qualcuno deve esserlo volentieri
perdere. "
Quindi cosa succede quando c'è un consenso abbastanza stabilito e nessuno
disposto a interpretare qualcuno meglio di loro? Ottieni qualcosa che sembra molto
come i giocatori che cercano semplicemente di sedersi. La maggior parte dei siti di poker online ha solo un numero finito
numero di tavoli disponibili. “Quindi, se vuoi giocare a heads-up no-limit, con
bui da cinquanta e cento dollari, ci sono solo dieci tavoli disponibili per
quello ", dice Haxton," e quindi solo i dieci migliori giocatori che sono d'accordo
ora ... siediti e aspetta che si presenti qualcuno che vuole giocare. " E se a
arriva un giocatore superiore e si siede a uno di questi tavoli? Se la persona seduta
non è disposto ad alzare la posta, si affrettano.

Pagina 93

"Immagina due scimmie", dice Christof Neumann. “Uno è seduto e si nutre


al suo posto, molto pacificamente, e un altro sta venendo [a] dove l'altro
il ragazzo è seduto. E quel tizio poi si alzava e se ne andava. "
Neumann non sta facendo una metafora del poker. È un biologo comportamentale al
Università di Neuchâtel che studia la dominanza nei macachi. Quello che è solo
descritto è noto come spostamento .
Lo spostamento avviene quando un animale usa la sua conoscenza della gerarchia per
determinare che un confronto particolare semplicemente non ne vale la pena. In molti animali
società, risorse e opportunità: cibo, compagni, spazi preferiti e così via
avanti - sono rari, e in qualche modo bisogna decidere chi ottiene cosa. Stabilire
un ordine in anticipo è meno violento che venire alle mani ogni volta che si accoppia
un'opportunità o una macchia d'erba privilegiata diventa disponibile. Anche se possiamo rabbrividire
quando vediamo creature che si voltano gli artigli e il becco l'una sull'altra, biologi
tendono a pensare agli ordini gerarchici come alla violenza che prevale sulla violenza.
Suona familiare? È il compromesso tra ricerca e ordinamento.
La creazione di un ordine gerarchico è una soluzione pugilistica a un fondamentalmente
problema computazionale . Per questo motivo, per inciso, debeaking polli
fattorie può essere un approccio ben intenzionato ma controproducente: rimuove il
l'autorità delle lotte individuali per risolvere l'ordine, e quindi lo rende molto
più difficile per il gregge eseguire qualsiasi procedura di smistamento. Quindi la quantità di
l'antagonismo all'interno del gregge in molti casi aumenta effettivamente.
Guardare il comportamento degli animali dal punto di vista dell'informatica
suggerisce diverse cose. Per uno, implica che il numero di ostili
gli scontri incontrati da ogni individuo cresceranno sostanzialmente, almeno
logaritmicamente, e forse quadraticamente, man mano che il gruppo si ingrandisce. Infatti,
studi sul “comportamento agonistico” nelle galline hanno scoperto che “atti aggressivi per gallina
aumentavano con l'aumentare delle dimensioni del gruppo. " La teoria dell'ordinamento suggerisce quindi che l'etica
l'allevamento del bestiame può includere la limitazione delle dimensioni del gregge o della mandria. (Nel
polli selvatici selvatici vagano in gruppi da dieci a venti, molto più piccoli delle dimensioni del gregge
negli allevamenti commerciali.) Gli studi mostrano anche che l'aggressività sembra scomparire
dopo un periodo di alcune settimane, a meno che non vengano aggiunti nuovi membri al gregge -
corroborando l'idea che il gruppo si sta ordinando.
La chiave per pensare allo smistamento decentralizzato in natura, sostiene Jessica
Flack, codirettore del Center for Complexity and Collective Computation presso

Pagina 94

UW-Madison, è che le gerarchie di dominanza sono in definitiva informazioni


gerarchie. C'è un notevole onere computazionale per questi decentralizzati
sistemi di smistamento, sottolinea Flack. Il numero di combattimenti, diciamo, in un gruppo di
macachi è ridotto al minimo solo nella misura in cui ogni scimmia ha una dettagliata e
simile: comprensione della gerarchia. Altrimenti ne deriverà la violenza.
Se si tratta di quanto sono bravi i protagonisti a tenere traccia del file
nell'ordine attuale, potremmo aspettarci di vedere meno confronti man mano che gli animali diventano
meglio in grado di ragionare e ricordare. E forse gli umani si avvicinano di più
selezione efficiente in modo ottimale. Come dice Haxton del mondo del poker, “Sono uno dei
i migliori giocatori heads-up, no-limit hold 'em nel mondo, e nella mia testa ho un
classifica abbastanza specifica di chi penso siano i venti giocatori migliori, e io
penso che ognuno di loro abbia in mente una classifica simile. Penso che ci sia una bella
alto grado di consenso su come appare l'elenco. " Solo quando questi
le classifiche differiranno e seguiranno i cash game.

Una gara invece di una lotta


Abbiamo ora visto due aspetti negativi separati del desiderio di qualsiasi gruppo di ordinare se stesso.
Hai, come minimo, un numero linearitmico di confronti, facendo
la vita di tutti diventa più combattiva man mano che il gruppo cresce, e tu anche obbliga tutti
concorrente per tenere traccia dello stato in continua evoluzione di tutti gli altri, altrimenti
si troveranno a combattere battaglie di cui non avevano bisogno. Tassa non solo il
corpo ma mente.
Ma non deve essere così. Ci sono modi per fare ordine senza
i costi.
C'è una competizione sportiva, ad esempio, in cui decine di migliaia
i concorrenti sono completamente ordinati nel tempo necessario per contenere solo un file
evento unico. (Un torneo Round-Robin con diecimila giocatori, sul
D'altra parte, richiederebbe un centinaio di milioni di matchup.) L'unico avvertimento è questo
il tempo necessario per l'evento è determinato dai suoi concorrenti più lenti. Questo
La competizione sportiva è la maratona e suggerisce qualcosa di critico: una gara è
fondamentalmente diverso da un combattimento.
Considera la differenza tra pugili e sciatori, tra schermitori e

Pagina 95

corridori. Un pugile olimpico deve rischiare una commozione cerebrale O (log n ) volte, di solito da 4
a 6, per arrivare al podio; permettendo a un maggior numero di atleti di entrare nel
i giochi metterebbero in pericolo la salute di tutti. Ma un corridore scheletro o un saltatore con gli sci o
Lo specialista halfpipe deve fare solo un numero costante di scommesse con
gravità, indipendentemente dalle dimensioni del campo. Uno schermidore si mette contro il suo avversario
pietà O (log n ) volte, ma un maratoneta deve sopportare solo una gara. Essere capace di
assegnare una semplice misura numerica dei risultati delle prestazioni in un tempo costante
algoritmo per lo stato.
Questo passaggio da numeri "ordinali" (che esprimono solo rango ) a "cardinali"
quelli (che assegnano direttamente una misura al calibro di qualcosa) ordinano naturalmente a
impostato senza richiedere confronti a coppie. Di conseguenza, rende possibile
gerarchie di dominanza che non richiedono confronti diretti testa a testa. Il
La lista Fortune 500, nella misura in cui crea una sorta di gerarchia aziendale, è una
di questi. Per trovare l'azienda di maggior valore negli Stati Uniti, gli analisti non lo fanno
è necessario eseguire la due diligence confrontando Microsoft con General Motors, quindi
General Motors alla Chevron, Chevron a Walmart e così via. Questi apparentemente
concorsi mele-arance (quante installazioni di software aziendale sono uguali
quanti futures sul petrolio?) diventano mele a mele in dollari.
Avere un benchmark, qualsiasi benchmark, risolve il problema computazionale di
aumentare una sorta.
Nella Silicon Valley, ad esempio, c'è un adagio sulle riunioni: "Vai a
i soldi, i soldi non vengono da te. " I fornitori vanno a fondatori, fondatori
vanno dai venture capitalist, i venture capitalist vanno dai loro soci accomandanti. Suo
possibile per gli individui risentirsi della base di questa gerarchia, ma non proprio
contestare il suo verdetto. Di conseguenza, le interazioni individuali a coppie avvengono con un file
minimo di jockey per lo status. In generale, qualsiasi coppia di persone può dire,
senza bisogno di negoziare, chi dovrebbe mostrare a quale livello di rispetto
chi. Tutti sanno dove incontrarsi.
Allo stesso modo, mentre il diritto di precedenza marittimo è disciplinato in teoria da un estremamente
elaborato insieme di convenzioni, in pratica determina un principio semplice
quali navi cedono il passo a quali: la "Legge della stazza lorda". Molto semplicemente, il
la nave più piccola si allontana da quella più grande. Alcuni animali sono anche fortunati
abbastanza per avere gerarchie di dominanza così nette. Come osserva Neumann,
“Guarda il pesce, per esempio: quello più grande è quello dominante. È molto semplice."
Pagina 96

E poiché è così semplice, è pacifico . A differenza dei polli e dei primati, il pesce
fare l'ordine senza spargere sangue.
Quando pensiamo ai fattori che compongono le società umane su larga scala
possibile, è facile concentrarsi sulle tecnologie: agricoltura, metalli, macchinari. Ma
la pratica culturale di misurare lo stato con metriche quantificabili potrebbe essere giusta
importante. Il denaro, ovviamente, non deve essere il criterio; una regola come "rispetto
i vostri anziani ”, per esempio, risolve similmente le questioni sullo status delle persone
riferimento a una quantità comune. E lo stesso principio è all'opera tra
nazioni come al loro interno. Si nota spesso che un parametro di riferimento come il PIL nazionale—
che sta alla base delle liste di invito ai vertici diplomatici come il G20 — è a
misurazione grossolana e imperfetta. Ma l'esistenza di qualsiasi punto di riferimento
trasforma la questione dello status nazionale da una che richiede almeno a
numero linearitmico di risse e risoluzioni in qualcosa con un unico
punto di riferimento che classifica tutti. Dato che lo status da nazione a nazione è spesso oggetto di controversie
prendere forma militare, questo non solo fa risparmiare tempo ma anche vite.
Un numero lineare di combattimenti potrebbe funzionare bene per gruppi su piccola scala; essi
fare in natura. Ma in un mondo in cui lo status viene stabilito attraverso il pairwise
confronti - sia che si tratti di scambi di retorica o di sparatorie - l'importo
di confronto rapidamente sfugge al controllo man mano che la società cresce. Operando a
scala industriale, con molte migliaia o milioni di individui che condividono lo stesso
spazio, richiede un salto oltre. Un salto da ordinale a cardinale.
Per quanto ci lamentiamo della corsa al successo quotidiana, il fatto che sia una gara piuttosto che un
la lotta è una parte fondamentale di ciò che ci distingue dalle scimmie, dai polli e, per
quello che importa, i topi.

Pagina 97

4 Memorizzazione nella cache


Dimenticalo
Nell'uso pratico del nostro intelletto, l'oblio è una funzione importante quanto
ricordando.

—WILLIAM JAMES
Hai un problema. Il tuo armadio è traboccante, rovesciando scarpe, camicie e
biancheria intima sul pavimento. Pensi: "È ora di organizzarsi". Adesso hai
due problemi.
In particolare, devi prima decidere cosa tenere e, secondo, come farlo
sistemalo. Fortunatamente, c'è una piccola industria di persone che ci pensa
problemi gemelli per vivere e sono più che felici di offrire i loro consigli.
Su cosa tenere, Martha Stewart dice di porsi alcune domande: “Come
da tempo ce l'ho? Funziona ancora? È un duplicato di qualcosa che ho già
proprio? Quando è stata l'ultima volta che l'ho indossato o usato? " Su come organizzare ciò che tu
keep, lei consiglia di "raggruppare cose simili insieme" e ai suoi colleghi esperti
essere d'accordo. Francine Jay, in The Joy of Less , afferma: "Appendi tutte le tue gonne insieme,
pantaloni insieme, vestiti insieme e cappotti insieme ". Andrew Mellen, che fattura
lui stesso come "L'uomo più organizzato d'America", dice, "Gli oggetti saranno
ordinati per tipo: tutti i pantaloni insieme, camicie insieme, cappotti e così via . All'interno di ogni tipo,
sono ulteriormente ordinati per colore e stile: maniche lunghe o maniche corte, per
scollatura, ecc. " A parte il problema di smistamento che ciò potrebbe comportare, sembra buono
consigli; sembra certamente unanime.
Tranne che c'è un'altra industria più grande di professionisti che pensa anche

Pagina 98

ossessivamente sull'archiviazione e hanno le loro idee.


Il tuo armadio presenta più o meno la stessa sfida che un computer deve affrontare quando
gestire la sua memoria: lo spazio è limitato e l'obiettivo è risparmiare denaro e
tempo. Da quando ci sono stati i computer, gli scienziati informatici lo hanno fatto
alle prese con il duplice problema di cosa tenere e come sistemarlo. Il
i risultati di questi decenni di sforzi rivelano che nei suoi consigli in quattro frasi su
cosa lanciare, Martha Stewart ne fa molti diversi, e non completamente
compatibili, raccomandazioni, una delle quali è molto più critica di
altri.
L'informatica della gestione della memoria rivela anche esattamente come il tuo
armadio (e il tuo ufficio) dovrebbe essere organizzato. A prima vista, compaiono i computer
per seguire la massima di Martha Stewart di "raggruppare cose simili insieme". Operativo
i sistemi ci incoraggiano a mettere i nostri file in cartelle, come con like, formando
gerarchie che si ramificano man mano che i loro contenuti diventano sempre più specifici. Ma proprio come
l'ordine della scrivania di uno studioso può nascondere il disordine della loro mente, così fa il
l'apparente ordine del file system di un computer oscura le persone altamente ingegnerizzate
caos di come i dati vengono effettivamente memorizzati sotto il rivestimento delle cartelle annidate.
Ciò che sta realmente accadendo si chiama caching .
La memorizzazione nella cache gioca un ruolo fondamentale nell'architettura della memoria e ne è alla base
tutto, dal layout dei chip del processore su scala millimetrica al
geografia di Internet globale. Offre una nuova prospettiva su tutti i vari
sistemi di archiviazione e banche di memoria della vita umana, non solo le nostre macchine, ma
anche i nostri armadi, i nostri uffici, le nostre biblioteche. E le nostre teste.

La gerarchia della memoria


Una certa donna aveva una coscienza molto acuta ma quasi nessuna memoria ...
Si ricordava abbastanza per lavorare e ha lavorato sodo.

—LYDIA DAVIS
A partire da circa il 2008, chiunque sia nel mercato per un nuovo computer ha
ha riscontrato un particolare enigma durante la scelta dell'opzione di archiviazione. Essi

Pagina 99

deve fare un compromesso tra dimensioni e velocità . L'industria informatica è attualmente


nella transizione dalle unità disco rigido alle unità a stato solido; allo stesso prezzo, a
il disco rigido offrirà una capacità notevolmente maggiore, ma un'unità a stato solido lo farà
offrono prestazioni notevolmente migliori, come la maggior parte dei consumatori sa ora o presto
scoprire quando iniziano a fare acquisti.
Ciò che i consumatori occasionali potrebbero non sapere è che si sta verificando questo esatto compromesso
realizzato all'interno della macchina stessa in un certo numero di scale, al punto in cui è
considerato uno dei principi fondamentali dell'informatica.
Nel 1946, Arthur Burks, Herman Goldstine e John von Neumann, lavoravano
presso l'Institute for Advanced Study di Princeton, ha presentato una proposta di progetto per
quello che chiamavano un "organo della memoria" elettrico. In un mondo ideale, hanno scritto, il
la macchina avrebbe ovviamente quantità illimitate di memoria fulminea, ma
in pratica questo non era possibile. (Ancora non lo è.) Invece, il trio ha proposto cosa
credevano fosse la seconda cosa migliore: “una gerarchia di ricordi, ognuno dei quali
ha una capacità maggiore rispetto al precedente ma che è accessibile meno rapidamente. " Di
avere effettivamente una piramide di diverse forme di memoria: una piccola, veloce
memoria e una grande, lenta, forse in qualche modo potremmo ottenere il meglio da entrambi.
L'idea di base dietro una gerarchia della memoria dovrebbe essere intuitiva per chiunque
ha mai usato una libreria. Se stai cercando un argomento per un articolo, diciamo, lì
sono alcuni libri a cui potresti dover fare riferimento in più occasioni. Piuttosto che andare
ogni volta che torni in biblioteca, controlli i libri pertinenti e
portali a casa sulla scrivania, dove potrai accedervi più facilmente.
In informatica, questa idea di una "gerarchia della memoria" è rimasta solo una teoria fino a
lo sviluppo nel 1962 di un supercomputer a Manchester, in Inghilterra, ha chiamato
Atlante. La sua memoria principale consisteva in un grande tamburo che poteva essere ruotato
leggere e scrivere informazioni, non diversamente da un cilindro fonografo in cera. Ma Atlas
aveva anche una memoria "funzionante" più piccola e più veloce costruita con magneti polarizzati. Dati
potrebbe essere letto dal tamburo ai magneti, manipolato lì con facilità, e
i risultati vengono poi riscritti sul tamburo.
Poco dopo lo sviluppo di Atlas, il matematico di Cambridge Maurice
Wilkes si rese conto che questa memoria più piccola e veloce non era solo comoda
posto in cui lavorare con i dati prima di salvarli di nuovo. Potrebbe anche essere utilizzato
trattenere deliberatamente informazioni che potrebbero essere necessarie in seguito,
anticipando richieste future simili e accelerando notevolmente l'operazione

Pagina 100

della macchina. Se quello di cui avevi bisogno era ancora nella memoria di lavoro, tu
non dovrei caricarlo affatto dal tamburo. Come ha detto Wilkes, il più piccolo
la memoria “accumula automaticamente su se stessa le parole che provengono da un più lento
memoria principale e li mantiene disponibili per un uso successivo senza che lo sia
necessario affinché si incorra nuovamente nella penalità dell'accesso alla memoria principale. "
La chiave, ovviamente, sarebbe gestire così quel piccolo, veloce, prezioso ricordo
aveva quello che stavi cercando il più spesso possibile. Per continuare la libreria
analogia, se riesci a fare un solo viaggio tra le pile per prendere tutti i libri tu
bisogno, e poi passare il resto della settimana a lavorare a casa, è quasi altrettanto buono
come se tutti i libri della biblioteca fossero già disponibili sulla tua scrivania. Più
torna alla biblioteca che fai, più le cose vanno lente e meno è la tua scrivania
facendo davvero per te.
La proposta di Wilkes è stata implementata successivamente nel supercomputer IBM 360/85
negli anni '60, dove ha acquisito il nome di "cache". Da allora, le cache hanno
è apparso ovunque nell'informatica. L'idea di tenere in giro pezzi di
le informazioni a cui fai riferimento frequentemente sono così potenti che vengono utilizzate in ogni
aspetto del calcolo. I processori hanno cache. I dischi rigidi dispongono di cache.
I sistemi operativi dispongono di cache. I browser Web dispongono di cache. E i server quello
fornire contenuti a quei browser hanno anche cache, rendendo possibile
ti mostra immediatamente lo stesso video di un gatto che cavalca un aspirapolvere che milioni
di ... Ma stiamo andando un po 'avanti a noi stessi.
La storia del computer negli ultimi cinquant'anni e più è stata dipinta come
uno di crescita esponenziale anno dopo anno, facendo riferimento, in parte, al famoso
previsione accurata della "Legge di Moore", fatta da Gordon Moore di Intel nel 1975, che
il numero di transistor nelle CPU raddoppierebbe ogni due anni. Cosa non ha
migliorato a quel ritmo è la prestazione della memoria, il che significa che rispetto a
tempo di elaborazione, anche il costo di accesso alla memoria sta aumentando in modo esponenziale.
Ad esempio, più velocemente puoi scrivere i tuoi documenti, maggiore è la perdita di
produttività da ogni viaggio in biblioteca. Allo stesso modo, una fabbrica che raddoppia la sua
velocità di produzione ogni anno, ma ha lo stesso numero di parti spedite
dall'estero allo stesso ritmo lento, significherà poco più di una fabbrica
è due volte più inattivo. Per un po 'sembrava che la legge di Moore stesse cedendo poco
tranne i processori che giravano i pollici sempre più velocemente e sempre più del
tempo. Negli anni '90 questo iniziò a essere conosciuto come il "muro della memoria".

Pagina 101

La migliore difesa dell'informatica dal colpire quel muro è stata mai vista
gerarchia più elaborata: cache per cache per cache, fino in fondo.
I moderni laptop, tablet e smartphone di consumo hanno nell'ordine di sei
gerarchia della memoria a strati e gestire la memoria in modo intelligente non è mai stato così
importante per l'informatica come lo è oggi.
Quindi iniziamo con la prima domanda che mi viene in mente sulle cache (o
armadi, del resto). Cosa facciamo quando si riempiono?

Sfratto e chiaroveggenza
Dipende da questo, arriva un momento in cui per ogni aggiunta di conoscenza
dimentichi qualcosa che sapevi prima. È della massima importanza,
quindi, per non avere fatti inutili che scacciano quelli utili.

-SHERLOCK HOLMES
Quando una cache si riempie, ovviamente avrai bisogno di fare spazio se lo fai
vuole memorizzare qualcos'altro, e nell'informatica questo fare spazio lo è
chiamata "sostituzione della cache" o "rimozione della cache". Come scrisse Wilkes, “Dal momento che il
[cache] può essere solo una frazione della dimensione della memoria principale, le parole non possono esserlo
conservato in esso a tempo indeterminato e deve essere collegato al sistema un algoritmo
da cui vengono progressivamente sovrascritti. " Questi algoritmi sono noti come
"Politiche di sostituzione" o "politiche di sfratto" o semplicemente come algoritmi di memorizzazione nella cache.
IBM, come abbiamo visto, ha svolto un ruolo iniziale nell'implementazione del caching
sistemi negli anni '60. Non sorprende che sia stata anche la casa di seminal early
ricerca sugli algoritmi di caching - nessuno, forse, importante come quello di László
"Les" Bélády. Bélády è nato nel 1928 in Ungheria, dove ha studiato come a
ingegnere meccanico prima di fuggire in Germania durante il 1956 ungherese
Rivoluzione con nient'altro che una borsa contenente “un cambio di biancheria intima e
il mio documento di laurea. " Dalla Germania andò in Francia e nel 1961
emigrò negli Stati Uniti, portando sua moglie, “un figlio neonato e 1.000 dollari
la mia tasca, e basta. " Sembra che avesse acquisito un senso finemente sintonizzato di cosa
da tenere e cosa lasciarsi alle spalle quando si è ritrovato in IBM, a lavorare

Pagina 102

sullo sfratto della cache.


L'articolo di Bélády del 1966 sugli algoritmi di caching sarebbe diventato il più citato
pezzo di ricerca informatica per quindici anni. Come spiega, l'obiettivo di
la gestione della cache serve a ridurre al minimo il numero di volte in cui non riesci a trovare cosa
stai cercando nella cache e devi andare alla memoria principale più lenta per trovare
esso; questi sono noti come "errori di pagina" o "errori di cache". La cache ottimale
la politica di sfratto, essenzialmente per definizione, ha scritto Bélády, è quando la cache è
pieno, per sfrattare qualsiasi oggetto avremo di nuovo bisogno di più a lungo da ora .
Naturalmente, sapere esattamente quando avrai bisogno di qualcosa di nuovo è più facile a dirsi
che fatto.
L'ipotetico algoritmo onnisciente e preveggente che guarderebbe avanti e
eseguire la politica ottimale è noto oggi in omaggio come l'algoritmo di Bélády .
L'algoritmo di Bélády è un esempio di ciò che gli informatici chiamano a
Algoritmo “chiaroveggente”: uno informato dai dati del futuro. Non è
necessariamente per quanto folle possa sembrare: ci sono casi in cui un sistema potrebbe saperlo
cosa aspettarsi, ma in generale la chiaroveggenza è difficile da trovare e il software
gli ingegneri scherzano sull'incontrare "difficoltà di implementazione" quando ci provano
implementare in pratica l'algoritmo di Bélády. Quindi la sfida è trovare un file
algoritmo che si avvicina il più possibile alla chiaroveggenza, per tutti quei tempi
quando siamo fermamente bloccati nel presente e possiamo solo immaginare cosa ci aspetta.
Potremmo semplicemente provare lo sfratto casuale , aggiungendo nuovi dati alla cache e
sovrascrivendo i vecchi dati a caso. Uno dei primi sorprendenti risultati nella memorizzazione nella cache
La teoria è che, sebbene lungi dall'essere perfetto, questo approccio non è affatto male. Come
succede, solo avere una cache rende un sistema più efficiente, indipendentemente da
come lo mantieni. Gli oggetti che usi spesso finiranno presto nella cache
Comunque. Un'altra strategia semplice è First-In, First-Out ( FIFO ), dove sfratti
o sovrascrivi tutto ciò che è rimasto nella cache più a lungo (come in Martha
La domanda di Stewart "Da quanto tempo ce l'ho?"). Un terzo approccio è Least
Usato di recente ( LRU ): sfratto l'oggetto rimasto intatto da più tempo
(“Quand'è stata l'ultima volta che l'ho indossato o usato?” Di Stewart?).
Si scopre che non solo questi due mantra di Stewart suggeriscono molto
politiche diverse, uno dei suoi suggerimenti supera chiaramente l'altro. Bélády
hanno confrontato lo sfratto casuale, FIFO e varianti di LRU in una serie di
scenari e ha scoperto che LRU ha costantemente eseguito il più vicino a
Pagina 103

chiaroveggenza. Il principio LRU è efficace a causa di qualcosa di computer


gli scienziati chiamano "località temporale": se un programma ha richiesto un pezzo particolare
di informazioni una volta, è probabile che lo faccia di nuovo nel prossimo futuro. Temporale
località risulta in parte dal modo in cui i computer risolvono i problemi (ad esempio,
eseguendo un ciclo che fa una rapida serie di letture e scritture correlate), ma
emerge anche dal modo in cui le persone risolvono i problemi. Se stai lavorando sul tuo file
computer, potresti passare dalla tua posta elettronica, a un browser web e una parola
processore. Il fatto che tu abbia effettuato l'accesso a uno di questi di recente è un indizio che lo sei
probabilmente lo farà di nuovo e, a parità di condizioni, il programma che non hai
utilizzato da più tempo è probabilmente anche quello per cui non verrà utilizzato
un po 'di tempo a venire.
In effetti, questo principio è persino implicito nell'interfaccia mostrata dai computer
i loro utenti. Le finestre sullo schermo del computer hanno ciò che viene chiamato "Z-
ordine ", una profondità simulata che determina quali programmi vengono sovrapposti
quale. Quelle usate meno di recente finiscono in fondo. In qualità di ex responsabile creativo di
Firefox, Aza Raskin, afferma: "La maggior parte del tempo utilizza un browser moderno
(computer) viene speso nell'equivalente digitale di mescolare carte. " Questo
Anche lo "shuffling" si rispecchia esattamente nel cambio di attività di Windows e Mac OS
interfacce: quando premi Alt + Tab o Comando + Tab, vedi il tuo
applicazioni elencate in ordine dalla più recente alla meno recente.
La letteratura sulle politiche di sfratto è tanto profonda quanto si può immaginare:
inclusi algoritmi che tengono conto della frequenza e dell'attualità dell'uso,
algoritmi che tengono traccia momento del successivo accesso -per-ultimo piuttosto che l'ultimo,
e così via. Ma nonostante l'abbondanza di schemi di memorizzazione nella cache innovativi, alcuni di
che può battere LRU nelle giuste condizioni, LRU stesso e piccoli aggiustamenti
di cui — è il preferito in modo schiacciante degli scienziati informatici e viene utilizzato in un file
ampia varietà di applicazioni distribuite su una varietà di scale. LRU ce lo insegna
la prossima cosa che possiamo aspettarci di aver bisogno è l'ultima di cui avevamo bisogno, mentre la cosa
avremo bisogno dopo che è probabilmente il secondo più recente. E l'ultima cosa
possiamo aspettarci di aver bisogno è quello di cui siamo già andati più a lungo senza.
A meno che non abbiamo buone ragioni per pensare diversamente, sembra che la nostra migliore guida
al futuro è un'immagine speculare del passato. La cosa più vicina alla chiaroveggenza è
presumere che la storia si ripeta - all'indietro.

Pagina 104

Capovolgere la libreria
Nel profondo dei sotterranei Gardner Stacks dell'Università della California,
Berkeley, dietro una porta chiusa a chiave e un prominente avviso "Staff Only", totalmente off-
limiti agli avventori, è uno dei gioielli del sistema bibliotecario UC. Cormac
McCarthy, Thomas Pynchon, Elizabeth Bishop e JD Salinger; Anaïs Nin,
Susan Sontag, Junot Díaz e Michael Chabon; Annie Proulx, Mark Strand e
Philip K. Dick; William Carlos Williams, Chuck Palahniuk e Toni Morrison;
Denis Johnson, Juliana Spahr, Jorie Graham e David Sedaris; Sylvia Plath,
David Mamet, David Foster Wallace e Neil Gaiman ... Non è della biblioteca
collezione di libri rari; è la sua cache.
Come abbiamo già discusso, le biblioteche sono un naturale esempio di memoria
gerarchia se utilizzato insieme alla nostra scrivania. In effetti, le biblioteche in
stessi, con le loro varie sezioni e strutture di stoccaggio, sono un ottimo esempio
di una gerarchia di memoria con più livelli. Di conseguenza, affrontano tutti
tipi di problemi di memorizzazione nella cache. Devono decidere quali libri mettere nel limitato
spazio espositivo nella parte anteriore della biblioteca, quali tenere nelle loro pile e quali
da consegnare allo stoccaggio fuori sede. La politica per cui i libri devono essere smistati fuori sede varia
da libreria a libreria, ma quasi tutti usano una versione di LRU. “Per il principale
Stacks, ad esempio ", afferma Beth Dupuis, che supervisiona il processo nell'UC
Biblioteche di Berkeley, “se un oggetto non è stato utilizzato per dodici anni, è il
tagliato fuori."
All'altra estremità dello spettro dai libri intatti in una dozzina di anni
è l'area di “smistamento approssimativo” della biblioteca, che abbiamo visitato nel capitolo precedente.
Qui è dove vanno i libri subito dopo essere stati restituiti, prima di essere completamente ordinati
e accantonato ancora una volta nelle cataste. L'ironia è che gli assistenti laboriosi
metterli di nuovo sui loro scaffali potrebbe, in un certo senso, essere che li rende meno
ordinato.
Ecco perché: se la località temporale è valida, gli scaffali di smistamento approssimativo contengono
i libri più importanti dell'intero edificio. Questi sono i libri che erano
utilizzati più di recente, quindi sono quelli che più probabilmente saranno gli avventori
cercando. Sembra un crimine che probabilmente è il più succoso e il più navigabile
scaffale delle miglia di pile delle biblioteche è sia nascosto che costantemente eroso
dal serio personale della biblioteca che fa il proprio lavoro.

Pagina 105

Nel frattempo, l'atrio della Biblioteca universitaria Moffit, l'ubicazione di


gli scaffali più importanti e accessibili: mettono in mostra il meglio della biblioteca
libri di recente acquisizione . Si tratta di istanziare una sorta di cache FIFO, privilegiando
gli elementi aggiunti per ultimi alla libreria, non per l'ultima lettura.
La prestazione dominante dell'algoritmo LRU nella maggior parte dei test su quel computer
Gli scienziati che ci hanno lanciato induce a un semplice suggerimento: girare la biblioteca all'interno
fuori . Metti gli acquisti in fondo, per chi li vuole trovare. E metti il ​file
gli articoli restituiti più di recente nella hall, dove sono maturi per la navigazione.
Gli esseri umani sono creature sociali, e presumibilmente il corpo universitario lo farebbe
trovo interessante esaminare le proprie abitudini di lettura. Spingerebbe il campus
verso una versione più organica e in forma libera di ciò per cui i college si battono quando
assegnano "libri comuni": la facilitazione di punti comuni intellettuali di
riferimento. Qui, i libri che vengono letti nel campus, qualunque cosa siano,
sarebbero diventati i libri che più probabilmente sarebbero stati incontrati accidentalmente da altri
studenti. Una sorta di analogo dal basso verso l'alto del libro comune
programma.
Ma un sistema come questo non sarebbe solo più socialmente positivo. Dal momento che il
gli articoli restituiti più di recente sono quelli che con maggiore probabilità verranno ritirati successivamente
sarebbe anche più efficiente. È vero che gli studenti potrebbero essere perplessi dal fatto
che i libri popolari a volte si trovano nelle pile e talvolta nei file
atrio. Tuttavia, mancano i libri restituiti di recente che attendono di essere rimessi
le pile in entrambi i casi. È solo che attualmente sono off-limits durante questo brief
limbo. Permettere invece ai libri restituiti di adornare la hall avrebbe dato
agli studenti la possibilità di cortocircuitare completamente il processo di scaffalatura. Nessun dipendente
avrebbe dovuto avventurarsi tra le cataste per depositare i volumi, e nessuno studente
avrebbe dovuto avventurarsi nelle pile per tirarli fuori. È esattamente così
la memorizzazione nella cache è pensata per funzionare.

La nuvola alla fine della strada


“In realtà abbiamo realizzato una mappa del paese, della scala di un miglio
miglio! "
"Lo hai usato molto?" Ho chiesto.

Pagina 106

"Non è mai stato sparso, ancora", ha detto Mein Herr: "gli agricoltori
obiettò: dissero che avrebbe coperto l'intero paese e escluso il
luce del sole! Quindi ora usiamo il paese stesso, come una mappa, e te lo assicuro
fa quasi altrettanto bene. "

-LEWIS CARROLL
Spesso pensiamo a Internet come a un luogo piatto, indipendente e poco connesso
Rete. In effetti, non è nessuna di queste cose. Un quarto di tutto il traffico Internet a
il presente è gestito da un'unica società, che riesce a restare quasi
completamente fuori dai titoli dei giornali. Si chiama questa azienda con sede nel Massachusetts
Akamai, e sono nel business del caching.
Pensiamo anche a Internet come astratto, demateriale, post-geografico. Siamo
ha detto che i nostri dati sono "nella nuvola", il che dovrebbe suggerire un luogo diffuso e distante.
Ancora una volta, nessuno di questi è vero. La realtà è che Internet è tutta una questione di bundle
di cavi fisici e scaffalature metalliche. Ed è molto più strettamente legato a
geografia di quanto potresti aspettarti.
Gli ingegneri pensano alla geografia su piccola scala quando progettano il computer
hardware: la memoria più veloce viene solitamente posizionata più vicino al processore, riducendo al minimo
la lunghezza dei fili che le informazioni devono percorrere. Il processore di oggi
i cicli sono misurati in gigahertz, vale a dire che stanno eseguendo operazioni
in frazioni di nanosecondi. Per riferimento, questo è il tempo necessario alla luce per viaggiare a
pochi pollici , quindi la disposizione fisica degli interni di un computer è molto simile a
preoccupazione. E applicando lo stesso principio su una scala notevolmente più ampia, reale
la geografia risulta essere fondamentale per il funzionamento del web, dove i fili
non sono pollici ma potenzialmente migliaia di miglia.
Se puoi creare una cache del contenuto della pagina web che è fisicamente,
geograficamente più vicino alle persone che lo desiderano, puoi pubblicare quelle pagine
Più veloce. Gran parte del traffico su Internet è ora gestito dalla “distribuzione dei contenuti
reti "(CDN), che dispongono di computer in tutto il mondo che ne conservano le copie
di siti web popolari. Ciò consente agli utenti che richiedono quelle pagine di ottenere i propri dati
da un computer che si trova nelle vicinanze, senza dover fare il lungo viaggio
continenti al server originale.
La più grande di queste CDN è gestita da Akamai: i fornitori di contenuti pagano

Pagina 107
i loro siti web devono essere "Akamaized" per prestazioni migliori. Un australiano che
il video in streaming dalla BBC, ad esempio, sta probabilmente raggiungendo Akamai locale
server a Sydney; la richiesta non arriva mai a Londra. Non è necessario.
Il capo architetto di Akamai, Stephen Ludin, afferma: "È nostra convinzione e noi costruiamo il
compagnia intorno al fatto che la distanza è importante. "
Nella nostra discussione precedente, abbiamo notato che alcuni tipi di memoria del computer
hanno prestazioni più veloci ma costano di più per unità di archiviazione, il che porta a una "memoria
gerarchia ”che cerca di ottenere il meglio da entrambi. Ma non è effettivamente necessario
avere una memoria fatta di materiali diversi affinché la memorizzazione nella cache abbia un senso. La memorizzazione nella cache è
altrettanto utile quando è la vicinanza, piuttosto che la prestazione, che è scarsa
risorsa.
Questa intuizione fondamentale: che i file richiesti devono essere archiviati vicino al file
luogo in cui vengono utilizzati: si traduce anche in ambienti puramente fisici.
Ad esempio, gli enormi centri logistici di Amazon generalmente evitano qualsiasi tipo
di organizzazione comprensibile dall'uomo, del tipo che troveresti in una biblioteca o in un
grande magazzino. Invece, ai dipendenti viene detto di posizionare gli articoli in arrivo ovunque
possono trovare spazio nel magazzino: batterie guancia a guancia con la matita
temperamatite, pannolini, griglie per barbecue e DVD per imparare il dobro e tagga il file
posizione di ogni articolo in un database centrale utilizzando codici a barre. Ma questo deliberatamente
sistema di archiviazione dall'aspetto disorganizzato ha ancora un'eccezione visibile: alta
gli articoli a richiesta vengono collocati in un'area diversa, più rapidamente accessibile rispetto al
riposo. Quell'area è la cache di Amazon.
Di recente, ad Amazon è stato concesso un brevetto per un'innovazione che spinge questo
principio un passo avanti. Il brevetto parla di “pacchetto anticipatorio
shipping ", su cui la stampa si è impadronita come se Amazon potesse in qualche modo spedire
qualcosa prima di acquistarlo. Amazon, come qualsiasi azienda tecnologica,
mi piacerebbe avere quel tipo di chiaroveggenza alla Bélády, ma per il prossimo migliore
cosa, si trasforma in cache. Il loro brevetto è in realtà per la spedizione di articoli che hanno
è stato recentemente popolare in una data regione per un magazzino di staging in quella regione—
come avere la propria CDN per i beni fisici. Quindi, quando qualcuno colloca un file
ordine, l'articolo è in fondo alla strada. Anticipare gli acquisti dei privati
è impegnativo, ma nel prevedere gli acquisti di poche migliaia di persone, il
la legge dei grandi numeri entra in gioco. Qualcuno a Berkeley ordinerà, diciamo,
carta igienica riciclata in un dato giorno, e quando lo fanno è già la maggior parte del

Pagina 108

laggiù.
Quando le cose popolari in una zona provengono anche da quella zona, ancora di più
emerge un'interessante geografia della nuvola. Nel 2011, il critico cinematografico Micah Mertes
ha creato una mappa degli Stati Uniti utilizzando i "Preferiti locali" di ogni stato da
Netflix: mette in evidenza i film insolitamente popolari in ciascuno di questi stati.
In modo schiacciante, si è scoperto che le persone adorano guardare i film ambientati dove vivono.
I Washingtoniani preferiscono i single , ambientato a Seattle; Louisianans guardano The Big Easy ,
ambientato a New Orleans; Non sorprende che Angelinos apprezzi LA Story ; Gli abitanti dell'Alaska amano
Braving Alaska ; e Montanans, Montana Sky . * E perché niente giova
tanto dal caching locale quanto dagli enormi file che compongono l'intera lunghezza
Video HD, è certo che Netflix lo abbia organizzato in modo che i file , diciamo, LA Story
vivere proprio a Los Angeles, proprio come i suoi personaggi e, cosa più importante, i suoi
fan.

Memorizzazione nella cache sul fronte interno


Mentre la memorizzazione nella cache è nata come uno schema per organizzare le informazioni digitali all'interno
computer, è chiaro che è altrettanto applicabile all'organizzazione di oggetti fisici in
ambienti umani. Quando abbiamo parlato con John Hennessy, presidente di Stanford
Università e un pioniere dell'architetto informatico che ha contribuito allo sviluppo moderno
sistemi di memorizzazione nella cache: ha immediatamente visto il collegamento:

La memorizzazione nella cache è una cosa così ovvia perché lo facciamo sempre. Voglio dire, la quantità di informazioni che ho
ottenere ... certe cose di cui devo tenere traccia in questo momento, un mucchio di cose che ho sulla mia scrivania, e poi
altre cose vengono archiviate e poi archiviate nel sistema degli archivi universitari dove
ci vuole un giorno intero per tirarne fuori qualcosa, se lo volessi. Ma usiamo sempre quella tecnica per provarci
organizzare le nostre vite.

Il parallelo diretto tra questi problemi significa che c'è il potenziale per
applicare consapevolmente le soluzioni dell'informatica alla casa.
Primo, quando decidi cosa tenere e cosa buttare via, LRU lo è
potenzialmente un buon principio da usare, molto meglio di FIFO. Non dovresti
getta necessariamente quella maglietta del college se la indossi ancora ogni tanto.
Ma i pantaloni scozzesi che non indossi da secoli? Possono essere di qualcun altro

Pagina 109

bonanza del negozio dell'usato.


In secondo luogo, sfruttare la geografia. Assicurati che le cose siano nella cache più vicina
nel luogo in cui vengono solitamente utilizzati. Questa non è una raccomandazione concreta
nella maggior parte dei libri di organizzazione domestica, ma risulta costantemente negli schemi che
le persone reali descrivono come lavorare bene per loro. “Continuo a correre e fare esercizio
attrezzi in una cassa sul pavimento dell'armadio del mio cappotto ", dice una persona citata
Ad esempio, Organizing from the Inside Out di Julie Morgenstern . “Mi piace avere
vicino alla porta d'ingresso. "
Un esempio leggermente più estremo appare nel libro Keeping Found Things
Trovato , da William Jones:

Un dottore mi ha parlato del suo approccio alla conservazione delle cose. “I miei figli pensano che io sia stravagante, ma io metto le cose
dove penso che ne avrò bisogno di nuovo in seguito, anche se non ha molto senso. " Come esempio di lei
sistema, mi ha detto che tiene sacchetti extra per aspirapolvere dietro il divano in soggiorno.
Dietro il divano in soggiorno? Ha un senso? ... Si scopre che quando il vuoto
viene utilizzato un detergente, di solito viene utilizzato per la moquette in soggiorno.… Quando si ottiene un sacchetto per aspirapolvere
pieno e ne serve uno nuovo, di solito è in soggiorno. Ed è proprio lì che l'aspirapolvere
le borse sono.

Un'ultima intuizione, che non è ancora stata inserita nelle guide sull'organizzazione dell'armadio, è
quella della gerarchia di memoria multilivello. Avere una cache è efficiente, ma avere
più livelli di cache, dal più piccolo e più veloce al più grande e più lento, possono farlo
essere ancora migliore. Per quanto riguarda i tuoi effetti personali, il tuo armadio è un unico nascondiglio
livello, il tuo seminterrato un altro e un armadietto per riporre le cose un terzo. (Questi sono in
ordine decrescente della velocità di accesso, ovviamente, quindi dovresti usare il principio LRU
come base per decidere cosa deve essere sfrattato da ogni livello a quello successivo.) Ma tu
potrebbe anche essere in grado di accelerare le cose aggiungendo ancora un altro livello di cache: un
ancora più piccolo, più veloce, più vicino del tuo armadio.
La moglie di Tom, altrimenti estremamente tollerante, si oppone a una pila di vestiti accanto
il letto, nonostante la sua insistenza sul fatto che è in realtà uno schema di cache altamente efficiente.
Fortunatamente, le nostre conversazioni con gli informatici hanno rivelato una soluzione a
anche questo problema. Rik Belew della UC San Diego, che studia i motori di ricerca da
una prospettiva cognitiva, consigliato l'uso di un cameriere. Anche se non lo fai
vederne troppi in questi giorni, un cameriere è essenzialmente un armadio a un vestito, a
gancio composto per giacca, cravatta e pantaloni: il pezzo perfetto di hardware per

Pagina 110

le tue esigenze di memorizzazione nella cache domestica. Il che dimostra che gli informatici
non solo ti farà risparmiare tempo; potrebbero anche salvare il tuo matrimonio.

Archiviazione e palificazione
Dopo aver deciso cosa tenere e dove dovrebbe andare, la sfida finale è
saperlo organizzare. Abbiamo parlato di cosa va nell'armadio e
dove dovrebbe essere l'armadio, ma come dovrebbero essere sistemate le cose all'interno?
Una delle costanti di tutti i consigli sull'organizzazione domestica che abbiamo
visto finora è l'idea di raggruppare "simili con simili" - e forse nessuno lo è
Vola direttamente di fronte a quel consiglio come Yukio Noguchi. "Devo sottolineare"
dice Noguchi, “che un principio fondamentale nel mio metodo è non raggruppare
file in base al contenuto. " Noguchi è un economista presso l'Università di Tokyo,
e l'autore di una serie di libri che offrono "super" trucchi per risolvere il tuo
ufficio e la tua vita. I loro titoli si traducono approssimativamente in Super Persuasion Method ,
Super metodo di lavoro , super metodo di studio e, cosa più importante per noi, Super
Metodo organizzato .
All'inizio della sua carriera di economista, Noguchi si è trovato costantemente
inondato di informazioni - corrispondenza, dati, manoscritti - e la perdita di un file
porzione significativa di ogni giorno cercando solo di organizzare tutto. Quindi ha cercato un file
alternativa. Ha iniziato inserendo semplicemente ogni documento in un file etichettato con
il titolo e la data del documento e inserendo tutti i file in un unico grande riquadro. Quello
risparmiava tempo: non doveva pensare al posto giusto in cui mettere ogni documento
—Ma non ha portato a nessuna forma di organizzazione. Poi, qualche volta all'inizio
Anni '90, ha avuto una svolta: ha iniziato a inserire i file esclusivamente a sinistra-
lato della mano della scatola. E così è nato il "super" sistema di archiviazione.
La regola di inserimento a sinistra, specifica Noguchi, deve essere seguita per i vecchi file
oltre a quelli nuovi: ogni volta che estrai un file per usarne il contenuto, devi farlo
rimettilo come file più a sinistra quando lo rimetti nella casella. E quando tu
cerca un file, inizi sempre anche dal lato sinistro. Più
i file a cui si accede di recente sono quindi i più veloci da trovare.
Questa pratica è iniziata, spiega Noguchi, perché riportava ogni file a sinistra
era solo più facile che tentare di reinserirlo nello stesso punto da cui proveniva. Solo

Pagina 111

gradualmente si rese conto che questa procedura non era solo semplice ma anche
sorprendentemente efficiente.
Il sistema di archiviazione Noguchi consente di risparmiare chiaramente tempo durante la sostituzione
qualcosa dopo aver finito di usarlo. C'è ancora la domanda, tuttavia, di
se è un buon modo per trovare i file di cui hai bisogno in primo luogo. Dopotutto, sì
certamente va contro le raccomandazioni di altri guru dell'efficienza, che ce lo dicono
che dovremmo mettere insieme cose simili. Anzi, anche l'etimologia del
la parola "organizzato" evoca un corpo composto di organi, che se non lo sono
celle raggruppate "come con simili", raggruppate insieme da forma e funzione simili.
Ma l'informatica ci offre qualcosa che la maggior parte dei guru dell'efficienza non fa:
garanzie.
Sebbene Noguchi all'epoca non lo sapesse, il suo sistema di archiviazione rappresenta un file
estensione del principio LRU. LRU ci dice che quando aggiungiamo qualcosa al nostro file
cache dovremmo scartare l'elemento più vecchio, ma non ci dice dove dovremmo
metti il nuovo oggetto. La risposta a questa domanda viene da una linea di ricerca
svolte da informatici negli anni '70 e '80. La loro versione di
il problema è chiamato "elenchi auto-organizzati" e la sua configurazione imita quasi esattamente
Il dilemma dell'archiviazione di Noguchi. Immagina di avere una serie di elementi in una sequenza,
e devi periodicamente cercarli per trovare elementi specifici. La ricerca
stesso è vincolato a essere lineare: devi esaminare gli elementi uno per uno,
cominciando dall'inizio, ma una volta trovato l'oggetto che stai cercando, puoi farlo
rimetterlo in qualsiasi punto della sequenza. Dove dovresti sostituire gli articoli
rendere la ricerca il più efficiente possibile?
Il documento definitivo sulle liste auto-organizzate, pubblicato da Daniel Sleator e
Robert Tarjan nel 1985, ha esaminato (nel modo classico dell'informatica) il
nel peggiore dei casi prestazioni di vari modi per organizzare l'elenco dato tutto il possibile
sequenze di richieste. Intuitivamente, poiché la ricerca inizia in primo piano, lo desideri
organizzare la sequenza in modo che appaiano gli elementi più probabili da cercare
Là. Ma quali oggetti saranno? Siamo tornati a desiderare la chiaroveggenza
ancora. "Se conosci la sequenza in anticipo", dice Tarjan, che divide la sua
tempo tra Princeton e Silicon Valley, "è possibile personalizzare i dati
struttura per ridurre al minimo il tempo totale per l'intera sequenza. Questa è la cosa ottimale
algoritmo offline: l'algoritmo di Dio se vuoi, o l'algoritmo nel cielo. Di
Ovviamente nessuno conosce il futuro, quindi la domanda è: se non conosci il file

Pagina 112

futuro, come vicino si può venire a questo algoritmo ottimale nel cielo?” Sleator
ei risultati di Tarjan hanno mostrato che alcuni "schemi di autoregolazione molto semplici,
sorprendentemente, rientrano in un fattore costante di chiaroveggenza. Vale a dire, se tu
segui il principio LRU, dove semplicemente rimetti sempre un oggetto nel file
all'inizio dell'elenco, quindi la quantità totale di tempo che impieghi a cercare lo farà
mai più del doppio del tempo che se avessi conosciuto il futuro. Non è un file
garantire che qualsiasi altro algoritmo possa fare.
Riconoscere il Noguchi Filing System come istanza del principio LRU
in azione ci dice che non è solo efficiente. In realtà è ottimale.
I risultati di Sleator e Tarjan ci forniscono anche un'ulteriore svolta, e otteniamo
ruotando il sistema di archiviazione Noguchi su un lato. Molto semplicemente, una scatola di file
su un lato diventa un mucchio. Ed è la natura stessa delle pile che le cerchi
dall'alto verso il basso, e che ogni volta che si estrae un documento non torna indietro
dove l'hai trovato, ma in cima. *
In breve, la matematica delle liste auto-organizzate suggerisce qualcosa di radicale:
la grande pila di carte sulla tua scrivania, lungi dall'essere un mestolo che induce in colpa
caos, è in realtà una delle strutture più ben progettate ed efficienti
a disposizione. Quello che agli altri potrebbe sembrare un pasticcio non organizzato è, in effetti, a
pasticcio auto-organizzato. Gettare le cose in cima alla pila è la cosa migliore
si può fare, timido di conoscere il futuro. Nel capitolo precedente abbiamo esaminato
casi in cui lasciare qualcosa non ordinato era più efficiente che prendersi del tempo
ordinare tutto; qui, tuttavia, c'è una ragione molto diversa per cui non lo fai
bisogno di organizzarlo.
Hai già.

La curva dell'oblio
Naturalmente, nessuna discussione sulla memoria potrebbe essere completa senza menzionare il file
"Organo della memoria" più vicino a casa: il cervello umano. Negli ultimi decenni,
l'influenza dell'informatica ha portato a una sorta di rivoluzione in
come gli psicologi pensano alla memoria.
Si dice che la scienza della memoria umana sia iniziata nel 1879, con un giovane
psicologo dell'Università di Berlino di nome Hermann Ebbinghaus.

Pagina 113

Ebbinghaus voleva arrivare al fondo di come funzionava la memoria umana, e a


dimostrare che era possibile studiare la mente con tutto il rigore matematico del
Scienze fisiche. Così ha iniziato a sperimentare su se stesso.
Ogni giorno, Ebbinghaus si sedeva e memorizzava un elenco di sciocchezze
sillabe. Poi si sarebbe messo alla prova sugli elenchi dei giorni precedenti. Perseguendo questo
abitudine nel corso di un anno, ha stabilito molti dei risultati più elementari in
ricerca sulla memoria umana. Ha confermato, ad esempio, che pratica una lista
più volte lo fa persistere più a lungo in memoria e che il numero di elementi
si può ricordare accuratamente che va giù col passare del tempo. I suoi risultati hanno tracciato una mappa
grafico di come la memoria svanisce nel tempo, conosciuto oggi dagli psicologi come “il
dimenticando la curva. "
I risultati di Ebbinghaus hanno stabilito la credibilità di una scienza quantitativa di
memoria umana, ma hanno lasciato aperto qualcosa di un mistero. Perché questo particolare
curva? Suggerisce che la memoria umana sia buona o cattiva? Qual è il file
storia sottostante qui? Queste domande hanno stimolato gli psicologi
speculazione e ricerca da più di cento anni.
Nel 1987, lo psicologo e scienziato informatico della Carnegie Mellon John Anderson
si è ritrovato a leggere dei sistemi di recupero delle informazioni dell'università
biblioteche. L'obiettivo di Anderson - o almeno così pensava - era scrivere di come il design
di quei sistemi potrebbero essere informati dallo studio della memoria umana. Invece, il file
accadde l'opposto: si rese conto che la scienza dell'informazione poteva fornire il
pezzo mancante nello studio della mente.
"Per molto tempo", dice Anderson, "avevo sentito che c'era qualcosa
manca nelle teorie esistenti sulla memoria umana, compresa la mia. Fondamentalmente,
tutte queste teorie caratterizzano la memoria come arbitraria e non ottimale
configurazione ... Avevo a lungo sentito che i processi di memoria di base erano abbastanza
adattivo e forse anche ottimale; tuttavia, non ero mai riuscito a vedere un file
quadro in cui mettere questo punto. Nell'informatica si lavora su
recupero delle informazioni, ho visto quel quadro disposto davanti a me. "
Un modo naturale per pensare all'oblio è che le nostre menti semplicemente finiscono
spazio. L'idea chiave alla base del nuovo resoconto di Anderson sulla memoria umana è questa
il problema potrebbe non essere di archiviazione , ma di organizzazione . Secondo il suo
teoria, la mente ha una capacità essenzialmente infinita per i ricordi, ma noi ne abbiamo solo
una quantità di tempo finita in cui cercarli. Anderson ha fatto l'analogia
Pagina 114

a una biblioteca con un unico scaffale arbitrariamente lungo: il sistema di archiviazione Noguchi all'indirizzo
Scala della Biblioteca del Congresso. Puoi inserire tutti gli oggetti che vuoi su quello scaffale,
ma più qualcosa è vicino alla parte anteriore, più velocemente sarà da trovare.
La chiave per una buona memoria umana diventa quindi la stessa della chiave per a
buona cache del computer: prevedere quali elementi è più probabile che vengano ricercati nel file
futuro.
Escludendo la chiaroveggenza, l'approccio migliore per fare tali previsioni nel
il mondo umano richiede la comprensione del mondo stesso. Con il suo collaboratore Lael
Schooler, Anderson ha deciso di eseguire studi simili a quelli di Ebbinghaus, non sugli esseri umani
menti, ma sulla società umana. La domanda era semplice: quali schemi
caratterizzano il modo in cui il mondo stesso "dimentica", il modo in cui gli eventi e
i riferimenti sbiadiscono nel tempo? Anderson e Schooler hanno analizzato tre umani
ambienti: titoli del New York Times , registrazioni di genitori che parlano
ai loro figli e alla casella di posta in arrivo di Anderson. In tutti i domini, hanno trovato
che una parola è molto probabile che appaia di nuovo subito dopo essere stata appena usata, e
che la probabilità di vederlo di nuovo diminuisce col passare del tempo.
In altre parole, la realtà stessa ha una struttura statistica che imita il
Curva di Ebbinghaus.
Questo suggerisce qualcosa di straordinario. Se lo schema da cui le cose svaniscono
la nostra mente è il modello stesso in base al quale le cose svaniscono dall'uso intorno a noi, quindi lì
può essere davvero un'ottima spiegazione per la curva dell'oblio di Ebbinghaus -
vale a dire, che è una perfetta sintonizzazione del cervello con il mondo, messa a disposizione
precisamente le cose che più probabilmente saranno necessarie.

Memoria umana e ambienti umani. Il pannello di sinistra mostra la percentuale di sillabe senza senso

Pagina 115

Ebbinghaus ha correttamente richiamato da un elenco, in funzione del numero di ore che ha aspettato per prime
memorizzare l'elenco. Il pannello di destra mostra la possibilità che una parola appaia nei titoli del Nuovo
York Times in un dato giorno, in funzione del tempo trascorso dalla sua precedente apparizione in stampa.

Ponendo l'accento sul tempo, il caching ci mostra che la memoria coinvolge


compromessi inevitabili e una certa somma zero. Non puoi avere tutte le librerie
prenota alla tua scrivania, ogni prodotto in esposizione nella parte anteriore del negozio, ogni
titolo above the fold, ogni foglio in cima alla pila. E allo stesso modo
non puoi avere ogni fatto, faccia o nome in primo piano.
"Molte persone ritengono che la memoria umana sia tutt'altro che ottimale",
ha scritto Anderson e Schooler. “Indicano i molti frustranti fallimenti di
memoria. Tuttavia, queste critiche non riescono ad apprezzare il compito prima dell'essere umano
memoria, che è cercare di gestire un'enorme scorta di ricordi. In qualsiasi sistema
responsabile della gestione di una vasta base di dati ci devono essere errori di recupero. È
semplicemente troppo costoso per mantenere l'accesso a un numero illimitato di articoli ".
Questa comprensione ha portato a sua volta a una seconda rivelazione sull'essere umano
memoria. Se questi compromessi sono davvero inevitabili, e il cervello sembra esserlo
sintonizzato in modo ottimale sul mondo che lo circonda, quindi ciò a cui ci riferiamo come inevitabile
Il "declino cognitivo" che deriva dall'età può infatti essere qualcos'altro.

La tirannia dell'esperienza
Un grande libro è una grande seccatura.
—CALLIMACO (305–410 aC), BIBLIOTECA DI ALESSANDRIA

Perché non fanno tutto l'aereo con quella roba da scatola nera?

—STEVEN WRIGHT
La necessità di una gerarchia della memoria del computer, sotto forma di una cascata di cache,
è in gran parte il risultato della nostra incapacità di permetterci di realizzare l'intero ricordo
del tipo di hardware più costoso. La cache più veloce sui computer attuali,
ad esempio, è realizzato con quello che viene chiamato SRAM, che costa circa mille
volte tanto per byte quanto la memoria flash nelle unità a stato solido. Ma il vero

Pagina 116

la motivazione per la memorizzazione nella cache va più in profondità. In effetti, anche se potessimo ottenere un file
macchina su misura che utilizzava esclusivamente la forma di memoria più veloce possibile,
avremmo ancora bisogno di cache.
Come spiega John Hennessy, le dimensioni da sole sono sufficienti per ridurre la velocità:

Quando crei qualcosa di più grande, è intrinsecamente più lento, giusto? Se ingrandisci una città, ci vuole
più tempo per andare dal punto A al punto B. Se ingrandisci una libreria, ci vorrà più tempo per trovare un libro
la Biblioteca. Se hai una pila di fogli più grande sulla scrivania, è necessario più tempo per trovare la carta
stai cercando, vero? Le cache sono in realtà una soluzione a questo problema ... Ad esempio, adesso, se
vai a comprare un processore, quello che otterrai è una cache di livello 1 e una cache di livello 2 sul chip. Il
la ragione per cui ci sono - anche solo sul chip ci sono due cache! - è per tenere il passo con il
velocità di ciclo del processore, la cache di primo livello ha dimensioni limitate.

Inevitabilmente, più grande è un ricordo, più tempo ci vuole per cercare e


estrarre una parte di informazioni da esso.
Brian e Tom, sulla trentina, si ritrovano già più di frequente
bloccando una conversazione come, ad esempio, aspettano il nome di qualcuno “on
la punta della lingua ”per venire in mente. Poi di nuovo, Brian all'età di dieci anni ne aveva due
dozzine di compagni di scuola; vent'anni dopo ha centinaia di contatti nel telefono
e migliaia su Facebook, e ha vissuto in quattro città, ognuna con la propria
comunità di amici, conoscenti e colleghi. Tom, a questo punto nel suo
carriera accademica, ha lavorato con centinaia di collaboratori e ha insegnato
migliaia di studenti. (In effetti, questo stesso libro prevedeva l'incontro con circa un
cento persone e citando mille). Tali effetti non sono affatto limitati a
legami sociali, ovviamente: un tipico bambino di due anni conosce duecento parole;
un adulto tipico ne conosce trentamila. E quando si tratta di memoria episodica,
beh, ogni anno aggiunge un terzo di milione di minuti di veglia al totale vissuto
Esperienza.
Considerato in questo modo, è una meraviglia che noi due, o chiunque altro, possiamo
mentalmente tenere il passo a tutti. Ciò che sorprende non è il rallentamento della memoria, ma il
Fatto che la mente può eventualmente rimanere a galla e reattiva come tanti dati
si accumula.
Se la sfida fondamentale della memoria è davvero piuttosto quella dell'organizzazione
rispetto allo stoccaggio, forse dovrebbe cambiare il modo in cui pensiamo all'impatto dell'invecchiamento
sulle nostre capacità mentali. Ha condotto un recente lavoro di un team di psicologi e linguisti

Pagina 117

di Michael Ramscar presso l'Università di Tubinga ha suggerito che ciò che noi
chiamare "declino cognitivo" - ritardi ed errori di recupero - potrebbe non riguardare la ricerca
processo in rallentamento o deterioramento, ma (almeno in parte) inevitabile
conseguenza della quantità di informazioni che dobbiamo navigare sempre più grande
e più grande. Indipendentemente da qualsiasi altra sfida che l'invecchiamento comporta, i cervelli più anziani—
che deve gestire una maggiore riserva di ricordi - stanno letteralmente risolvendo più difficile
problemi computazionali ogni giorno che passa. I vecchi possono deridere i giovani per
la loro velocità: "È perché non sai ancora niente!"
Il gruppo di Ramscar ha dimostrato l'impatto di informazioni aggiuntive sull'essere umano
memoria concentrandosi sul caso del linguaggio. Attraverso una serie di simulazioni,
i ricercatori hanno dimostrato che semplicemente sapere di più rende le cose più difficili quando è così
arriva a riconoscere parole, nomi e persino lettere. Non importa quanto sei bravo
schema organizzativo è che dover cercare tra più cose inevitabilmente
impiegare più tempo. Non è che ci stiamo dimenticando; è quello che stiamo ricordando. Siamo
diventare archivi.
Una comprensione delle inevitabili richieste di calcolo della memoria,
Ramscar dice, dovrebbe aiutare le persone a venire a patti con gli effetti dell'invecchiamento
cognizione. “Penso che la cosa tangibile più importante che gli anziani possano fare sia provare
comprendere l'idea che le loro menti siano l'elaborazione naturale delle informazioni
dispositivi ", scrive. “Alcune cose che potrebbero sembrare frustranti man mano che invecchiamo
(come ricordare i nomi!) sono una funzione della quantità di cose che dobbiamo setacciare
attraverso ... e non sono necessariamente un segno di una mente fallimentare. " Come dice lui, "Molto
di quello che attualmente viene chiamato declino è semplicemente imparare ".
La memorizzazione nella cache ci fornisce la lingua per capire cosa sta succedendo. Noi diciamo
"Scoreggia cerebrale" quando dovremmo davvero dire "cache miss". Lo sproporzionato
i ritardi occasionali nel recupero delle informazioni sono un promemoria di quanto noi
trarre vantaggio per il resto del tempo avendo ciò di cui abbiamo bisogno in primo piano.
Quindi, mentre invecchi e inizi a sperimentare queste sporadiche latenze, fatti coraggio:
la durata di un ritardo è in parte un indicatore della portata della tua esperienza. Il
lo sforzo di recupero è una testimonianza di quanto sai. E la rarità di quelli
i ritardi sono una testimonianza di quanto bene l'hai organizzato: mantenere il più importante
cose a portata di mano.

Pagina 118
5 Pianificazione
Cominciando dall'inizio

Il modo in cui trascorriamo le nostre giornate è, ovviamente, il modo in cui trascorriamo le nostre vite.

—ANNIE DILLARD
"Perché non scriviamo un libro sulla teoria della pianificazione?" Ho chiesto ... "Sì
non dovrebbe volerci molto tempo! " Scrivere libri, come fare la guerra, spesso implica
gravi errori di calcolo. Quindici anni dopo, la pianificazione è ancora incompiuta.

—EUGENE LAWLER
È lunedì mattina e hai un programma ancora vuoto e una lunga lista di
attività da completare. Alcuni possono essere avviati solo dopo che altri sono terminati (non puoi
caricare la lavastoviglie a meno che non sia stata scaricata prima), e alcune possono essere avviate solo dopo
un certo tempo (i vicini si lamenteranno se metti la spazzatura sul marciapiede
prima di martedì sera). Alcuni hanno scadenze precise, altri possono essere fatti
ogni volta, e molti sono confusi nel mezzo. Alcuni sono urgenti, ma non importanti.
Alcuni sono importanti, ma non urgenti. "Siamo quello che facciamo ripetutamente" sembri
per ricordare le parole di Aristotele: che si tratti di pulire il pavimento, passate più tempo con
famiglia, deposita le tasse in tempo, impara il francese.
Quindi cosa fare, quando e in quale ordine? La tua vita sta aspettando.
Anche se riusciamo sempre a trovare un modo per ordinare le cose che facciamo nel nostro
giorni, di regola non ci consideriamo particolarmente bravi in ​questo - da qui il

Pagina 119

status di bestseller perenne delle guide per la gestione del tempo. Sfortunatamente, il file
la guida che troviamo in essi è spesso divergente e incoerente. Ottenere
Cose fatte sostiene una politica di esecuzione immediata di qualsiasi attività di due minuti
o meno non appena viene in mente. Il bestseller rivale Eat That Frog! consiglia
iniziando con il compito più difficile e procedendo verso il più facile e il più facile
cose. The Now Habit suggerisce prima di pianificare i propri impegni sociali e
tempo libero e poi colmare le lacune con il lavoro, piuttosto che il contrario
in giro, come spesso facciamo. William James, il "padre della psicologia americana",
afferma che “non c'è niente di così faticoso come l'eterno aggrapparsi a un
compito incompiuto ", ma Frank Partnoy, in Wait , sostiene deliberatamente
non fare le cose subito.
Ogni guru ha un sistema diverso ed è difficile sapere chi ascoltare.

Trascorrere il tempo diventa una scienza


Sebbene la gestione del tempo sembri un problema vecchio quanto il tempo stesso, la scienza di
la programmazione è iniziata nelle officine meccaniche della rivoluzione industriale. Nel 1874,
Frederick Taylor, figlio di un ricco avvocato, ha rifiutato la sua accettazione a
Harvard per diventare apprendista macchinista presso Enterprise Hydraulic Works in
Filadelfia. Quattro anni dopo, ha completato il suo apprendistato e ha iniziato
lavorando presso la Midvale Steel Works, dove ha scalato i ranghi dal tornio
dall'operatore al caposquadra dell'officina meccanica e infine al capo ingegnere. Nel
processo, arrivò a credere che il tempo delle macchine (e delle persone) lui
sorvegliato non veniva usato molto bene, portandolo a sviluppare una disciplina per lui
chiamato "Gestione scientifica".
Taylor ha creato un ufficio di pianificazione, al centro del quale c'era una bacheca
mostrando il programma del negozio affinché tutti possano vederlo. Il tabellone raffigurava ogni macchina
nell'officina, mostrando il compito attualmente svolto da quella macchina e tutto il resto
i compiti che lo aspettano. Questa pratica sarebbe stata sviluppata dal collega di Taylor
Henry Gantt, che negli anni '10 ha sviluppato i diagrammi di Gantt che avrebbero aiutato
organizzare molti dei progetti di costruzione più ambiziosi del ventesimo secolo,
dalla diga di Hoover all'Interstate Highway System. Un secolo dopo, Gantt
i grafici adornano ancora le pareti e gli schermi dei project manager di aziende come

Pagina 120

Amazon, IKEA e SpaceX.


Taylor e Gantt hanno reso la pianificazione un oggetto di studio e l'hanno resa visiva
e forma concettuale. Ma non hanno risolto il problema fondamentale di
determinare quali orari erano i migliori. Il primo suggerimento che anche questo problema
potrebbe essere risolto non sarebbe apparso fino a diversi decenni dopo, in un articolo del 1954
pubblicato dal matematico di RAND Corporation Selmer Johnson.
Lo scenario esaminato da Johnson era la rilegatura, dove ogni libro deve
essere stampato su una macchina e poi rilegato su un altro. Ma il più comune
esempio di questa configurazione a due macchine è molto più vicino a casa: la lavanderia. quando
ti lavi i vestiti, devono passare attraverso la lavatrice e l'asciugatrice
sequenza e carichi diversi richiederanno tempi diversi in ciascuno. UN
un carico molto sporco potrebbe richiedere più tempo per il lavaggio, ma il tempo consueto per asciugare; un grande
il carico potrebbe richiedere più tempo per asciugare, ma il tempo normale per il lavaggio. Quindi, Johnson ha chiesto, se
hai diversi carichi di bucato da fare nello stesso giorno, qual è il modo migliore per farlo
li fai?
La sua risposta è stata che dovresti iniziare trovando il singolo passaggio che richiede
minor tempo, il carico che laverà o asciugherà più velocemente. Se è il più breve
passo coinvolge la lavatrice, pianificare prima quel carico . Se riguarda l'asciugatrice, pianifica
farlo durare . Ripetere questo processo per i carichi rimanenti, lavorando dai due
fine del programma verso la metà.
Intuitivamente, l'algoritmo di Johnson funziona perché indipendentemente da come tu
sequenza i carichi, ci sarà un po 'di tempo all'inizio quando la lavatrice è
in funzione ma non l'asciugatrice e alla fine un po 'di tempo quando l'asciugatrice è in funzione
ma non la lavatrice. Avendo i tempi di lavaggio più brevi all'inizio e il
tempi di asciugatura più brevi alla fine, massimizzi la quantità di sovrapposizione, quando il
lavatrice e asciugatrice funzionano contemporaneamente. Così puoi mantenere il totale
quantità di tempo speso a fare il bucato al minimo assoluto. L'analisi di Johnson
aveva prodotto il primo algoritmo ottimale della programmazione: inizia con il lavaggio più leggero, fine
con il cesto più piccolo.
Al di là delle sue applicazioni immediate, il documento di Johnson ne ha rivelate due più profonde
punti: primo, che la pianificazione potrebbe essere espressa algoritmicamente, e secondo, quello
esistevano soluzioni di pianificazione ottimali. Questo ha dato il via a quello che è diventato un file
letteratura tentacolare, esplorando strategie per un vasto serraglio di ipotetici
fabbriche con ogni possibile numero e tipo di macchine.
Pagina 121

Ci concentreremo su un piccolo sottoinsieme di questa letteratura: la parte che, a differenza


legatoria o lavanderia, si occupa della programmazione per una singola macchina. Perché il
Il problema di programmazione che conta di più riguarda una sola macchina: noi stessi.

Scadenze per il trattamento


Con la pianificazione per macchina singola, ci imbattiamo subito in un problema
il pipistrello. Il lavoro di Johnson sulla rilegatura si è basato sulla riduzione al minimo del tempo totale
necessario affinché le due macchine completino tutti i loro lavori. In caso di singolo
programmazione della macchina, tuttavia, se abbiamo intenzione di eseguire tutte le attività assegnate, allora
tutti i programmi richiederanno lo stesso tempo per essere completati; l'ordine è irrilevante.
Questo è un punto sufficientemente fondamentale e controintuitivo che vale la pena
ripetendo. Se hai una sola macchina e farai tutto il tuo
attività, quindi qualsiasi ordine delle attività richiederà la stessa quantità di tempo.
Così ci imbattiamo letteralmente nella prima lezione sulla programmazione a macchina singola
prima ancora di iniziare: rendi espliciti i tuoi obiettivi . Non possiamo dichiarare un programma
un vincitore fino a quando non sappiamo come stiamo tenendo il punteggio. Questo è qualcosa di un tema
in informatica: prima di poter avere un piano, devi prima scegliere una metrica.
E a quanto pare, quale metrica scegliamo qui influenzerà direttamente quale
gli approcci alla pianificazione se la cavano meglio.
I primi articoli sulla programmazione di una sola macchina sono seguiti rapidamente
del lavoro di rilegatura di libri di Johnson e ha offerto diversi parametri plausibili a
tener conto di. Per ogni metrica, hanno scoperto una strategia semplice e ottimale.
Ovviamente è comune, ad esempio, che le attività abbiano una data di scadenza, con l'estensione
il ritardo di un compito è quanto lontano è andato in ritardo. Quindi possiamo pensare al file
"Massimo ritardo" di un insieme di compiti come il ritardo di qualunque compito sia andato
oltre la data di scadenza, il genere di cose a cui potrebbe interessare il tuo datore di lavoro in a
valutazione delle prestazioni. (O cosa potrebbe interessare ai tuoi clienti in un negozio al dettaglio o
impostazione del servizio, in cui l'attività di "massimo ritardo" corrisponde al cliente
soggetto al tempo di attesa più lungo.)
Se sei preoccupato di ridurre al minimo il massimo ritardo, allora il migliore
la strategia consiste nell'iniziare con l'attività in scadenza il prima possibile e farsi strada verso l'attività
dovuto per ultimo. Questa strategia, nota come Prima data di scadenza , è abbastanza intuitiva. (Per

Pagina 122

Ad esempio, in un contesto del settore dei servizi, dove è la "data di scadenza" di ogni utente in arrivo
in effetti nell'istante in cui varcano la porta, significa solo servire i clienti
ordine di arrivo.) Ma alcune delle sue implicazioni sono sorprendenti. Ad esempio, come
il tempo necessario per completare ogni attività è del tutto irrilevante: non cambia il file
piano, quindi in effetti non hai nemmeno bisogno di sapere. Tutto ciò che conta è quando i compiti
sono dovuti a.
Potresti già utilizzare Prima data di scadenza per affrontare il tuo carico di lavoro, in formato
in questo caso probabilmente non avrai bisogno dell'informatica per dirti che si tratta di un file
strategia sensata. Quello che potresti non sapere, però, è che è l' ottimale
strategia. Più precisamente, è ottimale presumere che ti interessi solo uno
metrica in particolare: ridurre il tuo massimo ritardo. Se questo non è il tuo obiettivo,
tuttavia, un'altra strategia potrebbe essere più applicabile.
Ad esempio, considera il frigorifero. Se sei una delle tante persone che
avere un abbonamento all'agricoltura supportata dalla comunità (CSA), quindi ogni settimana o
due hai un sacco di prodotti freschi che arrivano a casa tua tutti in una volta. Ogni
il pezzo di prodotto è destinato a deteriorarsi in una data diversa, quindi mangiarli prima
La data di scadenza, in base al loro programma di deterioramento, sembra un inizio ragionevole
punto. Tuttavia, non è la fine della storia. La prima data di scadenza è ottimale per
riducendo il ritardo massimo, il che significa che ridurrà al minimo il marciume del
l'unica cosa più marcia che dovrai mangiare; potrebbe non essere il più appetitoso
metrica da mangiare.
Forse invece vogliamo ridurre al minimo il numero di cibi che si deteriorano. Qui a
La strategia chiamata Algoritmo di Moore ci offre il nostro miglior piano. Algoritmo di Moore
dice che iniziamo proprio come con Earliest Due Date, programmando il nostro
produrre in ordine di data di deterioramento, il più presto possibile, un articolo alla volta. Tuttavia, come
Non appena sembra che non riusciremo a mangiare il prossimo oggetto in tempo, ci fermiamo, guardiamo
torna sui pasti che abbiamo già pianificato e butta via l'oggetto più grande (quello
è quello che impiegherebbe più giorni a consumare). Ad esempio, potrebbe
significa rinunciare all'anguria che richiederebbe una mezza dozzina di porzioni da mangiare; non
anche tentarlo significherà arrivare a tutto ciò che segue molto prima. Noi
quindi ripetere questo schema, disponendo gli alimenti in base alla data di deterioramento e lanciando il
il più grande elemento già programmato ogni volta che rimaniamo indietro. Una volta che tutto quello
i resti possono essere mangiati in ordine di data di deterioramento senza che nulla rovini, abbiamo
ottenuto il nostro piano.

Pagina 123

L'algoritmo di Moore riduce al minimo il numero di oggetti che dovrai lanciare


lontano. Naturalmente, sei anche il benvenuto a compostare il cibo, donarlo al locale
banca del cibo o dallo al tuo vicino. In un contesto industriale o burocratico
dove non puoi semplicemente scartare un progetto, ma in cui il numero, invece di
la gravità degli ultimi progetti è ancora la tua più grande preoccupazione, l'algoritmo di Moore lo è
altrettanto indifferente a come vengono gestiti questi ultimi compiti. Qualunque cosa sia stata avviata
la parte principale del tuo programma può essere completata alla fine, in qualsiasi ordine; esso
non importa, perché sono già tutti in ritardo.

Finire di fare le cose


Fai le cose difficili mentre sono facili e fai le cose grandi mentre sono
sono piccoli.

—LAO TZU
A volte le scadenze non sono la nostra preoccupazione principale e vogliamo solo ottenere cose
fatto: più cose, il più rapidamente possibile. Si scopre che traducendo questo
il desiderio apparentemente semplice in una metrica di pianificazione esplicita è più difficile di esso
suoni.
Un approccio è assumere la prospettiva di un estraneo. Abbiamo notato che in singolo
programmazione della macchina, niente di ciò che facciamo può cambiare il tempo che ci vorrà per finire
tutte le nostre attività, ma se ciascuna attività, ad esempio, rappresenta un cliente in attesa, allora
c'è un modo per occupare il meno possibile del loro tempo collettivo. Immaginare
a partire dal lunedì mattina con un progetto di quattro giorni e un progetto di un giorno
la tua agenda. Se consegni il progetto più grande giovedì pomeriggio (4 giorni
trascorso) e poi quello piccolo del venerdì pomeriggio (trascorsi 5 giorni), i clienti
avrà aspettato un totale di 4 + 5 = 9 giorni. Se inverti l'ordine, tuttavia, tu
può finire il piccolo progetto lunedì e quello grande venerdì, con l'estensione
clienti in attesa di un totale di solo 1 + 5 = 6 giorni. Anche per te è una settimana lavorativa completa
modo, ma ora hai risparmiato ai tuoi clienti tre giorni del loro tempo totale.
I teorici della pianificazione chiamano questa metrica la "somma dei tempi di completamento".
Ridurre al minimo la somma dei tempi di completamento porta a un ottimo molto semplice

Pagina 124

algoritmo chiamato Shortest Processing Time : fai sempre tu il compito più veloce
può.
Anche se non hai clienti impazienti appesi a ogni lavoro, Shortest
Tempo di elaborazione ottiene le cose fatte . (Forse non sorprende che sia compatibile
con la raccomandazione in Getting Things Done di eseguire immediatamente qualsiasi
attività che richiede meno di due minuti.) Anche in questo caso, non è possibile modificare il totale
quantità di tempo che ti richiederà il tuo lavoro, ma il tempo di elaborazione più breve potrebbe diminuire
la tua mente riducendo il numero di attività in sospeso il più rapidamente possibile.
La metrica della somma dei tempi di completamento può essere espressa in un altro modo: è come
concentrandosi soprattutto sulla riduzione della lunghezza della tua lista di cose da fare. Se ogni pezzo di
gli affari incompiuti sono come una spina nel fianco, quindi correre attraverso il più facile
gli articoli possono portare un certo sollievo.
Naturalmente, non tutti gli affari incompiuti sono uguali. Mettere fuori un vero
il fuoco in cucina dovrebbe probabilmente essere fatto prima di "spegnere un fuoco" con a
e-mail veloce a un cliente, anche se il primo richiede un po 'più di tempo. Nella pianificazione, questo
la differenza di importanza viene catturata in una variabile nota come peso . Quando tu sei
esaminando la tua lista di cose da fare, questo peso potrebbe sembrare letterale: il peso che ricevi
dalle tue spalle finendo ogni attività. Il tempo di completamento di un'attività mostra come
a lungo si porta quel peso, riducendo così al minimo la somma dei tempi di completamento ponderati
(ovvero, la durata di ogni attività moltiplicata per il suo peso) significa ridurre al minimo il tuo
oppressione totale mentre lavori con tutta la tua agenda.
La strategia ottimale per questo obiettivo è una semplice modifica di Shortest
Tempo di elaborazione: dividi il peso di ciascuna attività per il tempo necessario
finire, e poi lavorare in ordine dalla più alta importanza risultante per unità
tempo (chiamatelo “densità” se volete, per continuare la metafora del peso) al più basso.
E anche se potrebbe essere difficile assegnare un grado di importanza a ciascuno dei tuoi
attività quotidiane, questa strategia offre comunque una buona regola pratica: dare la priorità solo a un file
attività che richiede il doppio del tempo se è due volte più importante.
In contesti aziendali, il "peso" potrebbe essere facilmente tradotto nella quantità di
denaro che ogni attività porterà. L'idea di dividere la ricompensa per la durata
si traduce, quindi, nell'assegnazione a ciascuna attività di una tariffa oraria. (Se sei un consulente
o freelance, che in effetti potrebbe già essere fatto per te: dividi semplicemente ciascuno
commissione del progetto in base alle sue dimensioni e procedi dalla tariffa oraria più alta al
È interessante notare che questa strategia ponderata compare anche negli studi sugli animali

Pagina 125

foraggiamento, con noci e bacche che prendono il posto di dollari e centesimi. Animali,
cercando di massimizzare la velocità con cui accumulano energia dal cibo, dovrebbe
perseguire gli alimenti in ordine di rapporto tra la loro energia calorica e il tempo necessario
prenderli e mangiarli - e in effetti sembra che lo facciano.
Quando applicato ai debiti piuttosto che ai redditi, lo stesso principio produce a
strategia per entrare in nero che viene chiamata la "valanga di debiti".
Questa strategia di riduzione del debito dice di ignorare il numero e l'entità dei propri debiti
interamente, e semplicemente incanalare i tuoi soldi verso il debito con il singolo più alto
tasso d'interesse. Ciò corrisponde piuttosto chiaramente a svolgere i lavori in ordine di
importanza per unità di tempo. Ed è la strategia che ridurrà l'onere totale
del tuo debito il più rapidamente possibile.
Se, d'altra parte, sei più interessato a ridurre il numero di file
debiti rispetto all'importo del debito - se, per esempio, il fastidio di numerose cambiali e
la raccolta di telefonate è un affare più grande della differenza nei tassi di interesse, allora
sei tornato al sapore non ponderato, "basta fare le cose" di Shortest
Tempo di elaborazione, pagando prima i debiti più piccoli semplicemente per farli uscire dal
modo. Nei circoli di riduzione del debito, questo approccio è noto come la "palla di neve del debito".
Se le persone, in pratica, dovrebbero dare la priorità all'abbassamento dell'importo in dollari di
i loro debiti o la quantità di essi rimane una controversia attiva, sia nel
stampa popolare così come nella ricerca economica.

Scegliere i nostri problemi


Questo ci riporta alla nota su cui abbiamo iniziato la nostra discussione sui singoli
programmazione della macchina. Si dice che “un uomo con un orologio sa che ore sono;
un uomo con due orologi non è mai sicuro." L'informatica può offrirci ottimali
algoritmi per varie metriche disponibili nella pianificazione a macchina singola, ma
la scelta della metrica che vogliamo seguire dipende da noi. In molti casi, ci arriviamo
decidere quale problema vogliamo risolvere.
Questo offre un modo radicale per ripensare alla procrastinazione, la classica patologia del
gestione del tempo. In genere lo consideriamo un algoritmo difettoso. E se lo fosse
esattamente l'opposto? E se fosse una soluzione ottimale al problema sbagliato ?
C'è un episodio di X-Files in cui il protagonista Mulder, costretto a letto

Pagina 126

e sul punto di essere consumato da un vampiro ossessivo-compulsivo, versa un sacchetto di


semi di girasole sul pavimento per autodifesa. Il vampiro, impotente contro il suo
compulsione, si china a raccoglierli uno per uno, e alla fine il sole sorge
prima che possa preparare un pasto a Mulder. Gli informatici lo chiamerebbero a
"Attacco ping" o attacco "denial of service": dai a un sistema un effetto travolgente
numero di cose banali da fare e le cose importanti si perdono nel caos.
Tipicamente associamo la procrastinazione con la pigrizia o il comportamento di evitamento,
ma può nascere altrettanto facilmente nelle persone (o nei computer, o nei vampiri) che lo sono
cercando seriamente ed entusiasta di fare le cose il più rapidamente possibile. Nel
uno studio del 2014 condotto da David Rosenbaum della Penn State, ad esempio, partecipanti
è stato chiesto di portare uno dei due secchi pesanti all'estremità opposta di un file
corridoio. Uno dei secchi era proprio accanto al partecipante; l'altro era
in parte lungo il corridoio. Con sorpresa degli sperimentatori, gente subito
raccolse il secchio vicino a loro e lo trascinò fino in fondo, passando il
altro secchio sulla strada, che avrebbero potuto trasportare una frazione del
distanza. Come scrivono i ricercatori, “questa scelta apparentemente irrazionale riflette a
tendenza a precrastinare, un termine che introduciamo per indicare l'accelerazione di
completamento sotto-obiettivo, anche a scapito di uno sforzo fisico extra ". Rimandare
lavorare
allo sumodo
stesso un grande progetto
può essere occupandosi
visto invece di varie
come "l'accelerazione del questioni banali del
completamento puòsotto-obiettivo", il che è un altro
modo per dire che i procrastinatori agiscono (in modo ottimale!) per ridurre il più rapidamente possibile
possibile il numero di compiti in sospeso nelle loro menti. Non è che abbiano un file
cattiva strategia per fare le cose; hanno un'ottima strategia per il torto
metrico.
Lavorare su un computer comporta un rischio aggiuntivo quando si tratta di
essere consapevoli e consapevoli delle nostre metriche di pianificazione: l'interfaccia utente
può sottilmente (o non così sottilmente) imporre la propria metrica su di noi. Un moderno
l'utente di smartphone, ad esempio, è abituato a vedere i "badge" che si librano sopra
icone delle applicazioni, numeri minacciosi in bianco su rosso che indicano esattamente quanti
compiti che ogni particolare app si aspetta che noi completiamo. Se è una casella di posta elettronica a tutto volume
la figura dei messaggi non letti, quindi tutti i messaggi vengono implicitamente dati uguali
peso. Possiamo dunque essere biasimati per aver applicato il più breve non ponderato
Algoritmo del tempo di elaborazione per risolvere il problema: gestire tutte le email più semplici
prima e rimandando i più difficili all'ultimo, per abbassare questo numero il più velocemente possibile

Pagina 127

possibile?
Vivi in ​base alla metrica, muori in base alla metrica. Se tutti i compiti hanno davvero lo stesso peso,
allora è esattamente quello che dovremmo fare. Ma se non vogliamo diventarlo
schiavi delle minuzie, allora dobbiamo prendere misure a tal fine. Questo inizia
assicurandoci che il problema della singola macchina che stiamo risolvendo sia quello che stiamo risolvendo
voglio risolvere. (Nel caso dei badge delle app, se non riusciamo a farli riflettere il nostro
priorità reali, e non può superare l'impulso a ridurne in modo ottimale qualsiasi
cifra numerica gettata in faccia, allora forse la cosa migliore da fare è semplicemente
disattivare i badge.)
Rimanere concentrati non solo sul portare a termine le cose, ma anche su cose pesanti
fatto — fare il lavoro più importante possibile in ogni momento — suona come un
cura sicura per procrastinare. Ma a quanto pare, anche questo non è abbastanza. E
un gruppo di esperti di programmazione di computer si imbatterebbe maggiormente in questa lezione
modo drammatico immaginabile: sulla superficie di Marte, con il mondo intero
Guardando.

Inversione di priorità e vincoli di precedenza


Era l'estate del 1997 e l'umanità aveva molto da festeggiare. Per la prima volta
mai, un rover stava navigando sulla superficie di Marte. Il Mars da 150 milioni di dollari
La sonda spaziale Pathfinder aveva accelerato fino a una velocità di 16.000 miglia all'ora,
viaggiato attraverso 309 milioni di miglia di spazio vuoto ed è atterrato con grado spaziale
airbag sulla superficie rocciosa marziana rossa.
E ora stava procrastinando.
Sulla Terra, gli ingegneri del Jet Propulsion Laboratory (JPL) erano entrambi preoccupati
e perplesso. Il compito con la massima priorità di Pathfinder (per spostare i dati dentro e fuori dal suo file
"Bus delle informazioni") veniva misteriosamente trascurato mentre il robot si allontanava
il suo tempo su compiti di media importanza. Cosa stava succedendo? Non è stato il robot
ne sai di meglio?
All'improvviso Pathfinder ha registrato che l'autobus delle informazioni non era stato trattato
con per un tempo inaccettabilmente lungo, e, mancando un ricorso più sottile, ha avviato a
riavvio completo, che costa alla missione la parte migliore di una giornata di lavoro. Un giorno o giù di lì
più tardi, la stessa cosa è successa di nuovo.
Pagina 128

Lavorando febbrilmente, il team del JPL è finalmente riuscito a riprodursi e poi


diagnosticare il comportamento. Il colpevole era un classico rischio di programmazione chiamato
inversione di priorità . Ciò che accade in un'inversione di priorità è che un compito a bassa priorità
prende possesso di una risorsa di sistema (accesso a un database, diciamo) per fare un po '
lavoro, ma viene poi interrotto a metà del lavoro da un timer, che si ferma
e invoca lo scheduler di sistema. Lo scheduler avvia un'attività ad alta priorità,
ma non può essere eseguito perché il database è occupato. E così lo scheduler si muove
nell'elenco delle priorità, eseguendo invece varie attività di priorità media non bloccate
— Invece di quello ad alta priorità (che è bloccato) o quello a bassa priorità
che lo sta bloccando (che è bloccato in linea dietro tutto il lavoro a priorità media). Nel
questi scenari da incubo, a volte può essere la massima priorità del sistema
trascurato per periodi di tempo arbitrariamente lunghi.*
Una volta che gli ingegneri del JPL avevano identificato il problema Pathfinder come un caso di
inversione di priorità, hanno scritto una correzione e trasmesso il nuovo codice a milioni
di miglia a Pathfinder. Qual è stata la soluzione che hanno inviato volando attraverso il solare
sistema? Eredità prioritaria . Se si scopre che un'attività a bassa priorità blocca un file
risorsa ad alta priorità, beh, allora tutto ad un tratto dovrebbe fare quel compito a bassa priorità
diventa momentaneamente l'elemento con la priorità più alta del sistema, "ereditando" il file
priorità della cosa che sta bloccando.
Il comico Mitch Hedberg racconta una volta in cui “Ero in un casinò, lo ero
pensando ai fatti miei, e questo ragazzo si avvicinò e disse: 'Avrai
per muoverti, stai bloccando l'uscita antincendio. ' Come se ci fosse un incendio, io no
correrò. " L'argomento del buttafuori era l'inversione di priorità; La confutazione di Hedberg
era l'eredità prioritaria. Hedberg oziava casualmente di fronte a una folla in fuga
mette il suo bighellonare a bassa priorità prima della loro corsa ad alta priorità per le loro vite
... ma non se eredita la loro priorità. E una folla in corsa ha un modo di
facendone ereditare la priorità piuttosto rapidamente. Come spiega Hedberg, "Se lo sei
infiammabile e hai le gambe, non stai mai bloccando un'uscita antincendio. "
La morale qui è che l'amore per fare le cose non è sufficiente per evitare
programmare le insidie, e nemmeno l'amore per fare cose importanti . UN
impegno a fare meticolosamente la cosa più importante che puoi, se perseguita
a testa in giù, in modo miope, può portare a ciò che sembra a tutto il mondo
indugio. Come con un'auto che gira le gomme, la stessa voglia di fare
il progresso immediato è come ci si blocca. “Le cose che contano di più devono

Pagina 129

non essere mai alla mercé delle cose che contano meno ”, avrebbe affermato Goethe
proclamato; ma mentre questo ha il suono della saggezza, a volte è giusto
non vero. A volte ciò che conta di più non può essere fatto fino a ciò che
importa meno è finito, quindi non c'è altra scelta che trattare quella cosa poco importante
essendo tanto importante quanto qualunque cosa stia bloccando.
Quando una determinata attività non può essere avviata fino al termine di un'altra, pianificazione
i teorici lo chiamano un "vincolo di precedenza". Per esperto di ricerca operativa
Laura Albert McLay, ricordando esplicitamente questo principio ha reso il
differenza in più di un'occasione nella sua famiglia. “Può essere davvero
utile se riesci a vedere queste cose. Ovviamente, superando la giornata con tre
ragazzi, c'è molta programmazione… Non possiamo uscire dalla porta a meno che i bambini non arrivino
prima colazione, e non possono fare colazione prima se non ricordo di dargliela
un cucchiaio. A volte c'è qualcosa di molto semplice che te ne dimentichi
ritarda tutto. In termini di algoritmi di pianificazione, sapere solo cosa [quello]
è, e mantenerlo in movimento, è incredibilmente utile. È così che faccio le cose
ogni giorno."
Nel 1978, il ricercatore di pianificazione Jan Karel Lenstra è stato in grado di utilizzare lo stesso
principio mentre aiutava il suo amico Gene a trasferirsi in una nuova casa a Berkeley.
“Gene stava posticipando qualcosa che doveva essere finito prima che potessimo iniziare
qualcos'altro che era urgente. " Come ricorda Lenstra, avevano bisogno di restituire un file
furgone, ma aveva bisogno del furgone per restituire un pezzo di equipaggiamento, ma aveva bisogno del
attrezzatura per riparare qualcosa nell'appartamento. La sistemazione dell'appartamento non sembrava
urgente (da qui il suo rinvio), ma il ritorno del furgone lo fece. Dice Lenstra: "Io
gli ha spiegato che il primo compito dovrebbe essere considerato ancora più urgente ".
Mentre Lenstra è una figura centrale nella teoria della pianificazione, e quindi è andata bene
posizionato per dare questo consiglio all'amico, è arrivato con un gusto particolarmente delizioso
ironia. Questo era un caso da manuale di inversione di priorità causata dalla precedenza
vincoli. E probabilmente il più grande esperto in materia del ventesimo secolo
vincoli di precedenza non era altro che il suo amico, Eugene "Gene" Lawler.

L'urto di velocità
Considerando che ha trascorso gran parte della sua vita a pensare a come farlo in modo più efficiente

Pagina 130

completare una sequenza di compiti, Lawler ha preso un percorso intrigante e tortuoso fino al suo
propria carriera. Ha studiato matematica alla Florida State University prima di iniziare
si è laureato ad Harvard nel 1954, anche se ha lasciato prima di finire un dottorato.
Dopo un periodo in giurisprudenza, l'esercito e (abbastanza tematicamente) lavorando in un
officina meccanica, è tornato ad Harvard nel 1958, terminando il dottorato di ricerca e prendendo un
posizione presso l'Università del Michigan. Visitando Berkeley in anno sabbatico nel 1969,
è stato arrestato durante una famigerata protesta contro la guerra del Vietnam. È diventato un membro del
Facoltà a Berkeley l'anno successivo, e ha acquisito una reputazione lì per esserci
“La coscienza sociale” del dipartimento di informatica. Dopo la sua morte in
1994, l'Association for Computing Machinery ha istituito un premio in
Il nome di Lawler, in onore delle persone che dimostrano il potenziale umanitario di
Informatica.
La prima indagine di Lawler sui vincoli di precedenza ha suggerito che essi
potrebbe essere gestito abbastanza facilmente. Ad esempio, prendi l'algoritmo Earliest Due Date
che riduce al minimo il ritardo massimo di una serie di attività. Se i tuoi compiti hanno
vincoli di precedenza, che rendono le cose più complicate: non puoi semplicemente andare avanti
in ordine di data di scadenza se alcune attività non possono essere avviate fino al termine di altre. Ma in
1968, Lawler ha dimostrato che questo non è un problema fintanto che costruisci il programma
torna in primo piano: guarda solo le attività da cui non dipendono altre attività e metti l'estensione
uno con l' ultima data di scadenza alla fine del programma. Quindi ripeti semplicemente questo
processo, ancora una volta considerando ad ogni passaggio solo quei compiti che nessun altro (finora
non programmate) dipendono dalle attività come prerequisito.
Ma mentre Lawler esaminava più a fondo i vincoli di precedenza, scoprì
qualcosa di curioso. L'algoritmo del tempo di elaborazione più breve, come abbiamo visto, è il
politica ottimale se si desidera eliminare il maggior numero di elementi il ​più rapidamente possibile da
la tua lista di cose da fare. Ma se alcune delle tue attività hanno vincoli di precedenza, non è così
un semplice o ovvio aggiustamento al Tempo di elaborazione più breve per adattarlo.
Anche se sembrava un problema di programmazione elementare, né Lawler né
qualsiasi altro ricercatore sembrava essere in grado di trovare un modo efficiente per risolverlo.
In effetti, era molto peggio di questo. Lo stesso Lawler lo avrebbe presto scoperto
questo problema appartiene a una classe che la maggior parte degli informatici ritiene non abbia
soluzione efficiente: è ciò che il campo chiama "intrattabile". * Teoria della pianificazione
il primo dosso si è rivelato essere un muro di mattoni.
Come abbiamo visto con lo scenario “tripla o niente” per il quale l'arresto è ottimale

Pagina 131

la teoria non ha parole sagge, non tutti i problemi che possono essere formalmente articolati lo hanno
una domanda. Nella pianificazione, è chiaro per definizione che ogni insieme di attività e
vincoli ha una pianificazione che è la migliore, quindi i problemi di pianificazione non lo sono
senza risposta, di per sé, ma potrebbe semplicemente essere il caso che non ci siano
algoritmo semplice che può trovare la pianificazione ottimale in modo ragionevole
quantità di tempo.
Ciò ha portato ricercatori come Lawler e Lenstra a una domanda irresistibile. Appena
quale proporzione di problemi di programmazione era comunque intrattabile? Venti anni
dopo che la teoria della programmazione è stata avviata dalla rilegatura di libri di Selmer Johnson
carta, la ricerca di soluzioni individuali stava per diventare qualcosa di molto
di gran lunga più grandioso e ambizioso: una ricerca per mappare l'intero paesaggio
teoria della pianificazione.
Ciò che i ricercatori hanno scoperto è che anche la più sottile modifica a una programmazione
problema spesso ribalta la linea sottile e irregolare tra trattabile e
intrattabile. Ad esempio, l'algoritmo di Moore riduce al minimo il numero di attività in ritardo
(o frutti marci) quando hanno tutti lo stesso valore, ma se alcuni sono di più
importante di altri, il problema diventa intrattabile e nessun algoritmo può farlo
fornire prontamente la pianificazione ottimale. Allo stesso modo, dover aspettare fino a un certo
il tempo per iniziare alcune delle tue attività rende quasi tutti i problemi di pianificazione per
che altrimenti avremmo soluzioni efficienti in problemi intrattabili. Non essendo
in grado di mettere fuori la spazzatura fino alla sera prima della raccolta potrebbe essere ragionevole
statuto municipale, ma manderà il tuo calendario a capofitto nell'intrattabilità.
Il disegno dei confini della teoria dello scheduling continua ancora oggi. UN
un recente sondaggio ha mostrato che lo stato di circa il 7% di tutti i problemi è ancora
unknown, scheduling's terra incognita. Del 93% dei problemi che facciamo
capire, tuttavia, la notizia non è eccezionale: solo il 9% può essere risolto in modo efficiente,
e l'altro 84% si è dimostrato intrattabile.* In altre parole, la maggior parte
i problemi di pianificazione non ammettono alcuna soluzione pronta. Se stai cercando di gestire perfettamente il tuo file
il calendario sembra opprimente, forse perché in realtà lo è. Ciò nonostante,
gli algoritmi di cui abbiamo discusso sono spesso il punto di partenza per affrontarli
problemi difficili, se non perfettamente, almeno quanto ci si può aspettare.

Elimina tutto: prelazione e incertezza

Pagina 132
Il momento migliore per piantare un albero è vent'anni fa. Il secondo miglior tempo è
adesso.

-PROVERBIO
Finora abbiamo considerato solo i fattori che rendono più difficile la pianificazione. Ma c'è
una svolta che può renderlo più semplice: essere in grado di interrompere un'attività a metà
e passare a un altro. Questa proprietà, "prelazione", si rivela cambiare il gioco
drammaticamente.
Riduzione al minimo dei ritardi massimi (per servire i clienti in un bar) o il
somma dei tempi di completamento (per abbreviare rapidamente la tua lista di cose da fare) entrambi attraversano il
linea in intrattabilità se alcune attività non possono essere avviate fino a un determinato momento. Ma
tornano ad avere soluzioni efficienti una volta consentita la prelazione. In entrambe
casi, le strategie classiche: prima data di scadenza e tempo di elaborazione più breve,
rispettivamente, rimangono i migliori, con una modifica abbastanza semplice. quando
arriva l'ora di inizio di un'attività, confronta quell'attività con quella attualmente in corso. Se
stai lavorando entro la prima data di scadenza e la nuova attività scade prima di
quello attuale, cambia marcia; altrimenti mantieni la rotta. Allo stesso modo, se lo sei
lavorando in base al tempo di elaborazione più breve e la nuova attività può essere completata più velocemente
rispetto a quello attuale, fermati prima per occupartene; altrimenti, continua con cosa
stavi facendo.
Ora, in una buona settimana un'officina può sapere tutto ciò che ci si aspetta
nei prossimi giorni, ma la maggior parte di noi di solito vola alla cieca, almeno in parte.
Potremmo anche non essere sicuri, ad esempio, quando saremo in grado di avviare un particolare
progetto (quando il tal dei tali mi darà una risposta concreta sul tal-e-tale?).
E in qualsiasi momento il nostro telefono può squillare o può comparire un'e-mail con la notizia di un file
compito completamente nuovo da aggiungere alla nostra agenda.
Si scopre, tuttavia, che anche se non sai quando inizieranno le attività,
La prima data di scadenza e il tempo di elaborazione più breve sono ancora strategie ottimali, in grado
per garantirti (in media) le migliori prestazioni possibili a fronte di
incertezza. Se i compiti vengono buttati sulla scrivania in momenti imprevedibili,
la strategia ottimale per ridurre al minimo il massimo ritardo è ancora quella preventiva
versione di Prima data di scadenza: passare al lavoro appena emesso se è dovuto
prima di quello che stai facendo attualmente, e altrimenti ignorandolo. Allo stesso modo,

Pagina 133

la versione preventiva di Shortest Processing Time: confronta il tempo rimanente con


terminare l'attività corrente fino al tempo necessario per completare quella nuova: è ancora
ottimale per minimizzare la somma dei tempi di completamento.
In effetti, la versione ponderata di Shortest Processing Time è piuttosto buona
candidato per la migliore strategia di pianificazione generale di fronte all'incertezza.
Offre una semplice ricetta per la gestione del tempo: ogni volta un nuovo pezzo di
il lavoro entra in gioco, dividi la sua importanza per il tempo necessario
completare. Se quella cifra è superiore a quella dell'attività che stai attualmente svolgendo, cambia
a quello nuovo; altrimenti attenersi all'attività corrente. Questo algoritmo è il
la cosa più vicina che la teoria della programmazione ha a una chiave scheletrica o al coltellino svizzero,
la strategia ottimale non solo per un tipo di problema ma per molti. Sotto
alcune ipotesi riduce al minimo non solo la somma dei tempi di completamento ponderati,
come ci si potrebbe aspettare, ma anche la somma dei pesi degli ultimi lavori e la somma
del ritardo ponderato di quei lavori.
Curiosamente, l'ottimizzazione di tutte queste altre metriche è intrattabile se conosciamo il file
orari di inizio e durata dei lavori in anticipo. Quindi, considerando l'impatto di
l'incertezza nella programmazione rivela qualcosa di controintuitivo: ci sono casi
dove la chiaroveggenza è un peso. Anche con la completa preconoscenza, trovare il file
un programma perfetto potrebbe essere praticamente impossibile. Al contrario, pensando al tuo
piedi e reagire come posti di lavoro sono disponibili in non vi darà come perfezionare un programma come se
hai visto nel futuro, ma il meglio che puoi fare è molto più facile da calcolare.
Questa è una consolazione. Come afferma lo scrittore e programmatore di business Jason Fried, "Feel
come se non si potesse procedere finché non si dispone di un piano antiproiettile? Sostituisci "piano"
con "indovina" e rilassati. " La teoria della pianificazione lo conferma.
Quando il futuro è nebbioso, si scopre che non hai bisogno di un calendario, solo di una cosa da fare
elenco.

La prelazione non è gratuita: il cambio di contesto


Più in fretta vado / Il behinder ottengo
—NEEDLEPOINT VISTO A BOONVILLE, CA

I programmatori non parlano perché non devono essere interrotti ... A


sincronizzarsi con altre persone (o con la loro rappresentazione nei telefoni,

Pagina 134

cicalini e campanelli) può significare solo interrompere il treno dei pensieri.


Le interruzioni significano alcuni bug. Non devi scendere dal treno.

—ELLEN ULLMAN
La teoria della pianificazione quindi racconta una storia ragionevolmente incoraggiante, dopo tutto. Ci sono
algoritmi semplici e ottimali per risolvere molti problemi di pianificazione e altro
i problemi sono allettanti vicini alle situazioni che incontriamo quotidianamente nella vita umana.
Ma quando si tratta di eseguire effettivamente la pianificazione di una singola macchina nel reale
mondo, le cose si complicano.
Prima di tutto, sia le persone che i sistemi operativi dei computer affrontano un curioso
sfida: la macchina che sta facendo la programmazione e la macchina che è
in programma sono la stessa cosa. Il che fa raddrizzare la tua lista di cose da fare
un elemento nella tua lista di cose da fare — che ha bisogno, di per sé, di essere prioritario e programmato.
In secondo luogo, la prelazione non è gratuita. Ogni volta che cambi attività, paghi un prezzo,
noto in informatica come cambio di contesto . Quando un processore per computer
sposta la sua attenzione da un determinato programma, ce n'è sempre una certa quantità
delle spese generali necessarie. Deve contrassegnare efficacemente il suo posto e metterlo da parte
tutte le sue informazioni relative a quel programma. Quindi ha bisogno di capire quale
programma da eseguire successivamente. Infine deve estrarre tutte le informazioni pertinenti per questo
programma, trova il suo posto nel codice e mettiti in marcia.
Niente di tutto questo passare avanti e indietro è "vero lavoro", cioè niente di tutto ciò
effettivamente fa avanzare lo stato di uno dei vari programmi del computer
commutazione tra. È metawork . Ogni cambio di contesto è tempo perso.
Anche gli esseri umani hanno chiaramente dei costi per cambiare contesto. Li sentiamo quando noi
spostare documenti dentro e fuori dalla nostra scrivania, chiudere e aprire documenti sul nostro computer,
entrare in una stanza senza ricordare cosa ci ha mandato lì, o semplicemente dire
forte, "Ora, dov'ero?" o "Cosa stavo dicendo?" Lo hanno dimostrato gli psicologi
che per noi, gli effetti del cambio di attività possono includere ritardi ed errori: a
la scala dei minuti anziché dei microsecondi. Per mettere quella figura in prospettiva,
chiunque interrompa più di qualche ora all'ora rischia di non fare
lavorare affatto.
Personalmente, abbiamo scoperto che sia la programmazione che la scrittura richiedono
tenendo presente lo stato dell'intero sistema, e quindi portare in modo eccessivamente grande

Pagina 135

costi del cambio di contesto. Un nostro amico che scrive software dice che il file
la normale settimana lavorativa non è adatta al suo flusso di lavoro, poiché per lui è di sedici ore
i giorni sono più del doppio più produttivi dei giorni di otto ore. Brian, da parte sua,
pensa alla scrittura come a una sorta di fabbro, dove ci vuole un po 'solo per riscaldarsi
il metallo prima che sia malleabile. Trova in qualche modo inutile bloccare
niente meno di novanta minuti per la scrittura, poiché non succede molto nel file
prima mezz'ora tranne il caricamento di un blocco gigante di "Ora, dove mi trovavo?" nel suo
testa. L'esperto di programmazione Kirk Pruhs, dell'Università di Pittsburgh, ha avuto il
stessa esperienza. “Se è meno di un'ora invece mi limiterò a fare commissioni, perché
mi ci vorranno i primi trentacinque minuti per capire veramente cosa voglio fare
e poi potrei non avere il tempo di farlo. "
La celebre poesia di Rudyard Kipling del 1910 “If—” si conclude con un richiamo esuberante
per la gestione del tempo: "Se riesci a riempire il minuto spietato / Con sessanta
valore di secondi di distanza percorsa ... "
Se solo. La verità è che c'è sempre un sovraccarico: tempo perso per il metawork, per il
logistica della contabilità e gestione degli incarichi. Questo è uno dei fondamentali
compromessi della programmazione. E più ti impegni, più spese ci sono.
Al suo estremo incubo, questo si trasforma in un fenomeno chiamato thrashing .

Thrashing
Gage: Sig. Zuckerberg, ho la sua piena attenzione? ...
Zuckerberg: Hai parte della mia attenzione, hai l'importo minimo.
- LA RETE SOCIALE

I computer eseguono il multitasking attraverso un processo chiamato "threading", che puoi pensare
di essere come fare il giocoliere con una serie di palline. Proprio come un giocoliere lancia solo una palla contro a
tempo nell'aria ma ne tiene tre in alto, una CPU funziona solo su un programma alla volta
tempo, ma scambiandoli abbastanza velocemente (sulla scala di dieci
millesimi di secondo) sembra che stia riproducendo un film, navigando sul Web,
e avvisarti della posta in arrivo tutto in una volta.
Negli anni '60, gli informatici iniziarono a pensare a come automatizzare il file
processo di condivisione delle risorse del computer tra diversi compiti e utenti. Era
un momento emozionante, racconta Peter Denning, oggi uno dei massimi esperti in materia

Pagina 136

computer multitasking, che allora stava lavorando al suo dottorato al MIT. Eccitante,
e incerto: "Come partizionare una memoria principale tra un gruppo di lavori
che sono lì quando alcuni di loro vogliono crescere e alcuni potrebbero volersi rimpicciolire
e interagiranno tra loro, cercando di rubare [la memoria] e tutto il resto
questo genere di cose? ... Come gestisci l'intera serie di interazioni?
Nessuno ne sapeva niente. "
Non sorprende, dato che i ricercatori non sapevano ancora di cosa si trattava
stavano facendo, lo sforzo ha incontrato difficoltà. E ce n'era uno in particolare
che ha attirato la loro attenzione. Come spiega Denning, a determinate condizioni a
problema drammatico “si presenta quando si aggiungono più lavori alla multiprogrammazione
mescolare. Ad un certo punto si supera una soglia critica, imprevedibile esattamente dove si trova
è, ma lo saprai quando arriverai lì, e all'improvviso il sistema sembra
morire."
Ripensa alla nostra immagine di giocoliere. Con una palla in aria, c'è
abbastanza tempo libero mentre quella palla è in alto perché il giocoliere ne possa lanciare altre
anche verso l'alto. Ma cosa succede se il giocoliere prende una palla in più di quanto può
maniglia? Non fa cadere quella palla; lascia tutto . L'intero sistema, abbastanza
letteralmente, va giù. Come dice Denning, “La presenza di uno in più
programma ha causato un crollo completo del servizio ... La netta differenza
tra i due casi in un primo momento sfida l'intuizione, il che potrebbe indurci ad aspettarci a
graduale degrado del servizio con l'introduzione di nuovi programmi in aree affollate
memoria principale." Invece, catastrofe. E mentre possiamo capire un essere umano
giocoliere essendo sopraffatto, cosa potrebbe causare una cosa del genere a un
macchina ?
Qui la teoria dello scheduling interseca la teoria del caching. L'intera idea delle cache è
per mantenere il "working set" degli elementi necessari a disposizione per un rapido accesso. Senso unico
questo viene fatto mantenendo veloci le informazioni che il computer sta attualmente utilizzando
memoria piuttosto che sul disco rigido lento. Ma se un'attività richiede di tenere traccia di
così tante cose che non entreranno tutte nella memoria, allora potresti benissimo finire
passare più tempo a scambiare informazioni dentro e fuori dalla memoria che a fare il
lavoro effettivo. Inoltre, quando si cambia attività, l'attività appena attiva potrebbe
creare spazio per il working set espellendo porzioni di altri working set da
memoria. L'attività successiva, dopo la riattivazione, riacquisirebbe quindi parti del suo
set di lavoro dal disco rigido e riportarli in memoria, di nuovo

Pagina 137

spostare gli altri. Questo problema - attività che si rubano spazio a vicenda - può sorgere
peggio ancora nei sistemi con gerarchie di cache tra il processore e il
memoria. Come Peter Zijlstra, uno dei principali sviluppatori del sistema operativo Linux
scheduler di sistema, afferma: "Le cache sono calde per il carico di lavoro corrente e
quando cambi contesto, praticamente invalidi tutte le cache. E questo fa male. "
All'estremo, un programma può essere eseguito quel tanto che basta per scambiare gli elementi necessari
in memoria, prima di lasciare il posto a un altro programma che gira quel tanto che basta per
sovrascriverli a turno.
Questo è il thrashing: un sistema che funziona a tutto tondo e non realizza nulla.
Denning prima ha diagnosticato questo fenomeno in un contesto di gestione della memoria, ma
gli informatici ora usano il termine "thrashing" per riferirsi praticamente a qualsiasi cosa
situazione in cui il sistema si ferma perché è completamente preoccupato
metawork. Le prestazioni di un computer potente non si interrompono gradualmente. It
cade da una scogliera. Il "lavoro reale" è effettivamente sceso a zero, il che significa anche
sarà quasi impossibile uscirne.
Il thrashing è uno stato umano molto riconoscibile. Se hai mai avuto un momento
dove volevi smettere di fare tutto solo per avere la possibilità di scrivere
tutto quello che avresti dovuto fare, ma non hai potuto risparmiare tempo, l'hai fatto
picchiato. E la causa è più o meno la stessa per le persone che per i computer: ogni compito
è un richiamo alle nostre limitate risorse cognitive. Quando si limita a ricordare
tutto ciò che dobbiamo fare occupa la nostra piena attenzione o dare la priorità a ciascuno
il compito consuma tutto il tempo che avevamo per svolgerli, o il nostro treno di pensieri lo è
continuamente interrotto prima che quei pensieri possano tradursi in azione - sembra
panico, come la paralisi a causa dell'iperattività. Si sta sbattendo e i computer lo sanno
bene.
Se hai mai lottato con un sistema in uno stato di thrashing, e se l'hai fatto
mai stato in uno stato del genere, allora potresti essere curioso dell'informatica
di uscire. Nel suo articolo fondamentale degli anni '60 sull'argomento, Denning ha osservato che un
un grammo di prevenzione vale una libbra di cura. La cosa più semplice da fare è semplicemente
ottenere più memoria: abbastanza RAM, ad esempio, per adattarsi ai working set di tutti i file
eseguire immediatamente i programmi in memoria e ridurre il tempo impiegato da un contesto
interruttore. Ma i consigli preventivi per il thrashing non ti aiutano quando trovi
te stesso nel mezzo di esso. Inoltre, quando si tratta dell'attenzione umana, lo siamo
bloccato con quello che abbiamo.

Pagina 138

Un altro modo per evitare il thrashing prima che inizi è imparare l'arte di dire no.
Denning ha sostenuto, ad esempio, che un sistema dovrebbe semplicemente rifiutarsi di aggiungere un file
programma al suo carico di lavoro se non aveva abbastanza memoria libera per mantenerlo in funzione
impostato. Questo previene il martellamento nelle macchine ed è un consiglio sensato per chiunque lo abbia
un piatto pieno. Ma anche questo potrebbe sembrare un lusso irraggiungibile per quelli di noi
che si trovano già sovraccarichi o comunque incapaci di frenare il
richieste che ci vengono poste.
In questi casi chiaramente non c'è modo di lavorare di più, ma puoi lavorare ...
più stupido . Insieme a considerazioni sulla memoria, una delle maggiori fonti di
il metawork nel cambiare contesto è l'atto stesso di scegliere cosa fare dopo. Questo,
inoltre, a volte può inondare l'effettivo svolgimento del lavoro. Di fronte, diciamo, a un
posta in arrivo traboccante di n messaggi, sappiamo dalla teoria dell'ordinamento che ripetutamente
scansionarlo per trovare la risposta più importante dopo richiederà O ( n 2 ) operazioni
- n scansioni di n messaggi ciascuno. Ciò significa che svegliarsi con una casella di posta che è
tre volte più pieno del solito potrebbe richiedere nove volte più tempo per l'elaborazione. Cosa c'è
di più, scansionare quelle email significa scambiare ogni messaggio nel tuo
mente, uno dopo l'altro, prima di rispondere a qualcuno di loro: una ricetta infallibile per
memoria che batte.
In uno stato violento, sostanzialmente non stai facendo progressi, quindi anche facendo
compiti nell'ordine sbagliato è meglio che non fare assolutamente nulla. Invece di rispondere
le email più importanti prima, il che richiede una valutazione dell'insieme
un'immagine che potrebbe richiedere più tempo del lavoro stesso, forse dovresti evitare
quelle sabbie mobili a tempo quadratico semplicemente rispondendo alle e-mail in ordine casuale , o
in qualunque ordine appaiano sullo schermo. Pensando allo stesso modo
lines, il core team di Linux, diversi anni fa, ha sostituito il proprio scheduler con uno
era meno “intelligente” nel calcolare le priorità del processo ma più che inventato
perché impiegando meno tempo a calcolarli.
Se vuoi comunque mantenere le tue priorità, c'è un diverso e
un affare ancora più interessante che puoi fare per recuperare la tua produttività.

Interrompere la coalescenza
Parte di ciò che rende la programmazione in tempo reale così complessa e interessante è che lo è

Pagina 139
fondamentalmente una negoziazione tra due principi che non sono del tutto compatibili.
Questi due principi sono chiamati reattività e rendimento : quanto velocemente
può rispondere alle cose e quanto puoi fare complessivamente. Chiunque sia
mai lavorato in un ambiente di ufficio può facilmente apprezzare la tensione tra
queste due metriche. È parte del motivo per cui ci sono persone il cui lavoro è quello di
rispondi al telefono: rispondono in modo che altri possano avere un throughput.
Ancora una volta, la vita è più difficile quando, come un computer, devi creare il file
capacità di risposta / velocità di trasferimento da soli. E la migliore strategia per ottenere
le cose fatte potrebbero essere, paradossalmente, rallentare.
Gli scheduler del sistema operativo in genere definiscono un "periodo" in cui ogni
il programma è garantito per funzionare almeno un po ', con il sistema che dà una "fetta"
di quel periodo a ciascun programma. Più programmi sono in esecuzione, più piccolo è
quelle sezioni diventano e più cambi di contesto avvengono in ogni periodo,
mantenere la reattività a scapito della produttività. Lasciato deselezionato, tuttavia,
questa politica di garantire ad ogni processo almeno una certa attenzione ogni periodo
potrebbe portare alla catastrofe. Con un numero sufficiente di programmi in esecuzione, lo slice di un'attività lo farebbe
rimpicciolire al punto che il sistema stava spendendo l' intera fetta sul contesto
commutazione, prima di passare immediatamente al contesto all'attività successiva.
Il colpevole è la dura garanzia di reattività. Così funzionamento moderno
i sistemi infatti stabiliscono una lunghezza minima per le loro sezioni e si rifiuteranno di suddividere
il periodo ancora più finemente. (In Linux, ad esempio, questa porzione minima utile
risulta essere circa tre quarti di millisecondo, ma negli esseri umani potrebbe
realisticamente essere di almeno diversi minuti.) Se vengono aggiunti più processi oltre a quello
punto, il periodo si allungherà semplicemente. Ciò significa che i processi dovranno
aspettare più a lungo per ottenere il loro turno, ma i turni che ottengono saranno almeno abbastanza lunghi
fare qualcosa.
È utile stabilire una quantità minima di tempo da dedicare a qualsiasi attività
impedire che un impegno per la reattività cancelli completamente il throughput: se
lo slice minimo è più lungo del tempo necessario per il cambio di contesto, quindi il
il sistema non può mai entrare in uno stato in cui il cambio di contesto è l' unica cosa che è
facendo. È anche un principio che è facile tradurre in una raccomandazione per
vite umane. Metodi come "timeboxing" o "pomodoros", dove letteralmente
impostare un timer da cucina e impegnarsi a svolgere una singola attività finché non si esaurisce, sono uno
incarnazione di questa idea.

Pagina 140

Ma a quale dimensione della fetta dovresti mirare? Di fronte alla questione di quanto tempo
attendere tra gli intervalli di esecuzione di un'attività ricorrente, come controllare il tuo
email, la risposta dal punto di vista del throughput è semplice: fintanto che
possibile. Ma non è la fine della storia; anche un rendimento maggiore, dopotutto
significa minore reattività.
Per il tuo computer, la fastidiosa interruzione che deve controllare regolarmente
non è l'email, sei tu. Potresti non muovere il mouse per minuti o ore, ma
quando lo fai, ti aspetti di vedere il puntatore sullo schermo muoversi immediatamente,
il che significa che la macchina impiega molto impegno semplicemente controllandoti. Il
più frequentemente controlla il mouse e la tastiera, più velocemente può reagire
quando c'è un input, ma più cambi di contesto deve fare. Quindi la regola che
i sistemi operativi dei computer seguono quando decidono quanto tempo possono permettersi
dedicarsi a qualche compito è semplice: il più a lungo possibile senza sembrare
nervoso o lento per l'utente.
Quando noi umani usciamo di casa per fare una commissione veloce, potremmo dire
qualcosa del tipo "Non ti accorgerai nemmeno che me ne sono andato". Quando le nostre macchine contestualizzano
passare a un calcolo, devono letteralmente tornare a noi prima che ce ne accorgiamo
se ne sono andati. Per trovare questo punto di equilibrio, i programmatori di sistemi operativi hanno
si è rivolto alla psicologia, estraendo articoli in psicofisica per il numero esatto di
millisecondi di ritardo necessari a un cervello umano per registrare il ritardo o lo sfarfallio. C'è
non ha senso prestare attenzione all'utente più spesso di così.
Grazie a questi sforzi, quando i sistemi operativi funzionano correttamente non lo fai
notate anche quanto sia duro il vostro computer. Continui a essere in grado di farlo
muovi il mouse sullo schermo in modo fluido anche quando il processore sta trasportando
inclinazione completa. La fluidità ti sta costando un po 'di produttività, ma questo è un compromesso di progettazione
che è stato esplicitamente fatto dagli ingegneri di sistema: il tuo sistema spende come
tutto il tempo che gli è possibile per evitare di interagire con te, poi passa a
ridisegnare il mouse appena in tempo.
E ancora, questo è un principio che può essere trasferito alle vite umane. Il
la morale è che dovresti cercare di rimanere su un singolo compito il più a lungo possibile senza
diminuire la tua reattività al di sotto del limite minimo accettabile. Decidere
quanto devi essere reattivo e poi, se vuoi fare le cose, essere no
più reattivo di così.
Se ti ritrovi a cambiare molto contesto perché stai affrontando un file

Pagina 141

raccolta eterogenea di compiti brevi, puoi anche utilizzare un'altra idea da


informatica: "interrompi coalescenza". Se hai cinque fatture della carta di credito, per
ad esempio, non pagarli all'arrivo; prenditi cura di loro tutto in una volta quando il
arriva il quinto disegno di legge. Finché le tue bollette non sono mai dovute per meno di trentuno giorni
dopo che sono arrivati, puoi designare, ad esempio, il primo di ogni mese come "fatturazione
giorno "e siediti a quel punto per elaborare ogni fattura sulla tua scrivania, non importa
sia che sia successo tre settimane o tre ore fa. Allo stesso modo, se nessuna delle tue email
i corrispondenti richiedono che tu risponda in meno di ventiquattro ore, puoi
limitati a controllare i tuoi messaggi una volta al giorno. I computer stessi lo fanno
qualcosa del genere: aspettano fino a un intervallo fisso e controllano tutto,
invece del cambio di contesto per gestire interruzioni separate e non coordinate da
i loro vari sottocomponenti. *
A volte, gli informatici notano l'assenza di coalescenza di interruzioni
le loro vite. Dice il direttore della ricerca di Google Peter Norvig: "Dovevo andare
in centro tre volte oggi per fare commissioni, e ho detto: 'Oh, beh, questo è solo un
bug di una riga nel tuo algoritmo. Avresti dovuto solo aspettare o aggiungerlo al file
coda delle cose da fare, piuttosto che eseguirle in sequenza man mano che ne venivano aggiunte una in un file
tempo.'"
A misura d'uomo, otteniamo interruzioni che si coalizzano gratuitamente dal sistema postale,
proprio come conseguenza del loro ciclo di consegna. Perché solo la posta viene recapitata
una volta al giorno, un messaggio spedito solo con pochi minuti di ritardo potrebbe richiedere un extra
ventiquattro ore per raggiungerti. Considerando i costi del cambio di contesto, il
Il rivestimento positivo di questo dovrebbe essere ormai ovvio: puoi solo essere interrotto da
fatture e lettere al massimo una volta al giorno. Inoltre, il servizio postale 24 ore su 24
il ritmo richiede una risposta minima da parte tua: non ne produce
differenza se invii la tua risposta cinque minuti o cinque ore dopo la ricezione
una lettera.
Nel mondo accademico, tenere l'orario d'ufficio è un modo per riunire le interruzioni da
studenti. E nel settore privato, la coalescenza delle interruzioni offre una visione redentiva
di uno dei rituali d'ufficio più diffamati: l'incontro settimanale. Qualunque sia il loro
inconvenienti, riunioni programmate regolarmente sono una delle nostre migliori difese contro il
interruzione spontanea e cambio di contesto non pianificato.
Forse il santo patrono dello stile di vita che cambia contesto minimale è il
il leggendario programmatore Donald Knuth. "Faccio una cosa alla volta", dice. "Questo

Pagina 142

è ciò che gli informatici chiamano elaborazione in batch: l'alternativa è lo scambio


e fuori. Non cambio dentro e fuori. " Knuth non sta scherzando. Il 1 gennaio 2014 lui
ha intrapreso "The TeX Tuneup del 2014", in cui ha risolto tutti i bug
era stato segnalato nel suo software di composizione TeX negli ultimi sei anni .
Il suo rapporto si conclude con l'allegra firma “Restate sintonizzati per The TeX Tuneup di
2021! " Allo stesso modo, Knuth non ha più un indirizzo e-mail dal 1990. “L'e-mail è un
cosa meravigliosa per le persone il cui ruolo nella vita è essere in cima alle cose. Ma no
per me; il mio ruolo è essere in fondo alle cose. Quello che faccio richiede lunghe ore
studio e concentrazione ininterrotta ". Controlla ogni sua posta
tre mesi e tutti i suoi fax ogni sei.
Ma non è necessario portare le cose all'estremo di Knuth per desiderare di più
le nostre vite hanno utilizzato l'interruzione della fusione come principio progettuale. L'ufficio postale lo dà
a noi quasi per caso; altrove, dobbiamo costruirlo, o richiederlo, per
noi stessi. I nostri dispositivi che emettono segnali acustici e ronzio hanno modalità "Non disturbare",
che potremmo attivare e disattivare manualmente durante il giorno, ma anche questo
smussa uno strumento. Invece, potremmo agitare per impostazioni che forniscano un file
opzione esplicita per l'interruzione della coalescenza: la stessa cosa su scala temporale umana
che i dispositivi stanno facendo internamente. Avvisami solo una volta ogni dieci minuti, diciamo;
allora dimmi tutto.

Pagina 143
6 regola di Bayes
Predire il futuro

Tutta la conoscenza umana è incerta, inesatta e parziale.

—BERTRAND RUSSELL
Domani sorgerà il sole. Puoi scommettere il tuo dollaro più basso che ci sarà
sole.
- ANNIE

Nel 1969, prima di intraprendere un dottorato in astrofisica a Princeton, J. Richard


Gott III ha fatto un viaggio in Europa. Là vide il muro di Berlino, che era stato
costruito otto anni prima. In piedi all'ombra del muro, un simbolo netto di
Durante la Guerra Fredda, iniziò a chiedersi per quanto tempo avrebbe continuato a dividere
l'Oriente e l'Occidente.
A prima vista, c'è qualcosa di assurdo nel provare a fare questo tipo di
predizione. Anche mettendo da parte l'impossibilità di prevedere la geopolitica, il
la domanda sembra matematicamente ridicola: si tratta di fare una previsione da un file
unico punto dati .
Ma per quanto ridicolo possa sembrare in apparenza, facciamo tutte queste previsioni
il tempo, per necessità. Arrivi a una fermata dell'autobus in una città straniera e impari,
forse, che l'altro turista lì in piedi ha aspettato sette minuti.
Quando è probabile che arrivi il prossimo autobus? Vale la pena aspettare e, se sì, come
dovresti farlo a lungo prima di arrenderti?
O forse un tuo amico esce con qualcuno da un mese e

Pagina 144

vuole il tuo consiglio: è troppo presto per invitarli a una famiglia in arrivo
nozze? La relazione è iniziata bene, ma fino a che punto è sicuro
fare piani?
Una famosa presentazione fatta da Peter Norvig, direttore della ricerca di Google,
portava il titolo "L'irragionevole efficacia dei dati" e ne era entusiasta
"Come miliardi di punti dati banali possono portare alla comprensione." I media
ci dicono costantemente che stiamo vivendo in "un'era di big data", quando i computer possono farlo
setacciare questi miliardi di punti dati e trovare modelli invisibili a chi è nudo
occhio. Ma spesso i problemi più rilevanti per la vita umana quotidiana sono l'opposto
estremo. I nostri giorni sono pieni di "piccoli dati". In effetti, come Gott in piedi al
Muro di Berlino, spesso dobbiamo fare una deduzione dalla più piccola quantità di
dati che potremmo eventualmente avere: un'unica osservazione.
Quindi come lo facciamo? E come dovremmo ?
La storia inizia nell'Inghilterra del diciottesimo secolo, in un dominio di indagine
irresistibile per le grandi menti matematiche dell'epoca, anche quelle del clero:
gioco d'azzardo.

Ragionando a ritroso con il reverendo Bayes


Se, quindi, siamo impegnati in argomenti per riporre fiducia nell'esperienza passata,
esolo
renderlo lo standard del nostro giudizio futuro, questi argomenti devono essere
probabile.

—DAVID HUME
Più di 250 anni fa, la questione di fare previsioni da piccoli dati
pesò molto sulla mente del reverendo Thomas Bayes, un presbiteriano
ministro nell'affascinante città termale di Tunbridge Wells, in Inghilterra.
Se compriamo dieci biglietti per una nuova lotteria sconosciuta, immaginò Bayes, e
cinque di loro vincono premi, quindi sembra relativamente facile stimare la lotteria
possibilità di vittoria: 5/10 o 50%. Ma cosa succederebbe se invece acquistassimo un biglietto unico e lo facessimo
vince un premio? Immaginiamo davvero che la probabilità di vincere sia 1/1, o
100%? Sembra troppo ottimistico. È? E se sì, di quanto? Cosa dovrebbe

Pagina 145

effettivamente indoviniamo?
Per qualcuno che ha avuto un tale impatto sulla storia del ragionamento sotto
incertezza, la stessa storia di Bayes rimane ironicamente incerta. È nato a
1701, o forse 1702, nella contea inglese dell'Hertfordshire, o forse lo era
Londra. E nel 1746, '47, '48 o '49 ne avrebbe scritto uno dei più
articoli influenti in tutta la matematica, abbandonarli inediti e passare a
altre cose.
Tra questi due eventi abbiamo un po 'più di certezza. Il figlio di a
ministro, Bayes andò all'Università di Edimburgo per studiare teologia, e lo fu
ordinato come suo padre. Aveva interessi matematici oltre che teologici,
e nel 1736 scrisse un'appassionata difesa del capriccioso Newton
"Calcolo" in risposta a un attacco del vescovo George Berkeley. Questo lavoro
ha portato alla sua elezione nel 1742 come membro della Royal Society, alla quale lui
è stato raccomandato come "un gentiluomo ... esperto in geometria e in tutte le parti di
Apprendimento matematico e filosofico ".
Dopo la morte di Bayes nel 1761, al suo amico Richard Price fu chiesto di rivedere il suo
documenti matematici per vedere se contenevano materiale pubblicabile. Prezzo
si è imbattuto in un saggio in particolare che lo ha entusiasmato, uno che ha detto “ha grande
merito e merita di essere preservato ". Il saggio riguardava esattamente il tipo di
problema della lotteria in discussione:

Immaginiamo quindi una persona presente all'estrazione di una lotteria, che non sa nulla del suo schema o
della proporzione di spazi vuoti rispetto ai premi in esso contenuti. Si supponga inoltre che sia obbligato a dedurlo
dal numero di spazi vuoti che sente estrarre rispetto al numero di premi ; e lo è
chiesto quali conclusioni in queste circostanze potesse ragionevolmente trarre.

L'intuizione critica di Bayes è stata che provando a usare i biglietti vincenti e quelli perdenti noi
vedere per capire il pool complessivo di biglietti da cui provengono è essenzialmente
ragionando a ritroso. E per farlo, ha sostenuto, dobbiamo prima ragionare in avanti
da ipotetici. In altre parole, dobbiamo prima determinare quanto sia probabile
che avremmo estratto i biglietti che abbiamo fatto se i vari scenari fossero veri. Questo
la probabilità, nota agli statistici moderni come "probabilità", ci dà il
informazioni di cui abbiamo bisogno per risolvere il problema.
Ad esempio, immagina di aver acquistato tre biglietti e tutti e tre sono stati vincitori.
Pagina 146

Ora, se la lotteria fosse del tipo particolarmente generoso dove sono tutti i biglietti
vincitori, quindi la nostra esperienza tre per tre sarebbe ovviamente avvenuta per tutti i
tempo; ha una probabilità del 100% in quello scenario. Se, invece, solo la metà della lotteria
i biglietti erano vincitori, la nostra esperienza tre per tre sarebbe avvenuta 1 ⁄ 2 × 1 ⁄ 2 × 1 ⁄ 2
del tempo, o in altre parole 1 ⁄ 8 del tempo. E se la lotteria ne premiasse solo uno
biglietto su mille, il nostro risultato sarebbe stato incredibilmente improbabile:
1 ⁄ 1.000 × 1 ⁄ 1.000 × 1 ⁄ 1.000 , o uno su un miliardo.

Bayes sosteneva che dovremmo quindi giudicare più probabile che tutto
i biglietti della lotteria sono vincitori di quella metà di loro, e a loro volta di più
probabile che la metà di loro lo sia rispetto a quella che solo uno su mille lo è. Forse noi
lo avevamo già intuito, ma la logica di Bayes ci offre la capacità di quantificare
quell'intuizione. A parità di condizioni, dovremmo immaginare che sia esattamente otto
volte più probabile che tutti i biglietti siano vincenti di quanto lo siano la metà di loro, perché
i biglietti che abbiamo estratto sono esattamente otto volte più probabili (100% contro uno su otto)
quello scenario. Allo stesso modo, è esattamente 125 milioni di volte più probabile che metà della lotteria
i biglietti sono vincitori di quello c'è solo un biglietto vincente ogni mille, che
lo sappiamo confrontando uno su otto con uno su un miliardo.
Questo è il punto cruciale dell'argomentazione di Bayes. Ragionando in avanti da ipotetico
il passato ci pone le basi per poi tornare a quello più probabile.
Era un approccio ingegnoso e innovativo, ma non è riuscito a fornire
una risposta completa al problema della lotteria. Nel presentare i risultati di Bayes alla Royal
La società, Price è stata in grado di stabilire che se acquisti un unico biglietto della lotteria ed è un
vincitore, c'è una probabilità del 75% che almeno la metà dei biglietti sia vincente. Ma
pensare alle probabilità delle probabilità può far girare la testa.
Inoltre, se qualcuno ci insistesse: “Bene, va bene, ma cosa ne pensi?
le probabilità della lotteria sono effettivamente ? " non sapremmo ancora cosa dire.
La risposta a questa domanda: come distillare tutto il possibile
ipotesi in una singola aspettativa specifica - ne sarebbero scoperte solo alcune
anni dopo, dal matematico francese Pierre-Simon Laplace.

Legge di Laplace
Laplace nacque in Normandia nel 1749 e suo padre lo mandò da un cattolico

Pagina 147

scuola con l'intento che si unisse al clero. Laplace ha continuato a studiare teologia
all'Università di Caen, ma a differenza di Bayes, che bilanciava spiritualità e
devozioni scientifiche per tutta la sua vita - alla fine abbandonò completamente la stoffa
per la matematica.
Nel 1774, completamente ignaro del precedente lavoro di Bayes, Laplace
ha pubblicato un documento ambizioso chiamato “Trattato sulla probabilità delle cause di
Eventi. " In esso, Laplace ha finalmente risolto il problema di come fare inferenze
indietro dagli effetti osservati alle loro probabili cause.
Bayes, come abbiamo visto, aveva trovato un modo per confrontare la probabilità relativa di uno
ipotesi a un'altra. Ma nel caso di una lotteria, c'è letteralmente un infinito
numero di ipotesi: una per ogni proporzione immaginabile di biglietti vincenti.
Usando il calcolo, la matematica un tempo controversa di cui Bayes era stato un
importante difensore, Laplace è stato in grado di dimostrare che questo vasto spettro di
le possibilità potrebbero essere distillate fino a una singola stima e sorprendentemente
uno conciso a quello. Se davvero non sappiamo nulla della nostra lotteria prima del tempo, lui
mostrato, quindi dopo aver estratto un biglietto vincente al nostro primo tentativo dovremmo aspettarci
che la proporzione di biglietti vincenti nell'intero pool è esattamente 2/3. Se compriamo
tre biglietti e tutti sono vincitori, la percentuale prevista di vincita
i biglietti sono esattamente 4/5. Infatti, per l'eventuale estrazione di w biglietti vincenti in n
tentativi, l'aspettativa è semplicemente il numero di vittorie più uno, diviso per
numero di tentativi più due: ( w +1) ⁄ ( n +2) .
Questo schema incredibilmente semplice per la stima delle probabilità è noto come
Legge di Laplace , ed è facile da applicare in qualsiasi situazione in cui è necessario valutare
le possibilità di un evento basato sulla sua storia. Se fai dieci tentativi a
qualcosa e cinque di loro riescono, la legge di Laplace stima il tuo totale
probabilità di essere 6/12 o 50%, coerenti con le nostre intuizioni. Se provi solo una volta
e funziona, la stima di Laplace di 2/3 è più ragionevole di
supponendo che vincerai ogni volta e più perseguibile rispetto alla guida di Price
(il che ci direbbe che esiste una metaprobabilità del 75% di un 50% o superiore
possibilità di successo).
Laplace ha continuato ad applicare il suo approccio statistico a un'ampia gamma di problemi
del suo tempo, compresa la valutazione se i bambini hanno davvero la stessa probabilità di nascere
maschio o femmina. (Ha stabilito, con una certezza virtuale, che i bambini maschi si trovano
fatto leggermente più probabile di quelle femminili.) Ha anche scritto il Filosofico

Pagina 148

Essay on Probabilities , probabilmente il primo libro sulla probabilità per un generale


pubblico e ancora uno dei migliori, esponendo la sua teoria e considerando la sua
applicazioni al diritto, alle scienze e alla vita quotidiana.
La legge di Laplace ci offre la prima semplice regola empirica per affrontare il piccolo
dati nel mondo reale. Anche quando abbiamo fatto solo poche osservazioni, o solo
uno: ci offre una guida pratica. Vuoi calcolare le probabilità che il tuo autobus sia
tardi? La possibilità che la tua squadra di softball vinca? Conta il numero di volte che ha
è successo in passato più uno, quindi dividi per il numero di opportunità più
Due. E la bellezza della legge di Laplace è che funziona altrettanto bene se noi
hanno un singolo punto dati o milioni di essi. La fede della piccola Annie che il sole lo farà
sorgere domani è giustificato, ci dice: con una Terra che ha visto sorgere il sole per
circa 1,6 trilioni di giorni consecutivi, la possibilità di un'altra alba il prossimo
"Tentativo" è quasi indistinguibile dal 100%.

Regola di Bayes e credenze precedenti


Tutte queste supposizioni sono coerenti e concepibili. Perché dovremmo dare
la preferenza a uno, che non è più coerente o concepibile del
riposo?

—DAVID HUME
Laplace considerò anche un'altra modifica all'argomento di Bayes che lo avrebbe fatto
rivelarsi cruciale: come gestire ipotesi che sono semplicemente più probabili di
altri. Ad esempio, anche se è possibile che una lotteria registri dei premi
Il 99% delle persone che acquistano i biglietti, è più probabile, presumiamo, che lo facciano
regalerebbe premi solo all'1%. Questa ipotesi dovrebbe riflettersi nel nostro
stime.
Per rendere le cose concrete, supponiamo che un amico ti mostri due monete diverse.
Una è una moneta normale, "discreta" con una probabilità del 50-50 di testa e croce; l'altro è un file
moneta a due teste. Li lascia cadere in un sacchetto e poi ne tira fuori uno a caso. Lui
lo gira una volta: testa. Quale moneta pensi che abbia lanciato il tuo amico?
Lo schema di Bayes di lavorare all'indietro rende breve il lavoro di questa domanda. UN

Pagina 149

capovolgere teste si verifica il 50% delle volte con una moneta equa e il 100% del
volta con una moneta a due teste. Quindi possiamo affermare con sicurezza che è 100% ⁄ 50% , o
esattamente il doppio delle probabilità che l'amico avesse tirato fuori la moneta a due teste.
Ora considera la seguente svolta. Questa volta, l'amico ti mostra nove giusti
monete e una moneta a due teste, le mette tutte e dieci in un sacchetto, ne pesca una a caso e
capovolge: testa. Ora cosa supponi? È una moneta giusta o a due teste
uno?
Il lavoro di Laplace ha anticipato questa ruga, e anche qui la risposta è
straordinariamente semplice. Come prima, una moneta equa ha esattamente la metà delle probabilità di uscire
teste come una moneta a due teste. Ma ora, una moneta equa è anche nove volte più probabile
sono stati disegnati in primo luogo. Si scopre che possiamo solo prendere questi due
considerazioni diverse e moltiplicale insieme: è esattamente quattro e mezzo
volte più probabile che il tuo amico abbia in mano una moneta giusta rispetto a quella a due teste.
La formula matematica che descrive questo rapporto, legando insieme il nostro
idee precedentemente tenute e le prove davanti ai nostri occhi, sono diventate note -
ironia della sorte, poiché il vero lavoro pesante è stato fatto da Laplace, come la regola di Bayes . E
fornisce una soluzione straordinariamente semplice al problema di come combinare
credenze preesistenti con evidenza osservata: moltiplicare le loro probabilità insieme.
In particolare, avere alcune convinzioni preesistenti è fondamentale affinché questa formula funzioni.
Se il tuo amico si fosse semplicemente avvicinato a te e avesse detto: “Ho lanciato una moneta da questa borsa
ed è venuto fuori teste. Quanto è probabile che questa sia una moneta equa? ”, Tu
sarebbe totalmente incapace di rispondere a questa domanda se non ne avessi almeno un po '
senso di quali monete c'erano nella borsa per cominciare. (Non puoi moltiplicare i due
probabilità insieme quando non ne hai una). Questo senso di ciò che era
"Nella borsa" prima del lancio della moneta: le probabilità che ciascuna ipotesi fosse stata
true prima di visualizzare i dati: è noto come probabilità a priori o "precedente" per
corto. E la regola di Bayes ha sempre bisogno di un tuo preventivo, anche se è solo un
indovina. Quante monete a due teste esistono? Quanto sono facili da ottenere? Quanto
di un imbroglione è tuo amico, comunque?
Il fatto che la regola di Bayes dipenda dall'uso dei priori è certo
punti nella storia sono stati considerati controversi, di parte, persino non scientifici. Ma in
In realtà, è abbastanza raro entrare in una situazione così totalmente sconosciuta alla nostra mente
effettivamente una tabula rasa, un punto su cui torneremo momentaneamente.
Quando hai una stima delle probabilità a priori, nel frattempo, quella di Bayes

Pagina 150

La regola si applica a un'ampia gamma di problemi di previsione, siano essi dei big data
varietà o il più comune ordinamento di piccoli dati. Calcolare la probabilità di
vincere una lotteria o lanciare teste è solo l'inizio. I metodi sviluppati
di Bayes e Laplace possono offrire aiuto ogni volta che hai incertezza e un po 'di
dati con cui lavorare. Ed è esattamente la situazione che affrontiamo quando ci proviamo
predire il futuro.

Il principio copernicano
È difficile fare previsioni, soprattutto sul futuro.

—Proverbio danese
Quando J. Richard Gott è arrivato al muro di Berlino, si è chiesto una cosa molto semplice
domanda: dove sono? Vale a dire, dove nella durata totale della vita di questo artefatto
mi è capitato di arrivare? In un certo senso, stava chiedendo la versione temporale del
Questione spaziale che aveva ossessionato l'astronomo quattro Niccolò Copernico
cento anni prima: dove siamo? Dov'è la Terra nell'universo?
Copernico farebbe il cambio di paradigma radicale di immaginare che la Terra
non era l'occhio di bue del centro dell'universo, che in effetti non era da nessuna parte
speciale in particolare. Gott ha deciso di fare lo stesso passo per quanto riguarda il tempo.
Ha fatto l'ipotesi che il momento in cui ha incontrato il Berlino
Il muro non era speciale, che era altrettanto probabile che si trovasse in qualsiasi momento del muro
vita totale. E se un momento era altrettanto probabile, in media il suo arrivo
sarebbe dovuto arrivare precisamente a metà percorso (poiché era probabile che il 50% scendesse
prima della metà e 50% di probabilità di cadere dopo). Più in generale, a meno che non lo sappiamo
meglio possiamo aspettarci di esserci mostrati esattamente a metà della durata di qualsiasi
dato fenomeno. * E se assumiamo di arrivare esattamente a metà strada
nella durata di qualcosa, la migliore ipotesi che possiamo fare per quanto tempo durerà
nel futuro diventa ovvio: esattamente finché è già durato . Gott ha visto
il Muro di Berlino otto anni dopo la sua costruzione, quindi la sua ipotesi migliore era che lo sarebbe stato
resistere per altri otto anni. (Finì per essere venti.)
Questo semplice ragionamento, che Gott chiamò Copernicano

Pagina 151

Principio , si traduce in un semplice algoritmo che può essere utilizzato per fare previsioni
su tutti i tipi di argomenti. Senza aspettative preconcette, potremmo usarlo
per ottenere previsioni per la fine non solo del muro di Berlino, ma di qualsiasi numero
altri fenomeni di breve e lunga durata. Il principio copernicano lo prevede
gli Stati Uniti d'America dureranno come nazione fino a circa l'anno
2255, che Google durerà fino al 2032 circa, e che il tuo rapporto
amico iniziato un mese fa probabilmente durerà circa un altro mese (forse raccontare
lui non ha ancora risposto a quell'invito a nozze). Allo stesso modo, ci dice di essere
scettico quando, ad esempio, una recente copertina del New Yorker raffigura un uomo con in mano un
smartphone da sei pollici con una griglia familiare di icone quadrate delle app e la didascalia
legge "2525". Dubbioso. Lo smartphone come lo conosciamo ha appena un decennio,
e il principio copernicano ci dice che non sarà probabilmente intorno al 2025, lascia
solo cinque secoli dopo. Nel 2525 sarebbe un po 'sorprendente se ci fosse anche un file
New York City.
Più in pratica, se stiamo considerando un impiego in un cantiere edile
la cui segnaletica indica che sono trascorsi "7 giorni dall'ultimo incidente industriale",
potremmo voler stare alla larga, a meno che non si tratti di un lavoro particolarmente breve che intendiamo fare.
E se un sistema di trasporto comunale non può permettersi l'incredibilmente utile ma
cartelli costosi in tempo reale che dicono ai motociclisti quando arriverà il prossimo autobus, il
Il principio copernicano suggerisce che potrebbe esserci un file drammaticamente più semplice e
alternativa più economica. Mostra semplicemente quanto tempo è passato dall'autobus precedente
arrivato a quella fermata offre un suggerimento sostanziale su quando lo farà il prossimo.
Ma è giusto il principio copernicano? Dopo che Gott ha pubblicato la sua congettura in
Nature , il giornale ha ricevuto una raffica di corrispondenza critica. Ed è facile
vediamo perché quando proviamo ad applicare la regola ad alcuni esempi più familiari. Se tu
incontrare un uomo di 90 anni, il principio copernicano prevede che vivrà fino a 180 anni.
Ogni bambino di 6 anni, nel frattempo, dovrebbe affrontare una morte prematura al
tenera età di 12 anni.
Per capire perché il principio copernicano funziona e perché a volte
no, dobbiamo tornare a Bayes. Perché nonostante la sua apparente semplicità, il
Il principio copernicano è davvero un esempio della regola di Bayes.

Bayes incontra Copernico

Pagina 152

Nel prevedere il futuro, come la longevità del muro di Berlino, il


Le ipotesi da valutare sono tutte le possibili durate del fenomeno
a portata di mano: durerà una settimana, un mese, un anno, un decennio? Per applicare la regola di Bayes, come
abbiamo visto, dobbiamo prima assegnare una probabilità a priori a ciascuno di questi
durate. E si scopre che il principio copernicano è esattamente ciò che risulta
dall'applicazione della regola di Bayes utilizzando ciò che è noto come un precedente non informativo .
All'inizio questo può sembrare una contraddizione in termini. Se la regola di Bayes è sempre
ci richiede di specificare le nostre aspettative e convinzioni precedenti, come potremmo dirglielo
non ne abbiamo? Nel caso di una lotteria, un modo per invocare l'ignoranza sarebbe
per assumere quello che viene chiamato il "priore uniforme", che considera ogni proporzione
di vincere i biglietti per essere altrettanto probabile. * Nel caso del muro di Berlino, un
previo disinformativo significa dire che non sappiamo nulla dell'ora
arco che stiamo cercando di prevedere: il muro potrebbe anche crollare nel prossimo
cinque minuti o durano cinque millenni.
A parte questo precedente non informativo, l'unico dato a cui forniamo
La regola di Bayes, come abbiamo visto, è il fatto che abbiamo incontrato il muro di Berlino
quando ha otto anni. Qualsiasi ipotesi che avrebbe previsto un minore di
La durata della vita di otto anni per il muro è quindi esclusa immediatamente, poiché quelli
le ipotesi non possono spiegare affatto la nostra situazione. (Allo stesso modo, una moneta a due teste è
escluso dalla prima comparsa di code.) Qualunque cosa più lunga di otto anni è
nel regno delle possibilità, ma se il muro dovesse essere intorno per a
milioni di anni, sarebbe una grande coincidenza se ci siamo imbattuti così
molto vicino all'inizio della sua esistenza. Pertanto, anche se enormemente lungo
la durata della vita non può essere esclusa, né sono molto probabili.
Quando la regola di Bayes combina tutte queste probabilità, la più probabile
brevi intervalli di tempo che spingono verso il basso la previsione media, la meno probabile ma ancora ferma
possibili lunghi che lo spingono verso l'alto - emerge il principio copernicano: se vogliamo
per prevedere quanto tempo durerà qualcosa e non avere altra conoscenza al riguardo
comunque, la migliore ipotesi che possiamo fare è che continuerà finché sarà
andata così lontano.
In effetti, Gott non fu nemmeno il primo a proporre qualcosa come il copernicano
Principio. Nella metà del ventesimo secolo, lo statistico bayesiano Harold Jeffreys
aveva cercato di determinare il numero di tram in una città dato il numero di serie
numero su un solo tram, e ha ottenuto la stessa risposta: il doppio del
Pagina 153

numero di serie. E un problema simile era sorto anche prima, durante la guerra mondiale
II, quando gli Alleati cercarono di stimare il numero di carri armati prodotti da
Germania. Stime puramente matematiche basate sul seriale dei carri armati catturati
numeri predissero che i tedeschi stavano producendo 246 carri armati ogni mese,
mentre stime ottenute da ricognizioni aeree estese (e altamente rischiose)
ha suggerito che la cifra fosse più simile a 1.400. Dopo la guerra, record tedeschi
ha rivelato la cifra reale: 245.
Riconoscendo che il principio copernicano è solo la regola di Bayes con un
previo non informativo risponde a molte domande sulla sua validità. Il Copernicano
Il principio sembra ragionevole esattamente in quelle situazioni in cui non sappiamo nulla
tutto — come guardare il muro di Berlino nel 1969, quando non siamo nemmeno sicuri di cosa
la tempistica è appropriata. E sembra completamente sbagliato in quei casi in cui noi
non sapere qualcosa sulla questione oggetto. Prevedere che un uomo di 90 anni
vivrà fino a 180 anni sembra irragionevole proprio perché entriamo nel
problema che sa già molto sulla durata della vita umana e quindi possiamo fare di meglio.
Più ricche sono le informazioni preliminari che portiamo alla regola di Bayes, più utile è il
previsioni che possiamo trarne.

Priori del mondo reale ...


Nel senso più ampio, ci sono due tipi di cose nel mondo: le cose che tendono
verso (o raggrupparsi attorno) un qualche tipo di valore "naturale" e cose che non lo fanno.
La durata della vita umana rientra chiaramente nella prima categoria. Seguono approssimativamente
quella che viene definita una distribuzione "normale", nota anche come "gaussiana"
distribuzione, dopo il matematico tedesco Carl Friedrich Gauss, e
chiamata informalmente "curva a campana" per la sua forma caratteristica. Questa forma fa a
buon lavoro di caratterizzazione della durata della vita umana; la durata media della vita degli uomini in
Gli Stati Uniti, ad esempio, sono centrati su circa 76 anni e le probabilità
cadere abbastanza bruscamente su entrambi i lati. Le distribuzioni normali tendono ad avere un singolo
scala appropriata: una durata della vita di una cifra è considerata tragica, una di tre cifre
straordinario. Molte altre cose nel mondo naturale sono normalmente distribuite come file
beh, dall'altezza umana, dal peso e dalla pressione sanguigna fino a mezzogiorno
la temperatura in una città e il diametro dei frutti in un frutteto.

Pagina 154

Ci sono molte cose al mondo che non sembrano normali


distribuito, tuttavia, non da molto lontano. La popolazione media di una città in
gli Stati Uniti, ad esempio, sono 8.226. Ma se dovessi fare un grafico del file
numero di città per popolazione, non vedresti nulla di lontanamente come una campana
curva. Non ci sarebbe modo più città più piccola di 8226 rispetto alle grandi. Al
Allo stesso tempo, quelli più grandi sarebbero molto più grandi della media. Questo tipo di
modello caratterizza quelle che vengono chiamate "distribuzioni della legge di potenza". Anche questi sono noti
come "distribuzioni senza scala" perché caratterizzano quantità che possono
plausibilmente su più scale: una città può avere decine, centinaia, migliaia,
decine di migliaia, centinaia di migliaia o milioni di residenti, quindi non possiamo
definire un singolo valore per quanto dovrebbe essere grande una città "normale".
La distribuzione della legge di potenza caratterizza una miriade di fenomeni nella quotidianità
vita che ha la stessa qualità di base delle popolazioni cittadine: la maggior parte delle cose sotto
significa, e alcuni enormi sopra di esso. Incassi al botteghino di film, che possono
vanno da quattro a dieci cifre, sono un altro esempio. La maggior parte dei film non fa
molti soldi a tutti, ma il Titanic occasionale fa ... beh, importi titanici.
In effetti, il denaro in generale è un dominio pieno di leggi di potere. Legge di potere
le distribuzioni caratterizzano sia la ricchezza delle persone che i redditi delle persone. La media
il reddito in America, ad esempio, è di $ 55.688, ma perché il reddito è all'incirca
Power-law distribuito, sappiamo, ancora una volta, che molte più persone saranno sotto
questo significa che sopra, mentre quelli che sono sopra potrebbero essere praticamente fuori
grafici. Così è: due terzi della popolazione degli Stati Uniti guadagnano meno del reddito medio,
ma l'1% più ricco fa quasi dieci volte la media. E l'1% del make 1%
dieci volte di più.
Si lamenta spesso che "i ricchi diventano più ricchi", e in effetti il ​processo di
"Attaccamento preferenziale" è uno dei modi più sicuri per produrre una legge di potere
distribuzione. I siti web più popolari hanno maggiori probabilità di essere ricevuti
collegamenti; le celebrità online più seguite sono quelle che hanno maggiori probabilità di guadagnare nuovi
fan; le aziende più prestigiose sono quelle che hanno maggiori probabilità di attrarre nuovi clienti;
le città più grandi sono quelle che hanno maggiori probabilità di attirare nuovi residenti. In ogni caso, a
ne risulterà la distribuzione della legge di potere.
La regola di Bayes ci dice che quando si tratta di fare previsioni basate su
prove limitate, poche cose sono importanti quanto avere buoni priori, cioè a
senso della distribuzione da cui ci aspettiamo che provengano le prove.

Pagina 155

Le buone previsioni iniziano quindi con avere un buon istinto su quando siamo
si tratta di una distribuzione normale e quando si tratta di una distribuzione di legge di potenza. Come
si scopre che la regola di Bayes ci offre una previsione semplice ma drammaticamente diversa
regola pratica per ciascuno.

... e le loro regole di previsione


Volevi dire "questo potrebbe andare avanti per sempre" in senso positivo?

—BEN LERNER
Esaminando il principio copernicano, abbiamo visto che quando la regola di Bayes è data un
prima non informativo, prevede sempre che la durata totale di un oggetto sarà
esattamente il doppio della sua età attuale. In effetti, il priore disinformativo, con i suoi selvaggiamente
diverse scale possibili - il muro che potrebbe durare mesi o millenni - lo è
una distribuzione della legge di potere. E per qualsiasi distribuzione della legge di potere, regola di Bayes
indica che la strategia di previsione appropriata è una regola moltiplicativa :
moltiplicare la quantità osservata finora per qualche fattore costante. Per un
prima non informativo, quel fattore costante sembra essere 2, da cui il copernicano
predizione; in altri casi di legge di potenza, il moltiplicatore dipenderà dall'esatto
distribuzione con cui stai lavorando. Per gli incassi dei film, ad esempio, esso
sembra essere circa 1.4. Quindi, se senti che un film ha guadagnato 6 milioni di dollari finora, tu
immagino che guadagnerà circa 8,4 milioni di dollari in totale; se ha guadagnato $ 90 milioni, indovina
raggiungerà $ 126 milioni.
Questa regola moltiplicativa è una conseguenza diretta del fatto che la legge del potere
le distribuzioni non specificano una scala naturale per il fenomeno che stanno
descrivere. L'unica cosa che ci dà un senso di scala per la nostra previsione,
quindi, è l'unico punto di dati che abbiamo, come il fatto che il muro di Berlino
è in piedi da otto anni. Maggiore è il valore di quel singolo punto dati, maggiore è
la scala di cui abbiamo probabilmente a che fare e viceversa. È possibile che un film
che ha incassato 6 milioni di dollari è in realtà un blockbuster nella sua prima ora di uscita, ma
è molto più probabile che sia solo un tipo di film da un milione di cifre.
Quando applichiamo la regola di Bayes con una distribuzione normale come precedente, sul file

Pagina 156

dall'altro, otteniamo un tipo di guida molto diverso. Invece di un file


regola moltiplicativa, otteniamo una regola media : usa la distribuzione "naturale"
media, la sua scala unica e specifica, come guida. Ad esempio, se qualcuno lo è
più giovane della durata media della vita, quindi prevedere semplicemente la media; come la loro età
si avvicina e poi supera la media, prevedere che vivranno qualche anno
Di Più. Seguire questa regola fornisce previsioni ragionevoli per il 90enne e
il bambino di 6 anni: 94 e 77, rispettivamente. (Il bambino di 6 anni ottiene un piccolo vantaggio rispetto al
popolazione media di 76 in virtù di aver superato l'infanzia: lo sappiamo
non è nella coda sinistra della distribuzione.)
Anche i tempi di esecuzione dei film, come le vite umane, seguono una distribuzione normale:
la maggior parte dei film si raggruppa intorno a un centinaio di minuti o giù di lì, con una diminuzione
numero di eccezioni che scendono su entrambi i lati. Ma non tutte le attività umane lo sono
così ben educato. Il poeta Dean Young una volta ha osservato che ogni volta che è
ascoltando una poesia in sezioni numerate, il suo cuore si stringe se il lettore lo annuncia
l'inizio della sezione quattro: se ci sono più di tre parti, tutte le scommesse sono annullate, e
Young ha bisogno di accovacciarsi per un earful. Si scopre che lo sgomento di Young è,
in effetti, perfettamente bayesiano. Un'analisi delle poesie mostra che, a differenza del film
i tempi di esecuzione, le poesie seguono qualcosa di più vicino a una legge di potere che a un normale
distribuzione: la maggior parte delle poesie sono brevi, ma alcune sono epiche. Quindi quando si tratta di
poesia, assicurati di avere un posto comodo. Qualcosa normalmente distribuito
quello che è andato avanti apparentemente troppo a lungo è destinato a finire a breve; ma più a lungo
qualcosa in una distribuzione della legge di potere è andato avanti, più a lungo puoi aspettartelo
andare avanti.
Tra questi due estremi, c'è in realtà una terza categoria di cose
vita: quelli che non hanno più né meno probabilità di finire solo perché se ne sono andati
acceso per un po '. A volte le cose sono semplicemente ... invarianti. Il danese
il matematico Agner Krarup Erlang, che ha studiato tali fenomeni, ha formalizzato
la diffusione di intervalli tra eventi indipendenti nella funzione che ora
porta il suo nome: la distribuzione Erlang. La forma di questa curva è diversa da
sia la normale che la legge di potenza: ha un contorno simile ad un'ala, che sale a un delicato
gobba, con una coda che cade più velocemente di una legge di potenza ma più lentamente di una
distribuzione normale. Erlang stesso, che lavorava per il Copenhagen Telephone
L'azienda all'inizio del XX secolo, lo usava per modellare quanto tempo poteva
dovrebbe passare tra le chiamate successive su una rete telefonica. Da allora, il

Pagina 157
La distribuzione
traffico Erlang eè pedonale
automobilistico stata utilizzata anche da di
e da ingegneri urbanisti
rete chee progettano
architetti per modellare
infrastrutture
per Internet. Ci sono anche molti domini nel mondo naturale, dove
gli eventi sono completamente indipendenti l'uno dall'altro e gli intervalli tra
cadono così su una curva di Erlang. Il decadimento radioattivo è un esempio, quale
significa che la distribuzione Erlang modella perfettamente quando aspettarsi i prossimi tick
di un contatore Geiger. Risulta anche che fa un buon lavoro nel descrivere certi
sforzi umani, come la quantità di tempo che i politici rimangono nella Camera di
Rappresentanti.
La distribuzione di Erlang ci fornisce un terzo tipo di regola di previsione, l' additivo
Regola : prevedere sempre che le cose andranno avanti solo per un importo costante più a lungo. Il
ritornello familiare di "Solo altri cinque minuti! ... [ cinque minuti dopo ] Altri cinque
minuti!" che così spesso caratterizza le affermazioni umane riguardanti, diciamo, la propria
disponibilità a lasciare la casa o l'ufficio, o il tempo fino al completamento di alcuni
compito, può sembrare indicativo di qualche incapacità cronica di fare stime realistiche.
Beh, nei casi in cui ci si trova contro una distribuzione Erlang, comunque, quello
il ritornello sembra essere corretto.
Se un appassionato di carte da casinò dice al suo coniuge impaziente, ad esempio,
che smetterà per il giorno dopo aver vinto un altro blackjack (le cui probabilità sono
circa 20 a 1), potrebbe prevedere allegramente: “Avrò finito tra una ventina di più
mani!" Se, una ventina di mani sfortunate dopo, lei ritorna, chiedendo quanto tempo ha
andando a farla aspettare ora , la sua risposta rimarrà invariata: “Avrò finito
altre venti mani! " Sembra che il nostro instancabile squalo di carte abbia
ha subito una perdita di memoria a breve termine, ma in realtà la sua previsione è del tutto
corretta. In effetti, le distribuzioni che producono la stessa previsione, indipendentemente dalla loro
storia o stato attuale, sono noti agli statistici come "senza memoria".

Pagina 158
Diverse distribuzioni precedenti e relative regole di previsione.

Questi tre modelli molto diversi di previsione ottimale: il moltiplicativo,


Regole medie e additive: tutte derivano direttamente dall'applicazione della regola di Bayes a
rispettivamente le distribuzioni legge di potenza, normale ed Erlang. E dato il

Pagina 159

Il modo in cui queste previsioni vengono fuori, le tre distribuzioni ci offrono differenti
anche una guida su quanto dovremmo essere sorpresi da certi eventi.
In una distribuzione basata sulla legge di potere, più a lungo è andata avanti qualcosa, più a lungo noi
aspettarsi che continui ad andare avanti. Quindi un evento di legge di potenza è più sorprendente del
lo stavamo aspettando da molto tempo e sorprendentemente al massimo prima di esso
accade. Una nazione, una società o un'istituzione diventa solo più venerabile con
ogni anno che passa, quindi è sempre sorprendente quando crolla.
In una distribuzione normale, gli eventi sono sorprendenti quando sono in anticipo, poiché noi
si aspettavano che raggiungessero la media, ma non quando sono in ritardo. In effetti, da quello
punto sembrano in ritardo, quindi più aspettiamo, più ci aspettiamo
loro.
E in una distribuzione Erlang, gli eventi per definizione non sono mai più o meno
sorprendenti, non importa quando si verificano. Ogni stato di cose è sempre uguale
probabilmente finirà indipendentemente da quanto tempo è durato. Non c'è da stupirsi che i politici lo siano sempre
pensando alle loro prossime elezioni.
Il gioco d'azzardo è caratterizzato da un tipo simile di aspettativa di stato stazionario. Se
la tua attesa, diciamo, per una vittoria alla roulette era caratterizzata da un normale
distribuzione, allora si applicherebbe la regola della media: dopo un periodo di sfortuna, direbbe
tu che il tuo numero dovrebbe arrivare da un momento all'altro, probabilmente seguito da altro
perdere giri. (In tal caso, avrebbe senso passare alla vittoria successiva e poi
Se, invece, l'attesa di una vittoria obbediva a una distribuzione della legge di potere, allora il
La regola moltiplicativa ti direbbe che i giri vincenti seguono rapidamente uno dopo l'altro
un altro, ma più a lungo era durata la siccità, più a lungo sarebbe stata probabilmente
Continua. (In questo scenario, faresti bene a continuare a giocare per un po 'dopo qualsiasi
vincere, ma rinunciare dopo una serie di sconfitte.) Contro una distribuzione senza memoria,
tuttavia, sei bloccato. La regola additiva ti dice che la possibilità di una vittoria ora è
lo stesso di un'ora fa, e lo stesso di un'ora da adesso.
Non cambia mai niente. Non sei ricompensato per aver resistito e finito con un
nota alta; né c'è un punto di svolta quando dovresti semplicemente ridurre le tue perdite.
In "The Gambler", Kenny Rogers ha notoriamente consigliato che devi "Sapere
quando andarsene / Sapere quando correre ", ma per una distribuzione senza memoria,
non v'è alcun momento giusto per smettere. Questo potrebbe in parte spiegare questi giochi '
dipendenza.
Sapere a quale distribuzione ti trovi di fronte può fare la differenza.

Pagina 160

Quando il biologo di Harvard e prolifico divulgatore della scienza Stephen Jay


Gould scoprì di avere il cancro, il suo impulso immediato fu di leggere il
letteratura medica pertinente. Poi ha scoperto perché i suoi medici si erano scoraggiati
lui dal farlo: la metà di tutti i pazienti con la sua forma di cancro è morta entro otto
mesi di scoperta.
Ma quell'unica statistica - otto mesi - non gli ha detto nulla sul
distribuzione dei sopravvissuti. Se fosse una distribuzione normale, allora la regola della media
darebbe una previsione abbastanza chiara di quanto tempo potrebbe aspettarsi di vivere: circa
otto mesi. Ma se fosse una legge di potenza, con una coda che si estende fino a
giusto, allora la situazione sarebbe ben diversa: la regola moltiplicativa lo sarebbe
digli che più a lungo viveva, più prove avrebbe fornito che lui
vivrebbe più a lungo. Leggendo ulteriormente, Gould scoprì che “la distribuzione era
anzi, fortemente asimmetrica a destra, con una lunga coda (per quanto piccola) che si estende per
diversi anni al di sopra della mediana di otto mesi. Non ho visto alcun motivo per cui non dovrei esserlo
in quella piccola coda, e ho tirato un lunghissimo sospiro di sollievo. " Gould avrebbe continuato
vivere per altri vent'anni dopo la diagnosi.

Piccoli dati e mente


Le tre regole di previsione, moltiplicativa, media e additiva, lo sono
applicabile in un'ampia gamma di situazioni quotidiane. E in quelle situazioni, le persone
in generale si rivelano straordinariamente bravi nell'usare la regola di previsione corretta.
Quando era alla scuola di specializzazione, Tom, insieme a Josh Tenenbaum del MIT, correva
un esperimento che chiede alle persone di fare previsioni per una varietà di tutti i giorni
quantità, come la durata della vita umana, gli incassi dei film e il tempo
I rappresentanti degli Stati Uniti spenderebbero in carica, basandosi su un solo pezzo di
informazioni in ogni caso: età attuale, denaro guadagnato finora e anni serviti
Data. Quindi hanno confrontato le previsioni fatte dalle persone con le previsioni fornite
applicando la regola di Bayes ai dati reali del mondo reale in ciascuno di essi
domini.
Come si è scoperto, le previsioni che le persone avevano fatto erano estremamente vicine
a quelli prodotti dalla regola di Bayes. Intuitivamente, le persone hanno creato diversi tipi di file
previsioni per quantità che seguivano distribuzioni diverse: legge di potenza,

Pagina 161

normale, ed Erlang ... nel mondo reale. In altre parole, mentre potresti non farlo
conoscere o ricordare consapevolmente quale situazione richiede il moltiplicativo,
Media, o regola additiva, le previsioni che fai ogni giorno tendono a essere implicite
riflettono i diversi casi in cui queste distribuzioni compaiono nella vita di tutti i giorni, e
i diversi modi in cui si comportano.
Alla luce di ciò che sappiamo della regola di Bayes, questo umano straordinariamente buono
le prestazioni suggeriscono qualcosa di critico che aiuta a capire come le persone
fare previsioni. I piccoli dati sono grandi dati sotto mentite spoglie. Il motivo che possiamo spesso
fare buone previsioni da un piccolo numero di osservazioni, o solo da una singola
uno è che i nostri precedenti sono così ricchi. Che lo sappiamo o no, sembra che lo sappiamo
portiamo in giro nelle nostre teste priori sorprendentemente accurati sugli incassi di film e
tempi di esecuzione, lunghezza delle poesie e termini del mandato politico, per non parlare dell'essere umano
durata della vita. Non abbiamo bisogno di raccoglierli esplicitamente; li assorbiamo dal
mondo.
Il fatto che, nel complesso, le intuizioni delle persone sembrano corrispondere strettamente al
le previsioni della regola di Bayes consentono anche di decodificare tutti i tipi
delle distribuzioni precedenti, anche quelle per le quali è più difficile ottenere informazioni reali autorevoli
dati mondiali. Ad esempio, essere tenuto in sospeso dal servizio clienti è deplorevole
aspetto comune dell'esperienza umana, ma non ci sono set di dati disponibili pubblicamente
tempi di attesa come ci sono per gli incassi al botteghino di Hollywood. Ma se
le previsioni delle persone sono informate dalle loro esperienze, possiamo usare la regola di Bayes
condurre ricognizioni indirette sul mondo minando le persone
aspettative. Quando Tom e Josh hanno chiesto alle persone di prevedere i tempi di attesa da un file
singolo punto dati, i risultati suggerivano che i loro soggetti stavano usando il
Regola moltiplicativa: l'attesa totale che le persone si aspettano è una e una terza volta più lunga
come hanno aspettato finora. Ciò è coerente con la distribuzione della legge di potere
come un precedente, dove è possibile un'ampia gamma di scale. Spero solo che tu non finisca
sul Titanic dei tempi di attesa. Negli ultimi dieci anni, approcci come questi lo hanno fatto
ha consentito agli scienziati cognitivi di identificare le distribuzioni precedenti delle persone in un ampio
fascia di domini, dalla visione alla lingua.
C'è un avvertimento cruciale qui, tuttavia. Nei casi in cui non abbiamo buoni
a priori, le nostre previsioni non sono buone. Nello studio di Tom e Josh, per esempio, lì
era un argomento da cui le previsioni delle persone si discostavano sistematicamente
Regola di Bayes: predire la durata del regno dei faraoni egizi. (Come

Pagina 162

succede, i regni dei faraoni seguono una distribuzione di Erlang). La gente semplicemente no
avere abbastanza visibilità quotidiana per avere una sensazione intuitiva per la gamma di quelli
valori, quindi le loro previsioni, ovviamente, vacillarono. Buone previsioni richiedono buone
priori.
Ciò ha una serie di importanti implicazioni. I nostri giudizi tradiscono il nostro
aspettative, e le nostre aspettative tradiscono la nostra esperienza. Cosa progettiamo
il futuro rivela molto, sul mondo in cui viviamo e sul nostro passato.

Cosa ci dicono le nostre previsioni su di noi


Quando Walter Mischel eseguì il suo famoso "test dei marshmallow" nei primi anni '70, lui
stava cercando di capire come la capacità di ritardare la gratificazione si sviluppa con l'età.
In una scuola materna del campus di Stanford, una serie di tre, quattro e cinque
i bambini di un anno hanno messo alla prova la loro forza di volontà. A ogni bambino sarebbe stato mostrato un delizioso
trattare, come un marshmallow, e ha detto che l'adulto che esegue l'esperimento era
sta per lasciare la stanza per un po '. Se lo volessero, potrebbero mangiare il dolcetto
al momento. Ma se avessero aspettato fino al ritorno dello sperimentatore, avrebbero ottenuto
due dolcetti.
Incapace di resistere, alcuni bambini mangiarono immediatamente il bocconcino. E alcuni di
rimasero fuori per quindici minuti interi o giù di lì fino allo sperimentatore
restituito e ha ricevuto due dolcetti come promesso. Ma forse il gruppo più interessante
compresi quelli in mezzo - quelli che sono riusciti ad aspettare un po ', ma
poi si arrese e mangiò il dolcetto.
Questi casi, in cui i bambini hanno lottato potentemente e hanno sofferto valorosamente, solo per
cedere e perdere comunque il marshmallow in più, sono stati interpretati come
suggerendo una sorta di irrazionalità. Se stai andando in caverna, perché non solo caverna
immediatamente e saltare la tortura? Ma tutto dipende dal tipo di situazione
i bambini pensano di essere dentro. Come Joe McGuire dell'Università della Pennsylvania
e Joe Kable hanno sottolineato, se il tempo necessario agli adulti a venire
back è governato da una distribuzione della legge di potere, con lunghe assenze che suggeriscono
attese ancora più lunghe - quindi tagliare le proprie perdite ad un certo punto può farlo
Senso perfetto.
In altre parole, la capacità di resistere alla tentazione può essere, almeno in parte, a

Pagina 163

questione di aspettative piuttosto che di forza di volontà. Se prevedi che gli adulti tendono a
tornare dopo brevi ritardi, qualcosa come una normale distribuzione, dovresti
essere in grado di resistere. La regola media suggerisce che dopo un'attesa dolorosa, il file
la cosa da fare è resistere: lo sperimentatore dovrebbe tornare da un momento all'altro
adesso. Ma se non hai idea della tempistica della scomparsa, coerente
con una distribuzione della legge di potere, allora è una battaglia in salita. La regola moltiplicativa
quindi suggerisce che un'attesa prolungata è solo una piccola frazione di ciò che verrà.
Decenni dopo gli esperimenti originali di marshmallow, Walter Mischel e il suo
i colleghi sono tornati indietro e hanno osservato come stavano andando i partecipanti nella vita.
Sorprendentemente, hanno scoperto che i bambini che avevano aspettato due dolcetti sono cresciuti
giovani adulti che hanno avuto più successo degli altri, anche misurati da
metriche quantitative come i loro punteggi SAT. Se il test marshmallow riguarda
forza di volontà, questa è una potente testimonianza dell'impatto che l'apprendimento dell'autocontrollo
può avere sulla propria vita. Ma se il test riguarda meno la volontà che le aspettative,
poi questo racconta una storia diversa, forse più toccante.
Un team di ricercatori dell'Università di Rochester ha recentemente esplorato come
esperienze precedenti potrebbero influenzare il comportamento nel test marshmallow. Prima
sono stati anche menzionati i marshmallow, i bambini nell'esperimento hanno intrapreso un
progetto artistico. Lo sperimentatore ha dato loro delle scorte mediocri e ha promesso
per tornare presto con opzioni migliori. Ma, a loro insaputa, i bambini lo erano
diviso in due gruppi. In un gruppo, lo sperimentatore era affidabile e venne
torna con le migliori forniture artistiche come promesso. Nell'altro, era inaffidabile,
tornando con nient'altro che scuse.
Completato il progetto artistico, i bambini sono passati al marshmallow standard
test. E qui, i bambini che avevano appreso che lo sperimentatore era inaffidabile
erano più propensi a mangiare il marshmallow prima che tornasse, perdendo il
opportunità di guadagnare una seconda sorpresa.
Fallire il test del marshmallow e avere meno successo in età avanzata può
non si tratta di mancanza di forza di volontà. Potrebbe essere il risultato della convinzione che gli adulti lo siano
non affidabile: che non ci si può fidare per mantenere la parola data, che scompaiono
per intervalli di lunghezza arbitraria. Imparare l'autocontrollo è importante, ma lo è
altrettanto importante crescere in un ambiente in cui gli adulti sono costantemente
presente e degno di fiducia.

Pagina 164
Priori nell'era della riproduzione meccanica
Come se qualcuno dovesse acquistare diverse copie del giornale del mattino per assicurare
stesso che quello che diceva era vero.

—LUDWIG WITTGENSTEIN
Sta attento a ciò che legge, perché è quello che scriverà. Sta attento
di ciò che impara, perché è quello che saprà.

—ANNIE DILLARD
Il modo migliore per fare buone previsioni, come ci mostra la regola di Bayes, è essere
accuratamente informato sulle cose che stai prevedendo. Ecco perché possiamo fare un file
buon lavoro di proiezione della durata della vita umana, ma prestazioni scadenti quando richiesto
stimare i regni dei faraoni.
Essere un buon bayesiano significa rappresentare il mondo in modo corretto
proporzioni: avere buone priorità, opportunamente calibrate. In generale, per
gli esseri umani e altri animali questo avviene naturalmente; di regola, quando qualcosa
ci sorprende, dovrebbe sorprenderci, e quando non lo fa, non dovrebbe. Anche
quando accumuliamo pregiudizi che non sono oggettivamente corretti, di solito continuano a fare a
un lavoro ragionevole di riflettere la parte specifica del mondo in cui viviamo. Per
Ad esempio, qualcuno che vive in un clima desertico potrebbe sovrastimare la quantità di
sabbia nel mondo, e qualcuno che vive ai poli potrebbe sopravvalutare il
quantità di neve. Entrambi sono ben sintonizzati sulla propria nicchia ecologica.
Tuttavia, tutto inizia a guastarsi quando una specie acquisisce il linguaggio.
Ciò di cui parliamo non è ciò che sperimentiamo: parliamo principalmente di interessante
cose, e quelle tendono ad essere cose non comuni. Più o meno da
definizione, gli eventi sono sempre vissuti alle loro frequenze proprie, ma questo
non è affatto vero per il linguaggio. Chiunque abbia subito un morso di serpente o un
il fulmine tenderà a raccontare quelle storie singolari per il resto della loro vita.
E quelle storie saranno così salienti che verranno raccolte e raccontate da
altri.
C'è una curiosa tensione, quindi, tra la comunicazione con gli altri e

Pagina 165

mantenere precisi precisi sul mondo. Quando le persone parlano di cosa


interessa loro e offrono storie che pensano che i loro ascoltatori troveranno interessanti
distorce le statistiche della nostra esperienza. Questo lo rende difficile da mantenere
distribuzioni precedenti appropriate. E la sfida è aumentata solo con il
sviluppo della stampa, dei notiziari serali e dei social media—
innovazioni che consentono alla nostra specie di diffondere meccanicamente il linguaggio .
Considera quante volte hai visto un aereo precipitato o uno schiantato
macchina. È del tutto possibile che tu ne abbia visti più o meno tutti, eppure molti di loro
quelle macchine erano sulla strada accanto a te, mentre probabilmente gli aerei erano in funzione
un altro continente, trasmesso tramite Internet o televisione. Negli Stati Uniti
Dichiara, ad esempio, il numero totale di persone che hanno perso la vita in
incidenti aerei commerciali dal 2000 non sarebbero sufficienti per colmare
La Carnegie Hall è addirittura mezza piena. Al contrario, il numero di persone negli Stati Uniti
Gli stati uccisi in incidenti stradali nello stesso periodo sono maggiori dell'intero
popolazione del Wyoming.
In poche parole, la rappresentazione degli eventi nei media non ne tiene traccia
frequenza nel mondo. Come osserva il sociologo Barry Glassner, il tasso di omicidi in
gli Stati Uniti sono diminuiti del 20% nel corso degli anni '90, ma durante questo periodo
periodo di tempo la presenza della violenza armata nelle notizie americane è aumentata del 600%.
Se vuoi essere un bayesiano intuitivo, se vuoi fare in modo naturale
buone previsioni, senza dover pensare a che tipo di regola di previsione è
appropriato: devi proteggere i tuoi priori. Controintuitivamente, potrebbe
significa spegnere le notizie.

Pagina 166

7 Overfitting
Quando pensare di meno

Quando Charles Darwin stava cercando di decidere se fare la proposta al suo


cugina Emma Wedgwood, prese carta e matita e le pesò tutte
possibile conseguenza. A favore del matrimonio ha elencato i figli, la compagnia,
e il "fascino della musica e delle chiacchiere femminili". Contro il matrimonio ha elencato il
"Terribile perdita di tempo", mancanza di libertà di andare dove voleva, il fardello di
visitare i parenti, la spesa e l'ansia provocata dai bambini, la preoccupazione che
"Forse a mia moglie non piacerà Londra" e avere meno soldi da spendere
libri. La pesatura di una colonna contro l'altra produceva un margine stretto di
vittoria, e in fondo Darwin scarabocchiato, "Marry-Marry-Marry QED"
Quod erat dimostrandum , l' approvazione matematica che lo stesso Darwin allora
ribadito in inglese: "Si è dimostrato necessario sposarsi."
L'elenco dei pro e dei contro era già un algoritmo consacrato dal tempo ai tempi di Darwin,
approvato da Benjamin Franklin un secolo prima. Per superare “il
Incertezza che ci lascia perplessi ", ha scritto Franklin,

a modo mio è, dividi mezzo foglio di carta per una riga in due colonne, scrivendo sopra quella Pro, e
sugli altri Con. Poi durante tre o quattro giorni di Considerazione ho messo sotto il diverso
Teste brevi Suggerimenti dei diversi motivi che in tempi diversi mi vengono in mente a favore o contro
Misurare. Quando li ho così riuniti tutti insieme in una vista, mi sforzo di stimarli
rispettivi pesi; e dove ne trovo due, uno per lato, che sembrano uguali, li elimino entrambi: Se
Trovo un professionista di Reason pari a circa due Reasons con, elimino i tre. Se ne giudico due
Ragioni equivalgono a circa tre Ragioni pro, elimino i cinque; e così procedendo trovo in
lunghezza dove si trova la Ballance; e se dopo uno o due giorni di ulteriore Considerazione non c'è niente di nuovo
di importanza si verifica su entrambi i lati, arrivo a una determinazione di conseguenza.

Pagina 167

Franklin ha persino pensato a questo come qualcosa come un calcolo, dicendo: "Io
hanno trovato un grande vantaggio da questo tipo di equazione, in quella che può essere chiamata
Algebra morale o prudenziale. "

Diario di Darwin, luglio 1838. Ristampato con il permesso della Cambridge University Library.

Pagina 168

Quando pensiamo al pensiero, è facile presumere che di più è meglio: quello


prenderai una decisione migliore più pro e contro elenchi, meglio sarà
previsione sul prezzo di un'azione i fattori più rilevanti identificati e
scrivi un rapporto migliore più tempo dedichi a lavorarci. Questo è sicuramente il file
premessa dietro il sistema di Franklin. In questo senso, l'approccio “algebrico” di Darwin
al matrimonio,
anche nonostante
lodevolmente la sua evidente eccentricità, sembra notevolmente e forse
razionale.
Tuttavia, se Franklin o Darwin fossero vissuti nell'era dell'apprendimento automatico
ricerca: la scienza dell'insegnamento dei computer da cui trarre buoni giudizi
esperienza - avrebbero visto l'algebra morale scossa dalle fondamenta. Il
questione di quanto sia difficile pensare e quanti fattori considerare, è al centro
di un problema intricato che statistici e ricercatori di machine learning chiamano
"Overfitting". E affrontare quel problema rivela che c'è una saggezza da fare
pensare deliberatamente di meno . Essere consapevoli dell'eccessivo adattamento cambia come dovremmo
avvicinati al mercato, al tavolo da pranzo, alla palestra… e all'altare.

Il caso contro la complessità


Tutto quello che puoi fare io posso fare di meglio; Posso fare qualsiasi cosa meglio di te.
- ANNIE PRENDI LA TUA PISTOLA

Ogni decisione è una sorta di previsione: su quanto ti piacerà qualcosa


non hai ancora provato, su dove sta andando una certa tendenza, su come la strada
è probabile che si verifichi meno viaggi (o più). E ogni previsione, in modo cruciale,
implica pensare a due cose distinte: quello che sai e quello che non sai.
Cioè, è un tentativo di formulare una teoria che tenga conto delle esperienze
hai dovuto uscire e dire qualcosa sui futuri che stai indovinando.
Una buona teoria, ovviamente, farà entrambe le cose. Ma il fatto che ogni previsione debba entrare
l'effetto pull double duty crea una certa inevitabile tensione.

Pagina 169

Soddisfazione della vita in funzione del tempo trascorso dal matrimonio.

Per illustrare questa tensione, diamo un'occhiata a un set di dati che avrebbe potuto essere
rilevante per Darwin: la soddisfazione di vita delle persone nei primi dieci anni di
matrimonio, da un recente studio condotto in Germania. Ogni punto su quel grafico è
tratto dallo studio stesso; il nostro compito è capire la formula per una riga che
si adatterebbe a questi punti e si estenderebbe nel futuro, permettendoci di fare previsioni
passato il segno di dieci anni.
Una possibile formula utilizzerebbe un solo fattore per prevedere la vita
soddisfazione: il tempo trascorso dal matrimonio. Ciò creerebbe una linea retta sul file
grafico. Un'altra possibilità è utilizzare due fattori, tempo e tempo al quadrato ; il
la linea risultante avrebbe una forma a U parabolica, consentendo di catturare un potenziale
relazione più complessa tra tempo e felicità. E se espandiamo il file
formula per includere ancora più fattori (tempo cubo e così via), la linea acquisirà
sempre più punti di flessione, diventando sempre più “curvi” e flessibili. Dal
Quando arriviamo a una formula a nove fattori, possiamo catturare relazioni molto complesse
infatti.
Matematicamente parlando, il nostro modello a due fattori incorpora tutti i

Pagina 170

informazioni che entrano nel modello a un fattore e hanno un altro termine che potrebbe
utilizzare pure. Allo stesso modo, il modello a nove fattori sfrutta tutte le informazioni in
l'eliminazione del modello a due fattori, più potenzialmente molto di più. Con questa logica, esso
sembra che il modello a nove fattori dovrebbe sempre darci le migliori previsioni.
A quanto pare, le cose non sono così semplici.

Previsioni di soddisfazione di vita utilizzando modelli con diversi numeri di fattori.

Il risultato dell'applicazione di questi modelli ai dati è mostrato sopra. L'unico-


Il modello fattoriale, non sorprende, tuttavia, manca molti dei punti dati esatti
cattura la tendenza di base: un calo dopo la felicità della luna di miele. Tuttavia, è
previsione in linea retta che questa diminuzione continuerà per sempre,
alla fine con conseguente miseria infinita. Qualcosa in quella traiettoria no
suona abbastanza bene. Il modello a due fattori si avvicina di più all'adattamento dei dati dell'indagine,
e la sua forma curva fa una diversa previsione a lungo termine, suggerendo che dopo
il declino iniziale della soddisfazione della vita più o meno si livella nel tempo. Infine, il
il modello a nove fattori passa attraverso ogni punto del grafico; è
essenzialmente una misura perfetta per tutti i dati dello studio.
In questo senso, sembra che la formula dei nove fattori sia davvero il nostro miglior modello.
Ma se guardi le previsioni che fa per gli anni non inclusi nello studio,
potresti chiederti quanto sia davvero utile: predice la miseria al
altare, un vertiginoso aumento repentino di soddisfazione dopo diversi mesi di matrimonio, a
da allora in poi un giro sulle montagne russe accidentato, e un calo assoluto dopo il decimo anno. Al contrario,
il livellamento previsto dal modello a due fattori è la previsione più coerente
Pagina 171

con quello che dicono psicologi ed economisti sul matrimonio e sulla felicità.
(Per inciso, credono che rifletta semplicemente un ritorno alla normalità - a
livello di base di soddisfazione delle persone per le loro vite, piuttosto che per qualsiasi altro
dispiacere per il matrimonio stesso.)
La lezione è questa: è proprio vero che includere più fattori in un modello lo farà
sempre, per definizione, adattarlo meglio ai dati che abbiamo già. Ma a
un migliore adattamento ai dati disponibili non significa necessariamente una migliore previsione.

Aggiunta di piccole quantità di "rumore" casuale ai dati (simulando gli effetti della ripetizione del rilevamento con a

Pagina 172

gruppo di partecipanti diverso) produce ondulazioni selvagge nel modello a nove fattori, mentre il modello a uno e due
i modelli fattoriali a confronto sono molto più stabili e coerenti nelle loro previsioni.

Certo, un modello troppo semplice, ad esempio la linea retta dell'uno,


formula del fattore: può non riuscire a catturare il modello essenziale nei dati. Se la verità
sembra una curva, nessuna linea retta potrà mai farlo bene. D'altra parte, a
modello troppo complicato, come il nostro modello a nove fattori qui, diventa
ipersensibile ai punti dati particolari che ci è capitato di osservare. Come un
conseguenza, proprio perché è sintonizzato così finemente su quello specifico set di dati, il file
le soluzioni che produce sono molto variabili. Se lo studio fosse ripetuto con
persone diverse, producendo leggere variazioni sullo stesso schema essenziale, il
i modelli a uno e due fattori rimarrebbero più o meno stabili, ma i modelli a nove
il modello fattoriale girerebbe selvaggiamente da un caso all'altro dello studio.
Questo è ciò che gli statistici chiamano overfitting .
Quindi una delle verità più profonde dell'apprendimento automatico è che, in effetti, non lo è
è sempre meglio usare un modello più complesso, che richieda un numero maggiore di
fattori in considerazione. E il problema non è solo che i fattori extra potrebbero offrire
rendimenti decrescenti: prestazioni migliori rispetto a un modello più semplice, ma non abbastanza
giustificare la complessità aggiunta. Piuttosto, potrebbero fare le nostre previsioni
drammaticamente peggio.

L'idolatria dei dati


Se disponessimo di dati abbondanti, tratti da un campione perfettamente rappresentativo,
completamente privo di errori e che rappresenta esattamente ciò che stiamo cercando di valutare,
quindi utilizzare il modello più complesso disponibile sarebbe davvero l'approccio migliore.
Ma se proviamo ad adattare perfettamente il nostro modello ai dati quando uno di questi fattori fallisce
per tenere, rischiamo di overfitting.
In altre parole, l'overfitting rappresenta un pericolo ogni volta che abbiamo a che fare con il rumore
o mismisurazione - e quasi sempre lo siamo. Possono esserci errori nel modo in cui il file
i dati sono stati raccolti o in che modo sono stati segnalati. A volte i fenomeni
essere indagati, come la felicità umana, sono difficili da definire, figuriamoci
misurare. Grazie alla loro flessibilità, i modelli più complessi a nostra disposizione possono farlo
si adattano a qualsiasi modello che appare nei dati, ma ciò significa che lo faranno anche loro

Pagina 173

anche quando quei modelli sono semplici fantasmi e miraggi nel rumore.
Nel corso della storia, i testi religiosi hanno messo in guardia i loro seguaci contro
idolatria: adorazione di statue, dipinti, reliquie e altri manufatti tangibili
al posto delle divinità intangibili rappresentate da quei manufatti. Il primo
Il comandamento, ad esempio, avverte di non inchinarsi a "qualsiasi immagine scolpita,
o qualsiasi somiglianza di qualsiasi cosa che sia nei cieli ". E nel Libro dei Re, a
serpente di bronzo realizzato per ordine di Dio diventa un oggetto di adorazione e incenso-
ardente, invece di Dio stesso. (Dio non è divertito). Fondamentalmente,
l'overfitting è una sorta di idolatria dei dati, una conseguenza del concentrarsi su cosa
siamo stati in grado di misurare piuttosto che ciò che conta.
Questo divario tra i dati che abbiamo e le previsioni che vogliamo è virtualmente
ovunque. Quando prendiamo una decisione importante, possiamo solo indovinare cosa farà piacere
più tardi, pensando ai fattori importanti per noi in questo momento. (Come quello di Harvard
Daniel Gilbert afferma che il nostro sé futuro spesso “paga buoni soldi per rimuovere il
tatuaggi che abbiamo pagato per ottenere buoni soldi. ") Quando si fa una previsione finanziaria, noi
può solo guardare cosa era correlato al prezzo di un'azione in passato, non cosa
potrebbe in futuro. Anche nei nostri piccoli atti quotidiani vale questo schema: scrivere un file
e-mail, utilizziamo la nostra lettura del testo per prevedere quella del destinatario.
Non meno che nei sondaggi pubblici, i dati nella nostra vita sono quindi anche sempre
rumoroso, nella migliore delle ipotesi una metrica proxy per le cose a cui teniamo veramente.
Di conseguenza, considerare sempre più fattori e spendere di più
lo sforzo di modellarli può portarci all'errore di ottimizzare per la cosa sbagliata
—Offrire preghiere al serpente di bronzo dei dati piuttosto che alla forza più grande che c'è dietro
esso.

Overfitting ovunque
Una volta che conosci l'overfitting, lo vedi ovunque.
L'eccessivo adattamento, ad esempio, spiega l'ironia dei nostri palati. Come può essere quello
i cibi che ci piacciono di più sono generalmente considerati dannosi per la nostra salute,
quando l'intera funzione delle papille gustative, evolutivamente parlando, è di impedirci
dal mangiare cose che fanno male?
La risposta è che il gusto è la metrica proxy del nostro corpo per la salute. Grassi, zuccheri e

Pagina 174

il sale sono nutrienti importanti, e per un paio di centinaia di migliaia di anni, l'essere
attratto dagli alimenti che li contenevano era una misura ragionevole per una dieta sostenuta.
Ma essere in grado di modificare gli alimenti a nostra disposizione ha rotto quella relazione. Noi
ora può aggiungere grassi e zuccheri agli alimenti oltre le quantità che sono buone per noi, e
poi mangia esclusivamente quegli alimenti piuttosto che il mix di piante, cereali e carni
che storicamente costituiva la dieta umana. In altre parole, possiamo esagerare con il gusto.
E più abilmente possiamo manipolare il cibo (e più i nostri stili di vita
divergono da quelli dei nostri antenati), più imperfetto diventa un gusto metrico.
La nostra azione umana si trasforma così in una maledizione, rendendoci pericolosamente in grado di avere
esattamente quello che vogliamo anche quando non vogliamo esattamente la cosa giusta.
Attenzione: quando vai in palestra per eliminare il peso extra da tutto ciò
zucchero, puoi anche rischiare di overfitting fitness. Alcuni segni visibili di forma fisica: bassi
grasso corporeo e massa muscolare elevata, per esempio, sono facili da misurare, e lo sono
relativi , diciamo, alla riduzione al minimo del rischio di malattie cardiache e altri disturbi. Ma loro,
sono anche una misura sostitutiva imperfetta. Adattare eccessivamente i segnali: adottare un
una dieta estrema per ridurre il grasso corporeo e l'assunzione di steroidi per costruire muscoli, forse, può
ti fanno il ritratto della buona salute, ma solo il ritratto.
L'overfitting si manifesta anche nello sport. Ad esempio, Tom è stato uno schermidore
e via, da quando era un adolescente. L'obiettivo originale della scherma era insegnare
persone come difendersi in un duello, da cui il nome: "difesa". E
le armi usate nella scherma moderna sono simili a quelle che venivano usate per allenarsi
per tali incontri. (Questo è particolarmente vero per la spada, che era ancora usata in
duelli formali meno di cinquant'anni fa.) Ma l'introduzione del punteggio elettronico
l'equipaggiamento, un pulsante sulla punta della lama che registra un colpo, ha cambiato il
natura dello sport e tecniche che ti servirebbero male in un duello serio
sono diventate abilità critiche nella competizione. Gli schermitori moderni usano lame flessibili
che consente loro di "colpire" il pulsante contro il loro avversario, sfiorando appena abbastanza forte
per registrarsi e segnare. Di conseguenza, possono sembrare più sottili
fruste di metallo l'una contro l'altra rispetto al taglio o alla spinta. È uno sport emozionante quanto
mai, ma quando gli atleti adattano la loro tattica alle stranezze del segnapunti, diventa
meno utile per instillare le abilità nell'arte della spada nel mondo reale.
Forse da nessuna parte, tuttavia, l'overfitting è potente e problematico come in
il mondo degli affari. "Le strutture di incentivazione funzionano", come ha affermato Steve Jobs. "Quindi tu
bisogna stare molto attenti a ciò che incentivi le persone a fare, perché vari

Pagina 175

le strutture di incentivi creano tutti i tipi di conseguenze che non puoi prevedere ".
Sam Altman, presidente dell'incubatore di startup Y Combinator, fa eco a Jobs's
parole di cautela: “È proprio vero che l'azienda costruirà qualunque sia il CEO
decide di misurare. "
In effetti, è incredibilmente difficile trovare incentivi o misurazioni
che non hanno alcun effetto perverso. Negli anni '50, la gestione della Cornell
Il professor VF Ridgway ha catalogato una serie di tali "conseguenze disfunzionali
delle misurazioni delle prestazioni. " In una ditta di collocamento, i dipendenti erano
valutati in base al numero di interviste condotte, cosa che li ha motivati
eseguire le riunioni il più rapidamente possibile, senza spendere molto tempo
aiutando effettivamente i propri clienti a trovare lavoro. In un'agenzia di polizia federale,
si è scoperto che gli investigatori a cui erano state assegnate quote mensili di rendimento sceglievano casi facili
la fine del mese piuttosto che i più urgenti. E in una fabbrica, concentrandosi
sulle metriche di produzione ha portato i supervisori a trascurare la manutenzione e le riparazioni, l'impostazione
catastrofe futura. Tali problemi non possono essere semplicemente liquidati come un fallimento
raggiungere gli obiettivi di gestione. Piuttosto, sono l'opposto: lo spietato e intelligente
ottimizzazione della cosa sbagliata.
Il passaggio del ventunesimo secolo all'analisi in tempo reale ha solo fatto il
pericolo di metriche più intense. Avinash Kaushik, evangelista del marketing digitale presso
Google avverte che sta cercando di convincere gli utenti del sito web a vedere quanti più annunci possibile
passa naturalmente al tentativo di riempire i siti di annunci: "Quando vieni pagato su un
[costo per mille impressioni] base l'incentivo è capire come mostrare
il maggior numero possibile di annunci su ogni pagina [e] assicurano che il visitatore veda di più
possibili pagine del sito… Quell'incentivo rimuove l'attenzione dall'importante
entità, il tuo cliente e lo inserisce nell'entità secondaria, il tuo inserzionista. "
Il sito web potrebbe guadagnare un po 'più di denaro a breve termine, ma pieno di pubblicità
articoli, presentazioni multi-pagina a caricamento lento e clickbait sensazionalisti
i titoli allontaneranno i lettori a lungo termine. La conclusione di Kaushik:
"Gli amici non consentono agli amici di misurare le visualizzazioni di pagina. Mai."
In alcuni casi, la differenza tra un modello e il mondo reale è letteralmente a
questione di vita e di morte. Nell'esercito e nelle forze dell'ordine, ad esempio,
L'addestramento meccanico ripetitivo è considerato un mezzo chiave per instillare abilità di linea di fuoco.
L'obiettivo è praticare determinati movimenti e tattiche al punto che diventino
totalmente automatico. Ma quando l'overfitting si insinua, può rivelarsi disastroso. Là

Pagina 176

sono storie di agenti di polizia che si ritrovano, ad esempio, a prendersi una pausa
durante uno scontro a fuoco per mettere in tasca i bossoli esausti: buona etichetta per un
poligono di tiro. In qualità di ex Ranger dell'esercito e professore di psicologia di West Point
Dave Grossman scrive: "Dopo che il fumo si era placato in molti veri scontri a fuoco,
gli ufficiali rimasero scioccati nello scoprire nelle loro tasche degli ottoni vuoti senza memoria
di come è arrivato lì. In diverse occasioni sono stati trovati poliziotti morti con l'ottone
le loro mani, morenti nel bel mezzo di una procedura amministrativa che era stata
forato in loro. " Allo stesso modo, l'FBI è stato costretto a cambiare la sua formazione dopo
agenti sono stati trovati sparando di riflesso due colpi e poi rinfoderando la loro arma
—Una cadenza standard durante l'allenamento — indipendentemente dal fatto che i loro colpi abbiano colpito il
bersaglio e se c'era ancora una minaccia. Errori come questi sono noti per legge
forze dell'ordine e militari come "cicatrici da addestramento", e riflettono il fatto che lo sia
possibile sovradimensionare la propria preparazione. In un caso particolarmente drammatico, un
l'ufficiale ha istintivamente afferrato la pistola dalle mani di un aggressore e poi
istintivamente glielo restituì, proprio come aveva fatto più e più volte con
i suoi allenatori in pratica.

Rilevamento dell'overfitting: convalida incrociata


Perché l'overfitting si presenta inizialmente come una teoria che si adatta perfettamente al
dati disponibili, può sembrare insidiosamente difficile da rilevare. Come possiamo aspettarci di dirlo
la differenza tra un modello veramente buono e uno troppo adatto? In un file
contesto educativo, come possiamo distinguere tra una classe di studenti che eccellono
sull'argomento e una classe semplicemente "insegnata alla prova"? Nel
mondo degli affari, come possiamo distinguere una vera star da un dipendente che
ha appena abilmente adattato il proprio lavoro agli indicatori chiave di prestazione dell'azienda
—O alla percezione del capo?
Prendere in giro quegli scenari è davvero impegnativo, ma non impossibile.
La ricerca sull'apprendimento automatico ha prodotto diverse strategie concrete per
rilevare l'overfitting e uno dei più importanti è ciò che è noto come Cross-
Validazione .
In poche parole, Cross-Validation significa valutare non solo quanto bene si adatta un modello
i dati sono forniti, ma quanto bene si generalizza ai dati che non ha visto.

Pagina 177

Paradossalmente, ciò potrebbe comportare l'utilizzo di meno dati. Nell'esempio del matrimonio, noi
potrebbe "trattenere", diciamo, due punti a caso e adattare i nostri modelli solo a
altri otto. Quindi prenderemmo quei due punti di prova e li useremo per valutare quanto bene
le nostre varie funzioni si generalizzano oltre gli otto punti di “allenamento” che sono stati
dato. I due punti trattenuti funzionano come canarini nella miniera di carbone: se a
modello complesso inchioda gli otto punti di allenamento ma manca selvaggiamente i due test
punti, è una buona scommessa che l'overfitting sia al lavoro.
Oltre a trattenere alcuni dei punti dati disponibili, è anche utile
valutare la possibilità di testare il modello con dati derivati ​da qualche altra forma di valutazione
interamente. Come abbiamo visto, l'uso di metriche proxy: gusto come proxy per
anche l'alimentazione, il numero di casi risolti come proxy per la diligenza degli investigatori
portare a overfitting. In questi casi, sarà necessario eseguire la convalida incrociata del file primario
misura delle prestazioni che stiamo utilizzando rispetto ad altre misure possibili.
Nelle scuole, ad esempio, i test standardizzati offrono una serie di vantaggi,
compresa una distinta economia di scala: possono essere classificati rapidamente e in modo economico
le migliaia. Accanto a tali test, tuttavia, le scuole potrebbero valutare in modo casuale
una piccola parte degli studenti - uno per classe, diciamo, o uno su cento -
utilizzando un metodo di valutazione diverso, forse qualcosa come un saggio o un orale
esame. (Poiché solo pochi studenti verrebbero testati in questo modo, avendo questo
la scala del metodo secondario non è una grande preoccupazione.) I test standardizzati lo farebbero
fornire un feedback immediato: potresti chiedere agli studenti di fare un breve
esame computerizzato ogni settimana e traccia i progressi della classe quasi in tempo reale
tempo, ad esempio, mentre i punti dati secondari servirebbero a incrociare
convalidare: per assicurarsi che gli studenti stessero effettivamente acquisendo la conoscenza
che il test standardizzato ha lo scopo di misurare, e non semplicemente di migliorare
prova. Se i punteggi standardizzati di una scuola aumentano mentre è "non standardizzato"
le prestazioni si sono mosse nella direzione opposta, gli amministratori avrebbero capito
segnale di avvertimento che "insegnare alla prova" era iniziato e le abilità degli alunni lo erano
cominciando a sovradimensionare la meccanica del test stesso.
Cross-Validation offre anche un suggerimento per le forze dell'ordine e militari
personale che cerca di instillare buoni riflessi senza martellare le abitudini del
processo di formazione stesso. Proprio come saggi ed esami orali possono convalidare in modo incrociato
test standardizzati, quindi potrebbero verificarsi valutazioni occasionali di "cross-training" non familiari
essere utilizzato per misurare se il tempo di reazione e la precisione di tiro stanno generalizzando
Pagina 178

a compiti non familiari. Se non lo sono, allora è un segnale forte per cambiare il file
regime di allenamento. Sebbene nulla possa veramente preparare uno per il combattimento reale,
esercizi come questo possono almeno avvisare in anticipo dove sono probabili "cicatrici da allenamento"
aver formato.

Come combattere l'overfitting: penalizzare la complessità


Se non puoi spiegarlo semplicemente, non lo capisci abbastanza bene.

-ANONIMO
Abbiamo visto alcuni dei modi in cui l'overfitting può rialzare la testa, e lo abbiamo fatto
ha esaminato alcuni dei metodi per rilevarlo e misurarlo. Ma cosa possiamo
effettivamente fare per alleviarlo?
Da un punto di vista statistico, l'overfitting è un sintomo di un'eccessiva sensibilità
i dati effettivi che abbiamo visto. La soluzione, quindi, è semplice: dobbiamo
bilancia il nostro desiderio di trovare un buon adattamento con la complessità dei modelli che utilizziamo
fare così.
Un modo per scegliere tra diversi modelli concorrenti è il rasoio di Occam
principio, il che suggerisce che, a parità di condizioni, il più semplice possibile
l'ipotesi è probabilmente quella corretta. Naturalmente, le cose raramente sono completamente
uguale, quindi non è immediatamente ovvio come applicare qualcosa come quello di Occam
rasoio in un contesto matematico. Alle prese con questa sfida negli anni '60,
Il matematico russo Andrey Tikhonov ha proposto una risposta: introdurre un
termine aggiuntivo ai tuoi calcoli che penalizza le soluzioni più complesse. Se noi
introdurre una penalità di complessità, quindi i modelli più complessi non devono farlo
semplicemente un lavoro migliore, ma un lavoro significativamente migliore di spiegare i dati per giustificare
la loro maggiore complessità. Gli informatici fanno riferimento a questo principio: usare
vincoli che penalizzano i modelli per la loro complessità, come la regolarizzazione .
Quindi come sono queste penalità di complessità? Un algoritmo, scoperto
nel 1996 dal biostatistico Robert Tibshirani, viene chiamato Lasso e usa come suo
penalizza il peso totale dei diversi fattori nel modello. * Mettendo questo
pressione al ribasso sui pesi dei fattori, il Lazo spinge il maggior numero di

Pagina 179

possibile completamente a zero. Solo i fattori che hanno un grande impatto su


i risultati rimangono nell'equazione, trasformando così potenzialmente, diciamo, un
modello a nove fattori sovradimensionato in una formula più semplice e robusta con solo un
due dei fattori più critici.
Tecniche come il Lazo sono ormai onnipresenti nell'apprendimento automatico, ma il
lo stesso tipo di principio, una pena per la complessità, appare anche in natura.
Gli organismi viventi ottengono una certa spinta verso la semplicità quasi automaticamente,
grazie ai vincoli di tempo, memoria, energia e attenzione. L'onere di
il metabolismo, ad esempio, agisce come un freno alla complessità degli organismi,
introdurre una penalità calorica per macchinari eccessivamente elaborati. Il fatto che il file
Il cervello umano
testimonianza brucia circa
dei vantaggi un quinto
evolutivi che dell'apporto
ci fornisconocalorico giornaliero
le nostre totale degli esseri umani è a
capacità intellettuali
con: i contributi del cervello devono in qualche modo più che pagare per quel considerevole carburante
conto. D'altra parte, possiamo anche dedurre che un cervello sostanzialmente più complesso
probabilmente non ha fornito dividendi sufficienti, evolutivamente parlando. Siamo come
intelligenti come dovevamo essere, ma non in modo stravagante di più.
Si ritiene che lo stesso tipo di processo abbia un ruolo anche a livello neurale. Nel
informatica, modelli software basati sul cervello, noti come “artificiali
reti neurali ”, possono apprendere funzioni arbitrariamente complesse, ma sono anche di più
flessibile rispetto al nostro modello a nove fattori sopra, ma proprio per questo
flessibilità sono notoriamente vulnerabili all'overfitting. Reale, biologico
le reti neurali aggirano alcuni di questo problema perché hanno bisogno di un compromesso
le loro prestazioni contro i costi di manutenzione. I neuroscienziati l'hanno fatto
ha suggerito, ad esempio, che il cervello cerchi di ridurre al minimo il numero di neuroni
sparano in un dato momento, implementando lo stesso tipo di discesa
pressione sulla complessità come il Lazo.
Il linguaggio forma ancora un altro lazo naturale: la complessità è punita dal
fatica di parlare più a lungo e faticare la capacità di attenzione del nostro ascoltatore.
I piani aziendali vengono compressi in un tono di ascensore; diventa un consiglio di vita
saggezza proverbiale solo se sufficientemente concisa e accattivante. E tutto ciò
deve essere ricordato deve passare attraverso il lazo intrinseco della memoria.

Il lato positivo dell'euristica

Pagina 180

L'economista Harry Markowitz ha vinto il Premio Nobel per l'economia nel 1990 per
sviluppare una moderna teoria del portafoglio: la sua rivoluzionaria "media varianza
ottimizzazione del portafoglio "ha mostrato come un investitore potrebbe fare un ottimo
allocazione tra vari fondi e attività per massimizzare i rendimenti a un dato livello
di rischio. Quindi, quando è arrivato il momento di investire i propri risparmi per la pensione, sembra
Markowitz avrebbe dovuto essere l'unica persona perfettamente attrezzata per il lavoro. Che cosa
ha deciso di fare?

Avrei dovuto calcolare le covarianze storiche delle classi di attività e tracciare una frontiera efficiente.
Invece, ho visualizzato il mio dolore se il mercato azionario fosse salito e io non ci ero dentro, o se fosse andato così
giù ed ero completamente dentro. La mia intenzione era di ridurre al minimo il mio futuro rimpianto. Quindi ho diviso il mio
contributi cinquanta-cinquanta tra obbligazioni e azioni.

Perché nel mondo avrebbe dovuto farlo? La storia del vincitore del Premio Nobel e
la sua strategia di investimento potrebbe essere presentata come un esempio di irrazionalità umana:
di fronte alla complessità della vita reale, ha abbandonato il modello razionale e
seguito una semplice euristica. Ma è proprio a causa della complessità del reale
vita che una semplice euristica potrebbe in effetti essere la soluzione razionale.
Quando si tratta di gestione del portafoglio, si scopre che a meno che tu non sia altamente
sicuro delle informazioni che hai sui mercati, potresti esserlo davvero
meglio ignorare del tutto quelle informazioni. Applicazione dell'ottimale di Markowitz
Lo schema di allocazione del portafoglio richiede buone stime dei dati statistici
immobili di diversi investimenti. Un errore in quelle stime può portare a molto
diverse allocazioni degli asset, aumentando potenzialmente il rischio. Al contrario, dividendo il tuo file
il denaro in modo uniforme tra azioni e obbligazioni non è affatto influenzato dai dati che hai
osservato. Questa strategia non cerca nemmeno di adattarsi alla performance storica
di quelle di investimento tipi così non c'è modo che possa sopra andare bene.
Naturalmente, il solo utilizzo di una divisione cinquanta-cinquanta non è necessariamente dolce per la complessità
spot, ma c'è qualcosa da dire per questo. Se ti capita di conoscere il previsto
media e varianza attesa di un insieme di investimenti, quindi utilizzare la varianza media
ottimizzazione del portafoglio: l'algoritmo ottimale è ottimale per una ragione. Ma quando
le probabilità di stimarle tutte correttamente sono basse, e il peso che il modello ha
mette su quelle quantità inaffidabili è alto, quindi dovrebbe suonare un allarme
nel processo decisionale: è tempo di regolarizzare.

Pagina 181

Ispirato da esempi come i risparmi per la pensione di Markowitz, gli psicologi


Gerd Gigerenzer e Henry Brighton hanno sostenuto che il processo decisionale
le scorciatoie che le persone usano nel mondo reale in molti casi sono esattamente il tipo di
pensare che porta buone decisioni. “In contrasto con l'opinione diffusa che
meno elaborazione riduce l'accuratezza ", scrivono," lo studio dell'euristica lo dimostra
meno informazioni, calcoli e tempo possono infatti migliorare la precisione. " UN
euristica che favorisce risposte più semplici, con meno fattori o meno calcoli
offre proprio questi effetti "meno è meglio".
Imporre sanzioni alla complessità finale di un modello non è l'unico modo
per alleviare l'overfitting, tuttavia. Puoi anche spingere un modello verso la semplicità
controllando la velocità con cui gli permetti di adattarsi ai dati in arrivo. Questo
rende lo studio dell'overfitting una guida illuminante per la nostra storia, sia come un
società e come specie.

Il peso della storia


Ogni cibo che un topo vivente ha mangiato non lo ha necessariamente ucciso.
—SAMUEL REVUSKY E ERWIN BEDARF, “ASSOCIAZIONE DI MALATTIA CON PREVIA INGESTIONE DI
NUOVI CIBI "

Il mercato del latte di soia negli Stati Uniti è più che quadruplicato dalla metà
Dal 1990 al 2013. Ma entro la fine del 2013, secondo i titoli dei giornali, era già così
sembrava un ricordo del passato, un lontano secondo posto al latte di mandorle. Come cibo
e il ricercatore di bevande Larry Finkel hanno dichiarato a Bloomberg Businessweek : “Le noci sono
alla moda adesso. La soia sembra più un alimento salutare vecchio stile ". La seta
azienda, famosa per la diffusione del latte di soia (come suggerisce il nome), riportata in
alla fine del 2013 che i suoi prodotti a base di latte di mandorle erano cresciuti di oltre il 50% nel
solo trimestre precedente. Nel frattempo, in altre notizie sulle bevande, il cocco leader
Il marchio di acqua Vita Coco ha riferito nel 2014 che le sue vendite erano raddoppiate dal 2011—
ed era aumentato di trecento volte dal 2004. Come il Nuovo
Il York Times ha affermato: "L'acqua di cocco sembra essere passata da invisibile a
inevitabile senza una pausa nel regno del vagamente familiare. " Nel frattempo,
il mercato dei cavoli è cresciuto del 40% solo nel 2013. Il più grande acquirente di cavolo nero
l'anno prima era stato Pizza Hut, che lo metteva nelle loro insalate - come decorazione.

Pagina 182

Alcuni dei domini più fondamentali della vita umana, come la questione del
quello che dovremmo mettere nel nostro corpo, sembra curiosamente essere il più dominato
da mode di breve durata. Parte di ciò che consente a queste mode di prendere d'assalto il mondo è
quanto velocemente la nostra cultura può cambiare. Le informazioni ora fluiscono attraverso la società
più velocemente che mai, mentre le catene di approvvigionamento globali consentono ai consumatori di farlo rapidamente
cambiare le loro abitudini di acquisto in massa (e il marketing li incoraggia a farlo).
Se qualche studio particolare suggerisce un beneficio per la salute, ad esempio, l'anice stellato,
può essere in tutta la blogosfera entro la settimana, in televisione la settimana dopo
quello, e apparentemente in ogni supermercato in sei mesi, con anice stellato dedicato
libri di cucina presto usciti dalle presse. Questa velocità mozzafiato è sia a
benedizione e una maledizione.
Al contrario, se guardiamo al modo in cui gli organismi, inclusi gli esseri umani, si evolvono, noi
nota qualcosa di intrigante: il cambiamento avviene lentamente. Ciò significa che il file
le proprietà degli organismi moderni sono plasmate non solo dal loro presente
ambienti, ma anche dalla loro storia. Ad esempio, il stranamente incrociato
disposizione del nostro sistema nervoso (il lato sinistro del nostro corpo controllato dal
lato destro del nostro cervello e viceversa) riflette la storia evolutiva di
vertebrati. Si ipotizza che questo fenomeno, chiamato "decussazione", sia avvenuto
in un punto dell'evoluzione in cui i corpi dei primi vertebrati ruotavano di 180 gradi con
rispetto alle loro teste; mentre le corde nervose degli invertebrati come le aragoste
ei lombrichi corrono sul lato "ventre" dell'animale, i vertebrati hanno il loro
cavi nervosi invece lungo la colonna vertebrale.
L'orecchio umano offre un altro esempio. Visto da un funzionale
prospettiva, è un sistema per tradurre le onde sonore in segnali elettrici da
via di amplificazione attraverso tre ossa: martello, incudine e staffa. Questo
il sistema di amplificazione è impressionante, ma le specifiche di come funziona hanno molto
a che fare con vincoli storici. I rettili, a quanto pare, hanno solo un osso
il loro orecchio, ma ossa aggiuntive nella mascella che mancano ai mammiferi. Quelle mascelle
apparentemente sono stati riproposti nell'orecchio dei mammiferi. Quindi la forma esatta e
la configurazione della nostra anatomia dell'orecchio riflette la nostra storia evolutiva almeno come
tanto quanto risolve il problema uditivo.
Il concetto di overfitting ci dà un modo di vedere la virtù in tale
bagaglio evolutivo. Anche se fibre nervose incrociate e riproposte
le ossa mascellari possono sembrare sistemazioni non ottimali, non necessariamente lo vogliamo

Pagina 183

evoluzione per ottimizzare completamente un organismo ad ogni cambiamento nella sua nicchia ambientale
- o, almeno, dovremmo riconoscere che così facendo sarebbe estremamente
sensibile a ulteriori cambiamenti ambientali. Dover fare uso dell'esistente
i materiali, d'altro canto, impongono una sorta di utile contenimento. Lo rende più difficile
per indurre drastici cambiamenti nella struttura degli organismi, più difficile da adattare. Come un
specie, essendo vincolati dal passato ci rende meno perfettamente adattati alla
presente lo sappiamo ma ci aiuta a mantenerci robusti per il futuro che non sappiamo.
Un'intuizione simile potrebbe aiutarci a resistere alle rapide mode dell'essere umano
società. Quando si parla di cultura, la tradizione gioca il ruolo dell'evoluzione
vincoli. Un po 'di conservatorismo, un certo pregiudizio a favore della storia, possono tamponarci
contro il ciclo boom-and-bust delle mode passeggere. Ciò non significa che dovremmo ignorare
anche gli ultimi dati, ovviamente. Salta verso il carrozzone, con tutti i mezzi, ma
non necessariamente su di esso.
Nell'apprendimento automatico, i vantaggi di muoversi lentamente emergono maggiormente
concretamente in una tecnica di regolarizzazione nota come Early Stopping . Quando noi
abbiamo esaminato i dati dell'indagine sul matrimonio in Germania all'inizio del capitolo, noi
è andato direttamente a esaminare i modelli a uno, due e nove fattori più adatti. Nel
molte situazioni, tuttavia, regolando i parametri per trovare il miglior adattamento possibile
i dati forniti sono un processo in sé e per sé. Cosa succede se interrompiamo quel processo
presto e semplicemente non consentono un modello del tempo di diventare troppo complesso? Ancora,
emerge quello che a prima vista potrebbe sembrare un po 'scontroso o scortese,
invece, come una strategia importante a sé stante.
Molti algoritmi di previsione, ad esempio, iniziano cercando il singolo
fattore più importante piuttosto che passare a un modello multifattoriale. Solo dopo
trovando quel primo fattore cercano il successivo fattore più importante da aggiungere
il modello, poi il successivo e così via. I loro modelli possono quindi essere evitati
diventare eccessivamente complesso semplicemente interrompendo il processo poco prima
l'overfitting ha avuto la possibilità di insinuarsi. Un approccio correlato al calcolo
le previsioni considerano un punto dati alla volta, con il modello ottimizzato
tenere conto di ogni nuovo punto prima che vengano aggiunti altri punti; anche lì il
la complessità del modello aumenta gradualmente, quindi è possibile interrompere il processo a breve
aiuta a evitare che si adatti eccessivamente.
Questo tipo di configurazione, dove più tempo significa più complessità, caratterizza
molti sforzi umani. Darti più tempo per decidere qualcosa

Pagina 184

non significa necessariamente che prenderai una decisione migliore. Ma lo fa


garantisci che finirai per considerare più fattori, più ipotetici, di più
pro e contro, e quindi rischi di overfitting.
Tom ha avuto esattamente questa esperienza quando è diventato professore. Il suo primo
semestre, insegnando la sua prima classe in assoluto, ha trascorso un'enorme quantità di tempo a perfezionare
le sue lezioni: più di dieci ore di preparazione per ogni ora di lezione. Il suo
secondo semestre, insegnando in una classe diversa, non era in grado di mettere tanto
tempo, e preoccupato che sarebbe stato un disastro. Ma è successa una cosa strana: il
agli studenti piaceva la seconda classe. In effetti, gli è piaciuto più del primo.
Quelle ore in più, si è scoperto, erano state spese a definire dettagli essenziali
questo ha solo confuso gli studenti e ha finito per essere tagliato dalle lezioni del
la prossima volta che Tom ha insegnato alla classe. Il problema di fondo, Tom alla fine si rese conto,
era che aveva usato il proprio gusto e il proprio giudizio come una sorta di metrica sostitutiva
per i suoi studenti. Questa metrica proxy ha funzionato abbastanza bene come
approssimazione, ma non valeva la pena di adattarlo eccessivamente, il che spiegava perché spendere
ore extra per “perfezionare” faticosamente tutte le diapositive erano state controproducenti.
L'efficacia della regolarizzazione in tutti i tipi di attività di apprendimento automatico
suggerisce che possiamo prendere decisioni migliori pensando e agendo deliberatamente
Di meno. Se i fattori da noi individuati per primi sono probabilmente i più importanti,
poi oltre un certo punto pensare di più a un problema non significa solo
è uno spreco di tempo e fatica: ci porterà a soluzioni peggiori. Arresto anticipato
fornisce le basi per un argomento ragionato contro il ragionamento, il pensiero
caso della persona contro il pensiero. Ma trasformare questo in un consiglio pratico richiede
rispondendo a un'altra domanda: quando dovremmo smettere di pensare?

Quando pensare di meno


Come per tutte le questioni che riguardano l'overfitting, quanto presto fermarsi dipende dal divario
tra ciò che puoi misurare e ciò che conta davvero. Se hai tutti i fatti,
sono privi di ogni errore e incertezza e puoi valutare direttamente qualunque cosa sia
importante per te, quindi non fermarti presto. Pensa a lungo e intensamente: la complessità e
lo sforzo è appropriato.
Ma non è quasi mai così. Se hai un'incertezza elevata e limitata
Pagina 185

dati, quindi interrompi presto con tutti i mezzi. Se non hai una lettura chiara di come il tuo
il lavoro verrà valutato, e da chi, allora non vale la pena dedicare tempo extra
è perfetto rispetto alla tua (o a quella di chiunque altro) idiosincratica indovinare cosa
la perfezione potrebbe essere. Maggiore è l'incertezza, maggiore è il divario tra
ciò che puoi misurare e ciò che conta, più dovresti stare attento
overfitting - cioè, più dovresti preferire la semplicità, e prima tu
dovrebbe fermarsi.
Quando sei veramente all'oscuro, i piani migliori saranno i più semplici. quando
le nostre aspettative sono incerte e i dati sono rumorosi, la cosa migliore è dipingere
un pennello ampio, per pensare a grandi linee. A volte letteralmente. Come imprenditori
Jason Fried e David Heinemeier Hansson spiegano, più avanti hanno bisogno
per fare brainstorming, più spessa è la penna che usano, una forma intelligente di semplificazione di
dimensione del tratto:

Quando iniziamo a progettare qualcosa, abbozziamo le idee con un pennarello grande e spesso, invece di
una penna a sfera. Perché? I punti della penna sono troppo sottili. Sono ad alta risoluzione. Ti incoraggiano a farlo
preoccuparti di cose di cui non dovresti ancora preoccuparti, come perfezionare l'ombreggiatura o se utilizzare un file
linea tratteggiata o tratteggiata. Finisci per concentrarti su cose che dovrebbero essere ancora sfocate.
Uno Sharpie rende impossibile eseguire il drill-down così in profondità. Puoi disegnare solo forme, linee e
scatole. Quello è buono. Il quadro generale è tutto ciò di cui dovresti preoccuparti all'inizio.

Come afferma Henry Mintzberg di McGill, “Cosa succederebbe se partissimo


la premessa che non possiamo misurare ciò che conta e partire da lì? Allora invece
di misurazione dovremmo usare qualcosa di molto spaventoso: si chiama giudizio. "
Il risultato dell'arresto anticipato è che a volte non è questione di scelta
tra l'essere razionali e seguire il nostro primo istinto. Andando con il nostro primo
l'istinto può essere la soluzione razionale. Il più complesso, instabile e incerto
la decisione, più razionale è l'approccio.
Per tornare a Darwin, il suo problema di decidere se proporre potrebbe
probabilmente sono stati risolti in base solo ai primi pro e contro di lui
identificati, con quelli successivi che si aggiungono al tempo e all'ansia spesi
la decisione senza necessariamente favorire la sua risoluzione (e con ogni probabilità
impedirlo). Ciò che sembrava prendere una decisione era il pensiero che “lo è
intollerabile pensare di trascorrere tutta la vita come un'ape neutra, lavorando,
funzionante e niente dopotutto. " Figli e compagnia: i primi

Pagina 186

i punti che ha menzionato - erano proprio quelli che alla fine lo hanno convinto a favore
del matrimonio. Il budget del suo libro era una distrazione.
Prima di diventare troppo critici nei confronti di Darwin, tuttavia, dipingendolo come un incallito
pensatore, vale la pena dare una seconda occhiata a questa pagina dal suo diario. Vedendolo
in facsimile mostra qualcosa di affascinante. Darwin non era Franklin, aggiungendo
considerazioni assortite per giorni. Nonostante la serietà con cui lui
si avvicinò a questa scelta che cambia la vita, Darwin decise esattamente quando
i suoi appunti arrivavano in fondo al foglio del diario. Si stava regolarizzando alla pagina.
Questo ricorda sia l'arresto anticipato che il lasso: tutto ciò che non lo fa
rendere la pagina non prende la decisione.
Decisa a sposarsi, Darwin passò immediatamente a pensare troppo al
tempismo. "Quando? Presto o tardi ", ha scritto sopra un altro elenco di pro e contro,
considerando tutto, dalla felicità alle spese al "disagio" al suo
desiderio di lunga data di viaggiare in mongolfiera e / o in Galles. Ma alla fine
della pagina ha deciso di "Non importa, affidati al caso" e il risultato, dentro
diversi mesi, è stata una proposta a Emma Wedgwood, l'inizio di un
collaborazione appagante e una vita familiare felice.

Pagina 187

8 Rilassamento
Lascialo scorrere

Nel 2010 Meghan Bellows stava lavorando al suo dottorato in ingegneria chimica presso
Princeton di giorno e pianificando il suo matrimonio di notte. La sua ricerca ruotava
per trovare i posti giusti in cui inserire gli amminoacidi in una catena proteica per produrre a
molecola con caratteristiche particolari. ("Se massimizzi l'energia di legame di
due proteine ​quindi puoi progettare con successo un inibitore peptidico di alcune
funzione biologica in modo da poter effettivamente inibire il progresso di una malattia. ") Sul
fronte nuziale, era bloccata sul problema della seduta.
C'era un gruppo di nove amici del college e Bellows si tormentava su chi
altro da buttare nel mezzo di una simile mini-riunione per fare un tavolo da dieci. Anche
peggio, aveva contato undici parenti stretti. Chi otterrebbe l'avvio dal file
la tavola dei genitori onorati, e come poteva spiegargliela? E che mi dici di
persone come i suoi vicini d'infanzia e la babysitter, o il lavoro dei suoi genitori
colleghi, che non conoscevano davvero nessuno al matrimonio?
Il problema sembrava difficile quanto il problema proteico che era lei
lavorando in laboratorio. Poi l'ha colpita. E ' stato il problema su cui stava lavorando a
il laboratorio. Una sera, mentre fissava i suoi posti a sedere, “me ne sono accorto
era letteralmente una correlazione uno a uno tra gli amminoacidi e le proteine ​in
la mia tesi di dottorato e le persone sedute ai tavoli al mio matrimonio. " Bellows gridò
il suo fidanzato per un pezzo di carta e iniziò a scarabocchiare equazioni. Aminoacidi
sono diventati ospiti, le energie di legame sono diventate relazioni, e le molecole
chiamato Il vicino più prossimo interazioni divenne, beh, il vicino più prossimo
interazioni. Potrebbe usare gli algoritmi della sua ricerca per risolvere la sua
nozze.

Pagina 188

I soffietti hanno escogitato un modo per definire numericamente la forza del


rapporti tra tutti gli ospiti. Se una particolare coppia di persone non ne conosceva una
un altro hanno ottenuto uno 0, se lo hanno ottenuto hanno ottenuto un 1 e se erano una coppia hanno ottenuto un
50. (La sorella della sposa ha dovuto dare un punteggio di 10 a tutte le persone che voleva
con cui sedersi, come una prerogativa speciale.) Bellows ha quindi specificato alcuni vincoli:
la capacità massima del tavolo e un punteggio minimo necessario per ogni tavolo, quindi
che nessun tavolo diventasse il goffo gruppo “miscellaneo” pieno di estranei.
Ha anche codificato l'obiettivo del programma: massimizzare i punteggi di relazione
tra gli ospiti e i loro commensali.
C'erano 107 persone al matrimonio e 11 tavoli, che potevano
ospitare dieci persone ciascuno. Ciò significa che c'erano circa 11 107 possibili
planimetrie: questo è un numero di 112 cifre, più di 200 miliardi di googols, una cifra
che fa impallidire il numero di atomi (solo 80 cifre) nell'universo osservabile.
La Bellows ha presentato il lavoro al suo computer di laboratorio sabato sera e l'ha lasciato
zangola. Quando è arrivata lunedì mattina, era ancora in funzione; ce l'aveva
sputa fuori il miglior incarico che aveva trovato fino a quel momento e rimettilo sulle proteine
design.
Anche con un cluster di computer da laboratorio ad alta potenza e trentasei ore complete di
tempo di elaborazione, non c'era modo per il programma di valutare più di un minuscolo
frazione della potenziale disposizione dei posti a sedere. Le probabilità sono che sia davvero ottimale
la soluzione, quella che avrebbe ottenuto il punteggio più alto, non è mai venuta fuori
nelle sue permutazioni. Tuttavia, Bellows era soddisfatto dei risultati del computer. “It
identificato relazioni di cui ci stavamo dimenticando ", dice, offrendo
possibilità deliziose e non convenzionali che i pianificatori umani non avevano nemmeno
considerato. Ad esempio, proponeva di rimuovere i suoi genitori dalla famiglia
tavolo, mettendoli invece con vecchi amici che non vedevano da anni. La sua finale
la raccomandazione era un accordo che tutte le parti concordavano fosse un successo, sebbene
la madre della sposa non ha resistito a fare solo qualche ritocco manuale.
Il fatto che tutta la potenza di calcolo di un laboratorio a Princeton non sia riuscita a trovare il file
la perfetta disposizione dei posti a sedere potrebbe sembrare sorprendente. Nella maggior parte dei domini che abbiamo
discussi finora, algoritmi semplici potrebbero garantire soluzioni ottimali.
Ma come hanno scoperto gli informatici negli ultimi decenni, ci sono
intere classi di problemi in cui una soluzione perfetta è essenzialmente irraggiungibile, no
importa quanto velocemente produciamo i nostri computer o quanto li programmiamo in modo intelligente. Nel

Pagina 189
Nessuno capisce infatti come un informatico che di fronte a
sfida apparentemente ingestibile, non dovresti né faticare per sempre né arrenderti,
ma, come vedremo, prova interamente una terza cosa.

La difficoltà di ottimizzazione
Prima di guidare il paese attraverso la guerra civile americana, prima di redigere il
Proclama di emancipazione o consegna del discorso di Gettysburg, Abraham
Lincoln ha lavorato come "avvocato della prateria" a Springfield, Illinois, viaggiando per l'Ottavo
Circuito giudiziario due volte l'anno per sedici anni. Essere un avvocato di circoscrizione significava
letteralmente facendo un giro, spostandosi attraverso le città di quattordici contee diverse
per provare casi, percorrendo centinaia di miglia per molte settimane. Pianificazione di questi circuiti
ha sollevato una sfida naturale: come visitare tutte le città necessarie coprendo come
poche miglia possibile e senza andare due volte in nessuna città.
Questo è un esempio di ciò che è noto a matematici e computer
scienziati come problema di "ottimizzazione vincolata": come trovare il migliore
disposizione di un insieme di variabili, date regole particolari e un punteggio
misurare. In effetti, è il problema di ottimizzazione più famoso di tutti. Se lo avesse fatto
stato studiato nel diciannovesimo secolo potrebbe essere diventato noto per sempre come
"Il problema dell'avvocato della prateria", e se fosse emerso per la prima volta nel ventunesimo
secolo potrebbe essere stato soprannominato "il problema del drone di consegna". Ma come il
problema segretario, è emerso a metà del XX secolo, un periodo
inconfondibilmente evocato dal suo nome canonico: "il problema del venditore ambulante".
Il problema della pianificazione del percorso non ha attirato l'attenzione della matematica
comunità fino agli anni '30, ma poi lo fece con una vendetta. Matematico
Karl Menger parlò del "problema del corriere postale" nel 1930, osservando che no
Si conosceva una soluzione più semplice che provare a turno ogni possibilità.
Hassler Whitney pose il problema in un discorso del 1934 a Princeton, dove si tenne
saldamente nel cervello del collega matematico Merrill Flood (che, potresti ricordare
dal capitolo 1, è attribuito anche il merito di aver fatto circolare la prima soluzione al segretario
problema). Quando Flood si trasferì in California negli anni '40, lo diffuse a sua volta
i suoi colleghi del RAND Institute e prima il nome iconico del problema
apparve in stampa in un articolo del 1949 dal matematico Julia Robinson. Come la

Pagina 190

problema ha attraversato i circoli matematici, è cresciuto in notorietà. Molti dei file


le più grandi menti dell'epoca ne erano ossessionate e nessuno sembrava in grado di renderlo reale
progresso.
Nel problema del venditore ambulante, la domanda non è se un computer (o
un matematico) potrebbe trovare la via più breve: in teoria, si può semplicemente
fai un elenco di tutte le possibilità e misurale ciascuna. Piuttosto, il problema è
che man mano che cresce il numero delle città, l'elenco delle possibili direttrici che le collegano
esplode. Un percorso è solo un ordinamento delle città, quindi provali tutti da bruto
forza è il temuto O ( n !) "tempo fattoriale", l'equivalente computazionale di
ordinare un mazzo di carte lanciandole in aria finché non atterrano
ordine.
La domanda è: c'è qualche speranza di fare meglio?
Decenni di lavoro hanno fatto poco per domare il problema del venditore ambulante. Flood, per
esempio, scrisse nel 1956, più di vent'anni dopo averlo incontrato per la prima volta: “It
sembra molto probabile che possa essere un approccio abbastanza diverso da qualsiasi altro ancora utilizzato
necessario per un
sarebbe anche trattare congenerale
metodo successoper
il problema. In effetti, epotrebbe
trattare il problema risultati benissimo
impossibiliesserci no
prezioso." Un altro decennio dopo, l'atmosfera era solo più cupa. "Suppongo",
ha scritto Jack Edmonds, “che non esiste un buon algoritmo per il venditore ambulante
problema."
Queste parole si sarebbero rivelate profetiche.

Definizione della difficoltà


A metà degli anni '60, Edmonds, presso il National Institute of Standards e
La tecnologia, insieme ad Alan Cobham di IBM, ha sviluppato una definizione di lavoro
per ciò che rende un problema fattibile da risolvere o meno. Hanno affermato che cosa è adesso
nota come tesi di Cobham-Edmonds: un algoritmo dovrebbe essere considerato
"Efficiente" se viene eseguito in quello che viene chiamato "tempo polinomiale", ovvero O ( n 2 ), O ( n 3 ) o
infatti n alla potenza di qualsiasi numero. Un problema, a sua volta, viene considerato
"Trattabile" se sappiamo come risolverlo utilizzando un algoritmo efficiente. Un problema
noi non sappiamo come risolvere in tempo polinomiale, d'altra parte, è considerato
"intrattabile." E a tutto tranne che alle scale più piccole, i problemi intrattabili sono

Pagina 191

oltre la portata della soluzione da parte dei computer, non importa quanto potente. *
Ciò equivale a ciò che è probabilmente l'intuizione centrale dell'informatica. Suo
possibile quantificare la difficoltà di un problema. E alcuni problemi sono solo ...
duro .
Dove finisce il problema del venditore ambulante? Curiosamente, noi
non sono ancora del tutto sicuro. Nel 1972, Richard Karp di Berkeley dimostrò che il
Il problema del venditore ambulante è legato a una classe controversa borderline di
problemi che non si sono ancora dimostrati definitivamente efficaci
risolvibile o no. Ma finora non sono state trovate soluzioni efficienti per nessuno di
quei problemi, rendendoli effettivamente intrattabili, e la maggior parte dei computer
gli scienziati ritengono che non ce ne siano da trovare. Quindi il "risultato dell'impossibilità"
per il problema del venditore ambulante immaginato da Flood negli anni Cinquanta
essere il suo destino finale. Inoltre, molti altri problemi di ottimizzazione con
implicazioni per tutto, dalla strategia politica alla salute pubblica alla sicurezza antincendio
—Sono altrettanto intrattabili.
Ma per gli scienziati informatici che lottano con tali problemi, questo verdetto
non è la fine della storia. Invece, è più come una chiamata alle armi. Avere
determinato che un problema è intrattabile, non puoi semplicemente alzare le mani. Come
L'esperto di programmazione Jan Karel Lenstra ci ha detto: “Quando il problema è difficile, è
non significa che puoi dimenticartene, significa che è solo in un diverso
stato. È un nemico serio, ma devi ancora combatterlo. " Ed è qui che il file
field ha scoperto qualcosa di inestimabile, qualcosa da cui tutti possiamo imparare: come
problemi di migliore approccio le cui risposte ottimali sono fuori portata. Come rilassarsi.

Semplicemente rilassati
Il perfetto è il nemico del bene.

—VOLTAIRE
Quando qualcuno ti dice di rilassarti, probabilmente è perché sei teso -
fare una quantità maggiore di cose di quanto dovresti. Quando gli informatici sono attivi
contro una sfida formidabile, anche le loro menti si rilassano, mentre passano

Pagina 192

intorno a libri come Introduzione ai metodi di rilassamento o Rilassamento discreto


Tecniche . Ma non si rilassano; rilassano il problema.
Una delle forme più semplici di rilassamento in informatica è nota come
Vincolo Rilassamento . In questa tecnica, i ricercatori rimuovono alcuni dei file
vincoli del problema e si accingono a risolvere il problema che desiderano avere.
Quindi, dopo aver fatto un certo progresso, provano ad aggiungere il file
vincoli. Cioè, rendono il problema temporaneamente più facile da gestire
prima di riportarlo alla realtà.
Ad esempio, puoi rilassare il problema del venditore ambulante lasciando che il file
venditore visita la stessa città più di una volta, lasciandolo tornare sui suoi passi
gratuito. Trovare il percorso più breve secondo queste regole più sciolte produce ciò che è
chiamato "albero di copertura minimo". (Se preferisci, puoi anche pensare al file
albero di copertura minimo come il minor numero di miglia di strada necessarie per collegare ogni
città ad almeno un'altra città. Il percorso del venditore ambulante più breve e il
lo spanning tree minimo per il circuito giudiziario di Lincoln sono mostrati di seguito)
si scopre che risolvere questo problema più flessibile non richiede tempo al computer.
E mentre lo spanning tree minimo non porta necessariamente direttamente al file
soluzione del vero problema, è comunque abbastanza utile. Per prima cosa, il
spanning tree, con il suo backtracking gratuito, non sarà mai più lungo del reale
soluzione, che deve seguire tutte le regole. Pertanto, possiamo usare il rilassato
problema - la fantasia - come limite inferiore alla realtà. Se calcoliamo che il file
La distanza tra gli alberi per un particolare insieme di città è di 100 miglia, possiamo esserne sicuri
la distanza del venditore ambulante non sarà inferiore a quella. E se troviamo, diciamo, a
Percorso di 110 miglia, possiamo essere certi che è al massimo il 10% più lungo della soluzione migliore.
In questo modo possiamo avere un'idea di quanto siamo vicini alla risposta reale anche senza
sapendo di cosa si tratta.

Pagina 193
Figura 8.1 Il percorso del venditore ambulante più breve (in alto) e l'albero di copertura minimo (in basso) per Lincoln's
Circuito giudiziario del 1855.

Ancora meglio, nel problema del venditore ambulante risulta che il minimo
spanning tree è in realtà uno dei migliori punti di partenza da cui iniziare a
cerca la vera soluzione. Approcci come questi hanno consentito anche uno dei
i maggiori problemi immaginabili con i venditori ambulanti: trovare il percorso più breve
visita ogni singola città sulla Terra, da risolvere con meno dello 0,05% del
soluzione ottima (sconosciuta).
Sebbene la maggior parte di noi non abbia incontrato la versione algoritmica formale di
Vincolo Rilassamento, il suo messaggio di base è familiare a quasi chiunque lo sia

Pagina 194

sognato in grande sulle domande della vita. Cosa faresti se non avessi paura?
legge un mantra che potresti aver visto nell'ufficio di un consulente di orientamento o ascoltato
un seminario motivazionale. Cosa faresti se non potessi fallire? Allo stesso modo,
quando si considerano questioni di professione o carriera, poniamo domande come Cosa
faresti se vincessi alla lotteria? oppure, prendendo una strada diversa, cosa vorresti
fare se tutti i lavori pagassero lo stesso? L'idea alla base di tali esercizi di pensiero è esattamente
quello del Constraint Relaxation: rendere trattabile l'intrattabile, fare progressi
in un mondo idealizzato che può essere riportato a quello reale. Se non puoi risolvere
il problema di fronte a te, risolverne una versione più semplice e poi vedere se è così
soluzione ti offre un punto di partenza, o un faro, nel problema in piena regola.
Forse lo fa.
Quello che il relax non può fare è offrirti una scorciatoia garantita per il perfetto
risposta. Ma l'informatica può anche quantificare il compromesso di questo rilassamento
offre tra tempo e qualità della soluzione. In molti casi, il rapporto è drammatico, a
un gioco da ragazzi, per esempio, una risposta almeno la metà della soluzione perfetta
in un quadrilionesimo del tempo. Il messaggio è semplice ma profondo: se lo siamo
disposto ad accettare soluzioni abbastanza vicine, quindi anche alcune delle più pelose
i problemi intorno possono essere risolti con le giuste tecniche.
Rimozione temporanea dei vincoli, come nello spanning tree minimo e nel file
"E se vincessi alla lotteria?" esempi, è la forma più semplice di
rilassamento algoritmico. Ma ci sono anche altri due tipi di rilassamento più sottili
che si presentano ripetutamente nella ricerca sull'ottimizzazione. Si sono dimostrati strumentali
nel risolvere alcuni dei problemi intrattabili più importanti del settore, con direct
implicazioni del mondo reale per qualsiasi cosa, dalla pianificazione urbana al controllo delle malattie
la coltivazione di rivalità atletiche.

Innumerevoli sfumature di grigio: continuo


Rilassamento
Il problema del venditore ambulante, come la ricerca del meglio da parte di Meghan Bellows
disposizione dei posti a sedere, è un particolare tipo di problema di ottimizzazione noto come
"Ottimizzazione discreta", ovvero, non esiste un continuum regolare tra di loro
soluzioni. Il venditore va o in questa città o in quella; o sei a

Pagina 195

tavolo cinque o sei. Non ci sono sfumature di grigio in mezzo.


Tali problemi di ottimizzazione discreti sono tutti intorno a noi. Nelle città, ad esempio,
i progettisti cercano di posizionare i camion dei pompieri in modo che ogni casa possa essere raggiunta entro un fisso
quantità di tempo, diciamo cinque minuti. Matematicamente, ogni camion dei pompieri "copre"
qualunque casa può essere raggiunta entro cinque minuti dalla sua posizione. Il
la sfida è trovare l'insieme minimo di posizioni in modo che tutte le case siano coperte.
“L'intera professione [vigili del fuoco e emergenza] ha appena adottato questa copertura
modello, ed è fantastico ", dice Laura Albert dell'Università del Wisconsin-Madison
McLay. "È una cosa bella e chiara che possiamo modellare." Ma dal momento che anche un camion dei pompieri
esiste in una posizione o no, il calcolo di quell'insieme minimo implica discreto
ottimizzazione. E come osserva McLay, “è lì che diventano molti problemi
computazionalmente difficile, quando non puoi fare la metà di questo e metà di quello. "
La sfida dell'ottimizzazione discreta si manifesta anche nei contesti sociali.
Immagina di voler organizzare una festa per tutti i tuoi amici e conoscenti, ma
non voleva pagare tutte le buste e i francobolli che tanti inviti
comporterebbe. Potresti invece decidere di inviare inviti per posta ad alcuni ben-
amici connessi e dì loro di "portare tutti quelli che conosciamo". Cosa avresti
idealmente vuoi trovare, quindi, è il più piccolo sottogruppo dei tuoi amici che sa tutto
il resto della tua cerchia sociale, che ti permetterebbe di leccare il minor numero di buste e
convincere comunque tutti a partecipare. Certo, questo potrebbe sembrare un sacco di lavoro solo per
risparmiare qualche soldo sui francobolli, ma è esattamente il tipo di problema politico
i responsabili delle campagne e gli operatori di marketing aziendali vogliono risolvere per diffondere il loro
messaggio più efficace. Ed è anche il problema che studiano gli epidemiologi
nel pensare, diciamo, al numero minimo di persone in una popolazione - e
quali persone: vaccinare per proteggere una società dalle malattie trasmissibili.
Come abbiamo notato, l'impegno di ottimizzazione discreta per i numeri interi: un incendio
reparto può avere un motore nel garage, o due, o tre, ma non due e un
mezzi camion dei pompieri, o π di loro, è ciò che rende tali problemi di ottimizzazione discreta
difficile da risolvere. In effetti, sia il problema del camion dei pompieri che l'invito alla festa
problema sono intrattabili: non esiste una soluzione generale efficiente per loro. Ma, come è
si scopre che esistono una serie di strategie efficienti per risolvere il problema
versioni continue di questi problemi, dove qualsiasi frazione o decimale è un
possibile soluzione. I ricercatori hanno dovuto affrontare un discreto problema di ottimizzazione
potrebbero guardare con invidia a quelle strategie, ma possono anche fare di più.
Pagina 196

Possono provare a rilassare il loro problema discreto in uno continuo e vedere cosa
accade.
Nel caso del problema dell'invito, rilassarlo da discreto a continuo
ottimizzazione significa che una soluzione può dirci di inviare a qualcuno un quarto di
invito e qualcun altro due terzi di uno. Che cosa vuol dire, anche? It
ovviamente non può essere la risposta alla domanda originale, ma, come il minimo
spanning tree, ci dà un punto di partenza. Con la soluzione rilassata in mano,
possiamo decidere come tradurre quelle frazioni di nuovo in realtà. Potremmo, per
Ad esempio, scegli di arrotondarli semplicemente se necessario, inviando inviti a
tutti coloro che hanno ricevuto "mezzo invito" o più nello scenario rilassato. Potremmo
interpretare queste frazioni anche come probabilità, ad esempio lanciare una moneta per
ogni luogo in cui la soluzione rilassata ci dice di mettere mezzo camion dei pompieri, e
effettivamente mettendo un camion lì solo se cade testa. In entrambi i casi, con questi
le frazioni tornate a numeri interi, avremo una soluzione che abbia senso
nel contesto del nostro problema originale e discreto.
Il passo finale, come per qualsiasi relax, è chiedere quanto è buona questa soluzione
rispetto alla migliore soluzione effettiva che avremmo potuto trovare
controllando esaurientemente ogni singola possibile risposta al problema originale. It
si scopre che per il problema degli inviti, Rilassamento Continuo con arrotondamento
ci darà una soluzione facilmente calcolabile che non è poi così male: è matematicamente
garantito per portare tutti quelli che vuoi alla festa mentre invii al massimo due volte
tanti inviti quante sono le migliori soluzioni ottenibili con la forza bruta. Allo stesso modo, in
il problema del camion dei pompieri, il rilassamento continuo con probabilità può ottenere rapidamente
noi entro un comodo limite della risposta ottimale.
Il Relax Continuo non è una bacchetta magica: ancora non ce ne dà una
modo efficiente per arrivare alle risposte veramente ottimali, solo alle loro approssimazioni.
Ma consegnare il doppio di invii o vaccinazioni ottimali è ancora lontano
meglio delle alternative non ottimizzate.

Solo un biglietto per eccesso di velocità: rilassamento lagrangiano


Vizzini: Inconcepibile!
Inigo Montoya: Continui a usare quella parola. Non credo che significhi quello che hai

Pagina 197

penso che significhi.


- LA PRINCIPESSA SPOSA

Un giorno, da bambino, Brian si lamentava con sua madre di tutte le cose che aveva
aveva a che fare:. i compiti, le sue faccende ... “Tecnicamente, non si hanno a che fare
qualsiasi cosa », rispose sua madre. “Non devi fare quello che i vostri insegnanti vi dicono.
Non devi fare quello che ti dico. Non hanno nemmeno necessario a rispettare la legge.
Ci sono conseguenze per tutto e puoi decidere se vuoi
per affrontare quelle conseguenze. "
La mente infantile di Brian era sconvolta. Era un messaggio potente, un risveglio di a
senso di agentività, responsabilità, giudizio morale. C'era anche qualcos'altro: a
potente tecnica computazionale chiamata rilassamento lagrangiano . L'idea
dietro la lagrangiana il rilassamento è semplice. Un problema di ottimizzazione ha due parti:
le regole e il punteggio. In Lagrangian Relaxation, prendiamo alcuni dei
vincoli del problema e inserirli invece nel sistema di punteggio. Cioè, noi
prendere l'impossibile e ridimensionarlo a costoso. (In un matrimonio a sedere
ottimizzazione, ad esempio, potremmo allentare il vincolo che le tabelle contengono dieci ciascuna
persone max, consentendo tavoli troppo pieni ma con una sorta di spazio per i gomiti
penalità). Quando i vincoli di un problema di ottimizzazione dicono "Fallo o altrimenti!"
Il rilassamento lagrangiano risponde: "Oppure cosa?" Una volta che possiamo colorare all'esterno del file
linee - anche solo un po ', e anche a un costo elevato - i problemi diventano trattabili
che prima non erano trattabili.
I Rilassamenti Lagrangiani sono una parte enorme della letteratura teorica sul
problema del venditore ambulante e altri problemi difficili in informatica.
Sono anche uno strumento fondamentale per una serie di applicazioni pratiche. Per esempio,
ricorda Michael Trick di Carnegie Mellon, che, come abbiamo accennato nel capitolo 3, è presente
incaricato della programmazione per la Major League Baseball e una serie di NCAA
conferenze. Quello che non avevamo menzionato è come lo fa. La composizione di
il programma di ogni anno è un gigantesco problema di ottimizzazione discreto, troppo complesso
per qualsiasi computer da risolvere con la forza bruta. Quindi ogni anno Trick e i suoi colleghi
allo Sports Scheduling Group si rivolge a Lagrangian Relaxation per ottenere il lavoro
fatto. Ogni volta che accendi la televisione o ti siedi in uno stadio, sappilo
l'incontro di quelle squadre su quel campo quella sera in particolare ... beh, non lo è
necessariamente il matchup ottimale. Ma è vicino. E per questo non abbiamo solo

Pagina 198

Michael Trick ma matematico francese del XVIII secolo Joseph-Louis


Ringraziare Lagrange.
Nel programmare una stagione sportiva, Trick scopre che il Rilassamento Continuo noi
sopra descritto non gli rende necessariamente la vita più facile. “Se finisci con
giochi frazionari, semplicemente non ottieni nulla di utile. " Una cosa è finire
con allocazioni frazionarie di inviti a feste o camion dei pompieri, dove i numeri
può sempre essere arrotondato se necessario. Ma nello sport, i vincoli interi sono attivi
quante squadre giocano una partita, quante partite vengono giocate in somma e come
molte volte ogni squadra gioca contro un'altra squadra - sono semplicemente troppo forti. “E così noi
non posso rilassarmi in quella direzione. Dobbiamo davvero mantenere il fondamentale
[discreta] parte del modello. "
Tuttavia, qualcosa deve essere fatto per fare i conti con l'assoluta complessità
del problema. Quindi “dobbiamo lavorare con le leghe per rilassare un po '
vincoli che potrebbero desiderare di avere ", spiega Trick. Il numero di tali
i vincoli che entrano nella pianificazione di una stagione sportiva sono immensi e includono
non solo i requisiti derivanti dalla struttura di base della lega ma anche tutti
tipi di richieste e scrupoli idiosincratici. Alcuni campionati vanno bene con il
seconda metà di stagione speculare alla prima, solo con partite casalinghe e trasferte
invertito; altre leghe non vogliono quella struttura, ma richiedono comunque che no
le squadre si incontrano una seconda volta finché non si sono già incontrate una volta ogni altra squadra.
Alcuni campionati insistono nel far accadere le rivalità più famose in finale
partita della stagione. Alcune squadre non possono giocare partite in casa in determinate date a causa di
eventi conflittuali nelle loro arene. Nel caso del basket NCAA, anche Trick lo ha fatto
considerare ulteriori vincoli provenienti dalle reti televisive che
trasmettere i giochi. I canali televisivi definiscono con un anno di anticipo cosa
anticipare che "giochi A" e "giochi B" siano: i giochi che attireranno il
pubblico più vasto. (Duke vs. UNC è un gioco A perenne, per esempio)
i canali quindi si aspettano una partita A e una partita B ogni settimana, ma mai due A
giochi allo stesso tempo, per evitare di dividere il pubblico.
Non sorprende che, date tutte queste richieste, Trick abbia scoperto che il calcolo di un file
Il programma sportivo diventa spesso possibile solo ammorbidendo alcuni di questi duri
vincoli.

Pagina 199

In genere, quando le persone vengono da noi per la prima volta con un programma sportivo, affermano ... "Non facciamo mai x
e non facciamo mai y .” Poi guardiamo i loro programmi e diciamo: “Beh, due volte hai fatto x e tre
volte hai fatto y l'anno scorso.” Poi “Oh, sì, beh, okay. A parte questo, non lo facciamo mai ". E
poi torniamo all'anno prima ... In genere ci rendiamo conto che ci sono alcune cose che pensano di loro
mai farlo le persone lo fanno. Le persone nel baseball credono che gli Yankees e i Mets non ci siano mai
casa allo stesso tempo. E non è vero. Non è mai stato vero. Sono a casa forse tre partite,
forse sei partite in un anno nello stesso giorno. Ma nella stagione più ampia, ottantuno partite in casa per
ciascuna delle squadre, è relativamente raro, la gente se ne dimentica.

Di tanto in tanto ci vuole un po 'di finezza diplomatica, ma un rilassamento lagrangiano


—Dove alcune impossibilità vengono ridotte a sanzioni, l'inconcepibile a
l'indesiderabile: consente di compiere progressi. Come dice Trick, piuttosto che
passare eoni alla ricerca di una risposta perfetta irraggiungibile, usando la lagrangiana
Il rilassamento gli permette di fare domande come "Quanto puoi avvicinarti?" Vicino
abbastanza, si scopre, per rendere felici tutti: la lega, le scuole, il
reti - e per alimentare le fiamme della March Madness, anno dopo anno.

Imparare a rilassarsi
Dei vari modi in cui le domande computazionali si presentano a noi,
i problemi di ottimizzazione - una parte obiettivi, una parte regole - sono probabilmente i più importanti
Comune. E problemi di ottimizzazione discreti , in cui le nostre opzioni sono nette
o / o le scelte, senza via di mezzo, sono le più tipiche di queste. Qui,
l'informatica trasmette un verdetto scoraggiante. Molti discreti
i problemi di ottimizzazione sono veramente difficili. Le menti più brillanti del campo sono emerse
vuoto in ogni tentativo di trovare un percorso facile per risposte perfette, e infatti lo sono
sempre più dedito a dimostrare che tali percorsi non esistono che a
cercandoli.
Se non altro, questo dovrebbe offrirci un po 'di consolazione. Se siamo di fronte a un file
problema che sembra nodoso, spinoso, invalicabile ... beh, potremmo avere ragione. E
avere un computer non aiuta necessariamente.
Almeno, a meno che non possiamo imparare a rilassarci.
Ci sono molti modi per alleviare un problema e ne abbiamo visti tre di più
importante. Il primo, Constraint Relaxation, rimuove semplicemente alcuni vincoli
del tutto e fa progressi su una forma più libera del problema prima di venire

Pagina 200

torna alla realtà. Il secondo, Rilassamento Continuo, diventa discreto o binario


scelte in continua: prima di decidere tra tè freddo e limonata
immagina una miscela "Arnold Palmer" 50–50 e poi arrotondala per eccesso o per difetto. Il terzo,
Il rilassamento lagrangiano, trasforma l'impossibilità in mere pene, insegnando l'arte
di piegare le regole (o infrangerle e accettarne le conseguenze). Una pietra
la band che decide quali canzoni inserire in un set limitato, per esempio, si trova di fronte
quello che gli informatici chiamano il "problema dello zaino": un rompicapo che chiede di farlo
decidere quale di un insieme di articoli di diversa massa e importanza imballare in un file
volume limitato. Nella sua formulazione rigorosa il problema dello zaino è famoso
intrattabile, ma questo non deve scoraggiare le nostre rilassate rock star. Come dimostrato
in molti celebri esempi, a volte è meglio giocare semplicemente un po 'oltre il
coprifuoco cittadino e incorrere nelle relative multe oltre a limitare lo spettacolo alla fascia oraria disponibile.
In effetti, anche quando non commetti l'infrazione, semplicemente immaginando che possa esserlo
illuminante.
L'editorialista britannico conservatore Christopher Booker afferma che “quando noi
intraprendere una linea di condotta che è inconsciamente guidata da un pio desiderio,
tutto può sembrare andare bene per un po 'di tempo ", ma questo perché" questa finzione può
non essere mai riconciliato con la realtà ”, porterà inevitabilmente a ciò che descrive come un
ripartizione in più fasi: "sogno", "frustrazione", "incubo", "esplosione".
L'informatica dipinge una visione drammaticamente più rosea. Poi di nuovo, come file
tecnica di ottimizzazione, il rilassamento consiste nell'essere consapevolmente guidati da
Pensiero speranzoso. Forse è in parte ciò che fa la differenza.
Il relax ci offre una serie di vantaggi. Per uno, offrono un limite
la qualità della vera soluzione. Se stiamo cercando di mettere in valigia il nostro calendario, immaginando
che possiamo teletrasportarci magicamente attraverso la città lo renderà immediatamente chiaro
otto riunioni di un'ora è il massimo che potremmo aspettarci di inserire in una giornata;
un tale limite potrebbe essere utile per stabilire le aspettative prima di affrontare il pieno
problema. In secondo luogo, i rilassamenti sono progettati in modo che possano essere effettivamente conciliati
con la realtà, e questo ci dà limiti alla soluzione dall'altra direzione.
Quando il rilassamento continuo ci dice di somministrare vaccini frazionati, possiamo semplicemente
immunizzare chiunque sia assegnato a ricevere mezzo vaccino o più e finire con
una soluzione facilmente calcolabile che richiede nel peggiore dei casi il doppio delle vaccinazioni rispetto a
in un mondo perfetto. Forse possiamo conviverci.
A meno che non siamo disposti a passare eoni alla ricerca della perfezione ogni volta che lo facciamo

Pagina 201

incontriamo un intoppo, problemi difficili richiedono che invece di far girare le nostre gomme noi
immagina versioni più semplici e affrontale per prime. Se applicato correttamente, non lo è
solo un pio desiderio, non fantasia o oziosi sogni ad occhi aperti. È uno dei nostri modi migliori
di fare progressi.
Pagina 202

9 Casualità
Quando lasciarlo al caso

Devo ammettere che dopo molti anni di lavoro in questo settore, l'efficacia di
la casualità per così tanti problemi algoritmici è assolutamente misteriosa
me. È efficiente, funziona; ma perché e come è assolutamente misterioso.

—MICHAEL RABIN
La casualità sembra l'opposto della ragione: una forma di rinuncia a un
problema, l'ultima risorsa. Lontano da esso. Il ruolo sorprendente e sempre più importante
della casualità nell'informatica ci mostra che fare uso del caso può essere un
parte deliberata ed efficace nell'affrontare i problemi più difficili. Infatti,
ci sono momenti in cui nient'altro andrà bene.
In contrasto con gli algoritmi "deterministici" standard che tipicamente immaginiamo
computer che utilizzano, in cui un passaggio segue un altro esattamente allo stesso modo
ogni volta, un algoritmo randomizzato utilizza numeri generati casualmente per risolvere a
problema. Recenti lavori nel campo dell'informatica hanno dimostrato che ci sono casi in cui
algoritmi randomizzati possono produrre buone risposte approssimative a difficili
domande più velocemente di tutti gli algoritmi deterministici conosciuti. E mentre non lo fanno
garantire sempre le soluzioni ottimali, possono ottenere algoritmi randomizzati
sorprendentemente vicino a loro in una frazione del tempo, semplicemente girando strategicamente un
poche monete mentre i loro cugini deterministici lo sudano.
C'è un messaggio profondo nel fatto che su alcuni problemi, randomizzato
gli approcci possono sovraperformare anche i migliori metodi deterministici. A volte il migliore
la soluzione a un problema è affidarsi al caso piuttosto che cercare di ragionare completamente su un
Pagina 203

risposta.
Ma semplicemente sapere che la casualità può essere utile non è abbastanza buono. tu
bisogno di sapere quando fare affidamento sul caso, in che modo e in che misura. Il
la storia recente dell'informatica fornisce alcune risposte, sebbene la storia
inizia un paio di secoli prima.

Campionamento
Nel 1777, George-Louis Leclerc, conte de Buffon, pubblicò i risultati di un
interessante analisi probabilistica. Se lasciamo cadere un ago su un foglio di carta a righe,
ha chiesto, quanto è probabile che attraversi una delle linee? Il lavoro di Buffon ha dimostrato che se
l'ago è più corto dello spazio tra i blines, la risposta è 2 ⁄ π volte il
la lunghezza dell'ago divisa per la lunghezza dello spazio vuoto. Per Buffon, derivando questo
la formula era sufficiente. Ma nel 1812 Pierre-Simon Laplace, uno degli eroi di
il capitolo 6, ha sottolineato che questo risultato ha un'altra implicazione: si potrebbe stimare
il valore di π semplicemente facendo cadere gli aghi sulla carta.
La proposta di Laplace indicava una profonda verità generale: quando vogliamo
sapere qualcosa su una quantità complessa, possiamo stimarne il valore
campionamento da esso. Questo è esattamente il tipo di calcolo che il suo lavoro su Bayes
La regola ci aiuta a eseguire. Infatti, seguendo il suggerimento di Laplace, diverse persone
hanno eseguito esattamente l'esperimento da lui suggerito, confermando che lo è
possibile, sebbene non particolarmente efficiente, stimare il valore di π in questo
modo pratico. *
Gettare migliaia di aghi su carta a righe rende interessante
passatempo (per alcuni), ma ci è voluto lo sviluppo del computer per realizzarlo
campionamento in un metodo pratico. Prima, quando matematici e fisici
hanno provato a usare la casualità per risolvere i problemi, i loro calcoli dovevano essere
faticosamente elaborato a mano, quindi era difficile generare abbastanza campioni per
produrre risultati accurati. Computer, in particolare il computer sviluppato a Los
Alamos durante la seconda guerra mondiale ha fatto la differenza.
Stanislaw "Stan" Ulam è stato uno dei matematici che hanno contribuito allo sviluppo
la bomba atomica. Cresciuto in Polonia, si è trasferito negli Stati Uniti a
1939, e si è unito al Progetto Manhattan nel 1943. Dopo un breve ritorno al mondo accademico

Pagina 204

era di nuovo a Los Alamos nel 1946, lavorando alla progettazione di termonucleari
Armi. Ma era anche malato: aveva contratto l'encefalite e l'aveva
chirurgia cerebrale d'urgenza. E mentre si riprendeva dalla sua malattia si preoccupava
se avrebbe riacquistato le sue capacità matematiche.
Durante la convalescenza, Ulam ha giocato molte carte, in particolare il solitario (aka
Klondike). Come ogni giocatore di solitario sa, alcuni mescoli del mazzo producono
giochi che non possono essere vinti. Così, mentre suonava Ulam, si chiese un naturale
domanda: qual è la probabilità che un mazzo mescolato produca una vincita
gioco?
In un gioco come il solitario, ragionare nello spazio delle possibilità
diventa quasi istantaneamente travolgente. Capovolgi la prima carta e ci sono cinquanta-
due possibili giochi di cui tenere traccia; capovolgi il secondo e ce ne sono cinquantuno
possibilità per ogni prima carta. Ciò significa che siamo già in migliaia di
possibili giochi prima ancora di iniziare a giocare. F. Scott Fitzgerald ha scritto una volta
che “la prova di un'intelligenza di prim'ordine è la capacità di tenere due idee opposte
in mente allo stesso tempo e mantenere ancora la capacità di funzionare. " Potrebbe essere
vero, ma nessuna intelligenza di prim'ordine, umana o no, può eventualmente contenere il
ottanta unvigintillion possibili ordini di mazzo mescolato in mente e ho qualche speranza di ottenere
funzionamento.
Dopo aver provato alcuni elaborati calcoli combinatori di questo tipo e aver dato
su, Ulam ha adottato un approccio diverso, bello nella sua semplicità: basta suonare il
gioco .

Ho notato che potrebbe essere molto più pratico [provare] ... posare le carte o sperimentare
il processo e notando semplicemente quale proporzione esce con successo, piuttosto che provare a calcolare
tutte le possibilità combinatorie che sono un numero esponenzialmente crescente così grande che, tranne
in casi molto elementari, non c'è modo di stimarlo. Questo è intellettualmente sorprendente, e se no
esattamente umiliante, dà una sensazione di modestia sui limiti del razionale o del tradizionale
pensiero. In un problema sufficientemente complicato, il campionamento effettivo è migliore di un esame di tutti
le catene di possibilità.

Quando dice "meglio", nota che non significa necessariamente che il campionamento lo farà
offrirti risposte più precise che analisi esaustive: ci saranno sempre
qualche errore associato a un processo di campionamento, anche se puoi ridurlo
assicurandoti che i tuoi campioni siano davvero casuali e prendendone sempre di più.

Pagina 205

Ciò che intende è che il campionamento è migliore perché ti dà una risposta a tutti, in
casi in cui nient'altro lo farà.
Anche l'intuizione di Ulam - che il campionamento può avere successo laddove l'analisi fallisce - lo era
cruciale per risolvere alcuni dei difficili problemi di fisica nucleare emersi a
Los Alamos. Una reazione nucleare è un processo di ramificazione, dove le possibilità
si moltiplicano selvaggiamente come nelle carte: una particella si divide in due, ciascuna di
che può continuare a colpire gli altri, facendoli dividere a turno, e così via.
Calcolare esattamente le possibilità di un risultato particolare di quel processo, con
molte, molte particelle che interagiscono, è difficile al punto da renderlo impossibile. Ma
simulandolo, con ogni interazione che è come girare una nuova carta, fornisce
un'alternativa.
Ulam ha sviluppato ulteriormente l'idea con John von Neumann e ha lavorato con
Nicholas Metropolis, un altro dei fisici del Progetto Manhattan, in poi
implementando il metodo sul computer di Los Alamos. Metropolis ha chiamato questo
approccio, sostituendo i calcoli di probabilità esaustivi con il campione
simulazioni: il metodo Monte Carlo , dopo il casinò di Monte Carlo in
Monaco, un luogo ugualmente dipendente dai capricci del caso. Il Los Alamos
il team è stato in grado di usarlo per risolvere i problemi chiave della fisica nucleare. Oggi il
Il metodo Monte Carlo è uno dei capisaldi dell'informatica scientifica.
Molti di questi problemi, come il calcolo delle interazioni del subatomico
particelle o le possibilità di vincere al solitario, sono intrinsecamente esse stesse
probabilistico, risolvendoli così attraverso un approccio casuale come Monte Carlo
ha un bel po 'di senso. Ma forse la realizzazione più sorprendente del
potere di casualità è che può essere utilizzato in situazioni in cui apparentemente il caso
non ha alcun ruolo. Anche se vuoi la risposta a una domanda che è rigorosamente sì
o no, vero o falso - nessuna probabilità al riguardo - il lancio di qualche dado può ancora essere
parte della soluzione.
Algoritmi randomizzati
La prima persona a dimostrare le applicazioni sorprendentemente ampie di
la casualità nell'informatica era Michael Rabin. Nato nel 1931 a Breslavia,
Germania (che divenne Wrocław, Polonia, alla fine della seconda guerra mondiale), Rabin

Pagina 206

era il discendente di una lunga stirpe di rabbini. La sua famiglia ha lasciato la Germania per
Palestina nel 1935, e lì fu deviato dal percorso rabbinico di suo padre
si era stabilito per lui dalla bellezza della matematica, scoprendo quella di Alan Turing
lavora all'inizio della sua carriera universitaria presso l'Università Ebraica e
immigrare negli Stati Uniti per iniziare un dottorato di ricerca a Princeton. Rabin avrebbe continuato
vincere il Premio Turing, l'equivalente informatico di un Nobel, per
estendendo l'informatica teorica per accogliere "non deterministico"
casi, in cui una macchina non è costretta a perseguire una singola opzione ma ne ha più
percorsi che potrebbe seguire. In un anno sabbatico nel 1975, Rabin arrivò al MIT, alla ricerca di un file
nuova direzione di ricerca da perseguire.
L'ha trovato in uno dei problemi più antichi di tutti: come identificare prime
numeri.
Gli algoritmi per trovare i numeri primi risalgono almeno all'antichità
Grecia, dove i matematici usavano un approccio diretto noto come
Setaccio di Erastothenes. Il setaccio di Erastothenes funziona come segue: per trovare tutto
i numeri primi minori di n iniziano scrivendo tutti i numeri da 1 a n in
sequenza. Quindi cancella tutti i numeri che sono multipli di 2, oltre a se stesso
(4, 6, 8, 10, 12 e così via). Prendi il numero successivo più piccolo che non è stato
barrato (in questo caso, 3) e barrato tutti i multipli di quel numero (6, 9, 12,
15). Continua così, e i numeri che rimangono alla fine sono i primi.
Per millenni, si è creduto che lo studio dei numeri primi fosse, come GH Hardy
mettiamola, "uno dei rami più ovviamente inutili" della matematica. Ma ciò
barcollò verso la praticità nel ventesimo secolo, diventando fondamentale in
crittografia e sicurezza online. Come accade, è molto più facile moltiplicarsi
numeri primi insieme piuttosto che rimuoverli. Con numeri primi abbastanza grandi, diciamo a
migliaia di cifre: la moltiplicazione può essere eseguita in una frazione di secondo
il factoring potrebbe richiedere letteralmente milioni di anni; questo fa ciò che è noto
come una "funzione unidirezionale". Nella crittografia moderna, ad esempio, i numeri primi segreti
noto solo al mittente e al destinatario si moltiplicano insieme per creare enormi
numeri compositi che possono essere trasmessi pubblicamente senza timori, sin dal factoring
il prodotto richiederebbe troppo tempo a qualsiasi intercettatore perché valga la pena tentare.
Quindi praticamente tutte le comunicazioni in linea sicure, siano esse commerciali, bancarie o
e-mail: inizia con una caccia ai numeri primi.
Questa applicazione crittografica ha improvvisamente creato algoritmi per trovare e

Pagina 207

controllare i numeri primi incredibilmente importante. E mentre il setaccio di Erastothenes lo è


efficace, non è efficiente. Se vuoi controllare se un numero particolare è
primo, noto come testare la sua "primalità", quindi seguendo la strategia del setaccio
richiede di provare a dividerlo per tutti i numeri primi fino alla sua radice quadrata. * Controllo
se un numero a sei cifre è primo richiederebbe la divisione per tutti i 168
numeri primi inferiori a 1.000, non così male. Ma controllando un numero di dodici cifre
implica la divisione per 78.498 numeri primi inferiori a 1 milione e tutta quella divisione
inizia rapidamente a perdere il controllo. I numeri primi usati nella crittografia moderna sono
centinaia di cifre lunghe; dimenticalo.
Al MIT, Rabin ha incontrato Gary Miller, un neolaureato al computer
dipartimento di scienze a Berkeley. Nella sua tesi di dottorato, Miller aveva sviluppato un
algoritmo intrigantemente promettente e molto più veloce per testare la primalità, ma c'è
era un piccolo problema: non sempre funzionava.
Miller aveva trovato un insieme di equazioni (espresse in termini di due numeri, n
e x ) che sono sempre veri se n è primo, indipendentemente dai valori per i quali si collega
x . Se risultano falsi anche per un singolo valore di x , non è possibile che n possa
essere primo: in questi casi, x è chiamato "testimone" contro la primalità. Il problema,
tuttavia, è falso positivo: anche quando n non è primo, le equazioni verranno comunque
fuori vero qualche volta. Questo sembrava lasciare in sospeso l'approccio di Miller.
Rabin si rese conto che questo era un posto dove un passo fuori dal solito
il mondo deterministico dell'informatica potrebbe essere prezioso. Se il numero n è
in realtà non prime, quanti valori possibili di x darebbero un falso positivo
e dichiararlo numero primo? La risposta, ha mostrato Rabin, non è più di una:
trimestre. Quindi per un valore casuale di x , se le equazioni di Miller risultano vere, c'è
solo una possibilità su quattro che n non sia effettivamente primo. E soprattutto, ogni volta
campioniamo una nuova x casuale e le equazioni di Miller controllano, la probabilità che
n sembra solo primo, ma in realtà non lo è, scende di un altro multiplo di quattro. Ripetere
la procedura dieci volte e la probabilità di un falso positivo è di una su quattro a
la decima potenza, meno di una su un milione. Ancora non abbastanza certezza? Dai un'occhiata
altre cinque volte e sei sceso a uno su un miliardo.
Vaughan Pratt, un altro scienziato informatico del MIT, ha implementato Rabin's
algoritmo e ha iniziato a ottenere risultati in una tarda notte d'inverno, mentre Rabin era a
a casa con gli amici per una festa di Hanukkah. Rabin ricorda di aver ricevuto una chiamata
intorno a mezzanotte:

Pagina 208

“Michael, questo è Vaughan. Sto ottenendo il risultato di questi esperimenti. Prendi carta e matita
400
e scrivilo. " E così aveva quel 2 −593 è primo. Indichiamo il prodotto di tutti i numeri primi p
inferiore a 300 per k . I numeri k × 338 + 821 ek × 338 + 823 sono numeri primi gemelli. * Questi
costituivano i più grandi numeri primi gemelli conosciuti all'epoca. I miei capelli si rizzarono. È stato incredibile. Era
semplicemente incredibile.

Il test di primalità di Miller-Rabin, come è ora noto, fornisce un modo per farlo
identificare rapidamente anche numeri primi giganteschi con un grado arbitrario di
certezza.
Qui potremmo porre una domanda filosofica su quale sia il significato di "è"
è. Siamo così abituati a che la matematica sia un regno di certezza a cui è stridente
pensare che un numero potrebbe essere "probabilmente primo" o "quasi sicuramente primo".
Quanto è certo abbastanza certo? In pratica, i moderni sistemi crittografici, il
quelli che crittografano le connessioni Internet e le transazioni digitali, sono sintonizzati per un file
tasso di falsi positivi inferiore a uno su un milione di miliardi di miliardi. In altre parole,
è un decimale che inizia con ventiquattro zeri, meno di un falso primo
per il numero di granelli di sabbia sulla Terra. Questo standard arriva dopo appena quaranta
applicazioni del test di Miller-Rabin. È vero che non sei mai del tutto certo ...
ma puoi avvicinarti terribilmente , tremendamente.
Anche se potresti non aver mai sentito parlare del test Miller-Rabin, il tuo laptop,
tablet e telefono lo sanno bene. Diversi decenni dopo la sua scoperta, è ancora il
metodo standard utilizzato per trovare e controllare i numeri primi in molti domini. Sta funzionando
dietro le quinte ogni volta che utilizzi la tua carta di credito online e quasi in qualsiasi momento
comunicazioni sicure vengono inviate via etere o via cavo.
Per decenni dopo il lavoro di Miller e Rabin, non si sapeva se lì
sarebbe mai un algoritmo efficiente che consente di testare la primalità in
moda deterministica, con assoluta certezza. Nel 2002, uno di questi metodi ha ottenuto
scoperto da Manindra Agrawal, Neeraj Kayal e Nitin Saxena all'Indian
Institute of Technology, ma gli algoritmi randomizzati come Miller-Rabin sono molti
più veloci e quindi sono ancora quelli utilizzati nella pratica oggi.
E per alcuni altri problemi, la casualità fornisce ancora l' unico noto
percorso verso soluzioni efficienti. Un curioso esempio dalla matematica è noto come
"Test di identità polinomiale." Se hai due espressioni polinomiali, come
2 x 3 + 13 x 2 + 22 x + 8 e (2 x + 1) × ( x + 2) × ( x + 4), calcolando se quelli

Pagina 209

le espressioni sono in effetti la stessa funzione, quindi facendo tutte le moltiplicazioni


confrontare i risultati - può richiedere molto tempo, soprattutto perché il
numero di variabili aumenta.
Offerte in questo caso casualità una via d'uscita: solo generano alcuni casuali x s
e collegarli. Se le due espressioni non sono uguali, sarebbe un grande
coincidenza se hanno dato la stessa risposta per alcuni input generati casualmente.
E una coincidenza ancora più grande se hanno dato anche risposte identiche per un secondo
input casuale. E una coincidenza ancora più grande se lo facessero per tre casuali
input in fila. Poiché non esiste un algoritmo deterministico noto per efficientemente
testare l'identità polinomiale, questo metodo randomizzato, con più
osservazioni che danno rapidamente luogo a quasi certezze: è l'unica pratica che noi
avere.

Elogio del campionamento


Il test di identità polinomiale mostra che a volte il nostro impegno è meglio speso
controllo di valori casuali: campionamento dalle due espressioni che vogliamo conoscere
circa ... che cercare di districare i loro meccanismi interni. In una certa misura questo sembra
ragionevolmente intuitivo. Dato un paio di gadget anonimi e ha chiesto se
sono due dispositivi diversi o due copie dello stesso, la maggior parte di noi inizierebbe
premendo pulsanti casuali piuttosto che aprire le custodie per esaminare il cablaggio.
E non siamo particolarmente sorpresi quando, diciamo, un signore della droga della televisione coltiva
apri alcuni bundle a caso per essere ragionevolmente certo della qualità del file
intera spedizione.
Ci sono casi, però, in cui non ci rivolgiamo alla casualità, e forse noi
dovrebbero.
Probabilmente il filosofo politico più importante del ventesimo secolo
era John Rawls di Harvard, che si era posto l'ambizioso compito di riconciliarsi
due idee chiave apparentemente opposte nel suo campo: libertà e uguaglianza . È una società
più “giusto” quando è più libero o più uguale? E i due devono davvero
si escludono a vicenda? Rawls ha offerto un modo per affrontare questa serie di domande
che ha chiamato il "velo dell'ignoranza". Immagina, disse, che stavi per esserlo
nato, ma non sapeva come chi: maschio o femmina, ricco o povero, cittadino o rurale, malato
Pagina 210

o sano. E prima di conoscere il tuo stato, dovevi scegliere di che tipo


società in cui vivresti. Cosa vorresti? Valutando vari social
arrangiamenti da dietro il velo dell'ignoranza, sosteneva Rawls, avremmo fatto di più
giungere prontamente a un consenso su come sarebbe un ideale.
Ciò che l'esperimento mentale di Rawls non prende in considerazione, tuttavia, è il file
costo computazionale di dare un senso a una società da dietro un tale velo. Come
potremmo, in questo ipotetico scenario, sperare di mantenere tutte le informazioni rilevanti
informazioni nelle nostre teste? Metti da parte le grandi questioni di giustizia ed equità per a
momento e cerca di applicare l'approccio di Rawls semplicemente, diciamo, a un cambiamento proposto in
regolamenti sull'assicurazione sanitaria. Prendi la probabilità di nascere, forse, come
qualcuno che cresce per diventare un impiegato comunale nel Midwest; moltiplicalo per
la distribuzione dei diversi piani di assistenza sanitaria a disposizione del governo
dipendenti in vari comuni del Midwest; moltiplicarlo per attuariale
dati che offrono la probabilità, ad esempio, di una tibia fratturata; moltiplicalo per
il conto medico medio per la procedura media per una tibia fratturata a
ospedale del Midwest, data la distribuzione di possibili piani assicurativi ... Va bene,
quindi la proposta di revisione dell'assicurazione sarebbe "buona" o "cattiva" per la nazione? Noi
posso a malapena sperare di valutare un singolo stinco ferito in questo modo, figuriamoci le vite di
centinaia di milioni.
I critici filosofici di Rawls hanno discusso a lungo su come siamo esattamente
dovrebbe sfruttare le informazioni ottenute dal velo dell'ignoranza.
Dovremmo cercare, ad esempio, di massimizzare la felicità media, mediana
felicità, felicità totale o qualcos'altro? Ciascuno di questi approcci,
notoriamente, si lascia aperta a distopie perniciose, come la civiltà di
Omelas immaginato dalla scrittrice Ursula K. Le Guin, in cui prosperità e armonia
abbondano ma un solo bambino è costretto a vivere in una miseria abietta. Questi sono degni
critiche, e Rawls le elude deliberatamente lasciando aperta la questione
cosa fare con le informazioni che otteniamo da dietro il velo. Forse il più grande
la domanda, tuttavia, è come raccogliere queste informazioni in primo luogo.
La risposta potrebbe venire dall'informatica. Scott Aaronson del MIT
dice di essere sorpreso dal fatto che gli informatici non abbiano ancora avuto più influenza su
filosofia. Parte del motivo, sospetta, è solo la loro “ incapacità di comunicare
cosa possono aggiungere all'arsenale concettuale della filosofia ". Elabora:

Pagina 211

Si potrebbe pensare che, una volta che sappiamo che qualcosa è calcolabile , se ci vogliono 10 o 20 secondi
i secondi per calcolare sono ovviamente la preoccupazione degli ingegneri piuttosto che dei filosofi. Ma quello
1010
La conclusione non sarebbe così ovvia, se la domanda fosse una di 10 secondi contro 10 secondi!
E in effetti, nella teoria della complessità, i divari quantitativi a cui teniamo sono di solito così vasti che uno ha
considerarli anche lacune qualitative. Pensa, ad esempio, alla differenza tra la lettura di un file
Libro di 400 pagine e lettura di ogni possibile libro del genere, o tra la scrittura di mille cifre
numero e contando fino a quel numero.

L'informatica ci offre un modo per articolare la complessità della valutazione


tutte le possibili disposizioni sociali per qualcosa come uno stinco ferito. Ma fortunatamente
fornisce ancheMonte
Gli algoritmi strumenti
Carloper affrontare
sono tale complessità.
alcuni degli approcci piùEutili
il campionamento
in quella cassetta degli attrezzi.
Quando abbiamo bisogno di dare un senso, diciamo, alla riforma sanitaria nazionale, una vasta
apparato troppo complesso per essere facilmente compreso - i nostri leader politici tipicamente
ci offrono due cose: aneddoti personali selezionati con cura e sintesi aggregata
statistiche. Gli aneddoti, ovviamente, sono ricchi e vividi, ma lo sono
non rappresentativo. Quasi ogni atto legislativo, non importa quanto illuminato o
fuorviato, lascerà qualcuno meglio e qualcuno peggio, così attentamente
le storie selezionate non offrono alcuna prospettiva su schemi più ampi. Aggregato
le statistiche, invece, sono il contrario: esaurienti ma sottili. Potremmo
imparare, ad esempio, se i premi medi sono diminuiti a livello nazionale, ma non come
il cambiamento funziona a un livello più granulare: potrebbero diminuire per la maggior parte ma,
In stile Omelas, lascia un gruppo specifico: studenti universitari, o Alaska, o
donne incinte - in gravi difficoltà. Una statistica può raccontarci solo una parte della storia,
oscurando qualsiasi eterogeneità sottostante. E spesso non sappiamo nemmeno quale
statistica di cui abbiamo bisogno.
Dal momento che né le statistiche generali né le storie preferite dai politici possono davvero
guidaci attraverso migliaia di pagine di proposte legislative, un Monte Carlo–
un informatico informato proporrebbe un approccio diverso: il campionamento. UN
un attento esame di campioni casuali può essere uno dei mezzi più efficaci di
dare un senso a qualcosa di troppo complesso per essere compreso direttamente. Quando esso
arriva a gestire un problema qualitativamente ingestibile, qualcosa di così spinoso
e complicato che non può essere digerito per intero: solitario o fissione atomica,
test di primalità o politica pubblica: il campionamento offre uno dei più semplici, e anche
i migliori modi per superare le difficoltà.
Possiamo vedere questo approccio all'opera con l'organizzazione di beneficenza GiveDirectly, che

Pagina 212

distribuisce trasferimenti di denaro incondizionati a persone che vivono in condizioni di estrema povertà in
Kenya e Uganda. Ha attirato l'attenzione per aver ripensato la carità convenzionale
pratiche su più livelli: non solo nella sua insolita missione, ma nel livello
di trasparenza e responsabilità che apporta al proprio processo. E l'ultima
elemento dello status quo che è difficile sono le storie di successo.
"Se controlli regolarmente il nostro sito Web, blog o pagina Facebook", scrive il programma
assistente Rebecca Lange, "potresti aver notato qualcosa che non vedi spesso:
storie e foto dei nostri destinatari ". Il problema non è che le storie luminose
offerto da altri enti di beneficenza non è vero. Piuttosto, il fatto stesso che lo fossero
scelto deliberatamente per mostrare i successi non è chiaro quanto
le informazioni possono essere raccolte da loro. Quindi GiveDirectly ha deciso di dare una svolta
anche questa pratica convenzionale.
Ogni mercoledì, il team di GiveDirectly seleziona a caso un destinatario di contanti,
invia un ufficiale sul campo per intervistarli e pubblica le note dell'ufficiale sul campo
testualmente, non importa cosa. Ad esempio, ecco la loro prima intervista del genere, con a
donna di nome Mary, che ha usato i soldi per un tetto di lamiera: *

È riuscita a costruire una casa migliore e quella era una casa in scatola. È stata anche in grado di acquistare un set di divani
per la sua casa. La sua vita è cambiata perché aveva un tetto che perdeva assorbendo
tutto in casa ogni volta che pioveva. Ma grazie al trasferimento è riuscita a fare di meglio
casa in scatola.

"Ci auguriamo che questo ti dia fiducia in tutti i tipi di informazioni che condividiamo
con te ", scrive Lange," e forse ti ispira anche a tenere gli altri
organizzazioni a un livello superiore. "
Il compromesso in tre parti
Immediatamente mi sono reso conto di quale qualità sia andata a formare un uomo di successo,
soprattutto nella letteratura, e che Shakespeare possedeva così enormemente -
Intendo capacità negativa, cioè quando un uomo è in grado di essere dentro
incertezze, misteri, dubbi, senza alcun irritante allungamento del fatto
e ragione.

—JOHN KEATS

Pagina 213

—JOHN KEATS
Non esiste la certezza assoluta, ma c'è la certezza
sufficiente per gli scopi della vita umana.

—JOHN STUART MILL


L'informatica è spesso una questione di negoziazione di compromessi. Nella nostra discussione di
l'ordinamento nel capitolo 3, ad esempio, abbiamo notato il compromesso tra il tempo trascorso
prima sull'ordinamento rispetto al tempo speso in seguito per la ricerca. E nella discussione di
memorizzando nella cache nel capitolo 4, abbiamo esplorato il compromesso di occupare spazio extra: le cache
per le cache per le cache: per risparmiare tempo.
Il tempo e lo spazio sono alla radice dei compromessi più familiari nel computer
scienza, ma un recente lavoro sugli algoritmi randomizzati mostra che esiste anche
un'altra variabile da considerare: la certezza. Come afferma Michael Mitzenmacher di Harvard
"Quello che faremo è trovare una risposta che ti faccia risparmiare tempo
e spazio e scambia questa terza dimensione: la probabilità di errore. " Chiesto per il suo
esempio preferito di questo compromesso con l'incertezza, non esita. "UN
il collega ha appena detto che dovrebbe esserci un gioco a bere che ogni volta questo termine
appare su una delle mie diapositive, devi bere qualcosa. Hai mai sentito parlare
Bloom filtri? "
Per comprendere l'idea alla base di un filtro Bloom, afferma Mitzenmacher, si consideri un file
motore di ricerca come Google, che cerca di eseguire la scansione dell'intero Web e indicizzare ogni
possibile URL. Il Web è composto da oltre un trilione di URL distinti e
l'URL medio pesa circa settantasette caratteri. Quando il
il motore di ricerca guarda un URL, come può verificare se quella pagina ha
già stato elaborato? Basta memorizzare un elenco di tutti gli URL che sono stati visitati
richiederebbe una quantità enorme di spazio e la ricerca ripetuta in quell'elenco (anche se
sono stati completamente risolti) potrebbe rivelarsi un incubo. In effetti, potrebbe benissimo essere quella la cura
è peggio della malattia: in altre parole, controllare ogni volta per accertarsene
non reindicizzare una pagina potrebbe richiedere più tempo della semplice indicizzazione
la pagina occasionale due volte.
E se avessimo solo bisogno di essere per lo più sicuri che questo URL fosse nuovo per noi? Quello è
dove entra in gioco il filtro Bloom. Prende il nome dal suo inventore, Burton H. Bloom, a
Il filtro Bloom funziona in modo molto simile al test di primalità Rabin-Miller: l'URL viene inserito

Pagina 214
in una serie di equazioni che controllano essenzialmente la presenza di "testimoni" della sua novità.
(Piuttosto che proclamare " n non è primo", queste equazioni dicono "non ho visto n
prima. ") Se sei disposto a tollerare un tasso di errore di appena l'1% o il 2%, memorizzare il tuo
i risultati in una struttura dati probabilistica come un filtro Bloom ti salveranno
quantità significative di tempo e spazio. E l'utilità di tali filtri lo è
non limitato ai motori di ricerca: i filtri Bloom sono stati forniti con un numero di
browser Web recenti per controllare gli URL rispetto a un elenco di siti Web dannosi noti,
e sono anche una parte importante delle criptovalute come Bitcoin.
Dice Mitzenmacher: "L'idea dello spazio di compromesso dell'errore, penso che sia il problema
è che le persone non lo associano al computer. Pensano che lo siano i computer
dovrebbe darti la risposta. Quindi, quando ascolti nella tua classe di algoritmi,
«Dovrebbe darti una risposta; potrebbe non essere la risposta giusta »- mi piace
pensare che quando [gli studenti] lo sentono, li focalizza. Penso che le persone non lo facciano
realizzano nella loro vita quanto lo fanno e lo accettano. "

Colline, valli e trappole


Il fiume serpeggia perché non può pensare.

—RICHARD KENNEY
La casualità ha anche dimostrato di essere un'arma potente per risolvere discreti
problemi di ottimizzazione, come l'assemblaggio del calendario per il basket NCAA o
trovare il percorso più breve per un venditore ambulante. Nel capitolo precedente abbiamo
visto come il rilassamento può svolgere un ruolo importante nel ridurre tali problemi a misura,
ma l'uso tattico della casualità è emerso come forse anche di più
tecnica importante.
Immagina di mettere insieme una vacanza in dieci città, la tua
versione del problema del venditore ambulante: inizierai e finirai a San
Francisco e visitare Seattle, Los Angeles, New York, Buenos Aires, Londra,
Amsterdam, Copenaghen, Istanbul, Delhi e Kyoto. Potresti non esserlo anche tu
preoccupato per la lunghezza totale del percorso, ma probabilmente lo vuoi
minimizzare il costo monetario del viaggio. La prima cosa da notare qui è che anche

Pagina 215

sebbene dieci città non sembrino quasi tante, il numero di itinerari possibili è dieci
fattoriale: più di tre milioni e mezzo. In altre parole, non c'è niente di pratico
modo per controllare semplicemente ogni permutazione e scegliere il prezzo più basso. tu
devono lavorare in modo più intelligente di così.
Per il tuo primo tentativo di itinerario, potresti prendere il più economico
volo in partenza da San Francisco (diciamo che è Seattle), prendendo poi il volo più economico
da lì a una qualsiasi delle altre città rimanenti (chiamatela Los Angeles), poi il
più economico da lì (ad esempio, New York) e così via, fino a quando non sei nella tua decima città
e da lì voli di nuovo a San Francisco. Questo è un esempio di un cosiddetto
algoritmo avido, che puoi anche pensare come un "algoritmo miope": uno quello
miope prende la cosa migliore disponibile in ogni fase del processo. Nella programmazione
teoria, come abbiamo visto nel capitolo 5, un algoritmo avido, per esempio, sempre funzionante
il lavoro più breve disponibile, senza guardare o pianificare oltre, a volte può
essere tutto ciò che un problema richiede. In questo caso, per il problema del venditore ambulante,
la soluzione data dall'algoritmo avido probabilmente non è terribile, ma è probabile
essere lontano dal meglio che puoi fare.
Dopo aver assemblato un itinerario di base, potresti provare alcune alternative
apportando lievi perturbazioni alla sequenza della città e vedendo se questo fa un
miglioramento. Ad esempio, se andiamo prima a Seattle, poi a Los Angeles,
possiamo provare a fare quelle città in ordine inverso: prima LA, poi Seattle. Per ogni
dato l'itinerario, possiamo fare undici di queste infradito da due città; diciamo che ci proviamo
tutti e poi vai con quello che ci fa risparmiare. Da qui
abbiamo un nuovo itinerario con cui lavorare, e possiamo iniziare permutando che uno,
ancora alla ricerca del miglior miglioramento locale. Questo è un algoritmo noto come Hill
Arrampicata: dalla ricerca attraverso uno spazio di soluzioni, alcune migliori e altre ancora
peggio, è comunemente pensato in termini di paesaggio con colline e valli,
dove il tuo obiettivo è raggiungere la vetta più alta.
Alla fine ti ritroverai con una soluzione migliore di tutte le sue
permutazioni; non importa quale adiacente si ferma, niente lo batte. È qui
che l'arrampicata si ferma. Significa che hai sicuramente trovato il singolo
miglior itinerario possibile, però? Purtroppo no. Potresti aver trovato solo un cosiddetto
"Massimo locale", non il massimo globale di tutte le possibilità. La collina-
il paesaggio di arrampicata è nebbioso. Puoi sapere che stai su a
cima di una montagna perché il terreno cade in tutte le direzioni, ma potrebbe esserci

Pagina 216

una montagna più alta appena oltre la valle successiva, nascosta dietro le nuvole.

Un "panorama degli errori", che descrive come la qualità della soluzione può variare a seconda delle diverse possibilità.

Considera l'aragosta bloccata nella trappola per aragoste: povera bestia, non si rende conto
che uscire dalla gabbia significa tornare indietro al centro della gabbia, che deve andare
più in profondità nella gabbia per farlo fuori. Una trappola per aragoste non è altro che un locale
massimo fatto di filo - un massimo locale che uccide.
Nel caso della pianificazione delle vacanze, i massimi locali sono fortunatamente meno fatali, ma
hanno lo stesso carattere. Anche una volta che abbiamo trovato una soluzione che non può essere
migliorato da eventuali piccole modifiche, è possibile che ci manchi ancora il globale
massimo. Il vero miglior itinerario può richiedere una radicale revisione del viaggio:
facendo interi continenti in un ordine diverso, per esempio, o procedendo verso ovest
invece che verso est. Potremmo aver bisogno di peggiorare temporaneamente la nostra soluzione, se lo vogliamo
per continuare a cercare miglioramenti. E la casualità fornisce una strategia:
in realtà, diverse strategie, per fare proprio questo.

Fuori dal massimo locale


Un approccio è quello di aumentare l'arrampicata in collina con ciò che è noto come "jitter": se lo è

Pagina 217

sembra che tu sia bloccato, mescola un po 'le cose. Apporta alcune piccole modifiche casuali
(anche se sono in peggio), poi torna a Hill Climbing; vedi se finisci
a un picco più alto.
Un altro approccio consiste nel rimescolare completamente la nostra soluzione quando raggiungiamo un
locale massimo e ricominciare l'arrampicata in collina da questo nuovo inizio casuale
punto. Questo algoritmo è noto, in modo abbastanza appropriato, come "Random-Restart Hill
Climbing "o, in modo più colorato," Shotgun Hill Climbing ". È una strategia quella
si rivela molto efficace quando ci sono molti massimi locali in un problema. Per
ad esempio, gli informatici utilizzano questo approccio quando cercano di decifrare i codici,
poiché ci sono molti modi per iniziare a decrittografare un messaggio che sembra promettente
prima ma finiscono per essere vicoli ciechi. Nella decrittazione, avere un testo che sembra
un po 'vicino a un inglese sensato non significa necessariamente che tu sia nemmeno attivo
la strada giusta. Quindi a volte è meglio non attaccarsi troppo a un'iniziale
direzione che si mostra promettente, e semplicemente ricomincia da capo.
Ma c'è anche un terzo approccio: invece di passare alla casualità totale
quando sei bloccato, usa un po 'di casualità ogni volta che fai un file
decisione. Questa tecnica, sviluppata dalla stessa squadra di Los Alamos che ha inventato
con il Metodo Monte Carlo, è chiamato Metropolis Algorithm . Il
Metropolis Algorithm è come Hill Climbing, provando diversi su piccola scala
ritocchi su una soluzione, ma con una differenza importante: in un dato punto, esso
accetterà potenzialmente sia modifiche sbagliate che buone.
Possiamo immaginare di applicare questo al nostro problema di pianificazione delle vacanze. Ancora una volta, noi
prova a modificare la nostra soluzione proposta oscillando tra le posizioni dei diversi
città. Se un tweak generato in modo casuale al nostro percorso di viaggio si traduce in un file
miglioramento, quindi lo accettiamo sempre e continuiamo a modificare da lì. Ma se
l'alterazione peggiorerebbe le cose, c'è ancora una possibilità che ce ne andiamo
con esso comunque (anche se peggiore è l'alterazione, minore è la possibilità).
In questo modo, non resteremo bloccati in nessun massimo locale per molto tempo: alla fine
proveremo un'altra soluzione vicina, anche se più costosa, e
potenzialmente essere sulla buona strada per elaborare un nuovo e migliore piano.
Che si tratti di jitter, riavvii casuali o possibilità di peggioramento occasionale,
la casualità è incredibilmente utile per evitare i massimi locali. Il caso non è solo un
modo praticabile di affrontare i problemi di ottimizzazione difficili; in molti casi lo è
essenziale. Tuttavia, alcune domande persistono. Quanta casualità dovresti

Pagina 218

uso? E quando? E, dato che strategie come l'algoritmo di Metropolis


può permutare il nostro itinerario praticamente all'infinito, come fai a saperlo
hai finito? Per i ricercatori che lavorano sull'ottimizzazione, una soluzione sorprendentemente definitiva
la risposta a queste domande verrebbe da un altro campo.

Ricottura simulata
Tra la fine degli anni '70 e l'inizio degli anni '80, Scott Kirkpatrick si considerava un
fisico, non uno scienziato informatico. In particolare, Kirkpatrick era interessato
fisica statistica, che usa la casualità come un modo per spiegare certi aspetti naturali
fenomeni, ad esempio la fisica della ricottura, il modo in cui i materiali
cambiano stato man mano che vengono riscaldati e raffreddati. Forse il più interessante
caratteristica della ricottura è la velocità con cui un materiale viene raffreddato
tende ad avere un impatto enorme sulla sua struttura finale. Come spiega Kirkpatrick:

La crescita di un singolo cristallo da una fusione [viene] eseguita mediante un'attenta ricottura, prima fondendo la sostanza, quindi
abbassando lentamente la temperatura, e trascorrendo molto tempo a temperature prossime a
punto di congelamento. Se ciò non viene fatto e la sostanza può uscire dall'equilibrio, il risultato
il cristallo avrà molti difetti, oppure la sostanza può formare un vetro, senza ordine cristallino.

Kirkpatrick lavorava allora in IBM, dove uno dei più grandi, complicati e
I problemi più sacri erano come disporre i circuiti sui chip che IBM
stava fabbricando. Il problema era sgraziato e intrattabile: c'era un
vasta gamma di possibili soluzioni da considerare e alcuni complicati vincoli. It
In generale era meglio che i componenti fossero vicini tra loro, ad esempio, ma
non troppo vicino, altrimenti non ci sarebbe spazio per i fili. E ogni volta che ti sei trasferito
qualsiasi cosa, dovresti ricalcolare come tutti i fili funzionerebbero nel nuovo
layout ipotetico.
A quel tempo, questo processo era guidato da una figura criptica di tipo guru
all'interno di IBM. Come ricorda Kirkpatrick, “Il ragazzo che era il migliore in IBM
spremere più circuiti su un chip ... aveva il modo più misterioso di
spiegando cosa stava facendo. Non gli piaceva dirtelo davvero. "
Dan Gelatt, amico di Kirkpatrick e collega IBM, è rimasto affascinato dal

Pagina 219

problema, e rapidamente agganciato Kirkpatrick, che ha avuto un lampo di intuizione. "La via
studiare [i sistemi fisici] significava riscaldarli, poi raffreddarli e lasciarli
il sistema si organizza. Da quello sfondo, sembrava perfettamente
cosa naturale trattare tutti i tipi di problemi di ottimizzazione come se i gradi di
la libertà che stavi cercando di organizzare erano piccoli atomi, o giri, o cosa
hai."
In fisica, ciò che chiamiamo "temperatura" è in realtà velocità, movimento casuale a
la scala molecolare. Questo era direttamente analogo, ragionò Kirkpatrick, al
jitter casuale che può essere aggiunto a un algoritmo di salita per realizzarlo
a volte si torna indietro da soluzioni migliori a soluzioni peggiori. In effetti, il Metropolis
L'algoritmo stesso era stato inizialmente progettato per modellare il comportamento casuale in
sistemi fisici (in quel caso, esplosioni nucleari). Quindi cosa succederebbe
Kirkpatrick si è chiesto se hai trattato un problema di ottimizzazione come una ricottura
problema - se lo "riscaldi" e poi lo "raffreddassi" lentamente?
Prendendo il problema delle vacanze in dieci città dall'alto, potremmo iniziare da "alto
temperatura ”scegliendo del tutto a caso il nostro itinerario di partenza, cogliendone uno
dall'intero spazio di possibili soluzioni indipendentemente dal prezzo. Allora possiamo
iniziare a "raffreddare" lentamente la nostra ricerca lanciando un dado ogni volta che ci troviamo
considerando una modifica alla sequenza della città. Prendendo sempre una variazione superiore
ha senso, ma prenderemmo solo quelli inferiori quando il dado mostra, diciamo, un 2
o più. Dopo un po ', lo raffredderemmo ulteriormente apportando solo una variazione di prezzo più alta
se il dado mostra un 3 o più, allora 4, poi 5. Alla fine saremmo per lo più in collina
arrampicandosi, facendo il movimento inferiore solo occasionalmente quando il dado mostra un 6.
Alla fine avremmo iniziato a salire solo in salita e ci fermeremo quando avremmo raggiunto il prossimo locale
max.
Questo approccio, chiamato Simulated Annealing , sembrava un modo intrigante
per mappare la fisica sulla risoluzione dei problemi. Ma funzionerebbe? La reazione iniziale
tra i ricercatori di ottimizzazione più tradizionali era che l'intero approccio
sembrava solo un po 'troppo ... metaforico. “Non sono riuscito a convincere i matematici
questa roba disordinata con le temperature, tutta questa roba basata sull'analogia, era reale ", dice
Kirkpatrick, "perché i matematici sono addestrati a diffidare davvero dell'intuizione".
Ma ogni sfiducia riguardo all'approccio basato sull'analogia sarebbe presto svanita: at
Gli algoritmi di annealing simulato di IBM, Kirkpatrick e Gelatt hanno iniziato a produrre
layout di chip migliori rispetto al guru. Piuttosto che mantenere la mamma sul loro segreto

Pagina 220

armi e diventare figure di guru criptiche essi stessi, hanno pubblicato la loro
metodo in un articolo su Science , aprendolo ad altri. Nei prossimi decenni,
quel giornale sarebbe stato citato ben trentaduemila volte. Ad oggi,
La ricottura simulata rimane uno degli approcci più promettenti a
problemi di ottimizzazione noti sul campo.

Casualità, evoluzione e creatività


Nel 1943, Salvador Luria non sapeva che stava per scoprirlo
porterebbe a un premio Nobel; pensava di andare a un ballo. Un recente
immigrato negli Stati Uniti dall'Italia di Mussolini, dove fu sefardita
Una famiglia ebrea era vissuta, Luria era una ricercatrice che studiava come si sviluppavano i batteri
immunità dai virus. Ma in quel momento la sua ricerca era lontana dalla sua mente,
mentre frequentava una riunione di facoltà in un country club vicino all'Università dell'Indiana.
Luria stava guardando uno dei suoi colleghi giocare a una slot machine:

Non sono un giocatore d'azzardo, lo stavo prendendo in giro per le sue inevitabili perdite, quando improvvisamente ha colpito il
jackpot, circa tre dollari in centesimi, mi diede un'occhiataccia e se ne andò. In quel momento ho iniziato
riflettere sulla numerologia attuale delle slot machine; così facendo mi è venuto in mente quello spazio
macchine e mutazioni batteriche hanno qualcosa da insegnarsi a vicenda.

Negli anni '40 non si sapeva esattamente perché o come resistessero i batteri
i virus (e, del resto, agli antibiotici) sono nati. Erano reazioni
all'interno dei batteri al virus, o c'erano semplicemente mutazioni in corso che
occasionalmente ha prodotto resistenza per caso? Non sembrava esserci modo di concepire un file
esperimento che offrirebbe una risposta decisiva in un modo o nell'altro, ovvero
finché Luria non vide quella slot machine e qualcosa scattò. Luria si rese conto che se lui
ha allevato diverse generazioni di diversi lignaggi di batteri, quindi ha esposto l'ultimo
generazione a un virus, accadrebbe una delle due cose radicalmente diverse. Se
la resistenza era una risposta al virus, si aspettava più o meno la stessa quantità di
batteri resistenti a comparire in ognuna delle sue colture batteriche, indipendentemente da
il loro lignaggio. D'altra parte, se la resistenza è emersa da mutazioni casuali,
si aspetterebbe di vedere qualcosa di molto più irregolare, proprio come quello di una slot machine

Pagina 221
pagamenti. Cioè, i batteri della maggior parte dei lignaggi non mostrerebbero alcuna resistenza;
alcuni lignaggi avrebbero avuto un'unica cultura di "nipote" che era mutata in
diventare resistente; e in rare occasioni, se fosse avvenuta la mutazione appropriata
diverse generazioni dopo l '"albero genealogico", ci sarebbe stato un jackpot: tutti i
I "nipoti" nel lignaggio sarebbero stati resistenti. Luria ha lasciato il ballo non appena
poteva e mettere in moto l'esperimento.
Dopo diversi giorni di attesa tesa e irrequieta, Luria tornò al laboratorio per controllare
sulle sue colonie. Montepremi.
La scoperta di Luria riguardava il potere del caso: su quanto casuale,
mutazioni casuali possono produrre resistenza virale. Ma era anche, almeno in parte,
A causa della forza del caso. Era nel posto giusto al momento giusto, dove
vedere la slot machine ha innescato una nuova idea. I racconti di scoperte spesso presentano un file
momento simile: la mela (forse apocrifa) di Newton, la vasca da bagno di Archimede
"Eureka!", La capsula di Petri trascurata in cui è cresciuta la muffa di Penicillium . In effetti, è un file
fenomeno abbastanza comune che una parola è stata inventata per catturarlo: nel 1754,
Horace Walpole ha coniato il termine "serendipity", basato sulle avventure delle fiabe
dei Tre Principi di Serendip (Serendip è il nome arcaico di Sri
Lanka), che “facevano sempre scoperte, per caso e per sagacia, di
cose per le quali non erano alla ricerca. "
Questo doppio ruolo della casualità: una parte fondamentale della biologia, una parte fondamentale di
scoperta - ha ripetutamente attirato l'attenzione degli psicologi che vogliono spiegare
creatività umana. Un primo esempio di questa idea è stato offerto da William James.
Nel 1880, essendo stato recentemente nominato professore assistente di psicologia presso
Harvard, ea dieci anni dalla pubblicazione dei suoi definitivi Principles of
Psicologia , James ha scritto un articolo sull'Atlantic Monthly intitolato "Great Men,
Grandi pensieri e l'ambiente. " L'articolo si apre con la sua tesi:

Un notevole parallelismo, che a mia conoscenza non è mai stato notato, si ottiene tra i fatti di
l'evoluzione sociale e la crescita mentale della razza, da un lato, e dell'evoluzione zoologica, come
esposto dal signor Darwin, dall'altro.

Nel momento in cui James scriveva, l'idea di "evoluzione zoologica" era ancora fresca
- On the Origin of Species essendo stato pubblicato nel 1859 e Mr. Darwin
lui stesso ancora vivo. James ha discusso di come applicare le idee evolutive

Pagina 222

diversi aspetti della società umana, e verso la fine dell'articolo si è rivolto al


evoluzione delle idee:

Nuove concezioni, emozioni e tendenze attive che evolvono sono originariamente prodotte nella forma
di immagini casuali, fantasie, nascite accidentali di variazione spontanea nell'attività funzionale di
il cervello umano eccessivamente instabile, che l'ambiente esterno semplicemente conferma o confuta,
adotta o rifiuta, conserva o distrugge - seleziona , in breve, proprio come seleziona morfologico e sociale
variazioni dovute a incidenti molecolari di tipo analogo.

James vedeva quindi la casualità come il cuore della creatività. E lui credeva che lo fosse
ingrandito nelle persone più creative. In loro presenza, ha scritto, “sembriamo
improvvisamente introdotto in un ribollente calderone di idee, dove tutto è
frizzante e ballonzolante in uno stato di attività sconcertante, dove le collaborazioni
può essere unito o allentato in un istante, la routine del tapis roulant è sconosciuta e il file
inaspettato sembra l'unica legge. " (Notare qui la stessa intuizione di "ricottura",
radicato nelle metafore della temperatura, dove la permutazione selvaggia è uguale al calore.)
L'istanza moderna della teoria di James appare nel lavoro di Donald
Campbell, uno psicologo vissuto cento anni dopo. Nel 1960, Campbell
ha pubblicato un documento intitolato “Blind Variation and Selective Retention in Creative
Pensiero come in altri processi di conoscenza. " Come James, ha aperto con il suo
tesi centrale: “Un processo di variazione cieca e di ritenzione selettiva è fondamentale
a tutte le conquiste induttive, a tutti i veri aumenti di conoscenza, a tutti
aumenta l'adattamento del sistema all'ambiente. " E come James è stato ispirato
evoluzione, pensando all'innovazione creativa come risultato dell'essere di nuove idee
generato casualmente e astute menti umane che conservano il meglio di quelle idee.
Campbell sostenne generosamente la sua argomentazione con citazioni di altri scienziati e
matematici sui processi alla base delle proprie scoperte. Il
fisici e filosofi del diciannovesimo secolo Ernst Mach e Henri Poincaré
entrambi sembravano offrire un resoconto simile a quello di Campbell, con Mach che andava così lontano
quanto a dichiarare che "così devono essere spiegate le dichiarazioni di Newton, Mozart,
Richard Wagner e altri, quando dicono quel pensiero, melodie e
le armonie si erano riversate su di loro e che avevano semplicemente mantenuto il diritto
quelli. "
Quando si tratta di stimolare la creatività, una tecnica comune è l'introduzione di un file

Pagina 223

elemento casuale, come una parola con cui le persone devono formare associazioni. Per
Ad esempio, il musicista Brian Eno e l'artista Peter Schmidt hanno creato un mazzo di carte
note come strategie oblique per risolvere problemi creativi. Scegli una carta, qualsiasi
carta e otterrai una nuova prospettiva casuale sul tuo progetto. (E se quello
sembra troppo lavoro, ora puoi scaricare un'app che prenderà una carta
per te.) Il racconto di Eno del motivo per cui hanno sviluppato le carte ha chiari parallelismi con
l'idea di sfuggire ai massimi locali:

Quando sei nel bel mezzo di qualcosa, dimentichi le cose più ovvie. Vieni fuori
lo studio e pensi "perché non ci siamo ricordati di fare questo o quello?" Queste [carte] sono davvero giuste
modi per buttarti fuori dalla cornice, per rompere un po 'il contesto, in modo da non farti parte di una band
uno studio incentrato su una canzone, ma siete persone vive e nel mondo e consapevoli di molte cose
anche altre cose.

Essere agitato in modo casuale, buttato fuori dall'inquadratura e concentrato su una scala più ampia,
fornisce un modo per lasciare ciò che potrebbe essere buono a livello locale e tornare all'inseguimento
di ciò che potrebbe essere ottimale a livello globale.
E non è necessario essere Brian Eno per aggiungere un po 'di stimolazione casuale al tuo
vita. Wikipedia, ad esempio, offre un collegamento "Articolo casuale", e Tom lo è stato
usandolo come home page predefinita del browser per diversi anni, vedendo un file
ha selezionato la voce di Wikipedia ogni volta che apre una nuova finestra. Mentre questo non ha
eppure ha portato a scoperte sorprendenti, ora sa molto su alcuni oscuri
argomenti (come il tipo di coltello utilizzato dalle forze armate cilene) e si sente
che alcuni di questi hanno arricchito la sua vita. (Ad esempio, ha imparato che esiste
una parola in portoghese per un "desiderio vago e costante di qualcosa che fa
non e probabilmente non può esistere ”, un problema che ancora non possiamo risolvere con una ricerca
motore.) Un effetto collaterale interessante è che ora ha anche un senso migliore non solo
di quali argomenti vengono trattati su Wikipedia, ma anche di quale casualità
sembra davvero. Ad esempio, pagine a cui sembra di avere una connessione
lui - articoli su persone o luoghi che conosce - si presentano con quello che sembra
frequenza sorprendente. (In un test, ha ottenuto "Members of the Western Australian
Consiglio legislativo, 1962-1965 ”dopo solo due ricariche, ed è cresciuto in
Western Australia.) Sapendo che questi sono effettivamente generati casualmente fa
è possibile calibrarsi meglio per valutare altre “coincidenze” in

Pagina 224

resto della sua vita.


Nel mondo fisico, puoi randomizzare le tue verdure unendoti a un file
Azienda agricola sostenuta dalla comunità, che consegnerà una scatola di prodotti a
te ogni settimana. Come abbiamo visto in precedenza, un abbonamento CSA potenzialmente rappresenta un file
problema di programmazione, ma ricevere frutta e verdura normalmente non lo faresti
comprare è un ottimo modo per essere buttato giù da un massimo locale nella tua ricetta
rotazione. Allo stesso modo, i club del libro, del vino e del cioccolato del mese sono un modo per
esponi alle possibilità intellettuali, enofile e gustative che potresti
mai incontrato diversamente.
Potresti preoccuparti che prendere ogni decisione lanciando una moneta possa portare a
guai, non da ultimo con il tuo capo, gli amici e la famiglia. Ed è vero quello
portare la casualità nella tua vita non è necessariamente una ricetta per il successo. Il
romanzo cult del 1971 The Dice Man di Luke Rhinehart (vero nome: George
Cockcroft) fornisce un ammonimento. Il suo narratore, un uomo che sostituisce la decisione-
fare con il lancio dei dadi, finisce rapidamente in situazioni che la maggior parte di noi farebbe
probabilmente piace evitare.
Ma forse è solo un caso in cui un po 'di conoscenza è una cosa pericolosa. Se
l'Uomo dei dadi aveva avuto solo una conoscenza più approfondita dell'informatica, l'avrebbe avuto
alcune indicazioni. Primo, da Hill Climbing: anche se sei abituato
a volte agendo in base a cattive idee, dovresti sempre agire in base a idee buone. Secondo,
dall'algoritmo Metropolis: la tua probabilità di seguire una cattiva idea dovrebbe
essere inversamente proporzionale a quanto sia cattiva un'idea. Terzo, da Simulato
Ricottura: dovresti caricare frontalmente la casualità, raffreddando rapidamente da un file
stato casuale, usando sempre meno casualità col passare del tempo, indugiando
più a lungo mentre ti avvicini al congelamento. Temprati, letteralmente.
Quest'ultimo punto non è stato perso dall'autore del romanzo. Cockcroft stesso
apparentemente si è rivolto, non diversamente dal suo protagonista, a "cubettare" per un periodo della sua vita,
vivere nomade con la sua famiglia su una barca a vela mediterranea, in una specie di
Rallentatore browniano. Ad un certo punto, tuttavia, il suo programma di ricottura si è raffreddato
off: si è sistemato comodamente in un massimo locale, su un lago nello stato di New
York. Ora che ha ottant'anni, è ancora contento. "Una volta che hai
da qualche parte eri felice ", disse al Guardian ," saresti stupido a scuoterlo
più in alto. "

Pagina 225
10 Rete
Come ci colleghiamo

Il termine connessione ha un'ampia varietà di significati. Può fare riferimento a un file


percorso fisico o logico tra due entità, può riferirsi al flusso
il percorso, può riferirsi inferenzialmente ad un'azione associata all'allestimento
di un percorso, oppure può riferirsi a un'associazione tra due o più entità,
con o senza riguardo a qualsiasi percorso tra di loro.

—VINT CERF E BOB KAHN


Connetti solo.
—EM FORSTER

Il telegrafo a lunga distanza iniziò con un presagio: Samuel FB Morse,


in piedi nelle camere della Corte Suprema degli Stati Uniti il ​24 maggio 1844, collegando il suo
assistente Alfred Vail a Baltimora un versetto dell'Antico Testamento: “COSA
HATH DIO WROUGHT ". La prima cosa che chiediamo a qualsiasi nuova connessione è come
è iniziato, e da quella origine non può fare a meno di cercare di augurarne il futuro.
La prima telefonata della storia, fatta da Alexander Graham Bell al suo
assistente il 10 marzo 1876, iniziò con un po 'di paradosso. "Sig. Watson, vieni
Qui; Voglio vederti ”, una testimonianza simultanea della sua capacità e incapacità di farlo
superare la distanza fisica.
Il cellulare iniziò con una vanteria: Martin Cooper di Motorola che camminava
lungo la Sixth Avenue il 3 aprile 1973, mentre i pedoni di Manhattan guardavano a bocca aperta, chiamando
il suo rivale Joel Engel di AT&T: “Joel, ti chiamo da un telefono cellulare. UN

Pagina 226

vero telefono cellulare: un telefono cellulare palmare, portatile, vero. " ("Io non
ricorda esattamente quello che ha detto ", ricorda Cooper," ma è stato davvero tranquillo per a
mentre. La mia ipotesi era che stesse digrignando i denti. ")
E il messaggio di testo iniziò, il 3 dicembre 1992, con allegria: Neil
Papworth presso Sema Group Telecoms augura presto a Richard Jarvis di Vodafone
"Buon Natale."
Gli inizi di Internet furono, in qualche modo opportunamente, molto più umili e
più infausto di tutto questo. Era il 29 ottobre 1969 e Charley Kline a
L'UCLA ha inviato a Bill Duvall presso lo Stanford Research Institute il primo messaggio
mai trasmesso da un computer a un altro tramite ARPANET. Il messaggio
era "login", o lo sarebbe stato se la macchina ricevente non si fosse arrestata in modo anomalo dopo
"Ecco."
Con amore, Kline riuscì a sembrare portentoso e malgrado l'Antico Testamento
lui stesso.
Il fondamento della connessione umana è il protocollo, una convenzione condivisa di
procedure e aspettative, da strette di mano e saluti all'etichetta, educazione,
e l'intera gamma di norme sociali. La connessione della macchina non è diversa. Protocollo
è come arriviamo sulla stessa pagina; infatti, la parola è radicata nel greco
protokollon , "prima colla", che si riferiva alla pagina esterna allegata a un libro o
manoscritto.
Negli affari interpersonali, questi protocolli si dimostrano una fonte sottile ma perenne di
ansia. Ho inviato un messaggio a tal dei tali molti giorni fa; a che punto devo
iniziare a sospettare di non averlo mai ricevuto? Adesso sono le 12:05 e la nostra chiamata è stata impostata
per mezzogiorno; ci aspettiamo entrambi che sia quello che chiama? La tua risposta
sembra strano; ti ho capito male o mi hai capito male? Vieni di nuovo?
La maggior parte della nostra tecnologia di comunicazione, dal telegrafo al testo, lo è
ci ha semplicemente fornito nuovi canali per sperimentare questi familiari
persona sfide. Ma con Internet, i computer non sono diventati solo il canale
ma anche gli endpoint: quelli che parlano. In quanto tali, dovevano esserlo
responsabile della risoluzione dei propri problemi di comunicazione. Queste macchine per
i problemi della macchina - e le loro soluzioni - imitano e illuminano allo stesso tempo i nostri.

Commutazione di pacchetto

Pagina 227

Ciò che ora pensiamo come "Internet" è in realtà una raccolta di molti
protocolli, ma il principale tra loro (tanto che spesso viene indicato di più
o meno sinonimo di Internet) è ciò che è noto come Trasmissione
Protocollo di controllo o TCP. Nasce da un discorso del 1973 e da un articolo del 1974 di
Vinton "Vint" Cerf e Robert "Bob" Kahn, che hanno presentato una proposta per il
linguaggio di, come immaginavano di chiamarlo, un "internetwork".
TCP inizialmente utilizzava linee telefoniche, ma è più appropriato considerato come il
evoluzione della posta piuttosto che del telefono. Le telefonate utilizzano ciò che viene chiamato
“Commutazione circuito”: il sistema apre un canale tra il mittente e il
ricevitore, che fornisce una larghezza di banda costante tra le parti in entrambe
indicazioni finché dura la chiamata. La commutazione del circuito ha molto senso per
l'interazione umana, ma già negli anni '60 era chiaro che questo paradigma
non avrebbe funzionato per le comunicazioni della macchina.
Come ricorda Leonard Kleinrock dell'UCLA,

Sapevo che i computer, quando parlano, non parlano come sono adesso, continuamente. Vanno
esplosione! e stanno zitti per un po '. Poco dopo, improvvisamente si avvicinano e sparano di nuovo. E
non puoi permetterti di dedicare una connessione di comunicazione a qualcosa che non è quasi mai
parlando, ma quando vuole parlare vuole un accesso immediato. Quindi non abbiamo dovuto usare il telefono
rete, che è stata progettata per la conversazione continua - la rete di commutazione di circuito - ma qualcosa
altro.

Le compagnie telefoniche, da parte loro, non sembravano particolarmente disponibili


parlare di un cambiamento fondamentale nei loro protocolli. Allontanandosi dal circuito
cambiare era considerato folle - "totale eresia", nelle parole di networking
ricercatore Van Jacobson. Kleinrock ricorda i suoi incontri con
l'industria delle telecomunicazioni:

Sono andato ad AT&T, la rete più grande dell'epoca, e ho spiegato loro che dovreste darci
buone comunicazioni di dati. E la loro risposta è stata, di cosa stai parlando? Gli Stati Uniti sono un
miniera di rame, è piena di cavi telefonici, usala. Ho detto no, no, non capisci. Ci vogliono 35
secondi per impostare una chiamata, mi addebiti un minimo di 3 minuti e voglio inviare 100 millisecondi
di dati! E la loro risposta fu: "Ragazzino, vattene". Così il ragazzino se ne andò e, con gli altri,
ha sviluppato questa tecnologia che ha mangiato il loro pranzo.

La tecnologia che ha mangiato il pranzo della commutazione di circuito sarebbe diventata nota come
Pagina 228

commutazione di pacchetto . In una rete a commutazione di pacchetto, invece di utilizzare un file


canale per ogni connessione, mittenti e destinatari atomizzano i loro messaggi in
piccoli frammenti noti come "pacchetti" e unirli nel flusso comune di dati
—Un po 'come le cartoline che si muovono alla velocità della luce.
In una rete di questo tipo, “ciò che potresti chiamare una connessione è un'illusione consensuale
tra i due endpoint ", spiega Stuart Cheshire, esperto di reti di Apple.
“Non ci sono connessioni in Internet. Parlando di una connessione in
Internet è come parlare di una connessione nel sistema di posta degli Stati Uniti. Scrivi
lettere alle persone e ogni lettera va in modo indipendente e potresti avere un
corrispondenza che va avanti e indietro e ha una certa continuità, ma il file
La posta degli Stati Uniti non ha bisogno di saperlo. ... Consegnano solo le lettere. "
L'uso efficiente della larghezza di banda non è stata l'unica considerazione che ha guidato la ricerca
nella commutazione di pacchetto negli anni '60; l'altra era la guerra nucleare. Paul Baran presso il
RAND Corporation stava cercando di risolvere il problema della robustezza della rete, quindi
che le comunicazioni militari potrebbero sopravvivere a un attacco nucleare che ha distrutto a
considerevole frazione della rete. Ispirato da algoritmi sviluppati negli anni '50
per la navigazione nei labirinti, Baran ha immaginato un design in cui ogni pezzo di
le informazioni potrebbero raggiungere autonomamente la propria destinazione, anche se il file
la rete stava cambiando dinamicamente o era ridotta a brandelli.
Questo è stato il secondo demerito contro la commutazione del circuito e il suo dedicato,
connessioni stabili: quella stessa stabilità significava che una chiamata interrotta rimaneva interrotta.
La commutazione del circuito non era abbastanza flessibile o adattabile per essere robusta. E
anche qui la commutazione di pacchetto potrebbe offrire proprio ciò che i tempi richiedevano. Nel
reti a commutazione di circuito, una chiamata fallisce se uno qualsiasi dei suoi collegamenti viene interrotto—
il che significa che l'affidabilità diminuisce in modo esponenziale man mano che una rete cresce.
Nella commutazione di pacchetto, invece, il proliferare di percorsi in maniera crescente
la rete diventa una virtù: ora ci sono molti più modi per far fluire i dati,
quindi l'affidabilità della rete aumenta esponenzialmente con le sue dimensioni.
Tuttavia, come dice Van Jacobson, anche dopo che la commutazione di pacchetto è stata ideata, il file
le compagnie telefoniche non furono impressionate. “Tutto il personale delle telecomunicazioni ha detto, a voce molto alta
voci, quella non è una rete! Questo è solo un modo scadente per usare la nostra rete!
Stai prendendo i nostri fili, si sta inviando sui sentieri che ci creiamo! E tu sei
mettendoci un sacco di gunk extra in modo da usarlo in modo davvero inefficiente. " Ma da a
punto di vista della commutazione di pacchetto, i cavi telefonici sono solo un mezzo per raggiungere un fine; il

Pagina 229

mittente e destinatario in realtà non si preoccupano di come vengono consegnati i pacchetti. La capacità
per operare in modo agnostico su un numero qualsiasi di media diversi sarebbe un pacchetto
la grande virtù della commutazione. Dopo le prime reti alla fine degli anni '60 e all'inizio degli anni '70,
come ARPANET, ha dimostrato la fattibilità del concetto, reti di tutti i tipi
iniziò a spuntare in tutto il paese, effettuando la commutazione di pacchetto non solo su rame
cavi telefonici, ma via satellite e via radio. Nel 2001, un gruppo di computer
scienziati della città norvegese di Bergen hanno anche implementato brevemente un pacchetto
commutazione di rete su "Avian Carrier", ovvero pacchetti annotati
carta e legato ai piedi dei piccioni.
Naturalmente, la commutazione di pacchetto non sarebbe priva di problemi. Per
principianti, una delle prime domande per qualsiasi protocollo, umano o macchina, è abbastanza
semplicemente: come fai a sapere che i tuoi messaggi stanno arrivando?
Riconoscimento
Nessuna trasmissione può essere affidabile al 100%.

—VINT CERF E BOB KAHN


"COSA HA SCATTATO DIO" non era solo il primo telegrafo a lunga distanza
messaggio inviato negli Stati Uniti. È stata anche la seconda: Alfred Vail ha inviato il file
citazione di nuovo a Morse nelle camere della Corte Suprema come un modo per confermare
ricevuta.
Ora, la risposta di Vail potrebbe rendere Morse, ei legislatori statunitensi si sono riuniti intorno
lui, fiducioso che il messaggio di Morse fosse stato ricevuto - presumendo, naturalmente,
che Vail non conosceva in anticipo la scelta del messaggio. Ma cosa farebbe
Vail sicuro che la sua conferma fosse stata ricevuta?
Gli informatici conoscono questo concetto come il "problema dei generali bizantini".
Immagina due generali, sui lati opposti di una valle che contiene il loro comune
nemico, tentando di coordinare un attacco. Solo con una sincronizzazione perfetta lo farà
ci riescono; perché entrambi attaccare da soli è un suicidio. Quel che è peggio, eventuali messaggi
da un generale all'altro devono essere consegnati a mano attraverso il terreno stesso
che contiene il nemico, il che significa che c'è una possibilità che un dato messaggio lo farà

Pagina 230

mai arrivare.
Il primo generale, diciamo, suggerisce un momento per l'attacco, ma non oserà farlo
a meno che non sappia per certo che anche il suo compagno si sta muovendo. Il secondo generale
riceve gli ordini e manda indietro una conferma, ma non oserà attaccare a meno che
sa che il primo generale ha ricevuto quella conferma (poiché altrimenti il
il primo generale non andrà). Il primo generale riceve la conferma - ma
non attaccherà finché non sarà certo che il secondo generale sa di averlo fatto. A seguire
questa catena logica richiede una serie infinita di messaggi, e ovviamente quello
non va bene. La comunicazione è una di quelle cose deliziose che funzionano solo in
pratica; in teoria è impossibile.
Nella maggior parte degli scenari, le conseguenze degli errori di comunicazione sono raramente così
terribile, e il bisogno di certezza raramente così assoluto. In TCP, un errore in generale
porta alla ritrasmissione piuttosto che alla morte, quindi è considerato sufficiente per una sessione
per cominciare con quella che viene chiamata "tripla stretta di mano". Il visitatore dice ciao, il
il server riconosce il ciao e lo saluta, il visitatore riconosce
che, e se il server riceve questo terzo messaggio, allora non c'è ulteriore conferma
necessario e vanno alle gare. Anche dopo aver effettuato questa connessione iniziale,
tuttavia, c'è ancora il rischio che alcuni pacchetti successivi possano essere danneggiati o persi
transito o arrivo fuori servizio. Nella posta, la consegna del pacco può essere
confermato tramite ricevute di ritorno; online, la consegna del pacchetto è confermata da cosa sono
chiamati pacchetti di riconoscimento o ACK. Questi sono fondamentali per il funzionamento
della rete.
Il modo in cui funzionano gli ACK è semplice e intelligente. Dietro le quinte di
tripla stretta di mano, ciascuna macchina fornisce all'altra una sorta di numero di serie
- ed è chiaro che ogni pacchetto inviato successivamente incrementerà quelli seriali
numeri di uno ogni volta, come gli assegni in un libretto degli assegni. Ad esempio, se il tuo
computer avvia il contatto con un server web, potrebbe inviare a quel server, ad esempio, il file
numero 100. L'ACK inviato dal server specificherà a sua volta il numero di serie in
che inizieranno i pacchetti del server (chiamatelo 5.000) e diranno anche
"Pronto per 101." L'ACK della tua macchina porterà il numero 101 e lo farà
trasmettere a sua volta "Pronto per 5,001". (Notare che questi due schemi di numerazione sono
totalmente indipendente e il numero che inizia ogni sequenza è tipicamente
scelto a caso.)
Questo meccanismo offre un modo pronto per individuare quando i pacchetti sono andati

Pagina 231

fuori strada. Se il server si aspetta 101 ma invece ottiene 102, invierà un ACK a
pacchetto 102 che dice ancora "Pronto per 101". Se poi riceve il pacchetto 103, dirà,
di nuovo, "Pronto per 101". Tre di questi ACK ridondanti di seguito segnalerebbero a
la tua macchina che 101 non è solo ritardata ma irrimediabilmente scomparsa, quindi verrà nuovamente inviata
quel pacchetto. A quel punto, il server (che ha conservato i pacchetti 102 e 103) lo farà
inviare un ACK dicendo "Pronto per 104" per segnalare che la sequenza è stata
restaurato.
Tutti questi riconoscimenti possono effettivamente arrivare a una quantità considerevole di
traffico. Pensiamo, diciamo, a un trasferimento di file di grandi dimensioni come un'operazione unidirezionale, ma in realtà
il destinatario sta inviando centinaia di "messaggi di controllo" al mittente. UN
rapporto della seconda metà del 2014 ha mostrato che quasi il 10% dell'upstream
Il traffico Internet nelle ore di punta era dovuto a Netflix, a cui tendiamo a pensare
come l'invio di dati quasi esclusivamente a valle , agli utenti. Ma tutto quel video
genera un numero enorme di ACK.
Nella sfera umana, l'ansia che il messaggio venga effettivamente ricevuto
allo stesso modo pervade la conversazione. Un oratore potrebbe inconsciamente aggiungere "Tu
conoscere?" fino alla fine di ogni frase, e un ascoltatore, da parte sua, non può fare a meno
fare un flusso costante di cenni, yeahs, aye-ayes, roger-thats, ten-fours, uh-huhs.
Lo facciamo anche faccia a faccia, ma durante una telefonata a volte è l'unico modo per farlo
sapere che la chiamata è ancora in corso. Non c'è da stupirsi che il maggior successo
La campagna di marketing del ventunesimo secolo per un operatore wireless prevedeva a
il tormentone del controllo qualità dell'ingegnere di rete, ripetuto più e più volte: “Can
mi senti adesso? "
Quando qualcosa va storto in questo avanti e indietro, spesso ci rimane un
punto interrogativo. Come dice il software blogger Tyler Treat,

In un sistema distribuito, cerchiamo di garantire la consegna di un messaggio aspettando un file


riconoscimento che è stato ricevuto, ma ogni genere di cose può andare storto. Il messaggio è stato ricevuto
caduto? L'ack è stato lasciato cadere? Il ricevitore si è schiantato? Sono solo lenti? La rete è lenta?
Am I lento?

Le questioni affrontate dai generali bizantini, come ci ricorda, “non sono design
complessità, sono risultati impossibili ".
Precedenti ricerche sul networking, osserva Vint Cerf, erano state fondate “su
presupposto che si possa costruire una rete sottostante affidabile ". D'altro canto,

Pagina 232

“Internet si basava sul presupposto che nessuna rete fosse necessariamente


affidabile e dovevi eseguire ritrasmissioni end-to-end per recuperare ".
Ironia della sorte, una delle poche eccezioni a questo è nella trasmissione dell'umano
voce. Le comunicazioni vocali in tempo reale, come Skype, in genere non vengono utilizzate
TCP, che è alla base della maggior parte del resto di Internet. Come hanno scoperto i ricercatori
agli albori del networking, utilizzando protocolli affidabili e robusti, con tutti i loro
ACK e ritrasmissione di pacchetti persi - per trasmettere la voce umana è
eccessivo. Gli umani forniscono la robustezza da soli. Come spiega Cerf, “In
nel caso della voce, se perdi un pacchetto, dici semplicemente: 'Dillo di nuovo, mi sono perso
qualcosa.'"
Per questo motivo, i servizi telefonici che riducono automaticamente il rumore di fondo a
il silenzio rende i propri utenti un grave disservizio. Lo sfondo statico è continuo
rassicurazione che la chiamata è ancora connessa e che qualsiasi silenzio è deliberato
scelta dell'altra parte. Senza di essa, bisogna confrontarsi costantemente con
possibilità che la chiamata sia caduta e offrire costantemente rassicurazioni che ha
non. Anche questa è l'ansia di tutti i protocolli di commutazione di pacchetto, anzi di qualsiasi altro
mezzo radicato nel cambio di turno asincrono, che si tratti di scrivere lettere, inviare messaggi di testo o
tentativi avanti e indietro di appuntamenti online. Ogni messaggio potrebbe essere l'ultimo, e
spesso non si può dire la differenza tra qualcuno che si prende il proprio tempo
rispondere e qualcuno che ha da tempo concluso la conversazione.
Quindi, esattamente come dovremmo gestire una persona o un computer
inaffidabile ?
La prima domanda è quanto tempo dovremmo durare un periodo di non risposta
costituire un guasto. In parte questo dipende dalla natura della rete: noi
inizia a preoccuparti in pochi secondi al telefono, giorni via email e settimane
tramite posta ordinaria. Più lungo è il tempo di andata e ritorno tra mittente e destinatario, il
più tempo ci vuole un silenzio per essere significativo, e più informazioni possono esserlo
potenzialmente "in fuga" prima che il mittente si accorga che c'è un problema. Nel
networking, facendo in modo che le parti sintonizzino adeguatamente le loro aspettative per la tempestività
dei riconoscimenti è fondamentale per il corretto funzionamento del sistema.
La seconda domanda, ovviamente, una volta che riconosciamo un guasto, è cosa
esattamente dovremmo fare al riguardo.

Backoff esponenziale: l'algoritmo del perdono

Pagina 233

Backoff esponenziale: l'algoritmo del perdono


La parola più difficile da tradurre al mondo è stata identificata come
"Ilunga", dalla lingua tshiluba parlata nel sud-est della Repubblica Democratica del Congo.
… Ilunga significa “una persona che è pronta a perdonare ogni abuso per il primo
volta, per tollerarlo una seconda volta, ma mai una terza volta. "
- NOTIZIE BBC

Se all'inizio non ci riesci, / Prova, riprova.


—TH PALMER

Oggi ci aspettiamo che i nostri dispositivi comunichino in modalità wireless anche quando i cavi lo farebbero
essere facile: la nostra tastiera e il nostro mouse, ad esempio, parlano in modalità wireless con un
computer seduto a pochi centimetri di distanza. Ma la rete wireless è iniziata
necessità, in un luogo dove nessun filo potrebbe fare il lavoro: le Hawaii. Alla fine degli anni '60
e all'inizio degli anni '70, Norman Abramson dell'Università delle Hawaii a Honolulu lo era
cercando di collegare insieme i sette campus dell'università e molte ricerche
istituti, distribuiti su quattro isole e centinaia di miglia. Ha avuto l'idea
di implementare la commutazione di pacchetto via radio anziché tramite il sistema telefonico,
collegando le isole con una catena sciolta di trasmettitori e ricevitori. Questo
il sistema sarebbe diventato noto come ALOHAnet.
Il più grande ostacolo che ALOHAnet ha dovuto superare è stata l'interferenza.
A volte due stazioni trasmettono nello stesso momento, inavvertitamente
disturbando i segnali l'uno dell'altro. (Questa è, ovviamente, una caratteristica familiare in human
conversazione.) Se entrambe le stazioni semplicemente ritrasmettessero subito per provare a farlo
trasmettere il loro messaggio, avrebbero corso il rischio di rimanere bloccati in perpetuo
interferenza per sempre. Chiaramente il protocollo ALOHAnet avrebbe dovuto dirlo
segnali in competizione su come darsi spazio a vicenda, come cedere e farsi strada
l'un l'altro.
La prima cosa che i mittenti devono fare qui è quella che viene chiamata "rottura
simmetria." Come sa ogni pedone sul marciapiede, schivando proprio come se fosse in arrivo
walker schiva a sinistra, e poi facendo schivare entrambi contemporaneamente il
altrimenti, non risolve nulla. È la stessa storia quando due altoparlanti entrambi
metti in pausa, fai gesti di deferenza verso l'altro e poi ricomincia a parlare a
lo stesso tempo; o quando due auto a un incrocio, ciascuna essendosi fermata per cedere
all'altro, prova ad accelerare in sincronia. Questa è un'area in cui l'uso di

Pagina 234

la casualità diventa essenziale, anzi, il networking non sarebbe possibile


Senza esso.
Una soluzione semplice è fare in modo che ogni stazione lanci una moneta. Teste, esso
ritrasmette; croce, attende un turno, quindi ritrasmette. Sicuramente uno di loro otterrà
attraverso incontrastato in breve tempo. Funziona abbastanza bene quando ci sono solo
due mittenti. Ma cosa succede se ci sono tre segnali simultanei? O quattro? Sarebbe
prendi una possibilità su quattro per la rete di far passare anche un singolo pacchetto a
quel punto (dopo di che avresti ancora tre stazioni in conflitto rimaste, e forse
nel frattempo arrivano segnali ancora più competitivi). Come il numero di conflitti
aumenta ulteriormente, il throughput della rete potrebbe semplicemente cadere da un precipizio. Un 1970
il rapporto su ALOHAnet ha affermato che oltre il 18,6% di utilizzo medio di
onde radio, "il canale diventa instabile ... e il numero medio di
le ritrasmissioni diventano illimitate. " Non bene.
Quindi che si fa? C'è un modo per creare un sistema che possa evitare questo destino?
La svolta si è rivelata aumentare il ritardo medio dopo ogni
fallimento successivo, in particolare, raddoppiando il potenziale ritardo prima di tentare
trasmettere di nuovo. Quindi, dopo un errore iniziale, un mittente ritrasmetterebbe in modo casuale
uno o due turni dopo; dopo un secondo errore, avrebbe riprovato ovunque
da uno a quattro turni dopo; un terzo fallimento consecutivo significherebbe aspettare
da qualche parte tra uno e otto turni, e così via. Questo approccio elegante
consente alla rete di ospitare potenzialmente qualsiasi numero di concorrenti
segnali. Poiché la lunghezza massima del ritardo (2, 4, 8, 16 ...) forma un esponenziale
progressione, è diventato noto come Exponential Backoff .
Il backoff esponenziale è stato una parte importante del buon funzionamento di
ALOHAnet a partire dal 1971 e negli anni '80 è stato integrato in TCP,
diventando una parte fondamentale di Internet. Dopo tutti questi decenni, lo è ancora. Come una
un autorevole documento afferma: "Per un endpoint di trasporto incorporato in una rete di
topologia sconosciuta e con una sconosciuta, inconoscibile e in continua evoluzione
popolazione di conversazioni concorrenti, solo uno schema ha qualche speranza
funzionante: backoff esponenziale. "
Ma sono gli altri usi dell'algoritmo che suggeriscono qualcosa di più
prescrittivo e più profondo. Al di là della semplice prevenzione delle collisioni, esponenziale
Il backoff è diventato il modo predefinito per gestire quasi tutti i casi di networking
fallimento o inaffidabilità. Ad esempio, quando il tuo computer sta cercando di raggiungere un file
Pagina 235

sito web che sembra essere inattivo, utilizza il backoff esponenziale, riprovando uno
secondo dopo, ancora pochi secondi dopo, e così via. Questo è un bene per
tutti: impedisce a un server host che è inattivo di essere bloccato
richieste non appena torna online e impedisce alla tua macchina di
sprecare troppi sforzi cercando di ottenere sangue da una pietra. Ma è interessante notare che
inoltre non obbliga (o permette) alla vostra macchina di arrendersi mai completamente.
Il backoff esponenziale è anche una parte fondamentale della sicurezza di rete, quando
i successivi errori di password nell'accesso a un account sono puniti da un
periodo di blocco in aumento esponenziale. Ciò impedisce a un hacker di utilizzare un file
"Attacco dizionario" contro un account, passando attraverso la potenziale password dopo
password fino a quando non saranno fortunati. Allo stesso tempo ne risolve anche un altro
problema: il vero proprietario dell'account, per quanto smemorato, non lo è mai
definitivamente bloccato dopo qualche interruzione arbitraria.
Nella società umana, tendiamo ad adottare una politica per dare alle persone un po 'di finito
numero di possibilità di fila, poi rinunciare del tutto. Tre strike, sei fuori.
Questo modello prevale di default in quasi tutte le situazioni che richiedono il perdono,
clemenza o perseveranza. In poche parole, forse lo stiamo facendo male.
Un nostro amico ha recentemente riflettuto su un compagno d'infanzia che aveva un
sconcertante abitudine di sfaldarsi sui piani sociali. Cosa fare? Decidere una volta e
per tutto quello che aveva finalmente avuto abbastanza e rinunciare completamente alla relazione
sembrava arbitrario e severo, ma continuava a persistere nella riprogrammazione perpetua
sembrava ingenuo, suscettibile di portare a una quantità infinita di delusioni e sprechi
tempo. Soluzione: backoff esponenziale sul tasso di invito. Prova a riprogrammare in un file
settimana, poi due, poi quattro, poi otto. Il tasso di "ritrasmissione" va verso
zero, ma non devi mai arrenderti completamente.
Un altro nostro amico si è agitato sull'opportunità di offrire riparo e denaro
assistenza a un familiare con una storia di tossicodipendenza. Non poteva
sopportare di rinunciare alla speranza che avrebbe cambiato le cose, e non poteva sopportare il
pensò di voltargli le spalle per sempre. Ma anche lei non poteva farcela
fare tutto ciò che era necessario per averlo a casa sua: comprargli vestiti e
cucinando per lui, riaprendo conti bancari per lui e spingendolo a lavorare ciascuno
mattina, quando in un momento misterioso e brusco prendeva tutto il
soldi e sparire, solo per chiamare di nuovo diverse settimane dopo e chiedere di essere
perdonato e ripreso. Sembrava un paradosso, un crudele e impossibile

Pagina 236

scelta.
Il backoff esponenziale non è una panacea magica in casi come questo, ma offre
una possibile via da seguire. Richiede un periodo in aumento esponenziale di
la sobrietà, ad esempio, offrirebbe un disincentivo a violare di nuovo le regole della casa.
Avrebbe fatto provare al membro della famiglia sempre più assiduamente che lo era
seriamente sul ritorno, e proteggerebbe l'ospite dal contrario
stress continuo del ciclo. Forse la cosa più importante, l'ospite non l'avrebbe mai fatto
devo dire al suo parente che lei aveva rinunciato a lui per sempre o che lo era
oltre la redenzione. Offre un modo per avere una pazienza finita e una misericordia infinita.
Forse non dobbiamo scegliere.
In effetti, lo scorso decennio ha visto l'inizio di una tranquilla rivoluzione nel
il modo in cui il sistema giudiziario stesso gestisce la supervisione della comunità per i criminali di droga.
Questa rivoluzione è guidata da un programma pilota chiamato HOPE, che
utilizza i principi di Exponential Backoff di ALOHAnet e che, in a
sorprendente coincidenza, iniziata nel luogo di nascita della stessa ALOHAnet: Honolulu.
Poco dopo aver prestato giuramento alla Corte del Primo Circuito delle Hawaii, il giudice Steven
Alm ha notato uno schema notevole. I probatori violerebbero ripetutamente il loro
termini di libertà vigilata e giudici di circoscrizione userebbero abitualmente la loro discrezione per lasciare
con un avvertimento. Ma a un certo punto, forse dopo una dozzina o più
violazioni, il giudice avrebbe deciso di essere severo e assegnare al trasgressore una prigione
condanna misurata in anni. Almeno dice: “Ho pensato, che modo folle di provare
cambiare il comportamento di chiunque. " Così Alm ha proposto quasi esattamente il contrario. Nel
luogo di violazione udienze programmate molto tempo nel futuro, che richiedono
Il giudizio incerto chiama e occasionalmente produce enormi sanzioni, HOPE lo è
basato su punizioni immediate e predefinite che iniziano con un solo giorno di carcere
e aumentare dopo ogni incidente. Uno studio quinquennale del Dipartimento di Giustizia
ha riferito che gli aspiranti in prova HOPE avevano la metà delle probabilità di esserlo
arrestato per un nuovo crimine o revocato la libertà vigilata. Ed erano il 72%
meno probabilità di usare droghe. Diciassette stati hanno seguito l'esempio delle Hawaii e
ha lanciato le proprie versioni di HOPE.

Controllo del flusso e prevenzione della congestione

Pagina 237

I primi sforzi per il networking di computer si sono concentrati sulla creazione di affidabili
trasmissioni su collegamenti inaffidabili. Questi sforzi si sono rivelati così efficaci che
subito una seconda preoccupazione: assicurarsi che una rete sovraccarica
potrebbe evitare un crollo catastrofico. Non appena TCP ha risolto il problema di
ottenere i dati dal punto A al punto B di quanto si è confrontato con il problema di
ingorgo.
L'allarme più significativo è avvenuto nel 1986, su una linea che collega il
Lawrence Berkeley Laboratory e il campus della UC Berkeley, che sono
separati da circa la lunghezza di un campo di calcio. (A Berkeley, lo spazio accade
da riempire con un vero campo di calcio.) Un giorno, la larghezza di banda di quella linea
è sceso bruscamente dai suoi tipici 32.000 bit al secondo a soli 40 bit per
secondo. Le vittime, Van Jacobson della LBL e Michael Karels della UCB, “lo erano
affascinato da questo improvviso calo di migliaia di volte nella larghezza di banda e ci siamo imbarcati
un'indagine sul perché le cose fossero andate così male. "
Nel frattempo, hanno sentito mormorii da altri gruppi di networking in tutto il
paese che stavano incontrando la stessa cosa. Jacobson ha iniziato a esaminare il file
codice sottostante. "C'è qualche errore nel protocollo?" lui si chiedeva. "Questo
stava lavorando su test su scala più piccola, e poi improvvisamente è andato in pezzi. "
Una delle maggiori differenze tra commutazione di circuito e pacchetto
il cambiamento emerge nel modo in cui affrontano la congestione. Nella commutazione di circuito, il
il sistema approva una richiesta di canale o la nega completamente se la richiesta
non può essere accolto. Ecco perché, se hai mai provato a utilizzare un sistema telefonico
durante alcune ore di punta, potresti aver incontrato le "informazioni speciali
tono "e un messaggio che proclama che" tutti i circuiti sono occupati ".
Il cambio di pacchetto è radicalmente diverso. Il sistema telefonico si riempie ; la posta
il sistema diventa lento . Non c'è niente nella rete per dire esplicitamente a un mittente come
ci sono molti altri mittenti o quanto è congestionata la rete
momento, e la quantità di congestione è in continua evoluzione. quindi, il
mittente e destinatario non devono solo comunicare ma metacomunicare: loro
è necessario capire quanto velocemente devono essere inviati i dati. In qualche modo, pacchetto assortito
i flussi, senza una gestione o un coordinamento espliciti, devono entrambi uscire da ciascuno
a modo tuo e sfrutta rapidamente ogni nuovo spazio disponibile.
Il risultato del lavoro investigativo di Jacobson e Karels fu una serie di flussi rivisti
algoritmi di controllo e di prevenzione della congestione: una delle modifiche più grandi

Pagina 238

a TCP in quarant'anni.
Al centro del controllo della congestione TCP c'è un algoritmo chiamato Additive
Aumento, Diminuzione moltiplicativa o AIMD. Prima che AIMD intervenga, un nuovo
connection aumenterà la sua velocità di trasmissione in modo aggressivo: se il primo pacchetto è
ricevuto con successo ne invia altri due, se entrambi riescono a farlo invia
un lotto di quattro e così via. Ma non appena l'ACK di un pacchetto non arriva
tornando al mittente, subentra l'algoritmo AIMD. Sotto AIMD, qualsiasi completamente
il lotto di pacchetti ricevuto fa sì che il numero di pacchetti in volo non raddoppi
ma semplicemente per aumentare di 1, ei pacchetti scartati causano la velocità di trasmissione
ridurre della metà (da cui il nome Aumento additivo, Diminuzione moltiplicativa).
In sostanza, AIMD assume la forma di qualcuno che dice: “Un po 'di più, un po'
di più, un po 'di più, whoa, troppo, tagliato indietro, okay un po' di più, un po '
altro ... "Quindi porta a una caratteristica forma di larghezza di banda nota come" TCP
dente di sega ": salite costanti punteggiate da ripidi dislivelli.
Perché una diminuzione così netta e asimmetrica? Come spiegano Jacobson e Karels,
la prima volta che AIMD entra in funzione è quando una connessione ha sperimentato la prima
ha lasciato cadere il pacchetto nella sua fase iniziale di espansione aggressiva. Perché quella iniziale
fase prevedeva il raddoppio della velocità di trasmissione ad ogni raffica di successo,
ridurre la velocità della metà non appena si è verificato un problema è del tutto
adeguata. E una volta che una trasmissione è in corso, se ricomincia a vacillare
è probabile che sia perché una nuova connessione è in competizione per la rete.
La valutazione più prudente di quella situazione, vale a dire, supponendo che lo fossi
l'unica persona che usa la rete e ora c'è una seconda persona che ne prende la metà
le risorse, porta anche a dimezzare. Il conservatorismo qui è essenziale:
una rete può stabilizzarsi solo se i suoi utenti si ritirano ad una velocità almeno pari alla velocità
quale è sovraccarico. Per lo stesso motivo, un aumento meramente additivo
aiuta a stabilizzare le cose per tutti, prevenendo un rapido sovraccarico e recupero
cicli.
Sebbene una distinzione così rigida tra addizione e moltiplicazione sia il
tipo di cosa improbabile da trovare in natura, il dente di sega TCP trova
risonanza in vari domini in cui l'idea è di prendere il più possibile in sicurezza
farla franca.
In una fortunata collaborazione del 2012, ad esempio, l'ecologista di Stanford
Deborah Gordon e lo scienziato informatico Balaji Prabhakar hanno scoperto che le formiche

Pagina 239
sembrano aver sviluppato algoritmi di controllo del flusso milioni di anni prima
gli umani lo hanno fatto. Come una rete di computer, una colonia di formiche deve affrontare un problema di allocazione
nel tentativo di gestire il suo "flusso", in questo caso, il flusso di formiche che si dirigono verso
foraggio per il cibo - in condizioni variabili che possono influenzare drasticamente il tasso a
che le formiche fanno viaggi di andata e ritorno di successo. E come i computer su Internet,
le formiche devono risolvere questo problema condiviso senza il vantaggio di una decisione centrale
maker, sviluppando invece quello che Gordon chiama "controllo senza gerarchia". It
si scopre che anche la soluzione delle formiche è simile: un ciclo di feedback ha successo
i raccoglitori spingono più persone a lasciare il nido, mentre i rimpatriati senza successo si traducono in a
diminuzione dell'attività di foraggiamento.
Anche altri comportamenti animali evocano il controllo del flusso TCP, con le sue caratteristiche
dente di sega. Scoiattoli e piccioni che inseguono avanzi di cibo umano si insinueranno
avanti un passo alla volta, di tanto in tanto balza indietro, quindi strisciare costantemente in avanti
ancora. E può essere che le stesse comunicazioni umane rispecchino il vero
protocolli che li trasmettono: ogni messaggio di testo o risposta e-mail incoraggia ancora
un altro, mentre ogni messaggio non restituito ne affligge il flusso.
Più in generale, AIMD suggerisce un approccio ai molti luoghi della vita in cui
lottiamo per allocare risorse limitate in condizioni incerte e fluttuanti.
Il satirico “Peter Principle”, articolato negli anni '60 dall'educazione
il professor Laurence J. Peter, afferma che “ogni dipendente tende a salire al suo livello
di incompetenza. " L'idea è che in un'organizzazione gerarchica, chiunque faccia un file
un lavoro abilmente sarà ricompensato con una promozione in un nuovo lavoro che può
comportano sfide più complesse e / o diverse. Quando finalmente il dipendente
raggiunge un ruolo in cui non si comportano bene, la loro marcia verso i ranghi lo farà
e rimarranno in quel ruolo per il resto della loro carriera. Così sta
alla ragione, va la logica inquietante del Principio di Peter, che alla fine ogni
il posto in un'organizzazione verrà riempito da qualcuno che fa quel lavoro male.
Circa cinquant'anni prima della formulazione di Peter, il filosofo spagnolo José Ortega y
Gasset nel 1910 espresse lo stesso sentimento. “Ogni dipendente pubblico dovrebbe esserlo
retrocessi al rango immediatamente inferiore ", scrisse," perché erano avanzati
finché non sono diventati incompetenti. "
Alcune organizzazioni hanno tentato di porre rimedio al principio di Peter
licenziando semplicemente i dipendenti che non avanzano. Il cosiddetto sistema Cravath,
ideato dal principale studio legale Cravath, Swaine & Moore, prevede quasi l'assunzione

Pagina 240

esclusivamente neolaureati, collocandoli negli ultimi ranghi, e poi


regolarmente promuovendoli o licenziandoli negli anni successivi. Nel 1980, il
Le forze armate statunitensi hanno adottato una politica simile "su o fuori" con l'ufficiale della difesa
Legge sulla gestione del personale. Anche il Regno Unito ha perseguito cosa
chiamano "controllo dell'equipaggio", con grande controversia.
C'è qualche alternativa, una via di mezzo tra la stagnazione istituzionale
del Principio di Peter e della severità draconiana del sistema "su o giù"? Il
L'algoritmo AIMD può offrire proprio un tale approccio, poiché è progettato esplicitamente
per gestire le esigenze di un ambiente volatile. Una rete di computer deve
gestire la propria capacità trasmissiva massima, maggiorata delle velocità di trasmissione di
i suoi clienti, che potrebbero fluttuare in modo imprevedibile. Allo stesso modo, in un'azienda
impostazione, una società ha un pool limitato di fondi per pagare le sue operazioni, e ciascuno
il lavoratore o il fornitore ha una capacità limitata per la quantità di lavoro che può svolgere e
la quantità di responsabilità che possono gestire. Tutti i bisogni, le capacità e
le collaborazioni sono sempre in evoluzione.
La lezione del TCP a dente di sega è che in maniera imprevedibile e mutevole
ambiente, spingere le cose al punto di fallire a volte è davvero il migliore
(o l'unico) modo per utilizzare al meglio tutte le risorse. Ciò che conta è fare
sicuro che la risposta al fallimento sia acuta e resiliente. Sotto AIMD, ogni
la connessione che non fa cadere la palla viene accelerata finché non lo è, e poi viene interrotta
a metà e ricomincia subito ad accelerare. E anche se violerebbe
quasi ogni norma dell'attuale cultura aziendale, si può immaginare una società in
che, ogni anno, ogni dipendente viene sempre promosso di un solo gradino
organigramma o inviato parte del percorso indietro.
Per come la vedeva Laurence J. Peter, l'insidioso Principio di Peter emerge
corporazioni a causa del “primo comandamento della vita gerarchica: il
la gerarchia deve essere preservata. " Il TCP, al contrario, insegna le virtù della flessibilità.
Le aziende parlano di gerarchie "piatte" e gerarchie "alte", ma potrebbero
considera di parlare di quelli dinamici . Sotto un sistema AIMD, nessuno è lungo
ansioso di essere sovraccarico di lavoro, né risentito a lungo per una promozione mancata;
entrambi sono correttivi temporanei e frequenti, e il sistema si avvicina al suo
equilibrio nonostante tutto cambi continuamente. Forse un giorno lo faremo
non parlare dell'arco della propria carriera, ma piuttosto del suo dente di sega.

Pagina 241

Backchannels: controllo del flusso in linguistica


Esaminando il controllo del flusso di rete è chiaro che ACK a monte
i pacchetti non solo riconoscono e confermano le trasmissioni, ma ne modellano i contorni
dell'intera interazione, del suo ritmo e cadenza. Questo ci offre sia un promemoria che
una panoramica sull'importanza del feedback per la comunicazione. In TCP, come abbiamo
visto, non esiste una trasmissione unidirezionale: senza coerente
feedback, il mittente rallenterà quasi immediatamente.
Curiosamente, la crescente consapevolezza del ruolo critico del feedback nel campo dei
il networking rispecchiava una serie quasi identica di sviluppi in corso
allo stesso tempo nella comunità linguistica. A metà del ventesimo
secolo, la linguistica era dominata dalle teorie di Noam Chomsky, che
considerava la lingua nel suo stato più perfetto e ideale: perfettamente fluente,
frasi grammaticali e ininterrotte, come se tutta la comunicazione fosse testo scritto.
Ma a partire dagli anni '60 e '70, un aumento di interesse per gli aspetti pratici di
la lingua parlata ha rivelato quanto siano elaborati e sottili i processi
governare i turni, l'interruzione e la composizione di una frase o di una storia al volo
rimanendo in sintonia con le reazioni di un ascoltatore in ogni fase del percorso. Che cosa
è emersa una visione di una comunicazione anche apparentemente unidirezionale come a
atto collaborativo. Come scrisse il linguista Victor Yngve nel 1970, “In effetti, entrambi
la persona che ha il turno e il suo partner sono impegnati contemporaneamente in entrambi
parlare e ascoltare. Ciò è dovuto all'esistenza di ciò che chiamo il retro
canale, sul quale la persona che ha il turno riceve brevi messaggi come
"sì" e "uh-huh" senza rinunciare al turno. "
Un esame dei "canali secondari" umani ha aperto un orizzonte completamente nuovo
campo della linguistica, sollecitando una completa rivalutazione delle dinamiche di
comunicazione, in particolare, il ruolo dell'ascoltatore. In uno studio illustrativo, a
il team guidato da Janet Bavelas presso l'Università di Victoria ha studiato cosa avrebbe fatto
capita quando qualcuno che ascolta una storia personale si è distratto: non cosa
succederebbe alla comprensione dell'ascoltatore, ma cosa succederebbe al
storia . Con scarso feedback, hanno scoperto, la storia va in pezzi.
I narratori che hanno raccontato storie ravvicinate ad ascoltatori distratti ... hanno raccontato loro meno bene nel complesso e

Pagina 242

particolarmente male in quella che avrebbe dovuto essere la drammatica conclusione. La loro fine della storia era
bruschi o instabili, oppure giravano intorno e ripetevano il finale più di una volta, e spesso
ha giustificato la loro storia spiegando l'ovvia chiamata ravvicinata.

Abbiamo tutti avuto l'esperienza di parlare con qualcuno i cui occhi si sono allontanati
- al loro telefono, forse - facendoci domandare se il nostro è poco brillante
la narrazione era la colpa. In effetti, ora è chiaro che la causa e l'effetto lo sono
spesso il contrario: un povero ascoltatore distrugge il racconto.
Comprensione della funzione e del significato esatti dei backchannel umani
continua ad essere un'area di ricerca attiva. Nel 2014, ad esempio, UC Santa
Jackson Tolins e Jean Fox Tree di Cruz hanno dimostrato che quelli poco appariscenti
"Uh-huhs" e "yeahs" e "hmms" e "ohs" che punteggiano il nostro discorso
ruoli distinti e precisi nella regolazione del flusso di informazioni da chi parla a
ascoltatore: sia la velocità che il livello di dettaglio. In effetti, sono altrettanto critici quanto
Gli ACK sono in TCP. Dice Tolins, "Davvero, mentre alcune persone potrebbero essere peggio di
altri, i "cattivi narratori" possono incolpare almeno in parte il loro pubblico ". Questo
la realizzazione ha avuto l'effetto collaterale inaspettato di alleviare parte della pressione
quando tiene lezioni, comprese, ovviamente, lezioni su quel risultato.
“Ogni volta che tengo questi discorsi di backchannel, dico sempre al pubblico che il
il modo in cui stanno tornando indietro al mio discorso in questo momento sta cambiando quello che dico ", lui
scherza, "quindi sono responsabili di come sto bene".

Bufferbloat: è la latenza, stupido


Lo sviluppo di un'efficace gestione attiva delle code è stato ostacolato da
idee sbagliate sulla causa e sul significato delle code.

—KATHLEEN NICHOLS E VAN JACOBSON


Era l'estate del 2010 e, come molti genitori, Jim Gettys era in campo
frequenti lamentele da parte dei suoi figli che la rete wi-fi di famiglia era in funzione
lentamente. A differenza della maggior parte dei genitori, però, Gettys ha lavorato presso HP, Alcatel-Lucent,
il World Wide Web Consortium e l'Internet Engineering Task Force. Lui
è stato letteralmente l'editor, nel 1999, delle specifiche HTTP ancora in uso oggi. Così

Pagina 243

dove la maggior parte dei papà smanettoni avrebbe esaminato il problema, Gettys ha esaminato il
problema .
Come spiegherebbe Gettys a una stanza piena di ingegneri di Google, con il networking
il gergo lascia il posto a una convinzione urgente e inequivocabile:

Mi è capitato di copiare, o risincronizzare, i vecchi archivi dell'X Consortium da casa mia al MIT
questo percorso lungo dieci millisecondi ... SmokePing [stava] segnalando latenze in media ben superiori a uno
secondo, insieme a una brutta perdita di pacchetti, proprio durante la copia di un file ... Ho preso Wireshark, e c'erano
queste esplosioni di comportamento davvero strano ... Questo non sembrava affatto un TCP [a dente di sega] che mi aspettavo. It
non dovrebbe mai accadere in questo modo.

In un inglese semplice, ha visto qualcosa ... molto strano. Come dice il proverbio, "il massimo
frase eccitante da ascoltare nella scienza, quella che annuncia nuove scoperte, non lo è
"Eureka!" ma "È divertente" ".
All'inizio Gettys pensava che qualcosa non andasse con il suo modem via cavo.
Quello che la sua famiglia aveva chiamato un problema in Internet sembrava un traffico
incepparsi nella presa a muro. I pacchetti destinati a Boston non si bloccavano
a metà strada lì; stavano rimanendo bloccati in casa.
Ma più Gettys lo approfondiva, più si preoccupava. Il
il problema non riguardava solo il router e il modem di casa, ma tutti i router domestici
e modem. E il problema non era solo nei dispositivi di rete, ma in
computer stessi, in desktop, laptop, tablet e smartphone, tessuti
in Linux, Windows e OS X. E non solo nell'hardware dell'utente finale:
ha toccato la stessa infrastruttura di Internet stessa. Gettys si è seduto a
pranzi con i principali attori di Comcast, Verizon, Cisco e Google, incluso Van
Jacobson e Vint Cerf, e lentamente hanno iniziato a mettere insieme i pezzi del puzzle.
Il problema era ovunque. E il problema era bufferbloat.
Un buffer è essenzialmente una coda la cui funzione è di smussare i burst. Se tu
è entrato in un negozio di ciambelle all'incirca nello stesso momento di un altro cliente
non farebbe per il cassiere momentaneamente sopraffatto per fare uno di voi
lasciare il negozio e tornare un'altra volta. I clienti non l'avrebbero, di
Certo, ma nemmeno il management: una simile politica è praticamente garantita
sottoutilizzare il cassiere. Mettere i clienti in coda invece garantisce che il file
il throughput medio del negozio si avvicina al throughput massimo . È un

Pagina 244

buona cosa.
Tuttavia, questo utilizzo superiore delle risorse ha un costo molto reale:
ritardo. Quando Tom ha portato sua figlia a un festival del Cinco de Mayo a Berkeley, lei
le misero il cuore su una crêpe al cioccolato e banana, così si misero in fila e aspettarono.
Alla fine, dopo venti minuti, Tom è arrivato in prima fila e si è piazzato
il suo ordine. Ma dopo aver pagato, hanno dovuto aspettare altri quaranta minuti per effettivamente
prendi la crêpe. (Come Jim Gettys, Tom si è subito trovato a mettere in campo un sostanziale
volume di reclami familiari.) Prendere ordini si è rivelato richiedere meno tempo di
fare le crêpes, quindi la fila per ordinare era solo la prima parte del problema. A
almeno era visibile, però; i clienti sapevano cosa stavano aspettando. Il secondo,
la coda più lunga era invisibile. Quindi in questo caso sarebbe stato molto più felice
risultato per tutti se il supporto per crepe avesse tagliato la linea in un punto e messo
segno che non prendevano ordini per un po '. Allontanare i clienti
avrebbe fatto stare tutti meglio, se fossero finiti in una crêpe più corta
linea o è andato altrove. E non sarebbe costato un centesimo di perdita alla bancarella di crêpe
vendite, perché in entrambi i casi possono vendere solo tante crepes quante ne possono fare
un giorno, indipendentemente da quanto tempo stanno aspettando i loro clienti.
Questo è precisamente il fenomeno che Jim Gettys stava osservando a casa sua
modem via cavo. Poiché stava caricando un file, il suo computer stava inviando il file
modem quanti più pacchetti upstream può gestire. E il modem lo era
fingendo di sopportare molto di più di quanto potrebbe effettivamente, senza respingerne nessuno
costruire una coda enorme. Quindi, quando Gettys ha provato a scaricare qualcosa in
allo stesso tempo, per visitare una pagina web o controllare la posta elettronica, riceverebbero i suoi pacchetti ACK
bloccato dietro l'upload, dovendo aspettare in linea al modem per uscire di casa.
Poiché i suoi ACK impiegavano un'eternità per tornare al server web e di posta elettronica, il file
i server a loro volta limiterebbero le proprie velocità di connessione a valle a un file
scansione corrispondente.
Era come cercare di avere una conversazione in cui ogni volta che dici "uh-huh"
è ritardato di dieci o venti secondi. L'altoparlante rallenterà molto,
supponendo che non li comprendi e non c'è niente che tu possa fare al riguardo
esso.
Quando un buffer di rete si riempie, ciò che accade tipicamente è chiamato Tail
Drop : un modo poco cerimonioso per dire che ogni pacchetto arriva dopo
il punto viene semplicemente rifiutato ed effettivamente eliminato. (Allontanando nuovi clienti

Pagina 245

dalla bancarella in crêpe una volta che la linea diventa troppo lunga sarebbe una versione di Tail Drop
in un contesto umano.) Data la metafora postale per il cambio di pacchetto, potrebbe
sembra un po 'strano immaginare un corriere che semplicemente vaporizza ogni pacco che lo fa
non entra nel camion quella mattina. Eppure sono proprio questi "pacchetti"
che portano un computer a notare che uno dei suoi pacchetti non è stato riconosciuto,
chiedendo ad AIMD di iniziare a dimezzare la larghezza di banda. I pacchetti rilasciati sono i file
Il principale meccanismo di feedback di Internet. Un buffer troppo grande: un ristorante
prendere ogni ordine, non importa quanto a corto di personale sia la cucina, prendere un modem
ogni pacchetto che arriva indipendentemente da quanto tempo ci vorrà per inviarli su—
impedisce che questa moderazione avvenga come dovrebbe.
Fondamentalmente, i buffer utilizzano il ritardo, noto nelle reti come "latenza", in
per massimizzare la produttività. Cioè, fanno aspettare i pacchetti (o i clienti),
per approfittare dei periodi successivi quando le cose sono lente. Ma un buffer che è
operare permanentemente a pieno ti dà il peggio di entrambi i mondi: tutta la latenza
e nessuno dei doni. Smussare le raffiche è fantastico se lo sei, in media ,
chiarendo le cose almeno alla stessa velocità con cui arrivano, ma se la tua media
il carico di lavoro supera il ritmo di lavoro medio, nessun buffer può fare miracoli. E il
più grande è il buffer, più arretrerai prima di iniziare a segnalare
Aiuto. Uno dei principi fondamentali dei buffer, siano essi per pacchetti o
clienti, è che funzionano correttamente solo quando vengono regolarmente azzerati.
Per decenni, la memoria del computer è stata sufficientemente costosa che ci fosse
semplicemente nessun motivo per costruire modem con una gran quantità di capacità di memoria non necessaria.
Quindi, semplicemente non c'era modo per un modem di creare una coda più grande
di quanto potrebbe gestire. Ma a un certo punto, come economie di scala nel computer
l'industria ha abbassato radicalmente il costo della memoria, i produttori di modem hanno iniziato
dando alle loro macchine gigabyte di RAM perché quello era effettivamente il file
la più piccola quantità di RAM che potrebbero ottenere. Di conseguenza, il dispositivo onnipresente
buffer: in modem, router, laptop, smartphone e nella spina dorsale di
Internet stesso è diventato migliaia di volte troppo grande, prima di persone come Jim
Gettys ha lanciato l'allarme per fare qualcosa al riguardo.

Meglio mai che tardi

Pagina 246
Prendi il tuo problema più elementare come una singola persona ... piaci a qualcuno, tu
non piacergli indietro. A un certo punto, era una specie di imbarazzo
situazione. Hai dovuto fare una conversazione, è stato strano. Ora cosa fai
fare? Qualcuno ti piace, non ti piacciono indietro? Fai solo finta di esserlo
occupato ... per sempre.

—AZIZ ANSARI
Adesso è meglio che mai.
Anche se spesso non è mai meglio di adesso.
- LO ZEN DI PITONE

La cantante Katy Perry ha il 107% in più di follower su Twitter rispetto al suo stato d'origine
La California ha persone. La persona più seguita su Twitter, all'inizio del 2016
conta circa 81,2 milioni di account tra i suoi fan. Ciò significa che anche se
Il 99% dei suoi fan non le invia mai messaggi, e anche se l'1% più devoto
chi le invia un messaggio lo fa solo una volta all'anno, quindi riceve ancora 2.225 messaggi a
giorno. Ogni singolo giorno.
Immagina se Perry si impegnasse a rispondere a ogni messaggio dei fan nell'ordine
ricevuto. Se potesse rispondere a 100 al giorno, il tempo di attesa previsto dai fan per un file
la risposta sarebbe presto misurata in decenni . È giusto immaginare che la maggior parte dei fan
preferirei una minima possibilità di ottenere una risposta immediata a una risposta garantita
tra dieci o venti anni.
Nota che Perry non ha questo problema quando lascia un locale e deve
corri un guanto di fan che si aspettano un autografo o poche parole. Perry fa cosa
lei può, va avanti e le opportunità perse svaniscono. Il corpo è il suo flusso
controllo. Non possiamo essere in più di un posto contemporaneamente. A una festa affollata noi
inevitabilmente partecipa a meno del 5% della conversazione e non riesce a leggere o
recuperare il ritardo sul resto. I fotoni che perdono la retina non vengono messi in coda per dopo
visualizzazione. Nella vita reale, la perdita di pacchetti è quasi totale.
Usiamo l'idioma di "palle cadute" quasi esclusivamente in modo dispregiativo
senso, il che implica che la persona in questione fosse pigra, compiacente o smemorata.
Ma il lancio tattico delle palle è una parte fondamentale per portare a termine le cose
sovraccarico.

Pagina 247

La critica più diffusa alle comunicazioni moderne è che lo siamo


"Sempre connesso." Ma il problema non è che siamo sempre connessi; siamo
non. Il problema è che siamo sempre tamponati . La differenza è enorme.
La sensazione di dover guardare tutto su Internet o leggere tutto
libri possibili, o vedere tutti gli spettacoli possibili, è bufferbloat. Ti perdi un episodio di
la tua serie preferita e guardala un'ora, un giorno, un decennio dopo. Continua
vacanza e tornare a casa in una montagna di corrispondenza. Era quello
la gente ha bussato alla tua porta, non ha avuto risposta e se n'è andata. Adesso lo sono
aspettando effettivamente in fila quando torni a casa.
Diamine, l'email è stata deliberatamente progettata per superare Tail Drop. Come suo
l'inventore, Ray Tomlinson, lo afferma:

A quel tempo non esisteva un modo veramente buono per lasciare messaggi alle persone. Il telefono ha funzionato fino a
punto, ma qualcuno doveva essere lì per ricevere la chiamata. E se non era la persona che volevi ottenere, lo era
era un assistente amministrativo o un servizio di segreteria telefonica o qualcosa del genere. Quello era il
meccanismo che dovevi passare per lasciare un messaggio, quindi tutti si sono attaccati all'idea che tu
potrebbe lasciare messaggi sul computer.

In altre parole, abbiamo chiesto un sistema che non respingesse mai un mittente,
e nel bene o nel male ne abbiamo uno. In effetti, negli ultimi quindici anni, il trasferimento
dalla commutazione di circuito alla commutazione di pacchetto si è diffusa in tutta la società.
Chiedevamo circuiti dedicati con altri; ora inviamo loro pacchetti
e attendi con ansia gli ACK. Abbiamo usato per rifiutare ; ora rimandiamo .
La tanto lamentata "mancanza di pigrizia" di cui si legge è, perversamente, la
caratteristica principale dei buffer: portare il throughput medio al throughput massimo.
Prevenire l'ozio è quello che fanno. Controlli la posta dalla strada, da
vacanza, in bagno, nel cuore della notte. Non sei mai, mai annoiato. Questo
è la benedizione mista dei buffer, che operano come pubblicizzato.
Gli autorisponditori di e-mail di vacanza dicono esplicitamente ai mittenti di aspettarsi latenza; un'
meglio si potrebbe invece dire ai mittenti di aspettarsi Tail Drop. Piuttosto che avvertire
mittenti di tempi di coda superiori alla media, potrebbe avvertirli che era semplicemente
rifiutando tutti i messaggi in arrivo. E questo non deve essere limitato a
vacanze: si può immaginare un programma di posta elettronica impostato per rifiutare automaticamente tutte le in arrivo
messaggi una volta che la posta in arrivo ha raggiunto, diciamo, un centinaio di elementi. Questo è sconsiderato per

Pagina 248

bollette e simili, ma non un approccio irragionevole, diciamo, agli inviti sociali.


L'idea di incontrare una casella di posta "piena" o una casella vocale "piena" è un anacronismo
ora, un lampante ritorno alla fine del ventesimo secolo e all'inizio degli anni 2000. Ma se
le reti che collegano i nostri nuovi telefoni e computer, con i loro
memoria effettivamente infinita, stanno ancora facendo cadere deliberatamente i pacchetti quando le cose
diventa veloce e furioso, allora forse c'è motivo di pensare a Tail Drop non come il
deplorevole conseguenza dello spazio di memoria limitato ma come strategia mirata in
suo diritto.
Per quanto riguarda il bufferbloat della rete, la storia in corso è complicata ma felice,
coinvolgendo sforzi su larga scala da parte dei produttori di hardware e sistemi operativi per
apportare modifiche fondamentali alle code di rete. C'è anche una proposta per un nuovo
backchannel per TCP, la prima modifica del genere da molti anni: Explicit
Notifica di congestione, o ECN. Districare completamente Internet da bufferbloat
attingerà a tutti questi cambiamenti e richiederà la pazienza di molti anni. "Questo
è una palude a lungo termine ", afferma Gettys.
Ma c'è molto da aspettarsi per un futuro post-bufferbloat. Con i loro
latenza intrinseca, i buffer sono dannosi per la maggior parte dei processi interattivi. Quando parliamo
via Skype, ad esempio, ora generalmente preferiamo un segnale occasionalmente statico
per una registrazione chiara di ciò che il nostro chiamante ha detto tre secondi fa. Per i giocatori, anche un file
Il ritardo di 50 millisecondi potrebbe essere la differenza tra fragging ed essere fragging;
infatti, il gioco è così sensibile alla latenza che tutti gli importanti riconoscimenti di gioco lo sono
ancora contestato di persona, con i giocatori che si imbarcano sugli aerei per radunarsi e competere
su una rete che serve solo una singola stanza. E lo stesso vale per
qualsiasi altra cosa in cui la sincronizzazione è importante. “Se vuoi suonare musica con il tuo
amici, anche nella [vostra] area metropolitana, vi interessano decine di millisecondi ",
Gettys osserva, immaginando tutta una serie di nuove applicazioni e aziende che
potrebbe nascere per sfruttare il potenziale interattivo delle basse latenze.
“Una generalizzazione che tolgo da tutta questa esperienza è che gli ingegneri
dovrebbe pensare al tempo come un cittadino di prima classe ".
Stuart Cheshire di Apple concorda sul fatto che è giunto il momento che la latenza diventi un file
priorità assoluta per gli ingegneri di rete. È sconvolto dalle aziende che fanno pubblicità
Le connessioni Internet "veloci" si riferiscono solo a una larghezza di banda elevata, non a un ritardo basso. Di
analogamente, osserva che un Boeing 737 e un Boeing 747 volano entrambi verso le cinque
cento miglia all'ora; il primo può contenere 120 passeggeri, mentre il secondo

Pagina 249

ne trasporta tre volte di più. Quindi "diresti che un Boeing 747 è tre volte
"più veloce" di un Boeing 737? Certo che no ”, esclama Cheshire. La capacità sì
a volte importa: per il trasferimento di file di grandi dimensioni, la larghezza di banda è la chiave. (Se hai un file
un'enorme quantità di carico da spostare, una nave portacontainer potrebbe trarne migliaia
scatta con un 747.) Per applicazioni interumane, tuttavia, tempi di consegna rapidi
è spesso molto più importante, e ciò di cui abbiamo veramente bisogno sono più Concorde. E
in effetti, ridurre le latenze è una delle attuali frontiere del networking
ricerca, e sarà interessante vedere cosa porterà.
Nel frattempo, ci sono altre battaglie da intraprendere. Gettys attira la sua attenzione
via per un secondo, guardando fuori dall'inquadratura. “Non funziona per te? io sono
sto parlando con qualcuno in questo momento, e me ne occuperò quando avrò finito. Siamo
concludendo qui — uh, no, i 5 GHz stanno funzionando al momento, i 2,4 GHz
il canale si è bloccato. È il famigerato bug. Riavvio il router. " Che sembra un file
momento opportuno per salutare e liberare la nostra banda a
commons, alla miriade di flussi che fanno aumentare il loro additivo.

Pagina 250

11 Teoria dei giochi


Le menti degli altri

Sono ottimista nel senso che credo che gli esseri umani siano nobili e onorevoli,
e alcuni di loro sono davvero intelligenti ... Ho un po 'più pessimista
vista di persone in gruppi.

-STEVE JOBS
Un investitore vende un'azione a un altro, uno convinto che sia andato giù e il
altri convinti che stia salendo; Penso di sapere cosa pensi ma non ne ho idea
cosa pensi io penso; scoppia una bolla economica; un potenziale amante offre a
regalo che non dice né "voglio essere più che amici" né "non voglio essere
più che amici"; un tavolo di commensali litiga su chi dovrebbe trattare chi e
perché; qualcuno che cerca di essere utile offende involontariamente; qualcuno che si sforza
essere cool attira risatine; qualcuno che cerca di staccarsi dalla mandria trova,
sgomento, la mandria che seguiva il suo esempio. "Ti amo", dice un amante a un altro;
“Anch'io ti amo”, risponde l'altro; ed entrambi si chiedono cosa sia esattamente l'altro
significa con quello.
Che cosa ha da dire l'informatica su tutto questo?
Agli scolari viene insegnato a concepire le trame letterarie come appartenenti a uno di
diverse categorie: uomo contro natura, uomo contro sé, uomo contro uomo, uomo contro società.
Finora in questo libro abbiamo considerato principalmente i casi nei primi due
categorie, vale a dire che l'informatica è stata finora la nostra guida
problemi creati dalla struttura fondamentale del mondo e dal nostro limitato
capacità di elaborazione delle informazioni. Ne derivano ottimi problemi di arresto

Pagina 251

l'irreversibilità e irrevocabilità del tempo; il dilemma esplora / sfrutta, da


offerta limitata nel tempo. Il rilassamento e la randomizzazione emergono come vitali e
strategie necessarie per affrontare l'ineluttabile complessità delle sfide
come la pianificazione del viaggio e le vaccinazioni.
In questo capitolo spostiamo l'attenzione e consideriamo i restanti due generi:
cioè, uomo contro uomo e uomo contro società: in effetti, i problemi che ci poniamo
e causarsi l'un l'altro. La nostra migliore guida a questo terreno viene da un ramo di
matematica conosciuta come teoria dei giochi, un campo che nella sua incarnazione classica aveva
un enorme impatto sul ventesimo secolo. Negli ultimi due decenni,
l'impollinazione incrociata tra teoria dei giochi e informatica ha prodotto il
campo della teoria dei giochi algoritmica , che ha già iniziato ad avere un impatto
il ventunesimo.

Ricorsione
Ora, un uomo intelligente metterebbe il veleno nel suo calice perché lui
saprebbe che solo un grande sciocco raggiungerebbe ciò che gli è stato dato. sono
non è un grande sciocco, quindi non posso chiaramente scegliere il vino di fronte a te. Ma
dovevi sapere che non ero un grande sciocco: ci avresti contato
—Quindi chiaramente non posso scegliere il vino davanti a me.
- LA PRINCIPESSA SPOSA
Probabilmente l'economista più influente del ventesimo secolo, John Maynard
Keynes, una volta ha detto che “investire con successo significa anticipare le anticipazioni di
altri." Per vendere una quota di azioni a, diciamo, $ 60, l'acquirente deve credergli
può venderlo in seguito per $ 70, a qualcuno che crede di poterlo vendere per $ 80 a
qualcuno che crede di poterlo vendere per $ 90 a qualcuno che crede di poterlo vendere
per $ 100 a qualcun altro. In questo modo, il valore di un'azione non è quello che le persone
penso che valga la pena, ma quello che la gente pensa la gente pensa che valga la pena. In effetti, anche quello è
non andando abbastanza lontano. Come disse Keynes, facendo una distinzione cruciale tra
bellezza e popolarità:

L'investimento professionale può essere paragonato a quei concorsi di giornali in cui i concorrenti

Pagina 252

devono scegliere i sei volti più belli da un centinaio di fotografie, il premio viene assegnato al
concorrente la cui scelta corrisponde più quasi alle preferenze medie dei concorrenti come a
totale; in modo che ogni concorrente debba scegliere, non quelle facce che lui stesso trova più belle, ma quelle
che ritiene più probabile catturare la fantasia degli altri concorrenti, che stanno tutti guardando il
problema dallo stesso punto di vista. Non si tratta di scegliere quelli che, al meglio di sé
giudizio, sono davvero le più belle, e nemmeno quelle che l'opinione media pensa sinceramente le più belle.
Abbiamo raggiunto il terzo grado in cui dedichiamo le nostre intelligenze ad anticipare quale media
opinion si aspetta che l'opinione media sia. E ci sono alcuni, credo che praticano il quarto,
quinto e gradi superiori.

L'informatica illustra i limiti fondamentali di questo tipo di


ragionando con quello che viene chiamato il "problema dell'arresto". Come ha dimostrato Alan Turing
1936, un programma per computer non può mai dirti con certezza se un altro programma
potrebbe finire per calcolare per sempre senza fine, tranne che simulando il
funzionamento di quel programma e quindi potenzialmente andando fuori dal profondo stesso.
(Di conseguenza, i programmatori non avranno mai strumenti automatici in grado di informarli
se il loro software si bloccherà.) Questo è uno dei risultati fondamentali in tutto
di informatica, su cui pendono molte altre prove.* In poche parole, in qualsiasi momento a
sistema, sia esso una macchina o una mente, simula il funzionamento di qualcosa come
complesso come se stesso, trova le sue risorse totalmente esaurite, più o meno da
definizione. Gli informatici hanno un termine per questo viaggio potenzialmente infinito
nella sala degli specchi, menti che simulano menti che simulano menti: "ricorsione".
"Nel poker, non giochi mai la tua mano", dice James Bond in Casino Royale ;
"Interpreti l'uomo di fronte a te." In effetti, ciò che suoni veramente è un file
ricorsione teoricamente infinita. C'è la tua mano e la mano in cui credi
avere il tuo avversario; poi la mano in cui credi che il tuo avversario ti crede
hanno, e la mano ritieni che il tuo avversario crede di credere che ha ...
e così via. "Non so se questo sia un vero termine di teoria dei giochi", dice il
il giocatore di poker più apprezzato al mondo, Dan Smith, “ma i giocatori di poker lo chiamano 'livellamento'.
Il primo livello è "Lo so". Due è "sai che lo so". Tre, "lo so che tu
sappi che lo so. Ci sono situazioni in cui arriva semplicemente dove sei
tipo, 'Wow, questo è un posto davvero stupido per bluffare, ma se sa che è un posto stupido
bluffare poi non mi chiamerà ed è lì che è il punto intelligente per bluffare. '
Queste cose accadono. "
Uno dei bluff più memorabili nel poker di alto livello si è verificato quando Tom
Dwan ha scommesso $ 479,500 sulla mano peggiore in assoluto di Texas Hold 'Em, il
Pagina 253

2-7 — mentre diceva letteralmente al suo avversario, Sammy George, che lo teneva in mano.
"Non hai due sette", rispose George. "Non hai due sette."
George ha passato e Dwan - con, sì, due-sette - ha preso il piatto.
Nel poker, la ricorsione è un gioco pericoloso. Non vuoi farti beccare
passo dietro al tuo avversario, ovviamente, ma c'è anche un imperativo da non prendere
troppo avanti a loro. “C'è una regola che in realtà vuoi solo giocare
un livello sopra il tuo avversario ", spiega la professionista del poker Vanessa Rousso.
“Se giochi troppo al di sopra del tuo avversario, penserai che lo hanno fatto
informazioni che in realtà non hanno - [e] non saranno in grado di raccogliere le
informazioni che vuoi che raccolgano dalle tue azioni. " A volte poker
Nel frattempo i professionisti attireranno deliberatamente il loro avversario in una contorta ricorsione
giocando a poker completamente da manuale e non psicologico. Questo è
noto come attirarli in "una guerra livellante contro se stessi".
(Attirare un avversario in un'inutile ricorsione può essere una strategia efficace in
anche altri giochi. Uno degli episodi più colorati, bizzarri e affascinanti in
la storia degli scacchi uomo contro macchina è arrivata in uno scontro lampo nel 2008 tra
Il grande maestro americano Hikaru Nakamura e il principale programma di scacchi per computer
Rybka. In una partita in cui ogni squadra ha avuto solo tre minuti per giocare tutti
delle loro mosse o perdere automaticamente, il vantaggio sembrava sicuramente essere sul
lato del computer, in grado di valutare milioni di posizioni ogni secondo,
e di fare la sua mossa senza contrarre un muscolo. Ma Nakamura immediatamente
ha bloccato il tabellone e ha proceduto a fare mosse ripetitive e senza senso come
veloce come poteva fare clic. Nel frattempo, il computer ha sprecato momenti preziosi
alla ricerca inutile di varianti vincenti che non esistevano e al tentativo ostinato
per anticipare tutte le possibili mosse future di Nakamura, che lui stesso era
semplicemente facendo l'equivalente degli scacchi di girarsi i pollici. Quando il computer
aveva quasi esaurito il suo tempo e cominciò a dimenarsi per non perdere il tempo,
Nakamura ha finalmente aperto la posizione e si è schiantato.)
Dati i pericoli della ricorsione, come riescono i professionisti del poker a uscirne? Essi
usa la teoria dei giochi. “A volte puoi trovare dei motivi per sfruttare lo sfruttamento
[livellamento] giocate, ma per la maggior parte del tempo fai solo giocate inferiori
ragioni che in realtà sono solo rumore ", spiega Dan Smith. “Cerco davvero di avere
un livello base di comprensione della teoria nella maggior parte delle situazioni ... Inizio sempre
sapere o cercare di sapere cosa sia Nash ".

Pagina 254

Allora, qual è Nash?

Raggiungere l'equilibrio
Conosci le regole, e anch'io ...
Conosciamo il gioco e lo giocheremo.

—RICK ASTLEY
La teoria dei giochi copre uno spettro incredibilmente ampio di scenari di cooperazione
e la concorrenza, ma il field è iniziato con quelli che assomigliano al poker heads-up: due-
persone garequesti
analizzando in cui giochi
il guadagno di di
si cerca unidentificare
giocatore è un
la perdita di un
cosiddetto altro giocatore.
equilibrio : cioè unMatematici
insieme di
strategie che entrambi i giocatori possono seguire in modo tale che nessuno dei due giocatori vorrebbe
cambiare il proprio gioco, dato il gioco del proprio avversario. Si chiama un
equilibrio perché è stabile, nessuna ulteriore riflessione da parte di nessuno dei giocatori
li porterà a scelte diverse. Sono contento della mia strategia, data la tua
e ti accontenti della tua strategia, data la mia.
In sasso-carta-forbici, ad esempio, l'equilibrio ce lo dice, forse
poco emozionante, per scegliere uno dei gesti delle mani omonimi completamente a
casuale, ciascuno circa un terzo delle volte. Ciò che rende stabile questo equilibrio è
che, una volta che entrambi i giocatori adottano questa strategia 1 ⁄ 3 - 1 ⁄ 3 - 1 ⁄ 3 , non c'è niente di meglio per
sia da fare che restare con esso. (Se provassimo a suonare, diciamo, più rock, il nostro avversario
noterebbe rapidamente e inizierebbe a suonare più carta, il che ci farebbe giocare
altre forbici, e così via finché non ci siamo sistemati entrambi nell'equilibrio 1 ⁄ 3 - 1 ⁄ 3 - 1 ⁄ 3
ancora.)
In uno dei risultati seminali nella teoria dei giochi, il matematico John Nash
ha dimostrato nel 1951 che ogni partita a due giocatori ha almeno un equilibrio. Questo
una grande scoperta avrebbe fatto guadagnare a Nash il Premio Nobel per l'economia nel 1994 (e
portare al libro e al film A Beautiful Mind , sulla vita di Nash). Come un
l'equilibrio è ora spesso definito come l '"equilibrio di Nash", il "Nash" quello
Dan Smith cerca sempre di tenerne traccia.
A prima vista, il fatto che un equilibrio di Nash esiste sempre in due giocatori

Pagina 255

i giochi sembrerebbero portarci un po 'di sollievo dalle ricorsioni della sala degli specchi
che caratterizzano il poker e molti altri concorsi familiari. Quando ci sentiamo
noi stessi cadendo nella tana del coniglio ricorsiva, abbiamo sempre un'opzione per farlo
uscire dalla testa del nostro avversario e cercare l'equilibrio, andando direttamente a
la migliore strategia, assumendo un gioco razionale. In sasso-carta-forbici, scrutando
il viso del tuo avversario per i segni di ciò che potrebbe lanciare dopo potrebbe non essere
utile, se sai che il semplice lancio a caso è un imbattibile
strategia a lungo termine.
Più in generale, l'equilibrio di Nash offre una previsione della stabilità a lungo
risultato a termine di qualsiasi insieme di regole o incentivi. In quanto tale, fornisce un inestimabile
strumento per prevedere e dare forma alla politica economica, nonché alla politica sociale in
generale. Come dice l'economista premio Nobel Roger Myerson, il Nash
l'equilibrio “ha avuto un impatto fondamentale e pervasivo nell'economia e nel
scienze sociali che è paragonabile a quella della scoperta del doppio del DNA
elica nelle scienze biologiche. "
L'informatica, tuttavia, ha complicato questa storia. In parole povere, il
oggetto di studio in matematica è la verità ; l'oggetto di studio in informatica è
complessità . Come abbiamo visto, non è sufficiente che un problema abbia una soluzione se
quel problema è intrattabile.
In un contesto di teoria dei giochi, sapere che esiste un equilibrio in realtà non lo è
dicci di cosa si tratta o come arrivarci. Come scienziato informatico della UC Berkeley
Christos Papadimitriou scrive, la teoria dei giochi “predice l'equilibrio degli agenti
comportamento tipicamente senza riguardo ai modi in cui tale stato sarà
raggiunto - una considerazione che sarebbe la prima cosa di un informatico
preoccupazione." Tim Roughgarden di Stanford fa eco al sentimento dell'essere
insoddisfatto della prova di Nash che gli equilibri esistono sempre. "Va bene", dice, "ma
siamo scienziati informatici, giusto? Dacci qualcosa che possiamo usare. Non limitarti a dirlo
me che c'è; dimmi come trovarlo. " E così, il campo di gioco originale
la teoria ha generato la teoria dei giochi algoritmica, cioè lo studio dell'ideale teorico
strategie per i giochi è diventato lo studio di come le macchine (e persone) vengono in su
con strategie per i giochi.
A quanto pare, fare troppe domande sugli equilibri di Nash ti fa entrare
problemi di calcolo in fretta. Entro la fine del ventesimo secolo,
determinare se un gioco ha più di un equilibrio o un equilibrio

Pagina 256

che dà a un giocatore una certa ricompensa, o un equilibrio che implica prendere a


un'azione particolare, si erano rivelati tutti problemi intrattabili. Quindi, da
Dal 2005 al 2008, Papadimitriou ei suoi colleghi lo hanno dimostrato semplicemente trovando Nash
anche gli equilibri sono intrattabili.
Giochi semplici come sasso-carta-forbici possono avere equilibri visibili in a
colpo d'occhio, ma nei giochi di complessità del mondo reale ora è chiaro che non possiamo accettare
ammesso che i partecipanti potranno scoprire o raggiungere il gioco
equilibrio. Questo, a sua volta, significa che i progettisti del gioco non possono necessariamente usare
l'equilibrio per prevedere come si comporteranno i giocatori. Le ramificazioni di questo
I risultati che fanno riflettere sono profondi: gli equilibri di Nash hanno occupato un posto sacro all'interno
teoria economica come un modo per modellare e prevedere il comportamento del mercato, ma quel posto
potrebbe non essere meritato. Come spiega Papadimitriou, “Se un concetto di equilibrio è
non calcolabile in modo efficiente, gran parte della sua credibilità come previsione del comportamento
di agenti razionali è perduto. " Scott Aaronson del MIT è d'accordo. "Secondo me", lui
dice, “se il teorema che gli equilibri di Nash esistono è considerato rilevante per i dibattiti
sul (diciamo) libero mercato contro l'intervento del governo, poi il teorema che
anche trovare questi equilibri è [intrattabile] dovrebbe essere considerato rilevante. " Il
le capacità predittive degli equilibri di Nash contano solo se quegli equilibri possono effettivamente
essere trovato dai giocatori. Per citare l'ex direttore della ricerca di eBay, Kamal
Jain, "Se il tuo laptop non riesce a trovarlo, nemmeno il mercato può farlo".

Strategie dominanti, nel bene e nel male


Anche quando possiamo raggiungere un equilibrio, solo perché è stabile non ce la fa
bene . Può sembrare paradossale, ma la strategia dell'equilibrio - dove nessuno dei due
il giocatore è disposto a cambiare tattica - non è necessariamente la strategia quella
porta ai migliori risultati per i giocatori. Da nessuna parte è meglio illustrato di
nel gioco per due giocatori più famoso, provocatorio e controverso della teoria dei giochi:
"Il dilemma del prigioniero."
Il dilemma del prigioniero funziona come segue. Immagina che tu e un co-
cospiratori sono stati arrestati dopo aver rapinato una banca e sono detenuti
celle di prigione separate. Ora devi decidere se "cooperare" tra loro
- rimanendo in silenzio e non ammettendo nulla - o "disertando" dal tuo

Pagina 257

partnership denunciando l'altro alla polizia. Lo sai se entrambi


cooperare tra di loro e tacere, lo stato non ha abbastanza
prove per condannare uno di voi, quindi andrete entrambi liberi, dividendo il bottino
- mezzo milione di dollari ciascuno, diciamo. Se uno di voi presenta un difetto e informa sul
l'altro, e l'altro non dice nulla, l'informatore si libera e ottiene l'intero
milioni di dollari, mentre il silenzioso viene condannato come unico autore del
reato e riceve una condanna a dieci anni. Se vi informate a vicenda, allora
condividerai la colpa e dividerai la pena: cinque anni ciascuno.
Ecco il problema. Qualunque cosa faccia il tuo complice, è sempre meglio
per te da disertare.
Se il tuo complice ti ha denunciato, farti fuori a sua volta ti darà
cinque anni della tua vita indietro - piuttosto riceverai la condanna condivisa (cinque anni)
che servire il tutto da soli (dieci anni). E se il tuo complice l'ha fatto
stai zitto, consegnarli ti farà guadagnare l'intero milione di dollari - non lo farai
devo dividerlo. Non importa cosa, è sempre meglio disertare che
cooperare, indipendentemente da ciò che decide il tuo complice. Fare altrimenti
ti fanno sempre peggio, non importa cosa.
In effetti, questo rende la defezione non solo la strategia dell'equilibrio, ma ciò che è
nota come strategia dominante . Una strategia dominante evita del tutto la ricorsione,
essendo la migliore risposta a tutte le possibili strategie del tuo avversario, così tu
non devi nemmeno preoccuparti di entrare nella loro testa. Una dominante
la strategia è una cosa potente.
Ma ora siamo arrivati ​al paradosso. Se tutti fanno la cosa razionale e
segue la strategia dominante, la storia si conclude con entrambi che servono cinque anni
di tempi duri - che, paragonati alla libertà ea un bel mezzo milione a testa, lo è
drammaticamente peggio per tutte le persone coinvolte. Come può essere successo?
Questo è emerso come una delle principali intuizioni della teoria dei giochi tradizionale: il
equilibrio per un insieme di giocatori, che agiscono tutti razionalmente nel proprio interesse, può
non essere il risultato effettivamente migliore per quei giocatori.
Teoria dei giochi algoritmica, in linea con i principi dell'informatica,
ha preso questa intuizione e l'ha quantificata, creando una misura chiamata “il prezzo di
anarchia." Il prezzo dell'anarchia misura il divario tra la cooperazione (a
soluzione progettata centralmente o coordinata) e concorrenza (dove ciascuna
il partecipante sta cercando in modo indipendente di massimizzare il risultato per se stesso). Nel

Pagina 258

un gioco come il dilemma del prigioniero, questo prezzo è effettivamente infinito: crescente
la quantità di denaro in gioco e l'allungamento delle pene detentive possono colmare il divario
tra i possibili risultati arbitrariamente ampi, anche se la strategia dominante rimane
lo stesso. Non c'è limite a quanto possano essere dolorose le cose per i giocatori se lo fanno
non coordinare. Ma in altri giochi, come farebbero i teorici dei giochi algoritmici
scoprire, il prezzo dell'anarchia non è poi così male.
Ad esempio, considera il traffico. Che si tratti di singoli pendolari che cercano di farlo
si fanno strada attraverso il quotidiano bumper-to-bumper, o router che mescolano TCP
pacchetti su Internet, tutti nel sistema vogliono semplicemente ciò che è più semplice
per loro personalmente. I conducenti vogliono solo prendere il percorso più veloce, qualunque esso sia,
e i router vogliono solo mescolare i loro pacchetti con il minimo sforzo, ma in
in entrambi i casi ciò può provocare un sovraffollamento lungo percorsi critici, creando
congestione che danneggia tutti. Quanto male, però? Sorprendentemente, Tim
Roughgarden e Éva Tardos di Cornell hanno dimostrato nel 2002 che la "rotta egoista"
approccio ha un prezzo di anarchia che è un semplice 4/3. Cioè, un libero per tutti è solo
33% peggio della perfetta coordinazione top-down.
Il lavoro di Roughgarden e Tardos ha profonde implicazioni sia per l'urbano
pianificazione del traffico fisico e per l'infrastruttura di rete. Il percorso egoistico è basso
Il prezzo dell'anarchia può spiegare, ad esempio, perché Internet funziona così bene
fa a meno di alcuna autorità centrale che gestisca l'instradamento dei singoli pacchetti.
Anche se tale coordinamento fosse possibile, non aggiungerebbe molto.
Quando si tratta di traffico del genere umano, il prezzo basso dell'anarchia si riduce
entrambi i modi. La buona notizia è che la mancanza di coordinamento centralizzato sta facendo
il tuo pendolarismo al massimo peggiora solo del 33%. D'altra parte, se lo speri
le auto autonome a guida autonoma in rete ci porteranno un futuro di utopia del traffico,
può essere scoraggiante apprendere che i guidatori egoisti e scoordinati di oggi lo sono
già abbastanza vicino all'ottimale. È vero che le auto a guida autonoma dovrebbero ridurre il
numero di incidenti stradali e possono essere in grado di guidare più da vicino, entrambi
di cui velocizzerebbe il traffico. Ma da un punto di vista della congestione, il fatto che
l'anarchia è solo 4/3 più congestionata come la perfetta coordinazione lo significa perfettamente
gli spostamenti coordinati saranno solo 3/4 congestionati come lo sono ora. È un po
come la famosa frase di James Branch Cabell: “L'ottimista proclama che noi
vivere nel migliore di tutti i mondi possibili; e il pessimista teme che sia vero. "
La congestione sarà sempre un problema risolvibile maggiormente dai pianificatori e dall'insieme

Pagina 259

domanda che dalle decisioni dei singoli conducenti, umani o informatici, egoisti
o cooperativa.
Quantificare il prezzo dell'anarchia ha conferito al campo un approccio concreto e rigoroso
modo per valutare i pro ei contro dei sistemi decentralizzati, che ha un ampio
implicazioni in un numero qualsiasi di domini in cui le persone si trovano
coinvolti nel gioco (che lo sappiano o no). Un prezzo basso di anarchia
significa che il sistema è, nel bene e nel male, buono da solo quanto lo sarebbe
se fosse gestito con cura. Un alto prezzo di anarchia, d'altra parte, significa
che le cose hanno il potenziale per andare bene se vengono coordinate attentamente -
ma che senza una qualche forma di intervento, stiamo corteggiando il disastro. Il
il dilemma del prigioniero è chiaramente di quest'ultimo tipo. Sfortunatamente, lo sono anche molti
i giochi più critici che il mondo deve giocare.

La tragedia dei comuni


Nel 1968, l'ecologo Garrett Hardin prese il dilemma del prigioniero a due giocatori
e immaginavo di ingrandirlo per coinvolgere tutti i membri di un villaggio agricolo.
Hardin ha invitato i suoi lettori a immaginare un "comune" di prato pubblico, a disposizione
essere pascolato dal bestiame di tutti, ma con capacità finita. In teoria, tutti i file
gli abitanti del villaggio dovrebbero pascolare solo tanti animali quanti ne lascerebbero l'erba
tutti. In pratica, però, i vantaggi del pascolo un po 'più di questo
maturano direttamente a te, mentre i danni sembrano troppo piccoli per essere di conseguenza. Ancora
se tutti seguono questa logica di utilizzare solo leggermente più dei comuni di
dovrebbero, ne risulta un terribile equilibrio: un prato completamente devastato, e no
da allora in poi erba per il bestiame di chiunque .
Hardin l'ha chiamata la "tragedia dei beni comuni", ed è diventata una di queste
le lenti primarie attraverso le quali economisti, scienziati politici e il
il movimento ambientalista vede crisi ecologiche su larga scala come l'inquinamento e
cambiamento climatico. "Quando ero un bambino, c'era questa cosa chiamata benzina con piombo",
dice Avrim Blum, scienziato informatico e teorico dei giochi della Carnegie Mellon.
"Il piombo costava dieci centesimi in meno o qualcosa del genere, ma inquina l'ambiente ...
Dato quello che stanno facendo tutti gli altri, quanto sei davvero peggio personalmente
[dal punto di vista della salute] se metti benzina con piombo nella tua macchina? Non molto peggio.
Pagina 260

È il dilemma del prigioniero. " Lo stesso vale a livello aziendale e nazionale


livelli. Un titolo di giornale recente ha sintetizzato il problema: “Clima stabile
richiede che la maggior parte dei combustibili fossili rimanga sottoterra, ma di chi? " Ogni società
(e, in una certa misura, ogni nazione) è meglio essere un po 'più spericolati di
i loro colleghi per motivi di vantaggio competitivo. Eppure se tutti agiscono di più
sconsideratamente, porta a una Terra devastata, e tutto per niente: non c'è economico
vantaggio per chiunque rispetto a dove hanno iniziato.
La logica di questo tipo di gioco è così pervasiva che non dobbiamo nemmeno guardare
ai misfatti per vederlo correre come un pazzo. Possiamo altrettanto facilmente finire in un terribile
equilibrio con la coscienza pulita. Come? Non guardare oltre la tua azienda
politica delle ferie. In America, le persone lavorano alcune delle ore più lunghe in
mondo; come ha detto l' Economist , “da nessuna parte il valore del lavoro è più alto e il
valore del tempo libero inferiore. " Ci sono poche leggi che obbligano i datori di lavoro a fornire
tempo libero, e anche quando i dipendenti americani ottengono le ferie non lo fanno
usalo. Uno studio recente ha dimostrato che il lavoratore medio prende solo la metà del
giorni di vacanza concessi loro e uno straordinario 15% non si prende affatto ferie.
Al momento, la Bay Area (dove viviamo noi due) ci sta provando
porre rimedio a questo triste stato di cose attraverso un radicale cambiamento di paradigma
quando si tratta di politica per le ferie, un cambiamento che è molto ben intenzionato e
completamente, apocalitticamente condannato. La premessa sembra abbastanza innocente:
invece di misurare un numero arbitrario fisso di giorni per ciascun dipendente,
quindi sprecare ore di lavoro delle risorse umane assicurandosi che nessuno superi il proprio limite, perché no
lasciare liberi i tuoi dipendenti? Perché non concedere semplicemente loro vacanze illimitate?
I resoconti aneddotici finora sono contrastanti, ma da una prospettiva teorica dei giochi,
questo approccio è un incubo. Tutti i dipendenti vogliono, in teoria, prenderne altrettanto
vacanza possibile. Ma tutti vogliono anche prendersi un po 'meno di ferie di
l'un l'altro, per essere percepiti come più fedeli, più impegnati e più dediti
(quindi più degno di promozione). Ognuno guarda agli altri per una linea di base, e
ci vorrà solo leggermente meno di quello. L'equilibrio di Nash di questo gioco è zero .
Come scrive il CEO della società di software Travis CI, Mathias Meyer, “People
esiteranno a prendersi una vacanza perché non vogliono sembrare quella persona che è
prendendo la maggior parte dei giorni di vacanza. È una corsa al ribasso. "
Questa è la tragedia dei beni comuni in pieno effetto. Ed è altrettanto brutto tra
imprese come al loro interno. Immagina due negozianti in una piccola città. Ognuno di loro

Pagina 261

può scegliere di rimanere aperto sette giorni su sette o di essere aperto solo sei giorni a
settimana, prendendo la domenica per rilassarsi con gli amici e la famiglia. Se entrambi
prendersi un giorno libero, manterranno la loro quota di mercato esistente e sperimenteranno meno
fatica. Tuttavia, se un negoziante decide di aprire il suo negozio sette giorni su sette,
attirerà più clienti, portandoli via dal suo concorrente e
minacciando il suo sostentamento. L'equilibrio di Nash, ancora una volta, è che tutti lavorino
tutto il tempo.
Questo problema esatto è diventato un punto di infiammabilità negli Stati Uniti durante il 2014
durante le festività natalizie, come rivenditore dopo rivenditore, non disposto a cedere quote di mercato a
concorrenti che stavano anticipando i soliti acquisti post-Ringraziamento
fretta, ceduto verso il pessimo equilibrio. "I negozi aprono prima del
mai prima ", ha riportato l' International Business Times . Macy ha deciso di aprire
due ore prima rispetto all'anno precedente, così come Target. Kmart, da parte sua, ha aperto
alle 6:00 del mattino del Ringraziamento ed era continuamente aperto per quarantadue
ore.
Quindi cosa possiamo fare, come giocatori, quando ci troviamo in una situazione del genere:
o il dilemma del prigioniero bipartitico, o la tragedia multipartitica del
commons? In un certo senso, niente. La stessa stabilità che hanno questi cattivi equilibri,
la cosa che li rende equilibrati, diventa dannabile. In generale non possiamo
spostare le strategie dominanti dall'interno. Ma questo non significa così male
gli equilibri non possono essere risolti. Significa solo che la soluzione dovrà arrivare
da qualche altra parte.

Design del meccanismo: cambia il gioco


Non odiare il giocatore, odia il gioco.

—ICE-T
Non schierarti mai più con nessuno contro la famiglia, mai più.
- IL PADRINO

Il dilemma del prigioniero è stato il punto focale per generazioni di dibattiti e


controversia sulla natura della cooperazione umana, ma University College

Pagina 262

Il teorico dei giochi londinesi Ken Binmore vede almeno alcune di queste controversie come
fuorviante. Come sostiene, è “semplicemente sbagliato che il Dilemma del Prigioniero
cattura ciò che conta nella cooperazione umana. Al contrario, rappresenta a
situazione in cui i dadi sono tesi contro l'emergere della cooperazione come
potrebbero essere. " *
Ebbene, se le regole del gioco impongono una cattiva strategia, forse non dovremmo provarci
cambiare strategie. Forse dovremmo provare a cambiare il gioco.
Questo ci porta a una branca della teoria dei giochi nota come "progettazione del meccanismo".
Mentre la teoria dei giochi chiede quale comportamento emergerà data una serie di regole,
il design del meccanismo (a volte chiamato "teoria del gioco inverso") funziona nell'altro
direzione, chiedendosi: quali regole ci daranno il comportamento che vogliamo vedere? E se
Le rivelazioni della teoria dei giochi, come il fatto che potrebbe essere una strategia di equilibrio
razionale per ogni giocatore ma dannoso per tutti: si sono dimostrati controintuitivi, il
le rivelazioni sulla progettazione dei meccanismi lo sono ancora di più.
Riportiamo te e il tuo cospiratore rapinatore di banche nella cella di prigione per
un altro passo al dilemma del prigioniero, con un'aggiunta cruciale: il Padrino.
Ora tu e il tuo compagno ladro siete membri di un sindacato del crimine, e il Don
ha reso, diciamo, fin troppo chiaro che qualsiasi informatore andrà a letto con il
Pesci. Questa alterazione dei guadagni del gioco ha l'effetto di limitare le azioni
puoi prendere, ma ironicamente rende molto più probabile che le cose finiscano bene,
sia per te che per il tuo partner. Poiché la defezione è ora meno attraente (per dirla
leggermente), entrambi i prigionieri sono indotti a cooperare ed entrambi cammineranno con sicurezza
mezzo milione di dollari più ricco. Meno, ovviamente, una decima nominale al don.
La cosa controintuitiva e potente qui è che possiamo peggiorare ogni risultato
—La morte da un lato, le tasse dall'altro — eppure rende la vita di tutti migliore
spostando l'equilibrio.
Per i negozianti delle piccole città, sarebbe una tregua verbale per togliere la domenica
instabile: non appena uno dei negozianti avesse avuto bisogno di denaro extra sarebbe stato responsabile
violarlo, spingendo l'altro a iniziare a lavorare anche la domenica per non perdere
quota di mercato. Questo li farebbe tornare indietro nel cattivo equilibrio in cui si trovano
prendi il peggio di entrambi i mondi: sono esausti e non diventano competitivi
vantaggio per questo. Ma potrebbero essere in grado di agire come il proprio don firmando un
contratto legalmente vincolante in base all'effetto che, ad esempio, i proventi guadagnati da entrambi
fare acquisti la domenica vai nell'altro negozio. Aggravando l'insoddisfacente

Pagina 263

equilibrio, ne farebbero uno nuovo e migliore.


D'altra parte, una modifica ai payoff del gioco che non cambia il
l'equilibrio avrà tipicamente un effetto molto minore di quello desiderato. Il CEO di
la società di software Evernote, Phil Libin, ha fatto notizia con una politica di offerta
Dipendenti di Evernote mille dollari in contanti per una vacanza. Questo suona
come un approccio ragionevole per convincere più dipendenti a prendersi le ferie, ma da
una prospettiva teorica del gioco è in realtà fuorviante. Aumentando la liquidità sul
La tabella nel dilemma del prigioniero, per esempio, non coglie il punto: il cambiamento
non fa nulla per alterare il cattivo equilibrio. Se finisce una rapina da un milione di dollari
con entrambi i ladri in prigione, così fa una rapina da dieci milioni di dollari. Il problema non è
che le vacanze non sono attraenti; il problema è che tutti vogliono prendere
un po 'meno vacanza rispetto ai loro coetanei, producendo un gioco il cui unico equilibrio
non è affatto vacanza. Mille dollari addolciscono l'affare ma non cambiano il
principio del gioco, che è quello di prendersi quante più ferie possibile mentre si è fermi
essere percepito come leggermente più fedele del prossimo ragazzo o ragazza, quindi ottenere
un aumento o una promozione su di loro che vale molte migliaia di dollari.
Ciò significa che Libin deve offrire decine di migliaia di dollari ciascuno
dipendente per ferie? No. Il design del meccanismo ci dice che Libin può ottenere il
dipendenti felici che vuole con il bastone, piuttosto che con la carota; può ottenere un file
migliore equilibrio senza spendere un centesimo. Ad esempio, potrebbe semplicemente fare
una certa quantità minima di ferie obbligatoria . Se non può cambiare la razza, lui
può ancora cambiare il fondo. Il design del meccanismo è un argomento potente per
la necessità di un designer, che si tratti di un CEO, di un contratto che vincoli tutte le parti o di un don chi
impone l' omertà per carotide garroted.
Un commissario di lega è anche questo tipo di designer. Immagina come
Uno spettacolo patetico che l'NBA sarebbe se non ci fossero partite in quanto tali e squadre
potrebbero semplicemente segnare l'uno sull'altro letteralmente in qualsiasi momento tra l'inizio e la fine
della stagione: 3:00 di domenica, mezzogiorno di Natale, lo chiami. Che cosa
vedresti essere giocatori smunti, cadaverici, in debito di sonno estremo, costringenti
vigilanza con stimolanti chimici, quasi impazzendo. La guerra è così.
D'altra parte, anche Wall Street, spietati capitalisti spietati che commerciano con il
microsecondo nella "città che non dorme mai", arriva a un cessate il fuoco ogni giorno alle
16:00 in punto, in modo che gli intermediari possano dormire a orari prevedibili ogni notte
senza farsi prendere troppo male dall'imboscata dei concorrenti che spingono verso un insonne

Pagina 264

equilibrio. In questo senso, la borsa è più uno sport che una guerra.
Aumentare questa logica si traduce in un potente argomento a favore del ruolo del governo.
In effetti, molti governi hanno leggi sui libri che impongono il minimo
ferie e orari di apertura limitati. E mentre gli Stati Uniti sono gli unici
nazioni sviluppate senza requisiti federali per le ferie pagate,
Massachusetts, Maine e Rhode Island hanno divieti a livello statale
Commercio del Ringraziamento.
Leggi come queste spesso derivano dall'era coloniale e inizialmente erano religiose
in natura. In effetti, la religione stessa fornisce un modo molto diretto per modificare il
struttura di giochi di questo tipo. In particolare, una legge religiosa come “Ricorda
il giorno del sabato ”risolve ordinatamente il problema affrontato dai negozianti, se
imposto da un Dio onnipotente o dai membri più vicini di a
Comunità religiosa. E aggiungendo forza divina alle ingiunzioni contro altri tipi
un comportamento antisociale, come l'omicidio, l'adulterio e il furto, è anche un modo per farlo
risolvere alcuni dei problemi teorici del gioco del vivere in un gruppo sociale. Dio
sembra essere anche meglio del governo in questo senso, poiché onniscienza e
l'onnipotenza fornisce una garanzia particolarmente forte che intraprenderà cattive azioni
avere conseguenze disastrose. Si scopre che non c'è nessun Padrino come Dio
Padre.
La religione sembra il genere di cose di cui parla raramente un informatico;
infatti, è letteralmente l'argomento di un libro intitolato Things a Computer Scientist
Raramente se ne parla . Ma riducendo il numero di opzioni a disposizione delle persone,
i vincoli comportamentali del tipo imposto dalla religione non solo assicurano
tipi di decisioni meno impegnativi dal punto di vista computazionale, possono anche produrre risultati migliori
risultati.

Design del meccanismo di Evolution


Per quanto egoista possa essere supposto un uomo, evidentemente ce ne sono alcuni
principi nella sua natura, che lo interessano per la fortuna degli altri, e
rendigli necessaria la loro felicità, anche se non ne ricava nulla,
tranne il piacere di vederlo.
—ADAM SMITH, LA TEORIA DEI SENTIMENTI MORALI

Pagina 265

Il cuore ha le sue ragioni di cui la ragione non sa nulla.

-BLAISE PASCAL
Le sequoie della California sono tra i più antichi e maestosi viventi
cose sul pianeta. Da un punto di vista teorico del gioco, però, lo sono
una specie di tragedia. L'unico motivo per cui sono così alti è che stanno cercando di esserlo
più alti l' uno dell'altro, fino al punto in cui sono i danni della sovraestensione
alla fine anche peggio dei danni di essere messi all'ombra. Come Richard Dawkins
lo mette,

Il baldacchino può essere pensato come un prato aereo, proprio come una prateria ondulata, ma cresciuto
trampoli. Il baldacchino sta raccogliendo energia solare più o meno alla stessa velocità di una prateria. Ma a
una parte sostanziale dell'energia viene "sprecata" essendo immessa direttamente nei trampoli, che non fanno nulla
più utile che sollevare il "prato" in aria, dove raccoglie esattamente lo stesso raccolto di
fotoni come farebbero - a un costo di gran lunga inferiore - se fosse appoggiato a terra.

Se la foresta potesse solo in qualche modo accettare una sorta di tregua, l'ecosistema
potrebbe godersi la generosità fotosintetica senza la corsa agli armamenti per la produzione del legno
sprecando tutto. Ma come abbiamo visto, i buoni risultati in questi scenari tendono solo a
sorgono nel contesto di un'autorità al di fuori del gioco - qualcuno che cambia il
guadagni dall'alto verso il basso. Sembrerebbe che in natura, quindi, ci sia
semplicemente nessun modo per stabilire un buon equilibrio tra gli individui.
D'altra parte, se la cooperazione porta davvero a risultati migliori in
certi giochi, allora ci aspetteremmo che le specie dalla mentalità cooperativa prevarranno
evolutivamente. Ma allora da dove verrebbe la collaborazione se fosse solo
razionale a livello di gruppo, non a livello individuale? Forse dovrebbe
provengono da qualcosa che gli individui non possono controllare completamente. Qualcosa, per
esempio, come le emozioni .
Considera due scenari apparentemente non correlati: (1) Un uomo compra un aspirapolvere
più pulito, si rompe in poche settimane e trascorre dieci minuti online lasciando un file
recensione vendicativa. (2) Una donna che fa la spesa in un minimarket si accorge
qualcuno ruba il portafoglio di un uomo anziano e scatta per la porta; lei affronta il ladro
e combatte il portafoglio gratuitamente.
Anche se quest'ultimo protagonista sembra chiaramente eroico, e il primo semplicemente

Pagina 266

arrabbiato, ciò che queste vignette hanno in comune, anche se in modi molto diversi, è
altruismo involontario. Il consumatore infelice non sta cercando di ottenere il vuoto
sostituzione delle pulizie o rimborso; sta cercando un tipo altamente indiretto di
retribuzione, dalla quale - in senso razionale, teorico dei giochi - ha da guadagnare
poco altro che la dispettosa soddisfazione di scrivere la recensione stessa. Nel
minimarket, l'eroica donna distribuisce giustizia vigilante all'enorme
costo personale; rischia lesioni o addirittura la morte per restituire, diciamo, $ 40 a un uomo che è a
per lei un totale estraneo. Anche se avesse voluto aiutare, avrebbe potuto semplicemente prendere
due ventenni di tasca sua e glieli regalò senza rischiare un viaggio
al pronto soccorso! In questo senso, entrambi i protagonisti agiscono in modo irrazionale. Dall'altra
mano, le loro azioni sono buone per la loro società: tutti noi vogliamo vivere in un mondo in
quale borseggio non paga e in quali attività commerciali che vendono di scarsa qualità
i prodotti hanno una cattiva reputazione.
Forse ognuno di noi, individualmente, sarebbe meglio essere il tipo di persona
che può sempre prendere una decisione distaccata e calcolata nel proprio interesse,
non è disposto a perdere tempo fumando su un costo irrecuperabile, figuriamoci perdere un dente oltre $ 40.
Ma tutti noi stiamo meglio vivendo in una società in cui si trovano posizioni così ribelli
Comune.
Quindi cosa ha agito in queste persone, in assenza di un'autorità esterna,
per farli contrarre l'equilibrio egoistico? Rabbia, per prima cosa. Se
spinto da un'attività scadente o da un ladruncolo, l'indignazione può prevalere sulla razionalità.
E in questi casi, può essere che la mano dell'evoluzione abbia fatto quello che voleva
altrimenti sarebbe stata necessaria un'autorità esterna al gioco.
La natura è piena di esempi di individui che vengono essenzialmente dirottati per servire
gli obiettivi di un'altra specie. Il trematode epatico della lancetta ( Dicrocoelium dendriticum ),
per esempio, è un parassita che fa arrampicare deliberatamente le formiche sulle cime dell'erba
lame in modo che vengano mangiate dalle pecore, l'ospite preferito della lancetta.
Allo stesso modo, il parassita Toxoplasma gondii fa sì che i topi perdano permanentemente la loro
paura dei gatti, con risultati simili.
Emozione, per il consumatore amaro, ritorsivo e per il minimarket
eroe allo stesso modo, è la nostra stessa specie che assume i controlli per un minuto. “La moralità è
istinto di branco nell'individuo ”, ha scritto Nietzsche. Parafrasando leggermente, potremmo
il rischio che l'emozione sia il design del meccanismo nella specie. Proprio perché
i sentimenti sono involontari, consentono contratti che non necessitano di applicazione esterna.
Pagina 267

La vendetta non funziona quasi mai a favore di chi la cerca, eppure


qualcuno che risponderà con veemenza “irrazionale” all'essere presi
il vantaggio è proprio per questo motivo che è più probabile che si ottenga un accordo equo. Come Cornell
l'economista Robert Frank afferma: “Se le persone si aspettano che rispondiamo in modo irrazionale al
furto della nostra proprietà, raramente ne avremo bisogno , perché non sarà in loro
interessi a rubarlo. Essere predisposti a rispondere in modo irrazionale serve molto meglio
qui che essere guidati solo dall'interesse materiale ".
(Per non pensare che gli esseri umani moderni civilizzati abbiano contratti legali e regole
legge invece della retribuzione, ricorda che spesso è più lavoro e sofferenza fare causa o
perseguire qualcuno di quanto la vittima possa sperare di recuperare in termini materiali.
Le azioni legali sono i mezzi per ritorsioni autodistruttive in una società sviluppata, no
il sostituto.)
Quanto alla rabbia, così alla compassione, al senso di colpa e all'amore.
Per quanto strano possa sembrare, anche il dilemma del prigioniero ha molto da dirci
sul matrimonio. Nella nostra discussione sui problemi di arresto ottimale, come il
problema con la segretaria, nel capitolo 1, abbiamo esaminato sia gli appuntamenti che l'appartamento
caccia come casi in cui dobbiamo prendere un impegno con un possibile futuro
opzioni ancora invisibili. Sia nell'amore che nella casa, però, continuiamo a incontrarci
più opzioni anche dopo aver preso la nostra decisione di arresto ottimale, quindi perché non esserlo
pronto a saltare la nave? Naturalmente, sapendo che l'altra parte (sia essa il coniuge o
padrone di casa) è a sua volta pronto a saltare la nave impedirebbe molti a lungo termine
investimenti (avere figli insieme o trasferirsi faticosamente nei propri
effetti personali) che rendono utili tali accordi.
In entrambi i casi questo cosiddetto problema di impegno può essere almeno parzialmente
indirizzato da un contratto. Ma la teoria dei giochi suggerisce che nel caso della datazione, il file
legami volontari della legge sono meno rilevanti per una partnership duratura rispetto al
legami involontari dell'amore stesso. Come dice Robert Frank, "La preoccupazione che le persone
lascerà le relazioni perché in seguito potrebbe diventare razionale per loro farlo
in gran parte cancellati se non è la valutazione razionale che li lega in primo luogo. "
Lui spiega:

Sì, le persone cercano caratteristiche oggettive a cui tengono. Tutti vogliono qualcuno che lo sia
gentile e intelligente, interessante e sano e forse fisicamente attraente, buona capacità di guadagno,
l'intera lista di funzioni, ma questo è il primo passo. ... Dopo aver trascorso abbastanza tempo insieme,

Pagina 268

non sono quelle cose che ti fanno venire voglia di stare insieme. È solo il fatto che è così particolare
persona: questo è ciò che è prezioso per te, quindi non hai davvero bisogno del contratto tanto quanto hai bisogno di un
sensazione che ti fa venir voglia di separarti, anche se oggettivamente potrebbe esserci un'opzione migliore
a tua disposizione.

Detto in modo diverso: l'amore è come il crimine organizzato. Cambia la struttura del file
gioco del matrimonio in modo che l'equilibrio diventi il ​risultato che funziona meglio per
tutti.
Il drammaturgo George Bernard Shaw una volta scrisse sul matrimonio che “Se il prigioniero
è felice, perché rinchiuderlo? Se non lo è, perché fingere che lo sia? " Teoria del gioco
offre una sottile risposta a questo particolare indovinello. La felicità è la serratura.
Un argomento basato sulla teoria dei giochi per l'amore evidenzierebbe un ulteriore punto:
il matrimonio è il dilemma del prigioniero in cui puoi scegliere la persona con cui ti trovi
chi sei in combutta. Potrebbe sembrare un piccolo cambiamento, ma potenzialmente
ha un grande effetto sulla struttura del gioco a cui stai giocando. Se lo sapessi, per
chissà perché, il tuo partner nel crimine sarebbe infelice se tu non fossi in giro ...
il tipo di miseria che nemmeno un milione di dollari potrebbe curare, allora ti preoccuperesti molto
meno di loro che disertano e ti lasciano a marcire in prigione.
Quindi l'argomento razionale per l'amore è duplice: le emozioni dell'attaccamento no
risparmia solo il pensiero ricorsivo delle intenzioni del tuo partner, ma per
la modifica dei guadagni consente effettivamente un risultato migliore. Cosa c'è di più,
essere in grado di innamorarsi involontariamente ti rende, a sua volta, più attraente
partner da avere. La tua capacità di spezzare il cuore, di dormire con l'emotività
pesci, è proprio la qualità che ti rende un complice così fidato.

Cascate di informazioni: la tragica razionalità di


Bolle
Ogni volta che ti trovi dalla parte della maggioranza, è tempo di fare una pausa
e riflettere.

—MARK TWAIN
Parte del motivo per cui è una buona idea prestare attenzione al comportamento degli altri

Pagina 269

è che così facendo, puoi aggiungere le loro informazioni sul mondo alle tue.
Un ristorante popolare è probabilmente buono; una sala da concerto semivuota è probabilmente un
cattivo segno; e se qualcuno con cui stai parlando sposta bruscamente il loro sguardo verso
qualcosa che non puoi vedere, probabilmente non è una cattiva idea anche girare la testa.
D'altra parte, imparare dagli altri non sembra sempre particolarmente
razionale. Le mode e le mode sono il risultato di seguire il comportamento degli altri senza
essere ancorati a qualsiasi verità oggettiva sottostante sul mondo. Cosa è peggio,
il presupposto che le azioni di altre persone siano una guida utile può portare all'ordinamento
di seguire il gregge che precipita il disastro economico. Se tutti gli altri lo sono
investire nel settore immobiliare, sembra una buona idea comprare una casa; dopo tutto, il
il prezzo aumenterà solo. Non è vero?
Un aspetto interessante della crisi dei mutui del 2007-2009 è che tutti
coinvolti sembravano sentirsi ingiustamente puniti per aver semplicemente fatto cosa
avrebbero dovuto. Una generazione di americani che sono cresciuti credendo in questo
le case erano investimenti sicuri e chi vedeva tutti intorno a loro acquistare
case nonostante (oa causa del) rapido aumento dei prezzi, sono state gravemente bruciate quando
quei prezzi hanno finalmente iniziato a cadere. I banchieri, nel frattempo, pensavano di sì
ingiustamente accusato di aver fatto ciò che avevano sempre fatto: offrire opportunità,
che i loro clienti potrebbero accettare o rifiutare. Sulla scia di un mercato brusco
crollo, la tentazione è sempre quella di dare la colpa. Qui la teoria dei giochi offre a
prospettiva che fa riflettere: catastrofi come questa possono accadere anche quando non c'è nessuno
colpa.
Apprezzare correttamente i meccanismi delle bolle finanziarie inizia con
comprensione delle aste. Mentre le aste possono sembrare angoli di nicchia del
economia, evocando dipinti ad olio da un milione di dollari da Sotheby's e
Christie's, o Beanie Babies e altri oggetti da collezione su eBay: sono davvero potenti
una parte sostanziale dell'economia. Google, ad esempio, fa più di
Il 90% delle sue entrate dalla vendita di annunci e quegli annunci sono tutti venduti tramite aste.
Nel frattempo, i governi usano le aste per vendere i diritti alle bande di
spettro delle telecomunicazioni (come le frequenze di trasmissione dei telefoni cellulari),
aumentando decine di miliardi di dollari di entrate. In effetti, molti mercati globali, in
tutto, dalle case ai libri ai tulipani, opera tramite aste di vari stili.
Uno dei formati di asta più semplici prevede che ogni partecipante annoti la propria offerta
in segreto, e colui la cui offerta è più alta vince l'oggetto a qualunque prezzo

Pagina 270

annotato. Questo è noto come "asta al primo prezzo con offerta sigillata" e da un
punto di vista algoritmico della teoria dei giochi c'è un grosso problema con esso - in realtà,
parecchi. Per prima cosa, c'è un senso in cui il vincitore paga sempre più del dovuto: se
tu valuti un articolo a $ 25 e io lo valuto a $ 10, ed entrambi dichiariamo il nostro vero
valutazioni ($ 25 e $ 10), quindi finisci per acquistarlo per $ 25 quando puoi
l'ho avuto solo per un capello più di $ 10. Questo problema, a sua volta, ne porta un altro,
vale a dire che per fare offerte adeguate, ovvero per non pagare più del dovuto, è necessario
per prevedere la vera valutazione degli altri giocatori in asta e "ombreggiare" la tua
fare un'offerta di conseguenza. È già abbastanza grave, ma gli altri giocatori non faranno offerte
anche le loro vere valutazioni, perché ombreggiano le loro offerte in base alle loro
tua previsione! Siamo tornati nella terra della ricorsione.
Un altro formato di asta classico, "asta olandese" o "asta discendente"
abbassa gradualmente il prezzo di un articolo finché qualcuno non è disposto ad acquistarlo. Il nome
fa riferimento all'asta dei fiori di Aalsmeer, la più grande asta di fiori al mondo,
che si svolge quotidianamente nei Paesi Bassi, ma le aste olandesi sono di più
prevalente di quanto potrebbe sembrare inizialmente. Un negozio che segna gli articoli invenduti,
e i proprietari che elencano gli appartamenti al prezzo più alto che pensano il mercato farà
orso, entrambi condividono la sua qualità di base: è probabile che il venditore inizi con ottimismo e
spingere il prezzo verso il basso fino a trovare un acquirente. L'asta discendente somiglia
l'asta al primo prezzo in quanto è più probabile che tu vinca pagando vicino al massimo
il tuo intervallo (ovvero, sarai pronto a fare un'offerta quando il prezzo scende a $ 25), e quindi
vorrà sfumare la tua offerta di una quantità complessivamente strategica. Compri
a $ 25, o restare la mano e provare ad aspettare un prezzo più basso? Ogni dollaro che risparmi
rischia di perdere del tutto.
L'inverso di un'asta olandese o discendente è ciò che è noto come "inglese
asta "o" asta ascendente ": il formato di asta più familiare. In un file
Asta inglese, gli offerenti si alternano aumentando il prezzo fino a quando tutti tranne uno scendono
su. Questo sembra offrire qualcosa di più vicino a ciò che vogliamo: qui, se apprezzi un file
oggetto a $ 25 e io lo valuto a $ 10, lo vincerai per poco più di $ 10 senza nessuno dei due
dover arrivare fino a $ 25 o scomparire nella tana del coniglio strategica.
Sia l'asta olandese che l'asta inglese introducono un livello extra di
complessità rispetto a un'asta con offerta sigillata, tuttavia. Non coinvolgono
solo le informazioni private di cui dispone ogni offerente ma anche il flusso pubblico di
comportamento di offerta. (In un'asta olandese, è l'assenza di un'offerta che rivela

Pagina 271
informazioni, chiarendo che nessuno degli altri offerenti valuta l'articolo a
l'attuale livello dei prezzi.) E nelle giuste circostanze, questa mescolanza di privato
e i dati pubblici possono rivelarsi tossici.
Immagina che gli offerenti siano dubbiosi sulle proprie stime del valore di
un lotto all'asta, diciamo, il diritto di trivellare per il petrolio in qualche parte dell'oceano. Come
Ken Binmore, teorico dei giochi dell'University College di Londra, osserva: “la quantità di petrolio
in un tratto è uguale per tutti, ma le stime degli acquirenti su quanto petrolio sia
probabile che si trovi in ​un tratto dipenderà dalle loro differenti indagini geologiche. Come
i sondaggi non sono solo costosi, ma notoriamente inaffidabili ". In una situazione del genere, esso
sembra naturale guardare da vicino le offerte dei tuoi avversari, per aumentare le tue
scarse informazioni private con le informazioni pubbliche.
Ma questa informazione pubblica potrebbe non essere così istruttiva come sembra.
In realtà non conosci le convinzioni degli altri offerenti , ma solo le loro azioni .
Ed è del tutto possibile che il loro comportamento sia basato sul tuo, proprio come il tuo
il comportamento è influenzato dal loro. È facile immaginare un gruppo di persone tutte
andando su una scogliera insieme perché "tutti gli altri" si comportavano come se avessero fatto tutto
va bene, quando in realtà ogni persona aveva scrupoli, ma li sopprimeva perché
dell'apparente fiducia di tutti gli altri nel gruppo.
Proprio come con la tragedia dei beni comuni, questo fallimento non è necessariamente il
colpa dei giocatori. Un documento enormemente influente degli economisti Sushil
Bikhchandani, David Hirshleifer e Ivo Welch hanno dimostrato che sotto il
giuste circostanze, un gruppo di agenti che si comportano tutti perfettamente razionalmente
e perfettamente appropriato può tuttavia cadere preda di ciò che è effettivamente
disinformazione infinita. Questo è diventato noto come "informazione
cascata."
Per continuare lo scenario dei diritti di perforazione petrolifera, immagina che ci siano dieci società
che potrebbe fare offerte sui diritti per un determinato tratto. Uno di loro ha un geologico
sondaggio che suggerisce che il tratto è ricco di petrolio; il sondaggio di un altro è inconcludente; il
la ricognizione degli altri otto suggerisce che sia sterile. Ma essendo concorrenti, di
Naturalmente, le aziende non condividono tra loro i risultati del sondaggio e
invece possono solo guardare le azioni degli altri. Quando inizia l'asta, la prima
L'azienda, con il promettente rapporto, fa un'offerta iniziale alta. Il secondo
società, incoraggiati da questa offerta ad assumere una propria visione ottimistica
sondaggio ambiguo, offerte ancora più alte. La terza azienda ha un sondaggio debole ma

Pagina 272

ora non ci si fida alla luce di quello che considerano due sondaggi indipendenti che
suggeriscono che sia una miniera d'oro, quindi fanno una nuova offerta alta. La quarta compagnia,
che ha anche un'indagine poco brillante, ora è ancora più fortemente incline a
ignorarlo, poiché sembra che tre dei loro concorrenti pensano che sia un vincitore. Così
anche loro offrono. Il "consenso" svincola dalla realtà. Si è formata una cascata.
Nessun singolo offerente ha agito in modo irrazionale, ma il risultato netto è una catastrofe. Come
Hirshleifer afferma: “Qualcosa di molto importante accade quando qualcuno decide
seguire ciecamente i suoi predecessori indipendentemente dal proprio segnale informativo,
e cioè che la sua azione diventa disinformativa per tutti i decisori successivi.
Ora il pool pubblico di informazioni non cresce più. Quel beneficio per il benessere di
avere informazioni pubbliche ... è cessato. "
Per vedere cosa succede nel mondo reale quando una cascata di informazioni prende
e gli offerenti non hanno quasi nient'altro che il comportamento reciproco da stimare
il valore di un oggetto, non guardare oltre la biologia dello sviluppo di Peter A. Lawrence
text The Making of a Fly , che nell'aprile 2011 è stato venduto per $ 23.698.655,93
(più $ 3,99 di spedizione) sul marketplace di terze parti di Amazon. Come e perché aveva
questo libro - certamente rispettato - ha raggiunto un prezzo di vendita di oltre $ 23
milione? Si scopre che due dei venditori stavano fissando i prezzi
algoritmicamente come frazioni costanti l'una dell'altra: si era sempre impostate su
0,99830 volte il prezzo del concorrente, mentre il concorrente era automaticamente
fissando il proprio prezzo a 1.27059 volte quello dell'altro. Nessuno dei due venditori a quanto pare
ha pensato di impostare un limite ai numeri risultanti e, infine, al processo
una spirale totalmente fuori controllo.
È possibile che un meccanismo simile fosse in gioco durante l'enigmatico e
controverso "flash crash" del mercato azionario del 6 maggio 2010, quando, nel giro di
minuti, il prezzo di diverse società apparentemente casuali nell'S & P 500 è aumentato
a più di $ 100.000 per azione, mentre altri sono scesi precipitosamente, a volte
a 0,01 dollari per azione. Quasi mille miliardi di dollari di valore sono andati istantaneamente in fumo.
Come ha riferito in diretta Jim Cramer della CNBC, sbalordito, “Quello… non può essere lì.
Non è un prezzo reale. Oh beh, vai a comprare Procter! Basta andare a comprare Procter e
Gamble, hanno riportato un trimestre decente, vai a comprarlo ... Voglio dire, questo è ridi ...
questa è una buona opportunità. " L'incredulità di Cramer è la sua informazione privata
resistere alle informazioni pubbliche. Apparentemente è l'unica persona in
mondo disposto a pagare, in questo caso, $ 49 per un'azione che a quanto pare il mercato è

Pagina 273

valore inferiore a $ 40, ma non gli importa; ha visto i rapporti trimestrali, è


certo in quello che sa.
Si dice che gli investitori rientrino in due grandi campi: investitori "fondamentali", chi
fare trading su ciò che percepiscono come il valore sottostante di un'azienda e
Investitori “tecnici”, che negoziano sulle fluttuazioni del mercato. L'ascesa di
il trading algoritmico ad alta velocità ha sconvolto l'equilibrio tra questi due
strategie, e spesso si lamenta che i computer, non ancorati alla realtà
valore mondiale delle merci - indifferente al prezzo di un texbook a decine di milioni di
dollari e azioni blue chip a un centesimo peggiorano l'irrazionalità del mercato.
Ma mentre questa critica è tipicamente rivolta ai computer, le persone fanno lo stesso
di cose anche, come può testimoniare un numero qualsiasi di bolle di investimento. Di nuovo, la colpa è
spesso non con i giocatori ma con il gioco stesso.
Le cascate di informazioni offrono una teoria razionale non solo delle bolle, ma anche di
le mode e il comportamento della mandria più in generale. Offrono un resoconto di come sia facile
possibile che qualsiasi mercato raggiunga picchi e crolli, anche in assenza di
irrazionalità, malevolenza o comportamento scorretto. I takeaway sono diversi. Per uno,
diffidare dei casi in cui l'informazione pubblica sembra superare l'informazione privata,
dove sai di più su ciò che le persone fanno rispetto al motivo per cui lo fanno,
dove sei più preoccupato che i tuoi giudizi si adattino al consenso che
adattando i fatti. Quando cerchi principalmente che gli altri stabiliscano una rotta, potrebbero
beh, guardo indietro a te per fare lo stesso. Secondo, ricorda quelle azioni
non sono credenze; le cascate vengono causate in parte quando interpretiamo male ciò che gli altri
pensa in base a quello che fanno . Dovremmo essere particolarmente riluttanti ad annullare il nostro
i propri dubbi e, se lo facciamo, potremmo voler trovare un modo per trasmetterli
dubbi anche mentre andiamo avanti, per timore che gli altri non riescano a distinguere la riluttanza in
le nostre menti dall'entusiasmo implicito nelle nostre azioni. Infine, dovremmo
ricorda dal dilemma del prigioniero che a volte un gioco può avere
regole irredimibili. Potrebbe non esserci nulla che possiamo fare una volta che ci siamo dentro, ma
la teoria delle cascate di informazioni può aiutarci a evitare un simile gioco all'inizio
posto.
E se sei il tipo di persona che fa sempre quello che pensi sia giusto, no
importa quanto gli altri pensano che sia pazzo, fatti coraggio. La cattiva notizia è che lo sarai
sbagliato più spesso dei seguaci della mandria. La buona notizia è che attenersi al tuo
convinzioni crea un'esternalità positiva, consentendo alle persone di fare accuratezza

Pagina 274

inferenze dal tuo comportamento. Potrebbe venire il momento in cui salverai il file
intera mandria dal disastro.

Per il tuo calcolo autonomo


L'applicazione dell'informatica alla teoria dei giochi ha rivelato quell'essere
l'obbligo di strategizzare è esso stesso una parte, spesso una parte importante, del prezzo che paghiamo
competere tra loro. E come dimostrano le difficoltà della ricorsione,
da nessuna parte quel prezzo è così alto come quando ci viene richiesto di entrare l'uno dentro l'altro
teste. In questo caso, la teoria dei giochi algoritmica ci offre un modo per ripensare il meccanismo
design: per tenere conto non solo del risultato dei giochi, ma anche del
sforzo computazionale richiesto ai giocatori.
Abbiamo visto come meccanismi d'asta apparentemente innocui, per esempio, possano farlo
incorrere in tutti i tipi di problemi: pensieri eccessivi, pagamenti eccessivi, cascate in fuga. Ma
la situazione non è del tutto disperata. In effetti, c'è un design di asta in
particolare che taglia il peso della ricorsione mentale come un coltello rovente
attraverso il burro. Si chiama asta Vickrey.
Chiamato per l'economista vincitore del Premio Nobel William Vickrey, il Vickrey
L'asta, proprio come l'asta al primo prezzo, è un processo di asta a "offerta sigillata". Questo è,
ogni partecipante scrive semplicemente un singolo numero in segreto e il più alto
l'offerente vince. Tuttavia, in un'asta Vickrey, il vincitore finisce per pagare non il
importo della propria offerta, ma quella del secondo classificato. Vale a dire, se
tu offri $ 25 e io offro $ 10, tu vinci l'oggetto al mio prezzo: devi solo pagare
$ 10.
Per un teorico dei giochi, un'asta Vickrey ha una serie di proprietà interessanti.
E per un teorico dei giochi algoritmici in particolare, una proprietà è particolarmente importante
out: i partecipanti sono incentivati ​ad essere onesti. In effetti, non c'è niente di meglio
strategia piuttosto che offrire il tuo "vero valore" per l'articolo, esattamente quello che pensi
l'oggetto vale. Fare offerte più del tuo vero valore è ovviamente sciocco, come
potresti rimanere bloccato a comprare qualcosa per più di quanto pensi che valga.
E fare un'offerta inferiore al tuo valore reale (cioè ombreggiare la tua offerta) rischia di perdere il
all'asta senza una buona ragione, dal momento che non ti fa risparmiare denaro, perché se tu
vinci, pagherai solo il valore della seconda offerta più alta, indipendentemente da come

Pagina 275

alto era il tuo. Questo rende l'asta Vickrey ciò che i progettisti di meccanismi
chiamare "a prova di strategia" o semplicemente "veritiero". Nell'asta di Vickrey, l'onestà è
letteralmente la migliore politica.
Ancora meglio, l'onestà rimane la migliore politica indipendentemente dal fatto che l'altra
gli stessi offerenti sono onesti. Nel dilemma del prigioniero, abbiamo visto come la defezione
si è rivelata la strategia "dominante", la mossa migliore, non importa se la tua
il partner ha disertato o ha collaborato. In un'asta di Vickrey, invece, l'onestà
è la strategia dominante. Questo è il Santo Graal del progettista del meccanismo. Tu fai
non c'è bisogno di strategizzare o ricorrere.
Ora, sembra che l'asta di Vickrey costerebbe del denaro al venditore
rispetto all'asta al primo prezzo, ma questo non è necessariamente vero. In un primo prezzo
asta, ogni offerente riduce la propria offerta per evitare di pagare più del dovuto; nel
asta Vickrey al secondo prezzo, non ce n'è bisogno - in un certo senso, l'asta stessa lo è
ombreggiando in modo ottimale la loro offerta per loro . In effetti, un principio della teoria dei giochi chiamato
L '“equivalenza dei ricavi” stabilisce che nel tempo, il prezzo medio di vendita previsto
in un'asta al primo prezzo convergeranno esattamente come in una Vickrey
asta. Quindi l'equilibrio di Vickrey coinvolge lo stesso offerente che vince il
articolo per lo stesso prezzo, senza alcuna strategia da parte di nessuno degli offerenti
qualunque cosa. Come Tim Roughgarden dice ai suoi studenti di Stanford, il Vickrey
l'asta è "fantastica".
Per Noam Nisan, teorico dei giochi algoritmici della Hebrew University, questo
la suggestione ha un'aria quasi utopica. “Ti piacerebbe prenderne un po '
tipo di regole della società in cui non vale la pena mentire, e poi la gente no
mentire così tanto, giusto? Questa è l'idea di base. Dal mio punto di vista, l'incredibile
la cosa di Vickrey è che non ti aspetteresti che in generale sia possibile farlo
giusto? Soprattutto in cose come un'asta, dove ovviamente voglio pagare
di meno, come puoi mai ... E poi ancora Vickrey mostra, ecco come fare
quello. Penso che sia davvero fantastico. "
In effetti, la lezione qui va ben oltre le aste. In una scoperta storica chiamata
il "principio di rivelazione", il premio Nobel Roger Myerson ha dimostrato che qualsiasi gioco
che richiede mascherare strategicamente la verità può essere trasformato in un gioco che
non richiede altro che semplice onestà. Paul Milgrom, collega di Myerson al
tempo, riflette: "È uno di quei risultati che se lo guardi da diverse parti,
da un lato, è assolutamente scioccante e sorprendente, e dall'altro lato,

Pagina 276

è banale. Ed è assolutamente meraviglioso, è così fantastico: è così che lo sai


stai guardando una delle cose migliori che puoi vedere. "
Il principio della rivelazione può sembrare difficile da accettare in apparenza, ma la sua prova lo è
in realtà abbastanza intuitivo. Immagina di avere un agente o un avvocato che lo sarà
giocare per te. Se ti fidi di loro per rappresentare i tuoi interessi, lo sei
dirai loro esattamente quello che vuoi e lascia che si occupino di tutto
shading strategico delle offerte e strategie ricorsive per tuo conto. Nel
All'asta Vickrey, il gioco stesso svolge questa funzione. E la rivelazione
Il principio non fa che espandere questa idea: qualsiasi gioco che può essere giocato per te dagli agenti
a chi dirai la verità, dice, diventerà un gioco onesto è il migliore se il
il comportamento che desideri dal tuo agente è incorporato nelle regole del gioco
si. Come dice Nisan, “La cosa fondamentale è se non vuoi che i tuoi clienti lo facciano
ottimizzare contro di te, faresti meglio a ottimizzare per loro. Questa è l'intera prova ...
Se progetto un algoritmo che già ottimizza per te, non c'è niente che tu possa fare
fare."
La teoria dei giochi algoritmica ha dato enormi contributi a numerosi
applicazioni pratiche negli ultimi vent'anni: aiutarci a capire il pacchetto
routing su Internet, migliorando le aste di spettro FCC che assegnano preziosi
(se invisibili) beni pubblici e migliorando gli algoritmi di abbinamento che accoppiano
studenti di medicina con ospedali, tra gli altri. E questo è probabilmente solo il file
inizio di una trasformazione molto più ampia. "Stiamo solo grattando la superficie",
dice Nisan. “Anche in teoria stiamo appena iniziando a capirlo. E c'è
un'altra generazione probabilmente fino a quello che ho capito completamente oggi
teoricamente verrà applicato con successo agli esseri umani. È una generazione; Penso di no
più di quello. Ci vorrà una generazione. "
Il filosofo esistenzialista francese Jean-Paul Sartre scrisse notoriamente che “L'inferno
sono altre persone. " Non voleva dire che gli altri siano intrinsecamente dannosi o
spiacevoli, ma piuttosto complicano i nostri pensieri e credenze:

Quando pensiamo a noi stessi, quando proviamo a conoscere noi stessi ... usiamo la conoscenza di noi
che altre persone hanno già. Ci giudichiamo con i mezzi che le altre persone hanno e hanno
dato a noi per giudicare noi stessi. In qualunque cosa dica di me, il giudizio di qualcun altro è sempre
entra. In qualunque cosa io senta dentro di me, entra in gioco il giudizio di qualcun altro ... Ma non è affatto così
significa che non si possono avere rapporti con altre persone. Mette semplicemente in evidenza l'importanza capitale di

Pagina 277

tutte le altre persone per ciascuno di noi.

Forse, dato quello che abbiamo visto in questo capitolo, potremmo tentare di rivedere
La dichiarazione di Sartre. Interagire con gli altri non deve essere un incubo—
anche se nel gioco sbagliato può sicuramente esserlo. Come ha osservato Keynes, la popolarità lo è
complicato, intrattabile, una sala ricorsiva di specchi; ma la bellezza, negli occhi del
beholder, non lo è. Adottare una strategia che non richiede anticipazione, previsione,
leggere o cambiare rotta a causa delle tattiche degli altri è un modo per tagliare
il nodo gordiano della ricorsione. E a volte quella strategia non è solo facile, lo è
ottimale.
Se cambiare strategia non aiuta, puoi provare a cambiare il gioco. E se
non è possibile, puoi almeno esercitare un certo controllo su quali giochi
scegli di giocare. La strada per l'inferno è lastricata di ricorsioni intrattabili, male
equilibri e cascate di informazioni. Cerca giochi in cui l'onestà è il
strategia dominante. Allora sii te stesso.
Pagina 278

Conclusione
Gentilezza computazionale

Credo fermamente che le cose importanti sugli esseri umani siano sociali
carattere e quel sollievo dalle macchine da molti dei nostri attuali esigenti
le funzioni intellettuali daranno finalmente tempo e incentivi alla razza umana
imparare a vivere bene insieme.

—MERRILL FLOOD
Qualsiasi sistema dinamico soggetto ai vincoli di spazio e tempo si scontra con a
insieme di problemi fondamentali e inevitabili. Questi problemi sono
di natura computazionale, che rende i computer non solo i nostri strumenti ma anche i nostri
compagni. Da ciò derivano tre semplici pezzi di saggezza.
In primo luogo, ci sono casi in cui lo hanno fatto scienziati informatici e matematici
identificato buoni approcci algoritmici a cui è possibile trasferire semplicemente
problemi umani. La regola del 37%, il criterio utilizzato meno di recente per la gestione
cache traboccanti e Upper Confidence Bound come guida all'esplorazione
sono tutti esempi di questo.
Secondo, sapere che stai usando un algoritmo ottimale dovrebbe essere un sollievo
anche se non ottieni i risultati che stavi cercando. La regola del 37% fallisce 63%
del tempo. Mantenere la cache con LRU non garantisce che lo farai
trova sempre quello che cerchi; in effetti, nessuno dei due avrebbe chiaroveggenza. Utilizzando
l'approccio Upper Confidence Bound al compromesso tra esplorazione e sfruttamento no
significa che si avrà alcun rimpianto, solo che quei rimpianti accumulano mai

Pagina 279

più lentamente mentre attraversi la vita. Anche la migliore strategia a volte produce risultati negativi
risultati, motivo per cui gli informatici si preoccupano di distinguere tra
"Processo" e "risultato". Se hai seguito il miglior processo possibile, allora l'hai fatto
fatto tutto quello che puoi e non dovresti incolpare te stesso se le cose non sono andate a modo tuo.
I risultati fanno notizia - anzi, rendono il mondo in cui viviamo -
quindi è facile fissarsi su di loro. Ma i processi sono ciò che abbiamo il controllo
al di sopra di. Come ha affermato Bertrand Russell, “sembra che dobbiamo tenerne conto
probabilità nel giudicare la correttezza oggettiva ... L'atto oggettivamente giusto è il
uno che probabilmente sarà più fortunato. Definirò questo come l' atto più saggio . "
Possiamo sperare di essere fortunati, ma dovremmo sforzarci di essere saggi. Chiamalo una specie di
Stoicismo computazionale.
Infine, possiamo tracciare una linea netta tra i problemi che ammettono
soluzioni dirette e problemi che non lo fanno. Se ti ritrovi bloccato in un file
scenario intrattabile, ricorda che euristiche, approssimazioni e uso strategico
di casualità può aiutarti a trovare soluzioni praticabili. Un tema che è emerso
ancora e ancora nelle nostre interviste con gli informatici era: a volte
"Abbastanza buono" è davvero abbastanza buono. Inoltre, essere consapevoli della complessità
può aiutarci a scegliere i nostri problemi: se abbiamo il controllo su quali situazioni dobbiamo
confrontiamoci, dovremmo scegliere quelli trattabili.
Ma non selezioniamo solo i problemi che ci poniamo. Selezioniamo anche
i problemi che ci poniamo a vicenda, che sia il modo in cui progettiamo una città o il
modo in cui poniamo una domanda. Questo crea un ponte sorprendente dall'informatica al
etica, sotto forma di un principio che chiamiamo gentilezza computazionale .

C'è un certo paradosso che noi due abbiamo osservato quando si trattava di programmare il
interviste contenute in questo libro. I nostri intervistati erano in media di più
probabilmente sarà disponibile quando abbiamo richiesto un incontro, ad esempio "il prossimo martedì tra
1:00 e 2:00 pm PST "rispetto a" in un momento conveniente la prossima settimana ". All'inizio
questo sembra assurdo, come i celebri studi dove le persone in media donano
più soldi per salvare la vita di un pinguino di ottomila pinguini, o
riferire di essere più preoccupato di morire in un atto di terrorismo che di morire
da qualsiasi causa, terrorismo compreso. Nel caso delle interviste, sembra che
le persone preferivano ricevere un problema vincolato, anche se i vincoli lo erano

Pagina 280

colto dal nulla, di uno spalancato. Apparentemente era meno difficile per
per soddisfare le nostre preferenze e vincoli piuttosto che per calcolarne uno migliore
opzione basata sulla propria. Gli informatici annuirebbero consapevolmente qui,
citando il divario di complessità tra "verifica" e "ricerca", di cui si tratta
ampio quanto il divario tra conoscere una buona canzone quando la ascolti e scrivere
uno sul posto.
Uno dei principi impliciti dell'informatica, per quanto strano possa sembrare, lo è
quel calcolo è cattivo : la direttiva sottostante di ogni buon algoritmo è quella di
minimizza il lavoro del pensiero. Quando interagiamo con altre persone, presentiamo
loro con problemi computazionali - non solo richieste e richieste esplicite, ma
sfide implicite come interpretare le nostre intenzioni, le nostre convinzioni e le nostre
preferenze. È logico, quindi, che una comprensione computazionale di
tali problemi mettono in luce la natura dell'interazione umana. Noi possiamo essere
"Computazionalmente gentile" con gli altri inquadrando i problemi in termini che rendono il
problema computazionale sottostante più facile. Questo è importante perché molti problemi
- soprattutto quelli sociali, come abbiamo visto - sono intrinsecamente e inestricabilmente difficili.
Considera questo scenario fin troppo comune. Un gruppo di amici è in piedi
in giro, cercando di capire dove andare a cena. Ognuno di loro ha chiaramente
alcune preferenze, anche se potenzialmente deboli. Ma nessuno di loro vuole affermare
quelle preferenze in modo esplicito, quindi navigano educatamente tra i rischi sociali
supposizioni e mezzi accenni invece.
Potrebbero arrivare a una risoluzione soddisfacente per tutti. Ma questo
procedura può facilmente andare storta. L'estate dopo il college, ad esempio, Brian e
due amici hanno fatto un viaggio in Spagna. Hanno negoziato l'itinerario di viaggio al volo, e
a un certo punto è diventato chiaro che non avrebbero avuto il tempo di andare alla corrida
avevano studiato e pianificato. Solo allora, come tentò di fare ciascuno dei tre
consola gli altri, hanno scoperto all'improvviso che in realtà nessuno di loro l'aveva fatto
voleva vedere la corrida in primo luogo. Ognuno aveva appena adottato coraggiosamente cosa
avevano percepito essere il livello di entusiasmo degli altri, producendo così il
livello
Allodistesso
entusiasmo
modo,che
un gli altri hanno
linguaggio adottato coraggiosamente
apparentemente innocuo comea "Oh,
loro volta.
sono flessibile" o "Cosa fare
vuoi fare stasera? " ha un oscuro ventre computazionale che dovrebbe fare
ci pensi due volte. Ha la patina di gentilezza al riguardo, ma ne fa due profondamente
cose allarmanti. In primo luogo, passa il dollaro cognitivo: “Ecco un problema, tu

Pagina 281

occupatene." In secondo luogo, non dichiarando le tue preferenze, invita gli altri a farlo
simularli o immaginarli. E come abbiamo visto, la simulazione delle menti di
altri è una delle più grandi sfide computazionali che una mente (o una macchina) possa affrontare
mai affrontare.
In tali situazioni, gentilezza computazionale ed etichetta convenzionale
divergere. Trattenere educatamente le tue preferenze pone il problema computazionale
di inferirli sul resto del gruppo. Al contrario, affermando educatamente il tuo
le preferenze ("Personalmente, sono incline a x . Cosa ne pensi?") aiuta
assumersi il carico cognitivo di spostare il gruppo verso la risoluzione.
In alternativa, puoi provare a ridurre, anziché massimizzare, il numero di file
opzioni che offri ad altre persone, ad esempio, offrendo una scelta tra due o tre
ristoranti piuttosto che dieci. Se ogni persona nel gruppo elimina il minimo
opzione preferita, che rende il compito più facile per tutti. E se stai invitando
qualcuno fuori a pranzo, o che stia programmando una riunione, offrendo uno o due concreti
proposte che possono accettare o rifiutare è un buon punto di partenza.
Nessuna di queste azioni è necessariamente "educata", ma tutte possono farlo in modo significativo
abbassare il costo computazionale dell'interazione.

La gentilezza computazionale non è solo un principio di comportamento; è anche un design


principio.
Nel 2003, lo scienziato informatico dell'Università di Waterloo Jeffrey Shallit
indagò sulla questione di quale moneta, se messa in circolazione negli Stati Uniti
States, aiuterebbe maggiormente a ridurre al minimo il numero di monete necessarie in media
fare un cambiamento. Deliziosamente, la risposta si è rivelata un pezzo da 18 cent, ma
Shallit è stato in qualche modo trattenuto dal fare una raccomandazione politica da
preoccupazioni computazionali.
Al momento, il cambiamento è semplicissimo: per qualsiasi importo, basta usare come
quanti più quarti che puoi senza andare oltre, poi quanti più centesimi possibili,
e così via per le denominazioni. Ad esempio, cinquantaquattro centesimi sono due quarti,
poi quattro penny. Con un pezzo da 18 centesimi, quel semplice algoritmo non è più
ottimale: cinquantaquattro centesimi è quindi meglio fare con tre pezzi da 18 centesimi e no
quarti a tutti. Infatti, Shallit ha osservato che le denominazioni sgraziate cambiano
trasformarsi in qualcosa "almeno tanto difficile ... quanto il problema del venditore ambulante".

Pagina 282

È molto da chiedere a un cassiere. Se si tiene conto della facilità di calcolo,


Dovrebbe essere scoperto, quindi ciò di cui la massa monetaria statunitense potrebbe utilizzare al meglio è a
2 o 3 centesimi. Non così eccitante come una moneta da 18 centesimi, ma quasi altrettanto
buono, e computazionalmente più gentile di gran lunga.
Il punto più profondo è che sottili cambiamenti nel design possono cambiare radicalmente il tipo
del problema cognitivo posto agli utenti umani. Architetti e urbanisti, per
ad esempio, abbiamo delle scelte su come costruire il nostro ambiente, il che significa
hanno scelte su come struttureranno i problemi computazionali che noi
devono risolvere.
Considera un ampio parcheggio, con una serie di corsie diverse, del genere spesso
si trova negli stadi e nei centri commerciali. Puoi guidare in una corsia verso il
destinazione, vedere un punto, decidere di lasciarlo andare a favore di (si spera) uno migliore
più avanti, ma poi, non trovando tale fortuna, raggiungi la destinazione e dirigiti
via lungo una corsia vicina. Dopo un certo periodo di guida, devi
decidi se un altro spazio è abbastanza buono da prendere, o così lontano da farlo
prova invece a cercare in una terza corsia.
Una prospettiva algoritmica qui è utile non solo per il conducente ma anche per
L'architetto. Metti a confronto il problema di decisione peloso e disordinato posto da uno di quelli
molto a un unico percorso lineare che si allontana dalla propria destinazione. In tal caso, uno
prende semplicemente il primo spazio disponibile: nessuna teoria dei giochi, nessuna analisi, nessun aspetto
regola di salto necessaria. Alcuni parcheggi sono strutturati in questo modo, con a
singola elica che si avvolge verso l'alto dal livello del suolo. Il loro carico computazionale è
zero: si spinge semplicemente in avanti finché non appare il primo spazio, quindi lo prende.
Quali che siano gli altri possibili fattori a favore e contro questo tipo di costruzione, noi
può sicuramente dire che è cognitivamente umano per i suoi driver - computazionalmente
genere.
Uno degli obiettivi principali del design dovrebbe essere quello di proteggere le persone
tensione, attrito e lavoro mentale non necessari. (Questo non è solo un abstract
preoccupazione; quando il parcheggio del centro commerciale diventa una fonte di stress, ad esempio, gli acquirenti
possono spendere meno soldi e tornare meno frequentemente). Urbanisti e architetti
valutare regolarmente come i diversi progetti di lotti utilizzeranno risorse come limitato
spazio, materiali e denaro. Ma raramente spiegano il modo in cui i loro progetti
tassare le risorse di calcolo delle persone che le utilizzano. Riconoscendo il
basi algoritmiche della nostra vita quotidiana, in questo caso, arresto ottimale

Pagina 283

non solo consentirebbe ai conducenti di prendere le decisioni migliori quando sono in un


scenario particolare, ma incoraggia anche i pianificatori a essere più attenti al
problemi a cui stanno costringendo i conducenti in primo luogo.
Ci sono una serie di altri casi in cui progetta computazionalmente più gentile
suggeriscono se stessi. Ad esempio, considera le politiche sui posti a sedere del ristorante. Alcuni
i ristoranti hanno una politica di "posti a sedere aperti", dove i clienti aspettano semplicemente
resta finché non si apre un tavolo e il primo a sedersi prende il tavolo. Altri lo faranno
prendi il tuo nome, ti faccio bere qualcosa al bar e ti avvisa quando c'è un tavolo
pronto. Questi approcci alla gestione delle scarse risorse condivise rispecchiano
la distinzione in informatica tra "rotazione" e "blocco". Quando un
il thread di elaborazione richiede una risorsa e non può ottenerla, anche il computer può
consentire a quel thread di "girare", per continuare a cercare la risorsa in modo perpetuo
"È già pronto?" loop, oppure può "bloccare": ferma quel thread, lavora su qualcosa
altrimenti, e poi torna indietro ogni volta che la risorsa diventa gratuita. Ad un
informatico, questo è un compromesso pratico: pesare il tempo perso per la filatura
contro il tempo perso nel cambio di contesto. Ma in un ristorante, non tutti
le risorse che vengono scambiate sono proprie. Una politica di "rotazione" riempie il vuoto
tavoli più veloci, ma le CPU che nel frattempo si stanno esaurendo sono le menti dei loro
clienti, intrappolati in una noiosa ma consumante vigilanza.
Come esempio parallelo, si consideri il problema computazionale posto da un bus
fermare. Se c'è un display dal vivo che dice che il prossimo autobus "arriverà tra 10 minuti",
poi puoi decidere una volta se aspettare, piuttosto che prendere l'autobus
continuava a non arrivare come un flusso di prove inferenziali, momento per momento,
e dover ridecidere e ridecidere. Inoltre, puoi attirare la tua attenzione
lontano dallo strabismo lungo la strada - girando - per quei dieci minuti di fila.
(Per le città che non sono all'altezza dell'attuazione necessaria per prevedere il prossimo
arrivo, abbiamo visto come l'inferenza bayesiana può anche fare sapere quando l'ultima
bus ha lasciato un utile proxy.) Tali sottili atti di gentilezza computazionale potrebbero fare altrettanto
tanto per il guidatore, se non di più, come sovvenzionamento delle tariffe: pensalo come un cognitivo
sussidio.

Se possiamo essere più gentili con gli altri, possiamo anche essere più gentili con noi stessi. Non solo
dal punto di vista computazionale, tutti gli algoritmi e le idee che abbiamo discusso lo faranno

Pagina 284

aiutare con quello. Ma anche più indulgente.


Lo standard intuitivo per il processo decisionale razionale viene valutato attentamente
tutte le opzioni disponibili e scegliendo la migliore. A prima vista, i computer sembrano
i modelli di questo approccio, facendosi strada attraverso calcoli complessi
per tutto il tempo necessario per ottenere risposte perfette. Ma come abbiamo visto, questo è un file
quadro obsoleto di ciò che fanno i computer: è un lusso offerto da un facile
problema. Nei casi difficili, i migliori algoritmi riguardano tutto ciò che fa
il più sensato nel minor tempo possibile, il che non implica affatto il dare
un'attenta considerazione di ogni fattore e perseguire ogni calcolo fino alla fine.
La vita è semplicemente troppo complicata per questo.
In quasi tutti i domini che abbiamo considerato, abbiamo visto come il più reale
fattori mondiali che includiamo, se sta avendo informazioni incomplete quando
intervistare candidati di lavoro, affrontare un mondo che cambia quando si cerca di farlo
risolvere il dilemma di esplorazione / sfruttamento o far dipendere determinati compiti da altri
quando stiamo cercando di portare a termine le cose, più è probabile che finiremo in un
situazione in cui trovare la soluzione perfetta richiede un tempo irragionevolmente lungo. E
in effetti, le persone si confrontano quasi sempre con ciò che considera l'informatica
i casi difficili. Di fronte a casi così difficili, gli algoritmi efficaci fanno
ipotesi, mostrare un pregiudizio verso soluzioni più semplici, compensare i costi dell'errore
contro i costi del ritardo e rischiare.
Queste non sono le concessioni che facciamo quando non possiamo essere razionali. Loro sono
cosa significa essere razionali.
Pagina 285

Appunti

Tieni presente che alcuni dei link a cui si fa riferimento non funzionano più.

I numeri di pagina per le note che apparivano nella versione stampata di questo titolo sono
non nel tuo e-book. Utilizzare la funzione di ricerca sul dispositivo di lettura elettronica per
cercare i passaggi rilevanti documentati o discussi.

INTRODUZIONE
al-Jabr wa'l-Muqābala : Al-Jabr wa'l-Muqābala ha portato con sé una tecnologia davvero dirompente: l'indiana
sistema decimale - e il fatto che ci riferiamo a questo sistema in qualche modo erroneamente come numeri arabi lo è
testimonianza dell'influenza del libro. L'introduzione dei numeri arabi e gli algoritmi che supportano,
ha dato il via a una resa dei conti medievale tra i sostenitori di questa nuova matematica (gli "algoristi") e altri
contabili tradizionali che prediligevano i numeri romani supportati da un pallottoliere (gli "abacisti"). È diventato carino
intenso: la città di Firenze varò nel 1399 una legge che vietava l'uso dei numeri arabi da parte delle banche.
Ironia della sorte, i numeri romani erano essi stessi un'innovazione controversa quando venivano offerti come file
alternativa alla semplice scrittura di numeri con parole, essendo dichiarato "non idoneo a mostrare una somma, dal momento che i nomi
sono stati inventati a tale scopo. " Vedi Murray, Capitoli nella storia della contabilità .
Tavoletta di argilla sumera di quattromila anni: un'analisi dettagliata appare in Knuth, "Ancient Babylonian
Algoritmi. " Ulteriori informazioni sulla storia degli algoritmi, con particolare attenzione alla matematica
algoritmi, appare in Chabert, Barbin e Weeks, A History of Algorithms .
colpisce con la fine di un corno: questa tecnica è nota come "percussione a martello morbido".
"La scienza è un modo di pensare": Sagan, Broca's Brain .

il modo in cui pensiamo alla razionalità umana: i limiti di una concezione classica della razionalità -
che presuppone una capacità computazionale infinita e un tempo infinito per risolvere un problema, erano famosi
indicato dallo psicologo, economista e pioniere dell'intelligenza artificiale Herbert Simon negli anni '50
(Simon, Models of Man ), che alla fine ha portato a un premio Nobel. Simon ha sostenuto che "razionalità limitata"
potrebbe fornire un resoconto migliore del comportamento umano. L'intuizione di Simon è stata ripresa in matematica e
Informatica. Il collega di Alan Turing IJ Good (famoso per il concetto di "singolarità" e per

Pagina 286

consigliare Stanley Kubrick su HAL 9000 per 2001: Odissea nello spazio ) ha definito questo tipo di pensiero "Tipo II
Razionalità." Mentre la razionalità di tipo I classica e antiquata si preoccupa solo di ottenere la risposta giusta,
La razionalità di tipo II tiene conto del costo per ottenere quella risposta, riconoscendo che il tempo è altrettanto
importante una valuta come precisione. Vedi Good, Good Thinking .
Gli esperti di intelligenza artificiale del ventunesimo secolo hanno anche sostenuto che "ottimalità limitata" -
scegliere l'algoritmo che meglio scambia tempo ed errore è la chiave per sviluppare l'intelligenza funzionale
agenti. Questo è un punto sottolineato, ad esempio, dallo scienziato informatico della UC Berkeley Stuart Russell, che letteralmente
ha scritto il libro sull'intelligenza artificiale (il libro di testo più venduto Artificial Intelligence: A Modern
Approach ) e di Eric Horvitz, amministratore delegato di Microsoft Research. Vedi, ad esempio, Russell e
Wefald, Do the Right Thing , e Horvitz e Zilberstein, "Computational Tradeoffs Under Bounded
Risorse ". Tom ei suoi colleghi hanno utilizzato questo approccio per sviluppare modelli di cognizione umana; vedere
Griffiths, Lieder e Goodman, "Rational Use of Cognitive Resources".
analogia con un matematico umano: nella sezione 9 di Turing, "On Computable Numbers", Turing giustifica
le scelte fatte nel definire quella che oggi chiamiamo macchina di Turing confrontandole con operazioni che a
persona potrebbe eseguire: un pezzo di carta bidimensionale diventa un nastro unidimensionale, quello della persona
lo stato d'animo diventa lo stato della macchina, ei simboli vengono scritti e letti come la persona o la macchina
si muove sulla carta. Il calcolo è ciò che fa un computer e al momento gli unici "computer"
erano persone.
siamo irrazionali e inclini all'errore: per esempio, vedi Gilovich, How We Know What Isn't So ; Ariely e
Jones, prevedibilmente irrazionale ; e Marcus, Kluge .

1. ARRESTO OTTIMALE
“Sebbene tutti i cristiani inizino”: dalla lettera di Keplero a “un nobile sconosciuto” il 23 ottobre 1613; vedere,
ad esempio, Baumgardt, Johannes Kepler .
un fenomeno così comune: la goccia di tacchino è menzionata, tra molti altri luoghi, in
http://www.npr.org/templates/story/story.php?storyId=120913056 e
http://jezebel.com/5862181/technology-cant-stop-the-turkey-drop.
In qualsiasi problema di arresto ottimale: per ulteriori informazioni sulla matematica dell'arresto ottimale, Ferguson,
Arresto e applicazioni ottimali , è un ottimo riferimento.
Il puzzle più famoso dell'arresto ottimale: un trattamento dettagliato della natura e delle origini della segretaria
problema appare in Ferguson, "Chi ha risolto il problema del segretario?"
la sua prima apparizione stampata: ciò di cui scrive Gardner è un gioco di società chiamato "Game of Googol",
apparentemente ideato nel 1958 da John Fox della Minneapolis-Honeywell Regulator Company e Gerald
Marnie del MIT. Ecco come fu descritto da Fox nella sua lettera originale a Gardner l'11 maggio 1959 (all
le lettere a Gardner che citiamo provengono dagli articoli di Martin Gardner alla Stanford University, serie 1, riquadro 5, cartella
19):
Il primo giocatore annota tanti numeri positivi univoci su diversi fogli di carta quanti ne ha
auguri. Quindi le mescola e le rigira una alla volta. Se il secondo giocatore glielo dice
fermati a un certo tagliando e il numero su quel tagliando è il numero più grande della collezione, quindi il
il secondo giocatore vince. In caso contrario, il primo giocatore vince.

Fox ha inoltre notato che il nome del gioco deriva dal fatto che il numero "uno googol" è spesso

Pagina 287

scritto su uno dei foglietti (presumibilmente per indurre l'avversario a pensare che sia il numero più alto, con "due
googol "che appare da qualche altra parte). Ha poi affermato che la strategia ottimale per il secondo giocatore era quella di
attendere fino a quando la metà dei tagliandi è stata girata e quindi scegliere il primo numero più grande del più grande nel
primo tempo, convergendo su una probabilità di vittoria del 34,7%.
Gardner ha scritto a Leo Moser, un matematico dell'Università di Alberta, per avere maggiori informazioni
sul problema. Moser aveva scritto un articolo su rivista nel 1956 che affrontava un problema strettamente correlato
(Moser, "On a Problem of Cayley"), originariamente proposto nel 1875 dall'influente matematico britannico
Arthur Cayley (Cayley, "Mathematical Questions"; Cayley, Collected Mathematical Papers ). Ecco il file
versione proposta da Cayley:
Una lotteria è organizzata come segue: ci sono n biglietti che rappresentano rispettivamente a , b , c sterline. UN
la persona disegna una volta; guarda il suo biglietto; e se vuole, disegna di nuovo (dal restante n - 1
Biglietti); guarda il suo biglietto e, se vuole, pesca di nuovo (dai restanti n - 2 biglietti); e così
attivo, attingendo tutto non più di k volte; e riceve il valore dell'ultimo biglietto estratto.
Supponendo che regoli i suoi disegni nel modo a lui più vantaggioso secondo il
teoria delle probabilità, qual è il valore della sua aspettativa?

Moser aggiunse un'altra informazione: che i biglietti avevano le stesse probabilità di assumere un valore
tra 0 e 1.
Nel problema di Cayley e nel leggero rimodellamento di Moser (a volte indicato collettivamente come il
Cayley-Moser), la vincita è il valore del biglietto scelto e la sfida è trovare la strategia
che dà il profitto medio più alto. È qui che il problema esplorato da Cayley e Moser differisce
il problema della segreteria (e il gioco di Googol) concentrandosi sulla massimizzazione del valore medio del
numero scelto, piuttosto che la probabilità di trovare il singolo numero più grande (quando nient'altro che il migliore
andrà bene). L'articolo di Moser del 1956 è degno di nota non solo per la chiara soluzione che fornisce a questo problema, ma anche
perché è il primo posto in cui vediamo menzionare le conseguenze nel mondo reale di un arresto ottimale. Moser parla
circa due possibili scenari: 1. Il problema del turista: un turista che viaggia in macchina vuole fermarsi per la notte
in uno dei n motel indicati sulla sua guida stradale. Cerca la sistemazione più comoda ma naturalmente
non vuole ripercorrere nessuna parte del suo viaggio. Quale criterio dovrebbe usare per fermarsi?
2. Il dilemma dello scapolo: uno scapolo incontra una ragazza che è disposta a sposarlo e il cui "valore" lui
può stimare. Se lui la rifiuta, lei non avrà nessuno di lui in seguito, ma è probabile che incontri altre ragazze nel
futuro e stima di avere n possibilità in tutto. In quali circostanze dovrebbe sposarsi?
L'idea di intrattenere una serie di corteggiatori - con i sessi dei protagonisti invertiti - ha debitamente fatto un
apparizione nella colonna di Gardner del 1960 sul gioco del googol.
Moser ha fornito la soluzione corretta - la regola del 37% - a Gardner, ma la sua lettera del 26 agosto 1959,
ha suggerito che il problema potrebbe avere un'origine anteriore: “Ho anche trovato in alcune note che RE Gaskell (di
Boeing Aircraft in Seattle) distribuito nel gennaio 1959. Attribuisce il problema al Dr. G. Marsaglia ".
L'interpretazione caritatevole di Gardner era che Fox e Marnie rivendicassero la creazione dello specifico
Game of Googol, non del problema più ampio di cui quel gioco era un esempio, un punto che era attentamente
fatto nella sua colonna. Ma ha ricevuto una serie di lettere che citano casi precedenti di problemi simili, e lo è
chiaro che il problema è stato passato in giro tra i matematici.

le origini del problema sono sorprendentemente misteriose: anche Gilbert e Mosteller, “Riconoscendo il
Maximum of a Sequence ”, ammette uno dei più autorevoli articoli scientifici sul problema della segreteria
che "gli sforzi per scoprire l'origine di questo problema non hanno avuto successo". Ferguson, "Chi ha risolto il problema
Problema segretario? "Fornisce una storia divertente e matematicamente dettagliata del problema segretario,
comprese alcune delle sue varianti. Ferguson ha sostenuto che in realtà il problema descritto da Gardner non era stato

Pagina 288

risolto. Dovrebbe essere già chiaro che molte persone hanno risolto il problema del segretario di massimizzare il
probabilità di selezionare il migliore da una sequenza di candidati distinti solo dai loro ranghi relativi, ma
Ferguson ha sottolineato che questo non è effettivamente il problema posto nel gioco di Googol. Prima di tutto, il
Il giocatore di Googol conosce i valori osservati su ogni foglio di carta. Secondo, è un gioco competitivo, con uno solo
giocatore che cerca di selezionare i numeri e una sequenza che ingannerà l'altro. Ferguson ha la sua soluzione
questo problema più impegnativo, ma è abbastanza complesso che dovrai leggere il giornale da solo!
Mosteller ha ricordato di aver sentito parlare del problema: Gilbert e Mosteller, “Riconoscendo il massimo di a
Sequenza."
Roger Pinkham di Rutgers ha scritto: Lettera di Roger Pinkham a Martin Gardner, 29 gennaio 1960.

L'influenza di Flood sull'informatica: vedi Cook, In Pursuit of the Travelling Salesman ; Poundstone,
Dilemma del prigioniero ; e Flood, "Soft News".
considerando il problema dal 1949: Flood fece questa affermazione in una lettera che scrisse a Gardner il 5 maggio,
1960. Allegò una lettera del 5 maggio 1958, in cui forniva la soluzione corretta, sebbene anche lui
ha indicato che si diceva che Andrew Gleason, David Blackwell e Herbert Robbins avessero risolto il problema
problema negli ultimi anni.
In una lettera a Tom Ferguson datata 12 maggio 1988, Flood è andato più in dettaglio sull'origine del
problema. (La lettera è in archivio presso l'archivio Merrill Flood presso l'Università del Michigan.) Sua figlia,
recentemente diplomato al liceo, aveva intrapreso una relazione seria con un uomo più anziano, e Flood e
sua moglie disapprovava. Sua figlia stava prendendo il verbale in una conferenza a George Washington
University nel gennaio 1950, e Flood ha presentato quello che ha chiamato il "problema del fidanzato". Nelle sue parole, "Io
non ha tentato di risolvere il problema in quel momento, ma l'ha introdotto semplicemente perché speravo che [lei]
penserei un po 'in questi termini e suonava come se potesse essere un bel problema matematico facile. "
Flood indica che Herbert Robbins fornì una soluzione approssimativa alcuni anni dopo, prima di Flood
stesso ha capito la soluzione esatta.

sembra essere in un articolo del 1964: il documento è Chow et al., "Optimal Selection Based on Relative Rank".
il meglio che hai visto finora: in letteratura si fa riferimento a ciò che chiamiamo "i migliori ancora" candidati (pensiamo
in modo un po 'confuso) come "candidati".

si assesta al 37% del pool: la regola del 37% si ricava eseguendo la stessa analisi per n candidati che lavorano
la probabilità che l'impostazione di uno standard basato sui primi k candidati risulti nella scelta del migliore
candidato in generale. Questa probabilità può essere espressa in termini di rapporto tra k e n , che possiamo chiamare p . Come n
aumenta, la probabilità di scegliere il miglior candidato converge alla funzione matematica - p log p .
Questo è massimizzato quando p = 1 / e . Il valore di e è 2 . 71828 …, quindi 1 / e è 0 . 367879441 …, o poco meno del 37%.
E la coincidenza matematica - che la probabilità di successo è la stessa di p - si manifesta perché log e è
uguale a 1. Quindi, se p = 1 / e , - p log p è solo 1 / e . Una versione ben spiegata della derivazione completa appare in
Ferguson, "Chi ha risolto il problema del segretario?"
una delle curiose simmetrie matematiche del problema: i matematici John Gilbert e Frederick
Mosteller chiama questa simmetria "divertente" e ne discute leggermente più a lungo in Gilbert e Mosteller,
"Riconoscere il massimo di una sequenza."

"La passione tra i sessi": Malthus, An Essay on the Principle of Population .


"Ho sposato il primo uomo che abbia mai baciato": attribuito da molte fonti, ad esempio, Thomas, Front Row at the White
Casa .

uno studente laureato, in cerca di amore: il post sul blog di Michael Trick sull'incontro con sua moglie è “Finding Love
In modo ottimale " Michael Trucchi Operazioni Ricerca Blog , febbraio 27, 2011,
http://mat.tepper.cmu.edu/blog/?p=1392 .
il numero di candidati o il tempo : la regola del 37% si applica direttamente al periodo di tempo della propria ricerca

Pagina 289

solo quando i candidati sono distribuiti uniformemente nel tempo. Altrimenti, vorrai mirare di più
precisamente per il 37% della distribuzione nel tempo. Vedere Bruss, "Un approccio unificato a una classe di scelta migliore
I problemi."
la regola del 37% dava 26,1 anni di età: L'analisi dell'attesa almeno fino a 26 anni per proporre (37% dei
modo da 18 a 40) appare per la prima volta in Lindley, "Dynamic Programming and Decision Theory", che è
presumibilmente dove Trick ha incontrato questa idea.
corteggiando un totale di undici donne: la storia di Keplero è trattata in dettaglio in Koestler, The Watershed e in
Baumgardt, Johannes Kepler , così come in Connor, la strega di Kepler . La maggior parte di ciò che sappiamo su Keplero
la ricerca di una seconda moglie viene da una lettera in particolare, che Keplero ha scritto a “uno sconosciuto
nobile ”di Linz, Austria, il 23 ottobre 1613.

proporre subito e spesso: Smith, "Un problema del segretario con un'occupazione incerta", ha dimostrato che se il
la probabilità che una proposta venga rifiutata è q , quindi la strategia che massimizza la probabilità di trovare il
1 / (1− q )
il miglior candidato consiste nel considerare una percentuale di candidati pari a qe quindi fare offerte a ciascun candidato
migliori di quelli visti finora. Questa proporzione è sempre inferiore a 1 / e , quindi stai migliorando le tue possibilità
facendo più offerte. Sfortunatamente, quelle possibilità sono ancora peggiori che se non fossi stato rifiutato -
1 / (1− q )
la probabilità di finire con il miglior candidato è anche q , e quindi inferiore a quello fornito da
Regola del 37%.
fino a quando non hai visto il 61% dei candidati: se sono consentite proposte in ritardo, la strategia ottimale dipende da
la probabilità che una proposta immediata venga accettata, q , e la probabilità che una proposta sia ritardata
accettato, p . La percentuale di candidati da passare inizialmente è data dalla formula abbastanza scoraggiante
. Questa formula integrata per il rifiuto e il richiamo viene da Petruccelli, “Best-Choice
Problemi che comportano l'incertezza ", sebbene Yang abbia considerato in precedenza il richiamo ai candidati del passato,
"Riconoscere il massimo di una sequenza casuale."
Questa formula semplifica quando facciamo scelte particolari per q e p . Se p = 0, lo sono le proposte ritardate
sempre bocciato, si riprende la regola per il problema segretario con bocciatura. Quando ci avviciniamo a q = 1, con
proposte immediate sempre accettate, la proporzione alla quale iniziare a fare offerte tende verso
p −1 −1
e , che è sempre maggiore di 1 / e (che può essere riscritto come e ). Ciò significa che avere il potenziale
fare offerte a candidati che sono stati trasferiti dovrebbe comportare un passaggio più lungo
candidati: qualcosa che è abbastanza intuitivo. Nel testo principale assumiamo che le proposte immediate lo siano
sempre accettati ( q = 1), ma ritardati proposte vengono respinte metà del tempo ( p = 0 . 5). Allora dovresti passare
oltre il 61% dei candidati e fa un'offerta al migliore ancora che segue, tornando alla fine e facendo un
offrire al meglio in generale, se necessario.
Un'altra possibilità considerata da Petruccelli è che la probabilità di rigetto aumenti con il tempo, come
S
l'ardore dei candidati diminuisce. Se la probabilità che un'offerta venga accettata da un richiedente è qp , dove
s è il numero di "passaggi" nel passato necessari per raggiungere quel candidato, da cui dipende la strategia ottimale
q , p , e il numero di richiedenti, n . Se q / (1 - p ) è maggiore di n - 1, allora è meglio giocare in attesa,
osservando tutti i candidati e quindi facendo un'offerta al migliore. Altrimenti, osserva una proporzione uguale a
1 / (1− q )
q e fare un'offerta al prossimo richiedente migliore di quelle viste finora. È interessante notare che questo è esattamente il file
stessa strategia (con la stessa probabilità di successo) di quella quando p = 0, il che significa che se la probabilità di
il rifiuto aumenta con il tempo, non c'è alcun vantaggio nel poter tornare da un candidato precedente.

"Non è necessario accumulare esperienza": Gilbert e Mosteller, "Riconoscere il massimo di a


Sequenza."
usa la regola della soglia: la strategia generale per risolvere i problemi di arresto ottimali come il completo
gioco di informazioni è iniziare dalla fine e ragionare a ritroso, un principio che viene chiamato "a ritroso"
induzione." Ad esempio, immagina un gioco in cui tiri un dado e hai la possibilità di restare con quello
numero o tira di nuovo un massimo di k volte (abbiamo preso questo esempio da Hill, "Sapere quando fermarsi").

Pagina 290

Qual è la strategia ottimale? Possiamo capirlo lavorando all'indietro. Se k = 0, non hai un'opzione
- devi restare fedele al tuo tiro e otterrai una media di 3,5 punti (il valore medio di un tiro di dado, (1 + 2 +
3 + 4 + 5 + 6) / 6). Se k = 1, dovresti mantenere solo un tiro che supera quella media, un 4 o superiore. Se ottieni
un 1, 2 o 3, faresti meglio a tentare il tiro finale. Seguendo questa strategia, c'è una probabilità del 50% che ti fermi
con un 4, 5 o 6 (per una media di 5) e una probabilità del 50% di passare al tiro finale (per una media di 3,5).
Quindi il tuo punteggio medio a k = 1 è 4,25 e dovresti mantenere un tiro a k = 2 solo se batte quel punteggio: un 5 o
più alto. E così via.
L'induzione all'indietro risponde quindi a una domanda secolare. "Un uccello in mano vale due nella boscaglia", noi
diciamo, ma è 2 . 0 il coefficiente giusto qui? La matematica suggerisce che il giusto numero di uccelli nella boscaglia
in realtà dipende dalla qualità dell'uccello in mano. Sostituendo gli uccelli con i dadi per comodità, un tiro di
1, 2 o 3 non vale nemmeno quanto un dado "nella boscaglia". Ma un risultato di 4 vale un dado nella boscaglia,
mentre un tiro di 5 vale due, tre o anche quattro dadi nel cespuglio. E un risultato di 6 vale anche più di
l'intero contenuto di un cespuglio di dadi infinitamente grande , qualunque cosa sia.
Gilbert e Mosteller hanno utilizzato lo stesso approccio per derivare la serie di soglie da utilizzare
il problema della segreteria completa dell'informazione. Le soglie stesse non sono descritte da un semplice
formula matematica, ma nel loro articolo compaiono alcune approssimazioni. L'approssimazione più semplice dà a
2
soglia di t k = 1 / (1 + 0 . 804 / k + 0,183 / k ) per il richiedente n - k . Se la probabilità di un candidato casuale
essendo migliore del candidato n - k è minore di t k , allora dovresti prendere quel candidato. Perché il
il denominatore aumenta, a un ritmo crescente, all'aumentare di k , dovresti abbassare rapidamente il tuo
soglia col passare del tempo.
molte altre varianti del problema del segretario: Freeman, "The Secretary Problem and Its Extensions"
riassume un gran numero di queste varianti. Ecco un breve tour di alcuni dei risultati più utili.
Se il numero di candidati è ugualmente probabile che sia un numero qualsiasi da 1 an , la regola ottimale è quella di
2
visualizza il primo n (che
/ e è circa il 13,5% di n ) e prendi il candidato successivo meglio del migliore visto
2
finora, con una probabilità di successo di 2 / e (Presman e Sonin, "Il problema della scelta migliore per un caso
Numero di oggetti ").
Se il numero di candidati è potenzialmente infinito, ma la ricerca si interrompe dopo ogni richiedente con
probabilità p , la regola ottimale è visualizzare i primi 0,18 / p richiedenti, con una probabilità di successo del 23,6% (ibid.).
Immagina di voler trovare la migliore segretaria, ma il valore di farlo diminuisce più a lungo cerchi. Se
K
la ricompensa per aver trovato la migliore segretaria dopo aver visto k candidati è ,dquindi la strategia che massimizza il
il payoff atteso stabilisce una soglia basata su un numero di candidati che è garantito essere inferiore a 1 / (1 - d )
man mano che il numero totale di candidati diventa grande (Rasmussen e Pliska, "Choosing the Maximum"). Se d è
vicino a 1, un'approssimazione alla strategia ottimale consiste nel visualizzare i primi −0,4348 / log d richiedenti e
quindi prendi il prossimo candidato meglio di qualsiasi altro visto finora. Se si segue questa strategia, è possibile visualizzare solo un file
una manciata di candidati, indipendentemente dalle dimensioni del pool.
Un modo in cui la vita reale differisce dagli scenari di reclutamento idealizzati è che l'obiettivo potrebbe non essere quello
massimizzare la probabilità di ottenere la migliore segretaria. È stata esplorata una varietà di alternative. rancio
et al., "Selezione ottimale basata sul rango relativo", ha mostrato che se l'obiettivo è massimizzare il rango medio
del candidato selezionato, si applica un diverso tipo di strategia. Piuttosto che una sola soglia sul parente
grado del richiedente, c'è una sequenza di soglie. Queste soglie aumentano con l'aumentare del numero di candidati
osservato, con l'intervistatore che diventa meno rigoroso nel tempo. Ad esempio, con quattro candidati, il
il grado relativo minimo che un candidato deve avere per interrompere la ricerca è 0 per il primo candidato (non fermarsi mai
il primo), 1 per il secondo (fermarsi solo se sono migliori del primo), 2 per il terzo (fermarsi se migliore o secondo
migliore) e 4 per il quarto (fermati già!). Seguendo questa strategia si ottiene un rango medio atteso di
7 1
1 ⁄ 8 , meglio di (1 + 2 + 3 + 4) / 4 = 2 ⁄ 2 che risulterebbe scegliendo un candidato a caso. Il
la formula per le soglie ottimali si trova per induzione all'indietro ed è complicata: ci riferiamo interessati
lettori del documento originale.
Puoi pensare alla differenza tra il classico problema della segretaria e il caso di grado medio in

Pagina 291

termini di come assegnano i guadagni ai diversi gradi. Nel problema classico, ottieni una vincita di 1 per
scegliendo il meglio e 0 per tutti gli altri. Nel caso del rango medio, ottieni un payoff pari al numero di
candidati meno il grado del candidato selezionato. Ci sono modi ovvi per generalizzare questo e multi-
strategie di soglia simili a quella che massimizza il lavoro di rango medio per qualsiasi funzione di payoff che
diminuisce all'aumentare del grado del ricorrente (Mucci, “On a Class of Secretary Problems”). Un altro
una generalizzazione interessante, con importanti implicazioni per gli amanti più esigenti, è che se la ricompensa è 1 per
scegliendo il migliore ma −1 per scegliere qualcun altro (con 0 per non fare alcuna scelta), dovresti andare
attraverso una percentuale di candidati fornita da , quindi prendi la prima persona meglio di tutte viste così
lontano (o nessuno se tutti falliscono questo criterio) (Sakaguchi, “Bilateral Sequential Games”). Quindi pensaci bene
la tua funzione di guadagno prima di prepararti a impegnarti!
Ma cosa succede se non ti interessa solo trovare la persona migliore, ma quanto tempo hai
insieme? Ferguson, Hardwick e Tamaki, in “Massimizzare la durata del possesso di un relativamente migliore
Oggetto ", ha esaminato diverse varianti di questo problema. Se ti interessa solo massimizzare il tempo che spendi
con la persona migliore nel tuo set di n , dovresti guardare le prime 0,204 n + 1,33 persone e saltare per
la persona successiva meglio di tutti loro. Ma se ti interessa massimizzare la quantità di tempo che trascorri
qualcuno che è il migliore di tutte le persone viste finora, dovresti solo guardare una proporzione corrispondente a
2
1 / e ≈ 13,5%. Questi periodi più brevi sono particolarmente rilevanti in contesti, come gli appuntamenti, dove
la ricerca di un partner potrebbe occupare una parte significativa della tua vita.
Si scopre che è più difficile trovare la seconda persona migliore che trovare la migliore. La strategia ottimale
è passare oltre la prima metà dei candidati, quindi scegliere il candidato successivo che è il secondo migliore rispetto a
quelli visti finora (Rose, "A Problem of Optimal Choice and Assignment"). La probabilità di successo è giusta
1/4 (al contrario di 1 / e per i migliori). Quindi è meglio non cercare di accontentarsi.
Infine, ci sono anche varianti che riconoscono il fatto che mentre stai cercando una segretaria, la tua
i candidati sono essi stessi alla ricerca di un lavoro. La simmetria aggiunta, che è particolarmente rilevante quando il
lo scenario riguarda gli appuntamenti - rende il problema ancora più complicato. Peter Todd, uno scienziato cognitivo presso
Indiana University, ha esplorato in dettaglio questa complessità (e come semplificarla). Vedi Todd e Miller,
"From Pride and Prejudice to Persuasion Satisficing in Mate Search" e Todd, "Coevolved Cognitive
Meccanismi nella ricerca degli accoppiamenti. "

Vendere una casa è simile: il problema della vendita di una casa è analizzato in Sakaguchi, "Programmazione dinamica
di alcuni progetti di campionamento sequenziale ”; Chow e Robbins, "A Martingale System Theorem and
Applicazioni "; e Chow e Robbins, "On Optimal Stopping Rules". Ci concentriamo sul caso in cui c'è
sono potenzialmente infinite molte offerte, ma questi autori forniscono anche strategie ottimali quando il numero di
le potenziali offerte sono note e limitate (che sono meno conservative: dovresti avere una soglia inferiore se lo desideri
hanno solo finitamente molte opportunità). Nel caso infinito, dovresti impostare una soglia basata sul previsto
valore di aspettare un'altra offerta e prendere la prima offerta che supera quella soglia.
prezzo di arresto in funzione del costo dell'attesa: esprime sia il prezzo di offerta pe il costo dell'attesa
per un'altra offerta c come frazioni della nostra fascia di prezzo (con 0 come il minimo dell'intervallo e 1 come il massimo), il
possibilità che la nostra prossima offerta sia migliore di p è semplicemente 1 - p . Se (o quando) arriva un'offerta migliore, la media
(1− p )
l'importo che ci aspetteremmo di guadagnare rispetto a p è giusto ⁄ 2 . Moltiplicarli insieme ci dà il previsto
risultato di intrattenere un'altra offerta, e questo dovrebbe essere maggiore o uguale al costo c per valere
(1− p )
facendo. Questa equazione (1 - p ) ( ⁄ 2 ) ≥ c può essere semplificato in e risolverlo per p ci dà il
risposta , come tracciato Qui.

"La prima offerta che abbiamo ricevuto è stata fantastica": Laura Albert McLay, intervista personale, 16 settembre 2014.
modellare il modo in cui le persone cercano lavoro: viene affrontata la formulazione della ricerca di lavoro come un problema di arresto ottimale
con in Stigler, "The Economics of Information" e Stigler, "Information in the Labour Market". McCall,
"Economics of Information and Job Search", proposto utilizzando un modello equivalente alla soluzione del
problema delle vendite di case, e Lippman e McCall, "The Economics of Job Search", ne discute diversi
Pagina 292

estensioni a questo modello. Proprio come il problema del segretario ha ispirato una vasta gamma di varianti, lo hanno fatto gli economisti
ha perfezionato questo semplice modello in vari modi per renderlo più realistico: consentendo l'arrivo di più offerte
lo stesso giorno, modificando i costi per il venditore e incorporando le fluttuazioni dell'economia durante il
ricerca. Una buona recensione dell'arresto ottimale in un contesto di ricerca di lavoro può essere trovata in Rogerson, Shimer e
Wright, Search-Theoretic Models of the Labour Market .

non sarà al di sopra della tua soglia ora: come afferma un sondaggio sul problema della ricerca di lavoro: "Assumi in precedenza
le offerte rifiutate non possono essere richiamate, anche se in realtà non è restrittivo perché il problema è stazionario,
quindi un'offerta che non è accettabile oggi non sarà accettabile domani ”(ibid.).
"Parcheggio per la facoltà": Clark Kerr, come citato in "Education: View from the Bridge" , Time , novembre
17, 1958.
"Piano sul traffico previsto": Donald Shoup, corrispondenza personale, giugno 2013.
implementato nel centro di San Francisco: ulteriori informazioni sul sistema SFpark sviluppato da
SFMTA, e il suo prezzo dinamico ispirato a Shoup, può essere trovato su http://sfpark.org/how-it-works/pricing/.
(Lo stesso Shoup è coinvolto in un ruolo di consulenza.) Questo programma ha iniziato ad avere effetto nel 2011 ed è il primo
progetto nel suo genere nel mondo. Per una recente analisi degli effetti del programma, vedere Millard-Ball,
Weinberger e Hampshire, "Il marciapiede è pieno all'80% o vuoto al 20%?"

quando l'occupazione passa dal 90% al 95%: Donald Shoup, intervista personale, 7 giugno 2013. Per essere precisi,
l'aumento dal 90% al 95% di occupazione riflette un aumento del 5,555… per cento.

Supponiamo di trovarvi su una strada infinitamente lunga: è stato presentato il problema di base del parcheggio, come formulato qui
come problema in DeGroot, Optimal Statistical Decisions . La soluzione è prendere il primo posto vuoto inferiore a
−log 2 / log (1− p ) punti dalla destinazione, dove p è la probabilità che un dato spazio sia disponibile.

non è necessario iniziare a guardare seriamente: il capitolo 17 di The High Cost of Free Parking di Shoup
discute la strategia di parcheggio su strada ottimale quando il prezzo crea una media di uno spazio libero per blocco,
che, come nota Shoup, “dipende dal conflitto tra avidità e pigrizia” (corrispondenza personale). Il
si pone la questione se "fare una crociera" per posti economici in strada o pagare per parcheggi privati
Capitolo 13 di Shoup.
una serie di modifiche a questo scenario di base: Tamaki, "Approccio adattivo ad alcuni problemi di arresto",
ha permesso alla probabilità che uno spot fosse disponibile di variare in base alla posizione e ha considerato come questi
le probabilità potrebbero essere stimate al volo. Tamaki, "Arresto ottimale nel problema del parcheggio con U-
Turn ", ha aggiunto la possibilità di inversioni a U. Tamaki, "An Optimal Parking Problem", considerato un'estensione
al modello di DeGroot in cui le opportunità di parcheggio non sono considerate un insieme discreto di punti. Sakaguchi
e Tamaki, "Sul problema del parcheggio ottimale in cui gli spazi appaiono casualmente", hanno usato questo continuo
formulazione e ha lasciato che la destinazione fosse sconosciuta. MacQueen e Miller, “Optimal Persistence
Politiche ", considerata indipendentemente una versione continua del problema che consente di aggirare il blocco.

"I ride my bike": Donald Shoup, intervista personale, 7 giugno 2013.


La rivista Forbes ha identificato Boris Berezovsky: Forbes , "World's Billionaires", 28 luglio 1997, p. 174.
uno di una nuova classe di oligarchi: Paul Klebnikov, "The Rise of an Oligarch" , Forbes , 9 settembre 2000.
“Colpire una volta sola, ma in testa”: Vladimir Putin, intervista al quotidiano francese Le Figaro ,
26 ottobre 2000.
libro interamente dedicato al problema del segretario: Berezovsky e Gnedin, Problems of Best Choice .
analizzato sotto diverse forme: ci sono vari modi per affrontare il problema di smettere di fumare quando
sei avanti. Il primo è massimizzare la lunghezza di una sequenza di vittorie. Supponiamo che tu stia lanciando una moneta
ha una probabilità p di uscire testa. Paghi c dollari per ogni possibilità di lanciare la moneta e ottieni
$ 1.00 quando esce testa, ma perde tutti i guadagni accumulati quando esce croce. Quando dovresti

Pagina 293

smettere di lanciare la moneta? La risposta, come mostrato da Norman Starr nel 1972, è di fermarsi dopo r teste, dove r è il
r +1
numero più piccolo tale che p ≤ c . Quindi, se è una moneta normale con p = 1/2 e costa $ 0,10 per lanciare la moneta,
dovresti fermarti non appena ottieni quattro teste di fila. L'analisi delle sequenze di teste appare in Starr,
"Come vincere una guerra se devi", dove viene presentato come un modello per vincere una guerra di logoramento. Un altro
un'analisi completa è presentata in Ferguson, "Stopping a Sum during a Success Run".
Massimizzare la lunghezza di una serie di teste è un'analogia abbastanza buona per alcuni tipi di situazioni aziendali—
per una sequenza di accordi che costano c da impostare, hanno una probabilità p di risolversi e pagano d in caso di successo ma
r / d +1
cancellare i tuoi guadagni in caso di fallimento, dovresti smettere dopo aver guadagnato r dollari in≤modo
c / d .tale
Droga
che pambiziosa
rivenditori, prendi nota.
Nel problema del ladro discusso nel testo, supponiamo che l'importo medio guadagnato da ogni rapina sia m
e la probabilità di farla franca con la rapina è q . Ma se il ladro viene catturato, succede con
probabilità 1 - q , perde tutto. La soluzione: esci quando i guadagni accumulati sono maggiori di o
pari a mq / (1 - q ). Il problema del ladro appare in Haggstrom, "Optimal Sequential Procedures When
È necessario più di uno stop ”, come parte di un problema più complesso in cui sta cercando di farlo anche il ladro
decidere in quale città trasferirsi.
trovato da una guardia del corpo: vedere, ad esempio, "Boris Berezovsky 'Found with Ligature Around His Neck'", BBC
Notizie , 28 marzo 2013, http://www.bbc.com/news/uk-21963080 .
conclusione ufficiale di un esame post-mortem: vedere, ad esempio, Reuters, "Berezovsky Death Coerent with
Hanging: Police ", 25 marzo 2013, http://www.reuters.com/article/2013/03/25/us-britain-russia-
berezovsky-postmortem-idUSBRE92O12320130325 .

"Berezovsky non si arrende": Hoffman, The Oligarchs , p. 128.


non v'è alcuna regola arresto ottimale: Una condizione per un ottimale regola d'arresto esistere è che la media
la ricompensa per l'arresto nel miglior punto possibile sia finita (vedere Ferguson, Arresto ottimale e applicazioni ).
Il gioco del "triplo o niente" viola questa condizione: se le teste escono k volte seguite da una coda, il
K k +1
il miglior giocatore possibile ottiene
- 1 come
3 ricompensa, fermandosi subito prima di quella coda. La probabilità di ciò è 1/2 .
La media su k è quindi infinita.
Se stai pensando che questo potrebbe essere risolto supponendo che le persone valutino il denaro meno e più loro
avere - che triplicare la ricompensa monetaria potrebbe non triplicare l'utilità che le persone assegnano a quel denaro - allora
c'è una soluzione semplice: ottieni comunque un gioco senza una regola di arresto ottimale solo offrendo ricompense
che triplicano nella loro utilità. Ad esempio, se l'utilità assegnata al denaro aumenta come funzione logaritmica
della somma di denaro, il gioco diventa "cubo o niente", la quantità di denaro che potresti
ricevere sulla prossima scommessa viene elevato alla potenza di tre ogni volta che vinci.
Curiosamente, anche se non esiste una regola di arresto ottimale per "triplo o niente", dove si trova tutta la tua fortuna
sempre in gioco, ci sono comunque buone strategie per giocare a giochi come questo quando puoi scegliere
quanto del tuo bankroll scommettere. Il cosiddetto schema di scommesse Kelly, dal nome di JL Kelly Jr. e primo
descritto in Kelly, "A New Interpretation of Information Rate", è un esempio. In questo schema, un giocatore
( p ( b +1) −1)
può massimizzare il suo tasso di rendimento scommettendo una percentuale di ⁄ b del suo bankroll su ciascuna sequenza
di scommesse che pagano b + 1 volte la puntata originale con probabilità p . Per il nostro gioco triplo o niente, b = 2
e p = 0 . 5, quindi dovremmo scommettere ogni volta un quarto del nostro bankroll, non tutto, che inevitabilmente
porta al fallimento. Una storia accessibile delle scommesse di Kelly appare in Poundstone, Fortune's Formula .

“Passa attraverso questo mondo ma una volta”: La provenienza di questa citazione non è del tutto certa, sebbene lo sia
è stato citato come un detto quacchero dalla seconda metà del diciannovesimo secolo, e sembra che lo sia stato
attribuito a Grellet almeno dal 1893. Per ulteriori informazioni, vedere W. Gurney Benham, Benham's Book of Citations,
Proverbi e parole di famiglia , 1907.
"Trascorri il pomeriggio": Dillard, Pilgrim a Tinker Creek .

segue più da vicino il classico problema della segretaria: Seale e Rapoport, “Sequential Decision Making

Pagina 294

con gradi relativi. "

balzò prima di quanto avrebbero dovuto: Ibid. Il luogo tipico in cui le persone passano dal guardare
il salto era di 13 richiedenti su 40 e 21 richiedenti su 80, rispettivamente del 32% e del 26%.

“Per natura sono molto impaziente”: Amnon Rapoport, intervista personale, 11 giugno 2013.
Seale e Rapoport hanno mostrato: Seale e Rapoport, "Sequential Decision Making with Relative Ranks".
"Non è irrazionale annoiarsi": Neil Bearden, corrispondenza personale, 26 giugno 2013. Vedi anche
Bearden, "A New Secretary Problem".
trasforma tutto il processo decisionale in un arresto ottimale: questo tipo di argomentazione è stata avanzata per la prima volta da Herbert
Simon, ed è stato uno dei contributi per cui ha ricevuto il premio Nobel. Simon ha iniziato il suo
notevole carriera come scienziato politico, scrivendo una dissertazione sull'argomento forse poco promettente di
comportamento amministrativo. Mentre approfondiva il problema di capire come le organizzazioni si componevano di reale
le persone prendono decisioni, ha sperimentato una crescente insoddisfazione per i modelli astratti di decisione-
fare offerto dall'economia matematica - modelli che si allineano con l'intuizione che l'azione razionale
richiede un'attenta considerazione delle nostre opzioni.
L'indagine di Simon su come le decisioni vengono effettivamente prese nelle organizzazioni glielo ha reso chiaro
queste ipotesi erano errate. Era necessaria un'alternativa. Come ha scritto in “A Behavioral Model of
Scelta razionale "," il compito è sostituire la razionalità globale dell'uomo economico con una sorta di razionale
comportamento compatibile con l'accesso alle informazioni e le capacità computazionali effettivamente
posseduto da organismi, compreso l'uomo, nei tipi di ambienti in cui esistono tali organismi ".
Il tipo di soluzione che Simon ha proposto come un resoconto più realistico della scelta umana - quello che ha soprannominato
"Soddisfacente": usa l'esperienza per stabilire una soglia per un risultato soddisfacente e "abbastanza buono", poi ci vuole
la prima opzione per superare quella soglia. Questo algoritmo ha lo stesso carattere delle soluzioni al
problemi di arresto ottimale che abbiamo considerato qui, in cui la soglia è determinata dalla spesa
un po 'di tempo per avere un'idea della gamma di opzioni (come nel problema della segretaria) o in base alla conoscenza del file
probabilità di risultati diversi. In effetti, uno degli esempi usati da Simon nella sua argomentazione è stato quello di
vendere una casa, con una soluzione simile a quella qui presentata.
il libro di testo definitivo sull'arresto ottimale: questo è Ferguson, Optimal Stop and Applications .

2. ESPLORA / ESPLORA

"Fatti nuovi amici": Joseph Parry, "Nuovi amici e vecchi amici", in The Best Loved Poems of the
American People , ed. Hazel Felleman (Garden City, NY: Doubleday, 1936), 58.

"Vita così ricca e rara": Helen Steiner Rice, "The Garden of Friendship", in The Poems and Prayers of
Helen Steiner Rice , ed. Virginia J. Ruehlmann (Grand Rapids, MI: Fleming H. Revell), 47.
"Cerchi di trovare spazi": Scott Plagenhoef, intervista personale, 5 settembre 2013.
Lo strano nome deriva da: In una lettera a Merrill Flood datata 14 aprile 1955 (disponibile in Merrill Flood
archivio presso l'Università del Michigan), Frederick Mosteller racconta la storia dell'origine del nome.
Mosteller e il suo collaboratore Robert Bush st