Ordine e Caos Google e L Arte Della Memo PDF

0103_vitali.qxp 01/09/2005 13.
08 Pagina 1
STEFANO VITALI*
Ordine e caos:
Google e l’arte della memoria
L’ordine è la madre della memoria.

JOHANN HEINRICH ALSTED
Google è stato progettato per mettere

ordine nel caos delle informazioni.
GUIDA ALLE FUNZIONI DI RICERCA DI GOOGLE
Prive di contesto, le parole

e le azioni non hanno alcun significato.
GREGORY BATESON
Il mondo secondo Google

L’immagine di Internet come sterminato “archivio” (effettivo o potenziale) delle
conoscenze, come una sorta di “memoria” (volontaria o involontaria) dell’umanità
costituisce uno dei miti più diffusi della nostra epoca.
Come sempre accade, anche in questo caso, il mito racconta qualcosa - forse poco,
forse molto - di vero, ma, al contempo, nasconde una realtà assai più complessa e pro-
blematica e talvolta inquietante. Una delle ragioni dell’inquietudine che Internet tra-
smette è riassunta in un interrogativo che tutti, almeno un volta, ci siamo posti: se in
Internet c’è tutto o di tutto, come faccio a trovare ciò che davvero mi serve e a scovare,
tra le tante risposte possibili, quella che meglio soddisfa le mie domande? Per nostra
fortuna - anche questo lo abbiamo presto imparato - c’è qualcuno che lavora a lenire
le nostre inquietudini e solennemente ce lo annuncia nel proprio sito Web.
Per sfruttare l’enorme quantità dei dati disponibili sul Web è necessario poter contare su
un servizio di ricerca di ottima qualità capace di fornire dati accessibili e utili. Senza uno
strumento di ricerca potente, trovare un sito Web specifico potrebbe essere difficile se non
addirittura impossibile. (…) Google è stato progettato per mettere ordine nel caos delle
informazioni1.
I cosiddetti “motori di ricerca”, e Google in particolare, son diventati negli ultimi

anni il “sistema di ricerca” per antonomasia. Digitare una o più parole nel form della
* Stefano Vitali lavora presso l’Archivio di Stato di Firenze.

Tutti i siti Web citati erano attivi alla data del 31 luglio 2005.
1 “Google. Guida alle funzioni di ricerca”, http://www.google.it/intl/it/why_use.html.
1
0103_vitali.qxp 01/09/2005 13.08 Pagina 2
STEFANO VITALI
home page di Google, scarna ed essenziale, ma proprio per questo rassicurante - come
a dire: l’ordine nel caos comincia proprio da qui - è diventato un gesto quotidiano, cui
ricorriamo nelle più varie e diverse circostanze. È così che Google è anch’esso diventato
un altro dei miti che costellano l’immaginario collettivo della contemporaneità e “il
mondo secondo Google”2 ha incominciato ad influenzare sottilmente il “mondo secon-
do noi”, cioè il nostro modo di conoscere e di interagire con la realtà, non solo con quel-
la “virtuale”, ma anche con quella “materiale”. E non solo con la realtà più lontana, ma,
grazie al “Google Desktop Search” che consente di cercare nei file salvati sui singoli per-
sonal computer, anche con quella più a portata di mano, come i nostri computer3.
D’altronde il peso di Google in un mondo molto “materiale” come quello dove circola-
no i quattrini e si accumulano le ricchezze è stato sancito dal successo della sua colloca-
zione in borsa. Nel luglio 2005 la capitalizzazione delle azioni dell’impresa che lo ha svi-
luppato e lo gestisce aveva raggiunto gli 88 miliardi di dollari, una cifra maggiore di
General Motor, Ford and Chrysler messe insieme4.
Ma, come tutti i successi, anche quello di Google ha mietuto le sue vittime. Non si
tratta soltanto dei diretti concorrenti5, oppure di coloro che non vedono il proprio sito
ben piazzato all’interno delle prime 10-20 voci indicizzate nelle liste di Google, né di
coloro che risultano sconfitti nelle mitiche Googlewars che, attraverso il numero delle
pagine rispettivamente recuperate con Google, mettono a confronto la popolarità di per-
sone, film, canzoni e di quant’altro si possa ricercare sul Web6. Altri sconfitti - se reali o
potenziali, se nei fatti o nell’autopercezione degli interessati, importa fino ad un certo
punto - vengono da molto più lontano dei giovani e rampanti webmaster che considera-
no Google come metro del proprio successo. Si tratta di venerandi professionisti che fino
a non molto tempo fa ritenevano di essere i detentori pressoché esclusivi del monopo-
lio della conservazione e della trasmissione della memoria e delle conoscenze accumu-
late nel corso dei secoli dall’umanità, almeno di quelle affidate alla carta (o a supporti
affini) e alla parola scritta e che, soprattutto, pensavano di aver messo a punto, con
molta fatica e dispendio di notevoli energie intellettuali e materiali, ottimi strumenti per
la ricerca ed il recupero di quella memoria e di quelle conoscenze.
2 Come esplicitamente teorizza il sito australiano Googlism, “Googlism fu sviluppato come uno strumento di
divertimento per vedere cosa Google “pensa” di certi argomenti e di certe persone. Naturalmente i risultati
non sono realmente opinioni di Google, piuttosto sono le vostre opinioni, dei responsabili dei siti Web del
mondo. (…) Noi semplicemente facciamo ricerche con Google e ti facciamo sapere cosa i responsabili dei siti
pensano del nome o dell’argomento che hai suggerito”. Nel gennaio 2004 Google, che evidentemente non gra-
diva l’iniziativa satirica, ha impedito a Googlism di effettuare query su Google: http://www.googlism.com/
about.htm.
3“Desktop Search vi permette di trovare in modo semplice e veloce le informazioni sul vostro computer, non
dovrete più organizzare manualmente file, email e bookmark. Dopo aver scaricato Google Desktop Search, l’ap-
plicazione crea un indice di tutte le informazioni disponibili per la ricerca e le memorizza sul computer, con-
sentendovi di cercare gli elementi personali con la stessa facilità con cui eseguite ricerche su Internet con
Google”: “Informazioni su Google Desktop Search”, http://desktop.google.it/it/about.html.
4 Cfr. R. Staglianò, Internet, l’estate che ci cambiò la vita, in “La domenica di Repubblica”, 24 luglio 2005, p. 30.
5Google è di gran lunga il motore di ricerca più utilizzato nella Rete, svolgendo circa la metà delle interroga-
zioni che gli utenti rivolgono all’insieme dei motori: cfr. D. Pellegrino, Google tratta circa la metà delle ricerche
online, in “Apogeonline News”, 28 luglio 2005, http://www.apogeonline.com/webzine/2005/07/28/02/
200507280201.
6 Cfr. http://www.googlewar.com/.
2
ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA
Questi professionisti sono gli archivisti e i bibliotecari che il successo di Google

sembra aver spinto, almeno in alcune realtà, sull’orlo di una profonda crisi d’identità,
costellata da interrogativi sulla persistente funzionalità, o la totale obsolescenza, che
avrebbe colpito non tanto, come è ovvio, i cataloghi e gli inventari cartacei, quanto gli
OPAC, le banche dati on line e tutti gli strumenti di ricerca digitali da essi predisposti,
che sembrano esser diventati delle armi spuntate di fronte all’incalzare dei motori di
ricerca e alle abitudini che essi ingenerano negli utenti. In una recente discussione
sulla lista degli archivisti canadesi c’è chi ha sostenuto che “in 5 o 10 anni tutti useran-
no Google per cercare tutto” e che perciò gli archivisti dovrebbero smetterla di svilup-
pare le proprie banche dati e i propri astrusi sistemi informativi per affidare la ricer-
ca dei propri prodotti descrittivi all’efficienza di Google7. Non diversamente, uno stu-
dio di OCLC ha indicato come presso i bibliotecari americani sia ampiamente diffusa
la sensazione di essere entrati in un mondo nel quale le tradizionali logiche di ricerca
nei cataloghi bibliografici attirino sempre meno utenti8. Una sensazione d’altronde
confermata da un articolo pubblicato nel giugno 2004 sul “New York Times”, che pre-
sentava uno studio secondo il quale nelle abitudini di ricerca degli studenti america-
ni i vecchi “motori di ricerca”, cioè le biblioteche, sarebbero stati quasi totalmente sop-
piantati dalle “electronic resources” che “sono diventate il principale strumento per la
raccolta di informazioni” soprattutto per gli studenti dei gradi intermedi9.
Non è certo una scelta casuale, ma il segno di una precisa e consapevole strategia
di difesa o di risposta all’incalzare dei motori di ricerca, l’adesione di gruppo cospicuo
di importanti biblioteche britanniche e statunitensi (fra le quali quelle delle Università
di Oxford, Harvard, Stanford, Michigan, nonché la New York Public Library) al Google
Print Library Project che si propone di riprodurre in formato digitale e di rendere ricer-
cabili on line tramite Google i libri posseduti da quelle biblioteche, aprendo alla libera
consultazione quelli non più coperti da copyright. Alla base di questa convergenza, che
non ha mancato di suscitare perplessità e non poche critiche, c’è l’idea che attraverso
questa strada le biblioteche possano acquistare maggiore visibilità e credibilità presso
la “Google generation”, convincendo le nuove generazioni che libri e biblioteche con-
tinuano a svolgere una importante funzione, essendo in grado di offrire la stessa infor-
mazione, anzi probabilmente una informazione di migliore qualità, rispetto a quella
che si raggiunge ordinariamente con i motori di ricerca10.
7 Cfr. i messaggi di Laura Millar e Tim Hutchinson, in “ARCAN-L”, 13-16 agosto 2004.
8Cfr. C. De Rosa, L. Dempsey, A. Wilson (a cura di), 2003 Environmental Scan: Pattern Recognition, OCLC Online
Computer Library Center, Dublin, Ohio 2004, http://www.oclc.org/reports/2003escan.htm.
9 Cit. in J. Pereira, Introduction and Overview, in DigiCULT, Thematic Issue 6: Resource Discovery Technologies for
the Heritage Sector, giugno 2004, p. 5, http://www.digicult.info/downloads/digicult_thematic_issue_
6_lores.pdf.
10 Su questi progetti cfr. B. Parrella, Libri e biblioteche: specie in via d’estinzione?, in “Apogeonline News”, 30 mag-
gio 2005, http://www.apogeonline.com/Webzine/2005/05/30/01/2005053001; W. Roush, The Infinite Library, in

“Technology Review”, maggio 2005, http://www.technologyreview.com/articles/05/05/issue/feature_
library.asp. I primi risultati del progetto possono consultarsi all’indirizzo http://print.google.com/.
3
STEFANO VITALI
Ars memorandi e…
È difficile negare che ci sia qualcosa di vero nelle sensazioni o nelle diagnosi secondo
le quali l’avvento di Google, e dei motori di ricerca più in generale, rappresenta una svol-
ta, un momento di rottura rispetto ai percorsi e alle tecniche tradizionalmente messi in
campo ad opera di archivisti e bibliotecari per rendere possibile ricercare e trovare le
informazioni che, di volta in volta, ci occorrono per individuare gli strumenti attraverso
i quali possiamo acquisire nuove conoscenze. Anzi, se proviamo a gettare uno sguardo
all’indietro, ci rendiamo conto che la rottura con un’intera tradizione culturale, che
Google e i motori di ricerca hanno in qualche modo determinato, è forse più radicale e
profonda.
C’è infatti un filo rosso che lega mestieri come quello dell’archivista e del biblioteca-
rio a quel fiume carsico che ha attraversato buona parte della storia della cultura occiden-
tale e che è costituito dalla tradizione dell’ars memorandi, da quella incessante ricerca, cioè,
di forme e metodologie di organizzazione, conservazione e recupero della memoria, inte-
sa come patrimonio di conoscenze sedimentatosi non solo e non tanto nelle menti dei sin-
goli, quanto nel sapere accumulato dalle generazioni nel corso del tempo.
Ormai da decenni, una larga messe di studi (da quelli della Yates, a quelli di Paolo
Rossi o di Lina Bozoni e Umberto Eco, solo per ricordarne alcuni) hanno sviluppato
approfondite ed affascinanti indagini su quella tradizione che, sbocciando con l’ars memo-
randi classica, si dispiega attraverso le interpretazioni e le metamorfosi che questa subì
nel Medioevo e nel Rinascimento, e le riletture di cui fu fatta oggetto nel corso dibattito
seicentesco e settecentesco sull’Enciclopedia e il metodo delle scienze naturali. Questa
tradizione culturale, e le varie “tecnologie dell’intelletto” (per riprendere una espressio-
ne di Jack Goody) sviluppate a partire da essa, hanno fatto perno attorno a due concetti
chiave, a due fondamentali idee forza, sempre implicate, seppure con modalità e declina-
zioni diverse, in ogni progetto di conservazione/trasmissione/recupero della memoria e
del sapere: quella di ordine e quella di classificazione. Organizzare il sapere, classificar-
lo, costruire un ordine ha sempre significato conservarlo e renderlo disponibile. Come ha
notato efficacemente Paolo Rossi,
la connessione fra organizzazione e conservazione fa parte integrante del discorso sulla

memoria ed è inscindibile da esso (…) Non è che prima si classifichi e poi si ricordi.
All’interno di quella secolare tradizione che si richiama alle arti della memoria (...) con-
servare e organizzare sono una cosa sola11.
Nell’ars memorandi classica, parte integrante della retorica, l’ordine è in primo luogo
un ordine spaziale e topografico, come efficacemente illustra la leggenda di Simonide di
Ceo, dalla quale prende le mosse lo studio di Frances A. Yates. La collocazione di con-
cetti, immagini, parole all’interno di architetture immaginarie, deve permettere di recu-
perarli alla bisogna scorrendo i loci in cui sono stati inscritti, di “modo che l’ordine dei
luoghi - come scriveva Cicerone - garantisca l’ordine delle cose”12.
11 P. Rossi, Il passato, la memoria, l’oblio. Otto saggi di storia delle idee, Il Mulino, Bologna 2001, 2^ed, p. 78.
12La citazione dal De Oratore di Cicerone è in F. A. Yates, L’arte della memoria, Einaudi, Torino 2004, pp. 3-5; cfr.
comunque, su queste tematiche, almeno i due primi capitoli, pp. 3-46.
4
L’idea che “l’ordine che assumono i ricordi qualunque esso sia” - si tratti di un
ordine “puramente soggettivo” oppure “formale di tipo matematico” - fosse “lo stru-
mento più efficace per richiamar[li]” trovava, d’altronde, il proprio fondamento nel De
memoria et reminiscentia di Aristotile13. E proprio attraverso Aristotile, gli scritti di
Quintiliano e di Cicerone o dello Pseudo-Cicerone della Retorica ad Herennium, l’arte
della memoria classica viene accolta nel pensiero medievale e integrata nella
Scolastica. La prima “delle quattro cose che aiutano l’uomo a ben ricordare” che
Giovanni da San Gimignano, riprendendo le tesi di San Tommaso, elencava era che
“egli dispon[esse] le cose che desidera ricordare in un certo ordine”14.
Incontratasi, fra Cinquecento e Seicento, con il cabalismo, il lullismo e la tradizio-
ne emetica, l’ars memorandi subisce un’ulteriore metamorfosi e, da parte integrante
della retorica, diventa componente della logica e, soprattutto, strumento di unificazio-
ne del sapere nel quadro di un utopico progetto di descrizione e classificazione enci-
clopedica dell’intero reale:
proprio perché si costituisce come la scienza delle scienze, l’arte [della memoria] è in
grado di offrire il criterio per un preciso e razionale ordinamento di tutto lo scibile i vari
aspetti del quale (…) vengono tutti ricompresi e inverati nell’arte15.
Così, se “la memoria è la tecnica dell’ordinamento enciclopedico delle nozioni”, il

problema del metodo della conoscenza “si risolve senza residui nel problema dell’or-
dine o di una sistematica classificazione”16.
Nella particolare torsione che a questo tipo di tematiche sarà data da Francesco
Bacone in poi, la questione dell’organizzazione del sapere diventa il problema della
fondazione di un metodo scientifico che non deve servire tanto a sistematizzare il
sapere già esistente, ma a permettere di scoprire nuove verità. Ma ancora una volta il
problema della classificazione e dell’ordine del sapere svolgeva un ruolo cruciale:
All’interno del nuovo metodo (la interpretatio naturae) gli aiuti alla memoria hanno il
compito di (…) impedire che l’intelletto si trovi come “smarrito” di fronte alla caotica
massa dei fatti. Il metodo trasforma una realtà caotica in una realtà organizzata. È, prima
di ogni altra cosa, ordinamento e classificazione17.
È proprio questa trasformazione nelle finalità dell’ars memorandi che, se da un lato

si intreccia “con le ricerche e le utopie relative alla creazione di una lingua artificiale e
universale” e, dall’altro, “condiziona il problema delle ‘classificazioni’ nella botanica,
13 Vedi su questo punto la disanima di C. A. Viano, La biblioteca e l’oblio, in P. Rossi (a cura di), La memoria del
sapere. Forme di conservazione e strutture organizzative dall’antichità ad oggi, Laterza, Roma-Bari 1990, p. 243.
14 Cfr. F. A. Yates, L’arte della memoria, cit., p. 79. Sull’arte delle memoria nel Medioevo cfr., in particolare, M.
Carruthers, The Book of Memory. A Study of Memory in Medieval Culture, Cambridge University Press, Cambridge
1990; cfr. anche L. Bolzoni, La rete delle immagini. Predicazione in volgare dalle origini a Bernardino da Siena,
Einaudi, Torino 2002.
15P. Rossi, Clavis universalis. Arti della memoria e logica combinatoria da Lullo a Leibniz, Il Mulino, Bologna 2000,
2^ ed., p. 67. Il corsivo è nel testo.
16 P. Rossi, Il passato, la memoria, l’oblio, cit., pp. 64-65.
17 P. Rossi, La memoria, le immagini, l’enciclopedia, in La memoria del sapere, cit., p. 224.
5
STEFANO VITALI
nella zoologia, nella chimica”, pone, allo stesso tempo, le premesse per la sua defini-
tiva estinzione. Come ha rilevato ancora Paolo Rossi,
l’arte delle memoria scompare, come tecnica “separata”, nell’età di Leibniz. Da un lato
diventa parte del nuovo metodo scientifico di Bacone e Cartesio, dall’altro lato va a con-
fluire nel grande progetto leibniziano di una ars combinatoria. Una delle ragione della
scomparsa è anche da vedere nel fatto che la stima o la considerazione per la memoria è
andata sempre più declinando18.
Così, esauritesi le utopie pansofiche che attraverso il “preciso e razionale ordina-

mento di tutto lo scibile”19 si proponevano, ancora nel corso del Seicento, di afferrare
quella clavis universalis di lulliana memoria che doveva porre “l’uomo in grado di coglie-
re, al di là delle apparenze fenomeniche (…) la struttura o trama ideale che costituisce
l’essenza della realtà”20, il problema dell’enciclopedia dello scibile, che ancora sarà dibat-
tuto fra Illuminismo e Positivismo, si nutrirà soprattutto dell’esigenza, sempre più com-
plessa e difficile da soddisfare, di mantenere, attraverso una classificazione “naturale ed
unitaria delle scienze” fondata su una qualche base razionale ed “oggettiva”, l’unità di
un sapere ormai messa profondamente ed irreversibilmente in discussione dal continuo
progresso della ricerca scientifica e tecnologica e dalla crescente segmentazione e spe-
cializzazione delle discipline21. A partire dal Settecento, la “dissociazione operata fra
ragione e memoria”22 e il sempre maggior rilievo attribuito, nei processi di costruzione
del sapere, alla creatività e alla immaginazione rispetto alla rielaborazione delle cono-
scenze ereditate dalla tradizione hanno posto le basi per una profonda svalutazione
intellettuale di tutto ciò che ha a che fare con le facoltà e le arti della memoria.
Se è pur vero che, come sostiene ancora Paolo Rossi, esse, perduto il fascino di cui
avevano goduto per secoli, si sono ridotte ai nostri tempi ad una sorta di “fossile intel-
lettuale”, è tuttavia altrettanto vero che talune delle problematiche, delle tecniche e delle
metodologie di cui si sono per lunghi secoli nutrite sono state, sotto molteplici punti di
vista, fatte proprie da discipline specialistiche quali l’archivistica, la bibliografia e la
biblioteconomia, il cui sviluppo si è accompagnato all’accelerazione di quel processo di
“esteriorizzazione” della memoria - secondo la definizione di Leroi-Gurhan23 - che ha
visto, nel corso dei secoli, affiancare, e poi sempre più sostituire, alla memoria umana
(vuoi naturale, vuoi artificialmente potenziata) un numero vieppiù crescente di suppor-
ti, strumenti e tecniche di memorizzazione, quali media e veicoli di trasmissione nello
spazio e nel tempo delle idee, delle esperienze e del sapere accumulatosi.
Anche in quelle discipline, il problema dell’elaborazione di sistemi di ordinamento
e classificazione che permettano un rapido recupero di documenti, informazioni e cono-
18 P. Rossi, Il passato, la memoria, l’oblio, cit., pp. 59-60.

19 P. Rossi, Clavis universalis, cit., p. 67.
20 Ibidem, p. 17.
21Cfr. W. Tega, Arbor Scientiarum. Enciclopedie e sistemi in Francia da Diderot a Compte, Il Mulino, Bologna 1984,
in particolare p. 298 e segg.
22 P. Rossi, Specializzazione del sapere e comunità scientifica, in La memoria del sapere, cit., p. 318.
23 Cfr. A. Leroi-Gourhan, Il gesto e la parola, vol. II: La memoria e i ritmi, Einaudi, Torino 1977, pp. 304-312.
6
scenze ha occupato sempre un ruolo centrale. Anzi, gettando un pur rapido sguardo alla
loro storia, non pochi intrecci sembrano emergere fra le soluzioni via via da esse propo-
ste ed adottate e le molteplici incarnazioni che l’ars memorandi et inveniendi ha conosciu-
to nel corso dei secoli. Lo ha efficacemente ricordato Alfredo Serrai, quando ha notato
che le
moderne teorie bibliografiche e catalografiche - nel senso più lato, compresa l’organizza-
zione del sapere e del linguaggio oltre a quella dei documenti - si sono formate in
ambiente filosofico impregnato di influssi ermetici, neopitagorici e neoplatonici, o (…)
addirittura deriv[a]no da precise, anche se indirette, influenze cabalistiche24.
Così, alle origini, le discipline bibliografiche sono praticamente indistinguibili dal-

l’enciclopedismo pansofico. In effetti l’epoca nella quale fioriscono le utopie di sistema-
tizzazione enciclopedica del reale è anche l’epoca della diffusione della stampa.
Entrambi i fenomeni pongono interrogativi cruciali sull’organizzazione e la trasmissio-
ne del sapere: “una enciclopedia - ha scritto ancora Paolo Rossi - conserva, organizza e
trasmette il sapere oppure fa insieme e contemporaneamente queste tre cose? la conser-
vazione dei contenuti ha a che fare con il modo in cui essi sono organizzati? un muta-
mento nella organizzazione del sapere serve alla conservazione, alla trasmissione o a
entrambe le cose?”25. Ma l’avvento della stampa ripropone anche l’illusione che, racco-
gliendo tutti i libri pubblicati, si possa concentrare in un unico luogo l’intero sapere del-
l’umanità. È un’illusione che dall’aspirazione alla raccolta di libri concreti sfuma rapida-
mente nella costruzione di quelle “biblioteche senza pareti” che si propongono, più che
la raccolta effettiva di tutti i libri esistenti, la catalogazione di tutto ciò che è stato pub-
blicato e/o scritto26. Certo è che non è possibile non intravedere una relazione fra i pro-
getti enciclopedici cinque-seicenteschi e l’architettura sistematica basata su variabili
modelli di articolazione gerarchica del sapere o su precise strutture tassonomiche, orga-
nizzate per materie o classi tematiche, dei cataloghi delle biblioteche, con o senza pare-
ti, che nello stesso arco di tempo si vengono compilando. “L’ idea [di Enciclopedia] - ha
notato Serrai - permeava intimamente il piano della organizzazione bibliografica e ne
inibiva la frantumazione secondo le linee della specializzazione scientifica e disciplina-
re”27. Basti pensare alle Pandectae della Bibliotheca universalis di Conrad Gesner, in cui “le
notizie e i dati risultano (...) organizzati secondo una classificazione sistematica che pog-
gia sulla visione della filosofia come enciclopedia delle scienze e delle arti”28, oppure alla
Bibliotheca selecta di Antonio Possevino, nella quale il modello enciclopedico è totalmen-
24 A. Serrai, Storia della bibliografia. I Bibliografia e Cabala. Le Enciclopedie rinascimentali (I), e cura di M. Cochetti,
Bulzoni, Roma 1988, p. 1. Cfr. dello stesso Serrai, Le classificazioni. Idee e materiali per una teoria e per una storia,
Olschki, Firenze 1977, in particolare pp. XXXII-XXXIII e XL-XLI.
25 P. Rossi, Il passato, la memoria, l’oblio, cit. p. 64.
26 R. Chartier, Biblioteche senza pareti, in Id, L’ordine dei libri, il Saggiatore, Milano 1994, pp. 75-101.
27 A. Serrai, Storia della bibliografia. I Bibliografia e Cabala. Le Enciclopedie rinascimentali (I), cit., p. 151.
28 Cfr. L. Balsamo, La bibliografia. Storia di una tradizione, Sansoni, Firenze 1995, p. 34. “Le Pandectae gesneriane,
pur non avendo il nome di enciclopedia (…) non solo equivalgono, nella sostanza, all’idea e al programma di
una enciclopedia generale, ma costituiscono senz’altro la più completa ed articolata compenetrazione di una
struttura scientifico-disciplinare e della corrispondente documentazione bibliografica”: A. Serrai, Storia della
bibliografia. I Bibliografia e Cabala. Le Enciclopedie rinascimentali (I), cit., p. 160.
7
STEFANO VITALI
te inserito all’interno di uno schema teologico di difesa dell’ortodossia cattolica, oppu-

re a La Bibliotheque del francese François Grudé de La Croix du Maine, che concepisce
il propria sistema di classificazione in 7 classi e 107 sezioni come un vero metodo di
ordinamento dei libri all’interno di un apposito mobile-scansia29. D’altronde se si con-
siderano le ascendenze baconiane della classificazione decimale elaborata da Melvil
Dewey nel secolo XIX e largamente adottata dalle biblioteche di tutto il mondo, ci si
accorge come le connessioni fra ars memorandi, sistemazioni enciclopediche cinque-sei-
centesche e scienze bibliografiche giungano praticamente fino ai giorni nostri30.
Anche negli archivi il dibattito sui metodi di ordinamento e sui criteri per garan-
tire un recupero efficiente e rapido dei documenti e delle informazioni in essi conte-
nute è sempre stato ben vivo. Ed è proprio fra Seicento e Settecento che, attorno alle
problematiche relative alle metodologie di classificazione dei documenti, si sviluppa
un intenso dibattito. Non si trattava, allora, soltanto di mettere a punto gli strumenti
che permettessero una ordinata sedimentazione della documentazione corrente -
quelli che diverranno più tardi, al termine di un lungo processo di evoluzione, i
moderni titolari - ma anche di fare ordine in una ingente massa di documenti eredita-
ti dal passato, ai quali si voleva dare una nuova funzionalità, non ancora compiuta-
mente storica ma, per il momento, ancora largamente connessa alle immediate esigen-
ze politiche e amministrative dei loro detentori. Quelli che in genere si definiscono
“ordinamenti per materia” e si ascrivono alla spirito sistematico dell’Illuminismo31,
trovano più probabilmente le loro radici proprio nella tradizione dell’ars memorandi e
nelle sue pratiche di ordinata distribuzione e di classificazione dello scibile.
Non è un caso che con progetti di ordinamento di archivi ereditati dal passato si
sia cimentato lo stesso Leibniz, i cui interessi per l’ars memorandi o reminiscendi non si
possono non mettere in relazione, oltre che con i suoi studi filosofici, anche con il
ruolo di bibliotecario coperto per vari anni e con le proposte in materia di archivi ela-
borate all’epoca del suo servizio presso il duca di Brunswick32. Nelle proprie riflessio-
ni sull’enciclopedia Leibniz includeva nei principi fondamentali della “scienza gene-
rale”, accanto all’ars demostrandi o judicandi e all’ars inveniendi, che “consentono di
acquisire e di dimostrare, in modo rigoroso, i concetti delle scienze” e “di promuove-
re l’avanzamento mediante la scoperta di verità nuove”, anche l’ars memorativa o remi-
niscendi, che “permette di memorizzarli e quindi di inventariarli e di distribuirli secon-
29 Sul Possevino e La Croix du Maine cfr. L. Balsamo, La bibliografia, cit., pp. 38-42 e 44-45. L’organizzazione
sistematico-disciplinare caratterizza, come è noto, anche i cataloghi di biblioteca fino a tempi recenti: per una
prima informazione cfr. D. M. Norris, A History of Cataloguing and Cataloguing Methods 1100-1850, Grafton and
Co., Londra 1939. Su queste tematiche cfr. anche G. Zaganelli, A. Capaccioni, Catalogare l’universo, Testo e
immagine, Torino 2004, in particolare il saggio di A. Capaccioni, Mappe e memorie. Postille a una storia del sape-
re, pp. 59-79.
30 Sulle fonti della classificazione Dewey cfr. W. A. Wiegand, The ‘‘Amherst Method’’: The Origins of the Dewey
Decimal Classification Scheme, in “Libraries & Culture”, Vol. 33 (1998), 2, Spring 1998, pp. 175-194, anche on line
http://www.gslis.utexas.edu/~landc/fulltext/LandC_33_2_Wiegand.pdf.
31 Per recenti riflessioni sul più noto dei metodi di ordinamento degli archivi “per materia”, cfr. M. Bologna,
Il metodo petroniano e gli “usi d’uffizio”: note sull’ordinamento per materia dal XVIII al XX secolo, in “Archivio stori-
co lombardo”, serie XII, CXXIII (1997), pp. 233-280.
32Su questi studi cfr. E. Lodolini, Archivio e registratura (archivistica e gestione dei documenti) nel pensiero di Leibniz,
in “Rassegna degli Archivi di Stato”, LVIII (1998), 2-3, pp. 245-267, dove alle pp. 256-267, i testi leibniziani sono
tradotti in italiano a cura di Mauro Tosti Croce.
8
do un determinato ordine”33. Nei quasi coevi scritti sull’organizzazione degli archivi,

Leibniz tesseva una vera e propria apologia dell’archivio ben ordinato e classificato
secondo criteri funzionali alla difesa degli “iura e praetensiones” di “un principe o [di]
una repubblica”, mettendolo a confronto con l’inaffidabilità degli uomini:
Gli strumenti a disposizione del signore sono vivi o inanimati, cioè persone o scritture,
di cui i primi sono spesso pericolosi, costosi, scomodi, di rado conformi alle aspettati-
ve e a causa della fragilità umana mai così all’altezza delle situazione da poter del tutto
fare a meno dei documenti. È perciò assai meglio e più sicuro organizzare nel migliore
dei modi possibile le carte (…) in modo da trarne ogni possibile vantaggio perché que-
sto è proprio di tutte le scritture: (…) aiutare la debolezza della memoria e prevenire
l’incostanza e l’ingiustizia degli uomini34.
Negli ultimi due secoli il problema del corretto ordinamento degli archivi storici35
e quello dell’elaborazione di efficaci strumenti di classificazione degli archivi corren-
ti36 sono stati, come è ben noto, al centro delle riflessioni e delle pratiche degli archivi-
sti, mentre la biblioteconomia si è venuta sempre più chiaramente configurando
“come metodo e insieme di tecniche per organizzare la documentazione libraria in
modo da renderne agevole e rapido il reperimento”37.
Insomma, sia che si tratti di individuare il modo più efficace di sistemare material-
mente documenti e libri38, sia che si tratti di organizzare le loro rappresentazioni in
repertori bibliografici, cataloghi di biblioteca o inventari archivistici, quelle che erano
state per lunghi secoli le problematiche caratteristiche dell’ars memorandi hanno trova-
to nuova vita all’interno di mondi quali quelli delle biblioteche e degli archivi o, più
recentemente, dei centri di documentazione, cosicché l’ordine, la sistematizzazione, la
classificazione, da criteri per facilitare il richiamo alla memoria umana di quanto si è
appreso, sono via via diventati strumenti per ritrovare efficacemente libri o documen-
ti, nonché le informazioni e le conoscenze ad essi affidati.
33Cfr. W. Tega, Arbor Scientiarum. Enciclopedie e sistemi in Francia da Diderot a Compte, Il Mulino, Bologna 1984,
in particolare pp. 27-28; cfr. anche lo scritto Sulla saggezza, in G. G. Leibniz, Scritti di Logica, a cura di F. Barone,
Zanichelli, Bologna 1968, pp. 197-201.
34 E. Lodolini, Archivio e registratura, cit., p. 262.
35 Sul problema dell’ordinamento degli archivi storici, la bibliografia è ampia e variegata. Oltre al classico G.
Cencetti, Scritti archivistici, Il centro di ricerca sugli archivi moderni, Roma 1970, in particolare pp. 47-79, cfr. P.
Carucci, Le fonti archivistiche: ordinamento e conservazione, La Nuova Italia Scientifica, Roma 1983, in particolare
pp. 131-168; per un approccio di tipo storico cfr. anche: S. Vitali, L’archivista e l’architetto: Bonaini, Guasti, Bongi
e il problema dell’ordinamento degli Archivi di Stato toscani, in G. Tori (a cura di), Salvatore Bongi nella cultura
dell’Ottocento. Archivistica, storiografia, bibliologia, Atti del convegno nazionale, Lucca, 31 gennaio - 4 febbraio 2000,
Ministero per i beni e le attività culturali, Direzione generale per gli archivi, Roma 2003, pp. 519-564.
36 La tematica della classificazione negli archivi correnti è tornata al centro dell’attenzione della comunità archi-
vistica con l’avvento delle tecnologie digitali di archiviazione, producendo una bibliografia già di riguardevo-
le mole. Per una rivisitazione della tematica che intreccia la riflessione storica con l’attualità cfr. G. Bonfiglio
Dosio (a cura di), Classificare: storia e attualità, numero monografico di “Archivi per la storia”, XVI (2003), 2,
luglio-dicembre; e cfr. E. A. Rossi, M. Guercio (a cura di), La metodologia per la definizione di piani di classificazio-
ne in ambiente digitale, Edizioni della Scuola superiore della pubblica amministrazione, Roma 2005.
37 Cfr. L. Balsamo, La bibliografia, cit., p. 34.
38Sull’ordinamento materiale dei libri sugli scaffali di biblioteche pubbliche e private cfr. H. Petroski, The Books
on the Bookshelf, Vintage books, New York 2000.
9
STEFANO VITALI
D’altronde di problematiche non molto lontane da queste, è intessuta non poca

parte della nostra vita quotidiana39, rinviando talvolta a strutture mentali profonde,
ma anche a differenze e conflitti ancestrali, come ad esempio rivela, o nasconde, quel
“cumulo di (…) infiniti gesti silenziosi” che separa il comportamento pratico degli
uomini e delle donne.
Valga, tra infiniti altri, l’esempio dei calzini: l’uomo li considera sempre al posto giusto,
quando non lo sono affatto per la donna (…) L’idea femminile del “posto giusto dei cal-
zini” proviene da molto lontano (…) contiene un’infinità di classificazioni di ordine ses-
suale e sociale40.
“Come puoi ritrovare un cosa se la metti nel posto sbagliato?”, è capitato di dire
ad una mia amica proprio nei giorni in cui stavo scrivendo queste pagine - lasciando
intendere che nel mondo c’è un ordine per tutte le cose (e forse non aveva torto).
“Ma codesta è una mentalità pre-Google!”, mi è venuto spontaneo di replicare. E
forse non avevo torto.
…information retrieval
Come è noto Google, come tutti i motori di ricerca presenti sul Web, si basa su tre
diverse componenti. La prima è costituita da appositi “robot” o “spider” che, ciclica-
mente, esplorano la Rete procedendo alla “cattura” e alla memorizzazione delle pagi-
ne Web o di loro elementi o parti significative. La seconda è costituita da procedure
automatiche di estrazione dei termini presenti nelle pagine “catturate”, che conflui-
scono in apposite basi di dati, grazie alle quali le parole indicizzate vengono messe in
relazione con i “documenti” da cui sono state estratte. La terza è il motore di ricerca
vero e proprio, cioè un software che permette di interrogare la banca dati dei termini
indicizzati e che restituisce, sulla base di criteri predefiniti, i “documenti” che conten-
gono il termine ricercato41. Dal punto di vista dei loro essenziali meccanismi di funzio-
namento, quindi, i motori di ricerca appartengono alla famiglia dei sistemi di informa-
tion retrieval, cioè di sistemi deputati al reperimento efficiente di informazioni e docu-
menti.
Come disciplina autonoma, l’information retrieval è emersa negli anni Cinquanta con
l’avvento dei primi calcolatori elettronici42. L’espressione information retrieval fu utilizza-
39Cfr. T. Madonado, Memoria e conoscenza. Sulle sorti del sapere nella prospettiva digitale, Feltrinelli, Milano 2005,
pp. 178-181.
40 C. Marazzi, Il posto dei calzini. La svolta linguistica dell’economia e i suoi effetti sulla politica, Bollati Boringhieri,
Torino 1999, pp. 63-63.

41 La bibliografia e la documentazione sui motori di ricerca è assai ampia; per un taglio originale cfr. F. Bite, C.
Parrini, I motori di ricerca nel caos della Rete. Kit di sopravvivenza, ShaKe edizioni, Milano 2001. Una sintetica illu-
strazione del funzionamento delle loro diverse componenti si può leggere in E. Liddy, How a Search Engine
Works, in “Searcher”, vol. 9 (2001), 5, pp. 38-45, anche on line, dove è stato consultato http://www.infotoday.com
/searcher/may01/liddy.htm. Su Google in particolare cfr. S. Brin, L. Page, The Anatomy of a Large-Scale Hypertex-
tual Web Search Engine, http://www-db.stanford.edu/~backrub/google.html. Anche i testi sull’information retrie-
val citati nella nota successiva dedicano ampio spazio al funzionamento dei motori di ricerca.
42 Per una prima informazione sulla storia dell’information retrieval, cfr. M. Lesk, The Seven Ages of Information
Retrieval, in “Adventures in Cybersound”, http://www.acmi.net.au/AIC/BUSH_LESK.html. Punti di riferimen-
10
ta per la prima volta, nel 1951, da un informatico, Calvin Mooers, ma fu resa popolare,
negli anni successivi, da uno dei padri fondatori di questo settore di ricerca, il bibliote-
cario inglese Cyril W. Cleverdon, che l’utilizzò nei resoconti delle indagini condotte in
quegli anni sulla efficienza dei diversi sistemi di indicizzazione documentaria. La pro-
fessione di uno dei padri fondatori della disciplina, come Cleverdon, è di per sé signifi-
cativa. L’information retrieval, infatti, nonostante la portata innovativa delle tecniche che
utilizza e dei principi che sviluppa, ha profonde radici nelle discipline bibliografiche e
documentarie e, in parte più limitata, in quelle archivistiche. Esso si è fortemente nutri-
to, soprattutto ai suoi inizi, di alcune delle tematiche sulle quali ci siamo soffermati nel
precedente paragrafo, mantenendo solidi rapporti con i tradizionali approcci ai proble-
mi di organizzazione e recupero dei documenti e delle informazioni.
Ciò si evince da vari elementi. In primo luogo i sistemi di information retrieval classici
sono basati su un’architettura logica che ripropone i tipici meccanismi di reperimento dei
libri di una biblioteca mediante schede catalografiche e dei fascicoli di una serie archivi-
stica, mediante gli strumenti repertoriali di cui è dotata. L’architettura logica, insomma, è
quella di una collezione di “documenti” (intesi nella più ampia accezione del termine di
testi scritti che veicolano contenuti informativi), cui è associata una rappresentazione dei
documenti stessi la quale, fornendo informazioni su loro attributi o proprietà (ad esem-
pio sul loro titolo, autore, ecc.) e/o sul loro contenuto semantico, favorisce l’individuazio-
ne di quelli che possono soddisfare le esigenze informative dell’utente.
È stato notato, probabilmente a ragione43, come la metafora adottata nello sviluppo
dei tradizionali sistemi di information retrieval sia stata nella sostanza ispirata dal cosid-
detto sistema di vertical filing, affermatosi in America, alla fine del XIX secolo, come stru-
mento di razionalizzazione della tenuta degli archivi correnti delle grandi imprese. Il
vertical filing system era (o è, si potrebbe dire, visto che è ancora in uso) costituito da una
cassettiera all’interno della quale i fascicoli, recanti una linguetta che riportava la loro
intestazione, erano disposti secondo un determinato ordine (alfabetico per nomi di per-
sona o di luogo, secondo una forma di classificazione decimale sulla base del soggetto,
ecc.). A parte poteva poi essere tenuto uno schedario dei fascicoli, ordinato secondo cri-
teri che potevano essere anche difformi rispetto alla collocazione fisica dei fascicoli stes-
si nella cassettiera44.
to fondamentali per una conoscenza approfondita dei principi e delle tecniche di information retrieval sono alcu-
ni manuali ormai classici, fra i quali C. J. “Keith” van Rijsbergen, Information Retrieval, Butterworths, Londra
1979, 2^ ed, anche on line, dove è stato consultato, http://www.dcs.gla.ac.uk/Keith/Preface.html; R. Baeza-Yates,
B. Ribeiro-Neto, Modern Information Retrieval, Addison Wesley, Reading (US) 1999, in parte anche on line, dove
è stato consultato, http://www.sims.berkeley.edu/~hearst/irbook/index.html; ho anche anche largamente attin-
to alla dispensa di M. Agosti, Ipertestualità e information retrieval, Università di Padova, Dipartimento di
Elettronica e Informatica, 1999. Ringrazio la prof.ssa Agosti per avermi messo a disposizione questa dispensa
ed altri suoi scritti.
43 Cfr. T. A. Brooks, Web search: how the Web has changed information retrieval, in “Information Research”, vol. 8,
n. 3, aprile 2003, http://informationr.net/ir/8-3/paper154.html.
44 Sulle origini e la diffusione del vertical filing system cfr. J. Yates, Control through Communication. The rise of
System in American Management, The Johns Hopkins University Press, Baltimora e Londa 1989, in particolare
pp. 56-63; Eadem, Business Use of Information and Technology during the Industrial Age, in A. D. Chandler Jr.,
J. W. Cortada (a cura di), A Nation Transformed by Information. How Information Has Shaped the United States from
Colonial Times to the Present, Oxford University Press, New York 2000, pp. 107-135, in particolare pp. 117-120.
11
STEFANO VITALI
Quest’insieme di strumenti e di metodologie per organizzare (secondo un ordina-

mento logico e/o fisico) e classificare i documenti e rendere il loro reperimento rapido
ed efficiente per molti versi non costituiva che una “riscoperta” dei moderni sistemi
di organizzazione degli archivi basati sulla “pratica” o comunque sul fascicolo, diffu-
sisi in Europa già nel corso dell’Antico regime e definitivamente affermatisi con l’av-
vento dello Stato moderno postnapolenico. Solo che la versione americana “aveva le
proprie radici nel mondo delle biblioteche” e precisamente nelle iniziative di diffusio-
ne dei cataloghi a scheda su formato standard sviluppate da Melwil Dewey nel corso
delle seconda metà dell’Ottocento in connessione con l’elaborazione del suo sistema
decimale di classificazione. I meccanismi di ricerca previsti non erano quindi molto
distanti da quelli praticati in una biblioteca per individuare e reperire i volumi45.
Anche le procedure di recupero dei documenti in un sistema di information retrie-
val non si allontanano molto da questo modello. Come in una biblioteca si scorre il
catalogo alla ricerca dei termini significativi (il nome dell’autore, il soggetto, l’indice
di classificazione) utili ad identificare i documenti che ci interessano, così anche nei
sistemi di information retrieval la ricerca è mediata dai termini associati direttamente ai
documenti e/o alle loro rappresentazioni. In quest’ultimo caso, però, i caratteri dello
strumento informatico permettono di moltiplicare le chiavi di accesso e di svincolarsi
da una ricerca che rimane tutto sommato monodimesionale e sequenziale come quel-
la in biblioteca. In un sistema di information retrieval, tipicamente, “l’utente specifica i
propri bisogni informativi, indicando alcune parole chiave e il sistema recupera l’in-
sieme dei documenti che si avvicinano alla domanda dell’utente”46, cioè i documenti
che, direttamente o tramite le loro rappresentazioni, sono associati nell’indice alle
parole ricercate.
I canali di ricerca per arrivare ad un determinato documento, quindi, possono
essere molteplici e, teoricamente, le possibilità di rintracciare i documenti si moltipli-
cano. Esse sono tuttavia vincolate alla congruenza fra il modo in cui è formulata la
query e i termini presenti o associati ai documenti. Le prestazioni di un sistema di infor-
mation retrieval dipende dal grado di efficienza con il quale esso risponde ad una deter-
minata domanda, recuperando il maggior numero di documenti che sono rilevanti per
le esigenze informative dell’utente ed escludendo quelli che invece non lo sono. Tale
grado di efficienza si misura attraverso alcuni parametri, che furono messi in luce
dagli studi condotti da Cecyl Cleverdon negli anni Sessanta del Novecento per valu-
tare l’efficacia delle diverse metodologie di rappresentazione del contenuto dei docu-
menti47. Questi studi stabilirono che, a prescindere da quale fosse il meccanismo adot-
tato per l’indicizzazione (per singoli termini, frasi composte, linguaggio naturale,
dizionari di sinonimi, dizionari di concetti, ecc.), il rendimento di un sistema di infor-
mation retrieval era comunque condizionato da proporzioni inverse di precision (la per-
centuale dei documenti rilevanti fra quelli reperiti) e di recall (la percentuale dei docu-
45 J. Yates, Business Use of Information and Technology, cit., p. 118.

46 R. Baeza-Yates e B. Ribeiro-Neto, Modern infomation retrieval, cit., p. 12.
47Cfr. C. W. Cleverdon, The Significance of the Cranfield Tests on Index Languages, in A. Bookstein, Y. Chiaramella,
G. Salton, V. V. Raghavan (a cura di), Proceedings of the 14th Annual International ACM SIGIR Conference on
Research and Development in Information Retrieval, Chicago, 13-16 ottobre 1991, ACM, 1991, pp. 3-12.
12
menti rilevanti recuperati su quelli disponibili). Quanto più aumenta il recall, cioè il
numero dei documenti recuperati che soddisfano la query, tanto più diminuisce la pre-
cision e aumenta il numero dei documenti recuperati non rilevanti, si incrementa cioè
il “rumore”. E quanto più aumenta la precision, diminuisce certamente il “rumore”, ma
aumenta la possibilità che sfuggano dei documenti rilevanti, cioè, si incrementa il
“silenzio”.
Questa sorta di paradosso dei sistemi di information retrieval trova in realtà la pro-
pria ragione ultima nel fatto che l’interazione fra l’utente e il sistema è necessariamen-
te basata sul linguaggio, scontando inevitabilmente, di quest’ultimo, quei caratteri di
ambiguità, indeterminatezza e ricchezza di sfumature che incidono non solo sulla
comunicazione quotidiana, ma, talvolta, anche su quella tecnica e specialistica, quali la
possibile polisemia delle parole, l’esistenza di sinonimi, la sensibilità ai contesti d’uso,
la stratificazione storica dei significati ecc. Per contrastare questo insieme di problemi
e migliorare l’efficienza dei sistemi informativi sono state poste in campo varie strate-
gie che, muovendosi all’interno di alternative opposte, cercano di dosare il più accor-
tamente possibile la precision e il recall a seconda delle diverse esigenze cui i sistemi
stessi devono rispondere.
Alcune strategie puntano sul controllo a priori del lessico e della semantica dei docu-
menti e/o delle loro rappresentazioni. Grazie all’integrazione fra sistemi di information
retrieval e sistemi di gestione di basi di dati e a metodologie di classificazione ed indiciz-
zazione che riprendono e sviluppano le tradizionali tecniche messe a punto dalle disci-
pline bibliografiche e documentaristiche, vengono così adottate forme di normalizzazio-
ne della terminologia, si creano dizionari di sinonimi, theasuari, liste d’autorità di nomi
e così via. L’intento è quello di ridurre i margini d’incertezza del linguaggio e di favori-
re un maggiore congruenza fra le modalità di formulazione delle query e i termini pre-
senti nei documenti e/o nelle loro rappresentazioni. Strategie del genere spostano evi-
dentemente la ricerca di efficienza dei sistemi dal software e dalle modalità d’interroga-
zione alla rappresentazione dell’informazione o, quanto meno, stabiliscono una forte
interrelazione fra i due aspetti e quindi presuppongono efficaci, ma indubbiamente one-
rosi, processi di indicizzazione, classificazione e organizzazione delle informazioni.
Altre strategie sono rivolte al potenziamento delle capacità di elaborazione automa-
tica delle informazioni da parte dei sistemi, sia nella fase di estrazione e generazione
degli indici, sia in sede di recupero dell’informazione. Per quanto concerne il primo
aspetto, possono ad esempio essere adottati approcci di tipo statistico che si basano sul-
l’ipotesi che la frequenza di una parola in un documento è indicativa del contenuto del
documento stesso e che la presenza in una frase di parole che hanno una determinata
frequenza all’interno del documento è indicativa dell’importanza della frase. Ai termi-
ni estratti dai documenti vengono assegnati “pesi” diversi, sulla base dei quali, a fron-
te di una query che ricerca determinate parole chiave, il sistema valuterà quali docu-
menti possono soddisfare con maggiore probabilità le esigenze informative dell’uten-
te. In sede di interazione fra utente e sistema, poi, è abbastanza comune il ricorso agli
operatori booleani che permettono di formulare articolate query così come a operatori
di prossimità che permettono di specificare la maggiore o minore vicinanza fra le paro-
le ricercate.
13
STEFANO VITALI
Anche nel caso in cui, invece che sul controllo del linguaggio, si punti maggior-
mente sugli automatismi del software (anche se le due strategie non si escludono affat-
to), vi sono delle condizioni, per così dire a priori,che costituiscono un necessario pre-
supposto per il successo del sistema. La principale di queste condizioni è costituita dal
fatto che i sistemi tradizionali di information retrieval operano in genere su basi di
documenti che, per quanto possano essere quantitativamente estese, sono per defini-
zione “raccolt[e] logicamente omogene[e]”, di solito costituite “per specifiche esigen-
ze informative di una utenza identificata” e in riferimento a settori disciplinari o ad
ambiti del reale circoscritti e sostanzialmente definiti48. Insomma la selezione operata
nella predisposizione della base di dati costituisce una sorta di limitata opera di “clas-
sificazione preventiva”, che riveste un ruolo non secondario nel garantire l’efficienza
dei sistemi.
D’altronde la complessiva logica di questi ultimi, pur nella variabilità delle speci-
fiche soluzioni adottate, implica in genere che il successo di una ricerca all’interno di
una base di dati testuale dipenda in parte non piccola dalla abilità di far buon uso
delle funzionalità del software, ma sia altresì direttamente proporzionale alla capaci-
tà di formulare interrogazioni con un lessico il più possibile coerente con quello pre-
sente nei documenti che si vogliono recuperare e/o nelle loro rappresentazioni.
Insomma tanto più si conosce il linguaggio e il contenuto dei documenti che si voglio-
no interrogare e recuperare, tanto più la ricerca avrà successo. Non è un caso che, in
genere, i miglior ricercatori all’interno delle basi di dati testuali finiscano per essere
coloro che le hanno sviluppate e implementate, tant’è vero che spesso “risulta neces-
sario affiancare all’utente finale un utente esperto, o intermediario, che conosce la
struttura dei surrogati utilizzati dal sistema e le modalità di ricerca”49, che conosce, in
buona sostanza, tutti i loro segreti.
Pur con tutte le diversità che i sistemi automatici di recupero dell’informazione
presentano rispetto ai metodi che l’uomo ha via via sperimentato nel corso dei secoli
per ritrovare quanto aveva affidato alla propria memoria o a supporti più stabili, è pur
vero che i primi conservano forti legami con i secondi e con l’elementare principio che
li ha sempre caratterizzati, secondo il quale senza aver preventivamente dato un certo
ordine logico e/o aver classificato sulla base di un qualche criterio ciò che si vuole
ritrovare, ogni ricerca diventa estremamente difficoltosa e, talvolta, priva di speranza.
Perché Google è “rivoluzionario”

Con Google, invece - e con altri motori di ricerca - questo legame con una secola-
re e solida tradizione, sembra essersi dissolto. Per far ricerca con Google non c’è biso-
gno di conoscerne i meccanismi di funzionamento né sapere alcunché di ciò che si
vuol trovare: basta digitare una o poche parole nel suo form d’interrogazione ed otte-
nere quantità a volte sorprendenti di risposte, nelle prime dieci o venti delle quali,
m i r a c o l o s a m e n t e, c’è quasi sempre qualcosa che ci soddisfa - o, più realistica-
48 M. Agosti, Ipertestualità e information retrieval, cit., p. 9.

49 Ibidem, p. 18
14
mente, qualcosa di cui si finisce per accontentarsi. Non solo non occorre conoscere
alcunché - o conoscere molto poco - per condurre ricerche “su” Google e trovare i
“documenti” che ci interessano, non c’è neanche bisogno che qualcuno li abbia pre-
ventivamente organizzati, ordinati e classificati a nostro beneficio.
È ovvio che non è possibile separare Google da Internet, ma è altrettanto certo che
il “combinato disposto” del World Wide Web - cioè di uno sterminato agglomerato di
dati, notizie, informazioni, documenti tenuto insieme grazie ai link ipertestuali - e di
Google - cioè di un motore di ricerca i cui meccanismi di funzionamento non ignora-
no, ma al contrario si propongono di mettere a frutto la logica ipertestuale sottesa a
quell’agglomerato - abbia prodotto qualcosa che ha cambiato non poco il modo di con-
cepire e realizzare la ricerca di informazioni.
Le discontinuità introdotte da Google riguardano in primo luogo proprio i presup-
posti e le metodologie su cui faceva perno l’information retrieval per così dire “classi-
co”. Mentre quest’ultimo si caratterizzava per una ricerca svolta all’interno di insiemi
predefiniti e tendenzialmente omogenei di documenti, aggregati sulla base di attribu-
ti comuni e/o di ben identificate esigenze informative, il territorio sul quale agisce
Google, cioè il Web, non ha, come è noto, barriere disciplinari né di altro genere, anzi
si segnala proprio per l’assenza di confini, la sua perenne mutabilità, l’eterogeneità dei
materiali presenti e soprattutto la sua vastità in continua crescita50. Esso, come hanno
scritto gli “inventori” di Google, Brin e Page, “è una estesa collezione di documenti
eterogenei completamente incontrollabili, vari dal punto di vista del formato (testo,
immagini, suono, ecc.), da quello della codifica (html, pdf, ecc.), delle lingue utilizza-
te e dei vocabolari adottati”51.
Le procedure di ricerca di Google, inoltre, si basano unicamente sulle parole pre-
senti nei “documenti” o meglio nelle pagine Web, senza la mediazione di quelle rap-
presentazioni dei “documenti” stessi, che nei sistemi classici di information retrieval,
contribuiscono spesso a facilitarne il recupero attraverso l’esplicita indicizzazione
di alcuni loro attributi essenziali (come ad esempio il titolo, il nome dell’autore, un
codice di classificazione ecc.) oppure una sintetica descrizione, più o meno struttura-
ta, del loro contenuto, formulata talvolta in un linguaggio controllato grazie a vocabo-
lari d’autorità. Anzi, per scelta esplicita, Google ha rinunciato anche ad indicizzare
quelle “metainformazioni” (ad esempio il nome dell’autore del documento, il titolo,
parole chiave indicanti il contenuto del documento, ecc.) che possono essere incluse
nella “testata” delle pagine html non visualizzata dai browser (il cosiddetto “head”),
per evitare che una loro maliziosa compilazione, possa alterare il modo in cui i risul-
tati della ricerca vengono presentati all’utente. Insomma i meccanismi di funziona-
mento di Google, non solo non si basano affatto su classificazioni, ordinamenti, siste-
mazioni preventive dei “documenti”, ma, in un certo senso, evitano proprio che ciò
possa accadere.
50 Si ricorda che alla fine del luglio 2005 Google effettuava la ricerca su 8.058.044.651 pagine Web.
51S. Brin, L. Page, The Anatomy of a Large-Scale Hypertextual Web Search Engine, cit.; cfr. anche M. Agosti, M.
Melucci, Information Retrieval on the Web, in M. Agosti, F. Crestani, G. Pasi (a cura di), Lectures on Information
Retrieval: Third European Summer-School, ESSIR 2000, Varenna, Italy, September 11-15, 2000, Springer Verlag,
Heidelberg 2001, in particolare pp. 276 e segg.
15
STEFANO VITALI
Non che nel mondo di Google l’ordine non esista e non svolga un ruolo importan-
te, tutt’altro. La sequenza con la quale le pagine o i “documenti” sono elencati in rispo-
sta alle interrogazioni è evidentemente cruciale nel determinare l’effettiva probabilità
che l’utente acceda o meno ad un determinato documento. Essa crea gerarchie di rile-
vanza e determina, se non classificazioni, classifiche che svolgono un ruolo fondamen-
tale nel rendere visibile o meno quanto si annida nelle maglie della Rete. Tuttavia le
crea non sulla base di principi espliciti stabiliti a priori, che facciano riferimento al
contenuto dei “documenti” o ad altri loro attributi, quanto piuttosto facendo ricorso
ad algoritmi basati su criteri - si potrebbe dire - in gran parte estrinseci, che in Google
si riassumono, in parte non piccola, nel cosiddetto Page Rank, basato su una valuta-
zione automatica della “popolarità” delle pagine Web. Insomma, mentre tradizional-
mente una biblioteca, un archivio, un insieme di documenti, ma anche di oggetti, di
qualsiasi natura non aveva segreti per chi ne conoscesse il codice di accesso, cioè la
logica di classificazione e/o di ordinamento, con i motori di ricerca non c’è più biso-
gno di conoscere alcun codice. Da un punto di vista generale, quindi, la ricerca si è
fatta più semplice e più democratica. L’altra faccia della medaglia, la faccia più inquie-
tante e nascosta, sta nel fatto che, in realtà, dato che è un software a condurre la ricer-
ca, il codice è diventato ancor più “segreto” di quanto non fosse negli archivi tradizio-
nali e la possibilità dell’utente di esercitare un controllo sui risultati della ricerca e,
soprattutto, sull’itinerario percorso per arrivarci è pressoché nulla.
Insomma i meccanismi di funzionamento e il successo di Google sembrano davve-
ro indicarci che non costituisce più una verità inossidabile quell’aureo principio secon-
do il quale si ritrova rapidamente ed efficacemente solo ciò che è stato classificato ed
ordinato secondo un qualche criterio, possibilmente dotato di una logica razionale e
riconoscibile. Ma attenzione! Non sarebbe proprio esatto pensare che Google e i moto-
ri di ricerca costituiscano l’elemento scatenante di quella che potremmo definire una
sorta di “crisi della classificazione” tradizionale. In realtà è vero proprio il contrario.
Google non è la causa, ma piuttosto il sintomo o, se vogliamo, l’effetto di quella “crisi”,
una “crisi” che non è sbocciata ieri, ma che certo è stata accentuata ed anzi svelata
in tutta le sue implicazioni dall’avvento del mondo digitale, dell’ipertestualità e del
World Wide Web.
Le classificazioni - ha scritto Serrai - sono, in generale, raggruppamenti ordinati di ogget-

ti (…) Per costituire una classificazione è necessario procedere ad una ripartizione degli
oggetti dati in classi o raggruppamenti, e poi ad un ordinamento di tali classi o raggrup-
pamenti sulla scorta di un principio di ordinamento52.
Classificare vuol dire, quindi, individuare un attributo, un carattere o un punto di

vista, in base al quale gli oggetti possano essere assimilati e, allo stesso tempo, distinti.
Data la complessità degli oggetti (documenti, libri, “informazioni” compresi) che carat-
terizzano il mondo in cui viviamo, va da sé che ogni scelta del genere implica inevita-
bilmente consistenti dosi di arbitrarietà, nonché di “ambiguità, ridondanze e deficien-
ze” come abbiamo imparato dalla fantasmagorica classificazione degli animali che Jorge
53 A. Serrai, Le classificazioni, cit, pp. X-XI.
16
Luis Borges immagina estratta dall’apocrifo Emporio celeste di riconoscimenti benevoli,
nelle [cui] remote pagine è scritto: gli animali si dividono in (a) appartenenti all’impera-
tore, (b) imbalsamati, (c) ammaestrati, (d) lattonzoli, (e) sirene, (f) favolosi, (g) cani ran-
dagi, (h) inclusi in questa classificazione, (i) che si agitano come pazzi, (j) innumerevoli,
(k) disegnati con un pennello finissimo di pelo di cammello, (l) eccetera, (m) che hanno
rotto il vaso, (n) che da lontano sembrano mosche53.
“Non v’è classificazione (…) - chiosa ancora Borges - che non sia arbitraria e con-
venzionale” e che, allo stesso tempo, non “rappresent[i] il ribaltamento di una molte-
plicità di dimensioni, che sono le diverse facce degli oggetti, sull’ordine classificatorio
unico”54. Se una biblioteca, ha scritto Ranganathan, si può dire che costituisca nel suo
insieme “il continuum multidimensionale del pensiero”, la sua classificazione “è equi-
valente alla rappresentazione di un continuum multidimensionale in una sola dimen-
sione”55. Serrai ha sua volta notato che:
la riduzione alla monodimensionalità diventa restrittiva, e le limitazioni della monodi-

mensionalità si fanno sentire, quando si stabilisce anche un ordine monodimensionale;
perché 1) un ordine monodimensionale è una disposizione unica di un insieme limitato
di significato che deve servire a contenere catalograficamente un insieme più ampio, e
perché, 2) un ordine è una cristallizzazione delle relazioni (altrimenti che ordine sareb-
be?) secondo una sola sequenza rispetto al gran numero di quelle possibili56.
Insomma, classificare significa creare gerarchie più o meno rigide e stabili, le quali
rischiano di essere tanto più insufficienti, e talvolta fuorvianti, quanto più la realtà
classificata è sfaccettata e dinamica. È un problema che, come ha messo in evidenza
Eco, era emerso anche a lato di talune di quelle complesse architetture classificatorie
di cui erano intessute le enciclopediche seicentesche, era stato colto da Leibniz ed era
stato affrontato esplicitamente nell’Encyclopédie di Diderot e D’Alembert57. Come è
noto, costoro non avevano voluto rinunciare a presentare una classificazione logico-
sistematica delle discipline che l’Encyclopédie si riprometteva di trattare ed avevano
posto in calce al Prospectus, con cui nel 1750 ne annunciavano la pubblicazione, un
Système figuré des connaissances humaines che riprendeva l’albero delle scienze elabora-
to da Francesco Bacone nel De Dignitate et augmentis scientiarum. Ma i criteri adottati
nell’organizzazione dell’opera riflettevano un spirito completamente diverso. In
primo luogo, le voci erano state disposte in ordine alfabetico, secondo un disegno “che
allontanava in modo definitivo questa impresa dalle costruzioni enciclopediche sei-
centesche”58 e che rifletteva piuttosto la consapevolezza di quanto lo sviluppo e la spe-
53 J. L. Borges, L’idioma analitico di John Wilkins, in Altre inquisizioni, Milano, Feltrinelli 1973, pp. 104-105. Cfr. sul
punto anche U. Eco, La ricerca della lingua perfetta nella cultura europea, Laterza, Roma-Bari 2004, pp. 222-223, che
ricorda come Foucault abbia posto questa citazione borgesiana in apertura del suo Le parole e le cose.
54 F. Gil, Sistematica e classificazione in Enciclopedia, vol XII, Einaudi, Torino 1981, p. 1003.
55 La citazione è ibidem.
56 A. Serrai, Le classificazioni, cit, p. XIII.
57 Cfr. U. Eco, La ricerca della lingua perfetta nella cultura europea, cit., pp. 269-278, 298- 299, 309-313.
58 W. Tega, Arbor Scientiarum, cit., p. 87.
17
STEFANO VITALI
cializzazione “delle scienze e delle arti” avesse trasformato il sapere in “una specie di
labirinto, una strada tortuosa nella quale lo spirito si avvia senza sapere bene in quale
direzione andare”59. Per muoversi in questo labirinto, cogliere le molteplici e variabili
connessioni fra le discipline e “costruire nuove forme di rapporto e di concatenazione
tra le idee e tra i fenomeni”, più che una classificazione astratta potevano essere allo-
ra utili i ”quattro tipi di rinvii” che dovevano raccordare fra loro gli articoli dell’ope-
ra60. Era insomma l’idea, già avanzata da Leibniz, di una “enciclopedia (…) polidimen-
sionale e mista, un’enciclopedia (…) costruita secondo ‘percorsi’ più che secondo
materie, un modello di sapere teorico pratico che sollecita utilizzazioni ‘trasversali’ “61.
Che cos’è questo modello, se non una prefigurazione dell’ipertestualità, che decostrui-
sce l’organizzazione gerarchica e lineare del sapere per proporre rapporti multidimen-
sionali e dinamici fra le sue varie componenti?
I limiti delle classificazioni, intrinseci alla loro stessa logica e struttura62, ne hanno
messo in discussione la funzionalità non solo all’interno delle discipline che ne fanno
largo uso - da quelle naturali alle matematiche, dalla biblioteconomia all’archivistica e
alle scienze dell’informazione e a molte altre ancora - ma anche in molti aspetti della
vita sociale. Essi sono stati semmai alla base di riflessioni, studi, ricerche che si pro-
pongono di superarli, così come sono state il “motore della storia delle classificazio-
ni”63, cioè sia dell’elaborazione di nuovi criteri classificatori, sia di nuove modalità di
elaborare strutture di classificazione64. Ma, in tempi recenti, essi hanno anche suggeri-
to riflessioni e proposte alternative di organizzazione della conoscenza, come quelle
avanzate da Vannevar Bush in As We May Think, che è considerato una sorta di con-
creta prefigurazione dell’ipertestualità digitale.
La nostra incapacità di fruire dei documenti è in gran parte causata dalla artificiosità dei
sistemi di indicizzazione. Quando dei dati, di qualunque tipo, vengono immagazzinati,
essi sono organizzati alfabeticamente o numericamente, e le informazioni vengono repe-
rite (quando accade) ricercandole di sottoclasse in sottoclasse. Queste informazioni sono
collocate in un unico punto, a meno che non ci siano dei duplicati; si devono avere delle
regole che tracciano il cammino che ci porterà ad esse, ma queste regole sono complica-
te (…) Ma la mente umana non funziona in questo modo. Essa opera per associazioni.
Quando afferra un’idea, essa salta immediatamente a quella successiva, che è suggerita
dall’associazione dei pensieri.
59Cfr. P. Rossi, Specializzazione del sapere e comunità scientifica, cit., pp. 330-332. La citazione è dal Discours préli-
minaire di D’Alembert, nella traduzione italiana dell’Enciclopedia o Dizionario ragionato delle scienze, delle arti e dei
mestieri, a cura di P. Casini, Laterza, Bari 1968, pp. 37-39.
60 Sulla logica dei “rinvii” nell’Encyclopédie, cfr. W. Tega, Arbor Scientiarum, cit., pp. 97-102.
61U. Eco, La ricerca della lingua perfetta nella cultura europea, cit., p. 299, che cita, in particolare, alcune osserva-
zioni di Stefano Gensini da G. W. Leibniz, Dal segno alle lingue. Profilo, testi, materiali, a cura di S. Sensini,
Marietti, Casale Monferrato 1990, p. 19.
62Per una illustrazione della struttura delle classificazioni cfr. F. Gil, Sistematica e classificazione, cit., p. 1029-
1003.
63 Ibidem, p. 1003.
64Valga per tutti l’esempio della classificazione a faccette in biblioteconomia, messa a punto sulla base di alcu-
ne intuizioni di Shiyali Ramamrita Ranganathan, che si propone come un sistema aperto e flessibile: C. Gnoli,
Classificazione a faccette, Associazione italiana biblioteche, Roma 2004.
18
Secondo Bush, occorreva quindi mettere a punto tecnologie che consentissero la

“selezione [delle informazioni] per associazione, piuttosto che per indicizzazione”,
assecondando le procedure che la mente tende a seguire spontaneamente65. A ben
guardare non si trattava di considerazioni completamente nuove se si tiene conto che
alla “legge dell’associazione”, di derivazione aristotelica, “secondo la quale le imma-
gini e le idee si associano in base alla somiglianza, alla opposizione, alla contiguità”,
si sono richiamati, nel corso dei secoli, vari teorici dell’ars memorandi66.
L’avvento dell’ipertestualità e l’estensione a scala globale di questa con il World
Wide Web hanno reso più evidenti i punti deboli dei percorsi di ricerca gerarchico-
deduttivi e delle classificazioni monodimensionali. L’ipertestualità suggerisce moda-
lità di costruzione delle relazioni fra documenti, informazioni e conoscenze basate su
concrete associazioni orizzontali stabilite a posteriori piuttosto che su tassonomie pre-
definite. Il Web lo si esplora - e si accede ai documenti che vi sono “pubblicati” - in
primo luogo navigando da una pagina all’altra e da un sito all’altro, lungo la rotta sug-
gerita dai link che, connettendo le “risorse”, creano fra di esse legami specifici e, allo
stesso tempo, multiformi e variegati, proprio perché a un unico documento si può
arrivare da percorsi diversi e allo stesso tempo dalla medesima pagina possono dipa-
narsi molteplici sentieri che conduco in varie direzioni.
Nella logica ipertestuale i link esercitano in un certo senso quella funzione di “smi-
stamento” che in uno schema di classificazione svolgono le sue varie articolazioni
gerarchiche. I link, proprio per questa ragione e per il fatto che in un certo senso costi-
tuiscono il tessuto connettivo della Rete, incorporano un ricco contenuto informativo,
utile ad indirizzare la ricerca e a favorire il recupero delle risorse. Si tratta di una carat-
teristica che è stata colta immediatamente da alcuni avvertiti teorici dell’information
retrieval che hanno notato come i collegamenti ipertestuali sul Web possono
rivelare le relazioni semantiche fra le pagine Web, poiché i documenti linkati possono
essere tendenzialmente rilevanti per lo stesso tipo di domanda. Per esempio, un link di
una pagina rilevante può puntare ad una pagina rilevante, o pagine rilevanti possono
essere frequentemente linkate da pagine che sono ricche di link 67.
Una delle ragioni del successo di Google sta in realtà proprio nel fatto che esso
sfrutta questa caratteristica dei collegamenti ipertestuali e la ricchezza del loro conte-
nuto informativo. L’algoritmo fondamentale su cui esso si basa, infatti, il cosiddetto
PageRank,
sfrutta la vastissima rete di collegamenti associati alle singole pagine per determinarne il
valore. In pratica, Google interpreta un collegamento dalla pagina A alla pagina B come
un “voto” espresso dalla prima in merito alla seconda. Tuttavia, non si limita a calcolare
il numero di voti, o collegamenti, assegnati a una pagina. Oltre a effettuare questo calco-
65 V. Bush, As We May Think, “The Atlantic Monthly”, luglio 1945, consultato nella versione on line,
http://www.theatlantic.com/doc/194507/bush. Cfr. anche G. P. Landow, L’ipertesto. Tecnologie digitali e critica let-
teraria, Bruno Mondadori, Milano 1998, in particolare, pp. 29-34.
66 Cfr. P. Rossi, Clavis universalis, cit., passim, p. 33. per la citazione.
67 M. Agosti, M. Melucci, Information Retrieval on the Web, cit., p. 253.
19
STEFANO VITALI
lo, Google prende in esame la pagina che ha assegnato il voto. I voti espressi da pagine
“importanti” hanno più rilevanza e quindi contribuiscono a rendere “importanti” anche
le pagine collegate. PageRank assegna ai siti Web importanti e di alta qualità un “voto”
più elevato di cui Google tiene conto ogni volta che esegue una ricerca. È evidente che
oltre ad essere importanti, le pagine devono corrispondere ai termini ricercati68.
Insomma, Google rivela una buona capacità di aderire alla logica con cui si orga-
nizza spontaneamente il World Wide Web. In realtà ci si potrebbe interrogare su quan-
to sia davvero profonda questa adesione, così come ci si potrebbe chiedere se Google,
e i motori di ricerca in generale, siano davvero sufficienti a dominare quel mondo
variegato e complesso che è costituito dal World Wide Web.
Ma Google basta?
In effetti, nonostante la sua indubbia carica innovativa, Google non è privo di
punti deboli. Con essi capita di confrontarsi non appena si abbia necessità di fare una
ricerca un po’ complessa ed estesa, per soddisfare la quale i primi risultati visualizza-
ti possono dimostrarsi insufficienti o non esaustivi. Alcuni di questi punti deboli deri-
vano da alcuni caratteri che i motori di ricerca hanno ereditato dalla tecnologia dell’in-
formation retrieval tradizionale. Altri sono la conseguenza dei problemi e delle difficol-
tà posti, nella ricerca, dai caratteri peculiari di Internet.
Fra questi ultimi vi è l’impenetrabilità del cosiddetto deep Web agli spider che cat-
turano le pagine Web indicizzate dai motori di ricerca. Il Web profondo è costituito sia
dalle banche dati interrogabili soltanto con sistemi di ricerca diciamo così “proprieta-
ri”, sia dai siti Web costituiti da pagine dinamiche, che si formano on the fly, al momen-
to dell’accesso al sito degli utenti e che, talvolta, sono tarate specificamente a seconda
delle diverse tipologie di visitatori, e altre volte sono addirittura personalizzate secon-
do il profilo assegnato ai singoli utenti. Nel deep Web si annida una quantità assai
cospicua di informazioni e documenti che secondo uno studio di qualche anno fa
aveva una dimensione fra le 400 e le 550 volte maggiore di quello “di superficie”,
ascendente a circa 550 miliardi di “documenti”, che sovente sono fra quelli di qualità
migliore e maggiormente verificabile69. Inoltre, dato che il meccanismo con cui gli spi-
der procedono alla esplorazione del Web ed alla acquisizione dei documenti da indi-
cizzare si basa sulla catena dei collegamenti ipertestuali che rinvia da un documento
ad un altro, rimangono fuori della loro portata le pagine che non sono “linkate” ad
altre, o che hanno pochi link, le quali costituirebbero almeno il 30% del Web. Le valu-
tazioni degli esperti possono variare di qualche punto, ma tutti concordano sul fatto
che, in ultima analisi, le percentuali dei documenti accessibili in Rete, indicizzate dai
motori di ricerca, sono complessivamente basse, aggirandosi sul 10-20% del totale.
Eppure nonostante la cospicua massa dei materiali e delle risorse che non sono
indicizzate dai motori di ricerca, la quantità di pagine che vengono sovente restituite a
fronte di una interrogazione è spesso elevatissima, arrivando non di rado a raggiunge-
68 Cfr. “Guida alle funzioni di ricerca” di Google, http://www.google.it/intl/it/why_use.html.

69Cfr. M. K. Bergman, The deep Web: surfacing hidden value, in “Journal of Electronic Publishing”, vol. 7, 1, ago-
sto 2001, http://www.press.umich.edu/jep/07-01/bergman.html.
20
re le migliaia se non le decine di migliaia. Nel bilanciamento fra la precision e il recall i

motori tendono, in genere, a prediligere quest’ultimo a scapito della prima. Anche se
l’esperienza, l’accortezza e l’utilizzo delle cosiddette modalità di ricerca avanzate (cui
tuttavia solo una assai esigua minoranza di utenti ricorre70) consentono di migliorarne,
seppure in misura tutto sommato limitata, le prestazioni, nell’elevato numero delle pagi-
ne segnalate non solo sono inevitabilmente annidati moltissimi materiali di dubbia qua-
lità, ma quasi sempre anche scarsamente o niente affatto rilevanti rispetto alla domanda
formulata. Allo stesso tempo rimane sempre il sospetto che un certo numero di docu-
menti pertinenti possano essere sfuggiti alla caccia dei motori.
Limiti di questo genere derivano in buona parte dal fatto che, come si è notato pre-
cedentemente, interrogando i motori di ricerca, gli utenti esprimono le loro esigenze
informative attraverso la formulazione di interrogazioni per parola in linguaggio natu-
rale ed ottengono, in risposta, le pagine Web o i “documenti” che contengono quelle
parole, o meglio quelle stringhe di caratteri alfanumerici piuttosto che come espressio-
ni linguistiche dotate di determinati significati. I motori di ricerca non si fanno carico, se
non in forme molto limitate, dell’ambiguità semantica del linguaggio comune, cioè di
“distinguere i differenti significati della stessa parola (il comune problema di distingue-
re ‘blind Venetian’ [un veneziano cieco] da ‘Venetian blind’ [tenda alla veneziana])71. Essi
hanno anche difficoltà a confrontarsi pienamente con “il ruolo centrale del contesto nel-
l’analisi del linguaggio e del pensiero”, cioè con quella “svolta contestuale” che i filoso-
fi del linguaggio fanno risalire all’enunciazione di quel “principio del contesto” di Frege,
che afferma che “il significato di una parola è dato solo nel contesto di un enunciato“72.
Insomma, i meccanismi di funzionamento dei motori di ricerca acuiscono alcuni
caratteri presenti anche nei tradizionali sistemi di information retrieval, ed in particolare
il fatto che
il messaggio è trattato in modalità monodimensionale, non problematica, presupponen-

do che parole, informazioni e dati posseggano significati univoci per tutti gli attori della
comunicazione e trascurando, in più, gli aspetti simbolici o interattivi di un messaggio73.
La maggiore conseguenza di ciò è che, pur essendo i motori il principale strumento

di mediazione fra l’utente e le informazioni, i documenti e le risorse che si trovano in
Rete, essi offrono uno scarso contributo nella selezione qualitativa di quanto attraverso
i loro meccanismi si può intercettare, non fornendo strumenti per una valutazione,
anche approssimativa, non tanto della rilevanza, quanto dell’affidabilità e dell’autorevo-
lezza di ciò che viene restituito all’utente. Essi perciò non contribuiscono che in minima
70Secondo la valutazione di Tim Bray, “Director of Web Technologies” alla Sun Microsystems, sembra che solo
lo 0,5% degli utenti ricorra alle funzioni di ricerca avanzata dei motori di ricerca, cfr: “On Search: The users”,
in Ongoing, ultimo aggiornamento 17 giugno 2003, http://www.tbray.org/ongoing/When/200x/2003/06/17/
SearchUsers.
71 Cfr. M. Lesk, The Seven Ages of Information Retrieval, cit.
72
Cfr. C. Penco, Introduzione. Le ragioni di una svolta, in C. Penco (a cura di), La svolta contestuale, McGraw-Hill,
Milano 2002, p. XV. La citazione di Frege è da Die Grundlagen der Aritmetik, la cui edizione originale è del 1884.
73 D. Bogliolo, KM, Knowledge Management - 2/3, in “AIDA Informazioni”, XVI (1998), 3, http://www.aidainfor-
mazioni.it/pub/km2.html.
21
STEFANO VITALI
parte ad alleviare quel senso di angoscia e di frustrazione che non di rado ci coglie di
fronte all’information overlaod che caratterizza il mondo contemporaneo e che in Internet
trova probabilmente la sua più evidente manifestazione.
Oltre i motori di ricerca

Ai limiti e ai punti deboli dei motori di ricerca si cerca di porre rimedio attraverso
strategie differenziate. Alcune di esse puntano a perfezionare i meccanismi e gli stru-
menti di information retrieval e a mettere a punto nuove e sofisticate tipologie di motori
o di meta motori di ricerca74. Altre, invece, si propongono di affrontare il problema della
ricerca sul Web con un approccio sostanzialmente differente rispetto a quello dei moto-
ri di ricerca. Fra queste ultime, l’iniziativa certamente di più ampia portata è quella che
va sotto il nome di Web semantico e che è propugnata da Tim Berners-Lee, il progetti-
sta del World Wide Web. Essa nasce anche dalla insoddisfazione nei confronti delle mo-
dalità di reperimento delle informazioni sul Web.
I motori di ricerca - ha scritto Berners-Lee - si sono dimostrati utilissimi nel setacciare, con
grande rapidità, elenchi sterminati per rintracciare documenti negletti, ma anche inutili,
dal momento che non possono valutare la qualità del documento. Di solito ci scaricano
addosso un mucchio di spazzatura. Il problema è che di solito i motori di ricerca control-
lano la presenza nei documenti di certi termini, un indizio che dice molto poco del loro
contenuto75.
Il Web semantico si propone, invece, di creare una ragnatela di dati significativi che
possano essere ricercati, scambiati, manipolati ed elaborati in varie forme dai computer,
in modo da realizzare transazioni sicure e rapide. La ricerca di risorse, servizi, documen-
ti, ma anche l’esecuzione di determinati compiti potrebbe essere così affidata alle mac-
chine, che sarebbero poste in grado di utilizzare davvero l’immensa massa di informa-
zioni presenti sul Web.
Ma per realizzare un progetto del genere, per rendere ad esempio possibile ad appli-
74 Per una panoramica generale delle attuali direzioni di ricerca nel campo dell’information retrieval cfr. J. Allan,
B. Croft (a cura di), Challenges in Information Retrieval and Language Modeling Report of a Workshop held at the
Center for Intelligent Information Retrieval, University of Massachusetts Amherst, September 2002, in “SIGIR Forum”,
vol. 37 (2003), n. 1, http://www.sigir.org/forum/S2003/ir-challenges2.pdf. Il sito Web dello Special Interest
Group on Information Retrieval dell’Association for Computing Machinery, dove è pubblicato l’articolo segna-
lato, è ricco di materiali molto aggiornati. Un esempio di nuova tipologia di motori di ricerca - o meglio di meta
motori che ricercano all’interno dei risultati che si ottengono effettuando query in parallelo su più motori di
ricerca - è ad esempio quella basata sulla tecnica del “clustering”, che raggruppa i risultati di una ricerca in car-
telle separate, identificate da parole o brevi frasi che dovrebbero sintetizzare i contenuti comuni dei documen-
ti associati. Il più famoso di questi meta motori è Vivisimo, http://vivisimo.com/. Un meta motore dello stesso
tipo è stato messo a punto presso il Dipartimento di Informatica dell’Università di Pisa: cfr. P. Ferragina, A.
Gulli, A Personalized Search Engine Based on WebSnippet Hierarchical Clustering, in International
World Wide Web Conference, Special interest tracks and posters of the 14th international conference on World Wide
Web, 2005, Chiba, Japan, May 10 - 14, 2005, ACM Press, New York 2005, pp. 801-810, anche on line, http://roque-
fort.di.unipi.it/~ferrax/snaket_www05.pdf. Il motore di ricerca, denominato SnakeT, è all’indirizzo http://sna-
ket.di.unipi.it/.
75 T. Berners-Lee, L’architettura del nuovo Web, Feltrinelli, Milano 2001, p. 155; cfr anche T. Berners-Lee, J.
Hendler, O. Lassila, The Semantic Web, in “Scientific American”, maggio 2001, http://www.sciam.com
/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21 e la sezione sul Web semantico del sito del
World Wide Web Consortium, http://www.w3.org/2001/sw/.
22
cazioni diverse di scambiarsi dei semplici indirizzi, “comprendendo” che uno zip code è
praticamente l’equivalente di un CAP (il codice l’avviamento postale), le “macchine”
devono essere “istruite” dagli uomini. I principali strumenti per realizzare un obiettivo
del genere dovrebbero essere i metadati semantici e le ontologie. Con i primi, documen-
ti e risorse Web dovrebbero essere dotati di informazioni significative in grado di iden-
tificarli, illustrarne gli attributi e renderli disponibili all’interazione con applicazioni
software in grado di elaborarli76. Le seconde dovrebbero portare ordine nell’eterogenei-
tà dei linguaggi e nell’imprecisione dei concetti in modo da definire in modo univoco e
stabile le “entità” di cui si parla, e le informazioni che le riguardano e che devono esse-
re reperite, scambiate e manipolate dai computer.
Il progetto del Web semantico è indubbiamente affascinante ed ambizioso, ma, forse
proprio per questo, suscitatore di non poche perplessità e di qualche interrogativo. Se
ne è ad esempio criticata l’eccessiva fiducia nel ragionamento di tipo sillogistico, grazie
al quale le applicazioni, in base alle informazioni fornite e ad apposite istruzioni,
dovrebbero fare delle “scelte”77. Altri hanno invece rilevato una visione “eccessivamen-
te mentalistica e astratta” dei processi di standardizzazione del linguaggio e di elabora-
zione delle ontologie, quasi che si trattasse semplicemente di “mettersi d’accordo (…)
[sul] significato idealmente corretto rispetto ad un determinato dominio”, con “l’illusio-
ne (…) di poter identificare l’ontologia (…) ‘vera’.”, e non invece di confrontarsi soven-
te anche con vincoli di ordine economico, oltre che con mentalità e visioni del mondo
fortemente radicate negli uomini e nelle istituzioni78. Certo, nella visione del Web
semantico, almeno nella versione “centralistica”, propugnata da Berners-Lee e dal
WWW Consortium, colpisce una certa aspirazione a descrivere e classificare tendenzial-
mente tutto quanto è rappresentato sul Web, che ricorda i teatri della memoria e le uto-
piche aspirazioni dell’ars memorandi cinque-seicentesca a catalogare l’intero universo.
Più realistici sembrano i progetti che si muovono su un orizzonte più limitato e che
mirano all’interoperabilità e allo scambio di informazioni all’interno di comunità di
attori definite e circoscritte. In questi casi le ambizioni ontologiche sembrano avere una
portata più ristretta, ma proprio per questo più realistica ed efficace79.
76 Per una prima informazione sui metadati e sulle loro varie implicazioni, cfr. di chi scrive, Passato digitale. Le
fonti dello storico nell’era del computer, Bruno Mondadori, Milano 2004, pp. 186-190.
77 Cfr. C. Shirky, The Semantic Web, Syllogism, and Worldview, 7 novembre 2003, in Clay Shirky’s Writings About
the Internet, http://www.shirky.com/writings/semantic_syllogism.html.

78 Cfr. M. Bonifacio, Alcune delle domande che il Semantic Web non si fa: il processo e il valore economico del linguag-
gio e del significato, in “Networks. Rivista di filosofia dell’intelligenza artificiale e scienze cognitive”, 2003, 2,
numero monografico dedicato al Web semantico, http://lgxserve.ciseca.uniba.it/lei/ai/networks/03-2
/bonifacio.pdf. Aggiunge Bonifacio: “Volendo adottare un punto di vista capace di andare oltre a quello mera-
mente mentalistico, è evidente come dietro ad ogni sistema di L-S [liguaggio-significato] si cela un mondo di
interessi concreti e tangibili che da quel sistema dipendono (…) Da questo punto di vista (economico-concre-
to) emerge in primo luogo come la negoziazione del significato non sia tanto un processo astratto tendente alla
correttezza logica, quanto piuttosto una vera e propria “negoziazione” nel senso economico del termine: impli-
ca la considerazione di costi e benefici (valori) nelle posizioni di partenza e dell’impatto che i cambiamenti pro-
ducono sulle posizioni finali dei partecipanti al “gioco linguistico”.
79 Cfr per un esempio di tentativi del genere il caso dei feed Rss utilizzati dai blogger: G. Roncaglia, Blogosfera e
feed RSS: una palestra per il Semantic Web?, in “Networks. Rivista di filosofia dell’intelligenza artificiale e scien-
ze cognitive”, 2003, 2, cit., http://lgxserve.ciseca.uniba.it/lei/ai/networks/03-2/roncaglia.pdf. Cfr. anche G.
Granieri, Blog generation, Laterza, Roma-Bari 2005, pp. 96-105.
23
STEFANO VITALI
Ciò che di molto interessante la proposta del Web semantico sembra indicare per
il filo del ragionamento che stiamo seguendo in queste pagine, è che il superamento
di alcuni limiti nell’organizzazione (o nella non organizzazione) del Web, e delle con-
seguenti difficoltà di reperire informazione utile e affidabile, sembra in misura cre-
scente essere affidato alla ‘riscoperta’ e al recupero di taluni dei tradizionali strumen-
ti di sistematizzazione e di classificazione dei documenti e delle conoscenze. È quan-
to avviene anche all’interno di quelle enclave del Web (in genere di carattere accade-
mico o latamente culturale) che si propongono di sviluppare meccanismi di ricerca in
grado di generare risultati di maggiore precisione e qualità rispetto a quelli offerti da
Google e dai comuni motori di ricerca. Si tratta, ad esempio, delle iniziative, assai dif-
fuse nel mondo dei beni culturali, che mirano ad offrire accesso a documenti e risorse
digitali attraverso una loro catalogazione semantica oppure altre che adottano il
modello messo a punto dall’Open Archive Iniziative per la ricerca all’interno di rac-
colte di pubblicazioni elettroniche e di biblioteche digitali distribuite. Questo modello
si basa su sistemi di cattura (o di harvesting) dei metadati associati ai documenti e alle
risorse digitali che ne descrivono caratteri e contenuto semantico e sono resi disponi-
bili attraverso appositi protocolli80.
La prospettiva di introdurre sul Web principi di ordine e classificazione non può
che essere visto con favore, soprattutto da chi fa un mestiere, come quello dell’archi-
vista, a quei principi religiosamente devoto. Tuttavia ci sono vari aspetti di quelle ini-
ziative sui quali varrebbe la pena di discutere approfonditamente, soprattutto per
domandarsi se sia adeguata ai peculiari caratteri del mondo digitale la tendenza a
riproporre alcuni modelli di ricerca e di organizzazione di informazioni, documenti e
conoscenze tipici del mondo convenzionale. È indubbio che, nonostante tutti i loro
limiti, i sistemi di classificazione, quando si applicano a discipline e/o domini del reale
ben individuati e circoscritti, costituiscono non solo un prezioso ausilio a trovare o a
scoprire ciò che si cerca, ma anche un potente veicolo di comunicazione, spesso impli-
cita, di principi e fondamenti teorici disciplinari. È pur vero, tuttavia, che la logica del-
l’ipertestualità e del mondo digitale in generale ha reso consapevoli del fatto che clas-
sificazioni lineari e monodimensionali rischiano di offrire una rappresentazione della
realtà e della conoscenza impoverita e schematica, e che solo strumenti che permetta-
no di gestire tassonomie flessibili, dinamiche e multidimensionali sono in grado di
restituire la complessità del reale81.
Ma le maggiori perplessità che suscitano alcune delle iniziative accennate sopra
sono di altra natura. Esse, nell’affidare a set di metadati il compito di rappresentare e
classificare documenti e risorse digitali afferenti a diversi ambiti disciplinari e/o a dif-
ferenti istituzioni di conservazione (musei, archivi, biblioteche), fanno in genere rife-
rimento al cosiddetto Dublin Core (DC), un “tracciato” descrittivo elementare che
80Informazioni più dettagliate sul sito ufficiale dell’OAI, http://www.openarchives.org/index.html. Un moto-

re di ricerca basato sull’architettura OAI è quello sviluppato dall’University of Michigan Digital Library
Production Service ricerca. Esso alla data del 29 luglio 2005 dava accesso a 5.713.388 “documenti” di 514 isti-
tuzioni diverse: disponibile all’indirizzo http://oaister.umdl.umich.edu/o/oaister/.
81 Cfr. su questo punto le interessanti considerazioni di C. Lagoze, From Static to Dynamic Surrogates: Resource
Discovery in the Digital Age, in “D-Lib Magazine”, vol 3, 6, giugno 1997, http://www.dlib.org/dlib/
june97/06lagoze.html.
24
mira a individuare gli elementi essenziali necessari a descrivere materiali di diversa

natura (testo, immagini, registrazioni sonore, video, documenti multimediali)82. I limi-
ti che strumenti come il Dublin Core presentano non sono dovuti tanto al fatto che la
loro voluta schematicità rischia di impoverire notevolmente la semantica in genere
associata ai tradizionali strumenti utilizzati per descrivere o catalogare le risorse nei
loro specifici ambiti, quanto piuttosto al fatto che “quando strutture descrittive com-
plesse sono migrate nel formato DC, se ne perde l’articolazione gerarchica e la loro
complessità non può essere espressa”83. Ciò significa che si perde in sostanza la capa-
cità di rappresentare in modo efficace il contesto all’interno nel quale le risorse sono
iscritte e, attraverso questo, il loro contesto di provenienza che è fondamentale per la
loro stessa comprensione ed interpretazione.
In realtà, l’impermeabilità ai contesti o la difficoltà a rappresentarli e a tenerne
conto è un problema generale che interessa l’insieme degli strumenti di reperimento
delle informazioni e dei documenti sul Web, a partire dai motori di ricerca, compreso
lo stesso Google. Mentre il Web e i singoli siti sono aggregazioni complesse, le cui logi-
che di sedimentazione e di organizzazione contribuiscono a definire il significato dei
materiali che contengono, il recupero dei singoli documenti da parte dei motori di
ricerca è, infatti, sostanzialmente decontestualizzato. Essi indirizzano al singolo docu-
mento o alla singola pagina, come se si trattasse di entità irrelate ed in sé concluse. Ciò
ha o può avere come conseguenza il fatto che sovente è quasi impossibile individuare
chi ha l’effettiva responsabilità delle pagine o dei documenti recuperati, o comunque
del sito Web di cui fanno parte, elementi tutti che contribuirebbero ad esprimere valu-
tazioni fondate sulla qualità e l’affidabilità dei materiali verso cui i motori indirizzano.
Questo approccio puntiforme, frammentario e destrutturato all’informazione deri-
va probabilmente dalla metafora attraverso la quale i motori di ricerca guardano alla
Rete e che hanno ereditato dai sistemi tradizionali di information retrieval. Tale metafo-
ra è quella della biblioteca, vista come collezione di “documenti” autonomi, privi di
relazioni strutturali e portatori di una conoscenza che non necessita operazioni di con-
testualizzazione. In realtà, ci si potrebbe chiedere se una metafora di questo genere sia
effettivamente quella più pertinente per il mondo digitale in generale e per il Web in
particolare o se essa non impedisca piuttosto di far vedere come la Rete proponga di
continuo dei contesti all’interno dei quali l’informazione presenta una propria speci-
fica dimensione, che ne filtra necessariamente anche la corretta intelligibilità e inter-
pretazione. I documenti e le informazioni digitali accessibili attraverso le reti telema-
tiche, infatti, disegnano uno spazio relazionale interamente costruito, uno spazio
informativo segnato da relazioni di tipo simbolico. Tali relazioni sono dense di signi-
ficato e ricche di implicazioni, perché esprimono una componente strutturale del
modo in cui l’informazione è selezionata, organizzata, presentata, fatta interagire con
altra informazione: basti pensare alla rilevanza che ha l’articolazione dei siti Web o ai
percorsi che da ciascun sito possono dipanarsi. Gli spazi della Rete definiscono, quin-
82 La bibliografia su Dublin Core e le sue applicazioni è sterminata. Il miglior punto di partenza è il sito uffi-
ciale del progetto: Dublin Core Metadata Iniziative, http://dublincore.org/.
83 G. Geser, Resource Discovery - Position Paper: Putting the Users First, in DigiCULT, Thematic Issue 6: Resource
Discovery Technologies for the Heritage Sector, cit., p. 9.
25
STEFANO VITALI
di, contesti nei quali documenti e informazioni intrecciano fra loro relazioni significa-
tive che possono suggerirne possibili chiavi di lettura. È ovvio che l’emergere di que-
sti contesti non è il frutto del caso. Essi sono piuttosto il risultato di strategie e scelte
dei soggetti che comunicano, organizzano, svolgono attività attraverso la Rete.
Sembrerebbe perciò quasi ovvio che gli strumenti di ricerca sul Web non ignorassero,
ma piuttosto mettessero in evidenza i contesti da cui “estraggono” i documenti,
segnalando ad esempio esplicitamente il sito di provenienza di un determinato docu-
mento e, per quanto possibile, anche i soggetti responsabili del sito stesso ed ogni altra
informazione utile a contestualizzare i documenti stessi. Eppure nulla di ciò avviene.
Introdurre la dimensione contestuale nelle procedure di ricerca e di presentazione
dei suoi risultati all’utente sarebbe un passo importante anche nell’ottica di una gene-
rale riconsiderazione dell’immagine un po’ semplificata di tali procedure che è stata
fatta propria ed “implementata” dagli strumenti sviluppati fino adesso nel mondo
digitale. La ricerca di risorse informative in grado di soddisfare le esigenze di cono-
scenza è infatti un processo intellettuale multidimensionale, ricorsivo, altamente dina-
mico, che può includere fasi distinte ed utilizzare strumenti diversi, colloquiando con
i quali, esso diventa anche un processo, spesso inconsapevole, di apprendimento,
durante il quale, non solo impariamo o affiniamo la conoscenza di specifiche termino-
logie, di reti concettuali, di riferimenti contestuali, ma soprattutto ricalibriamo e ride-
finiamo le nostre domande o ci poniamo interrogativi del tutto nuovi. Per questo, al
contrario di quanto avviene oggi, le metafore cui ispirarsi nella messa a punto dei
sistemi di ricerca dovrebbero essere molteplici, fare riferimento a modelli plurimi e
utilizzare approcci teorici (più che tecnologici) ampiamente interdisciplinari.
Senza dimenticare certo che anche la scoperta serendipitosa gioca un ruolo molto
rilevante nella soddisfazione delle nostre esigenze informative. Anzi a pensarci bene
verrebbe quasi la voglia di dire che in fondo la strategia di non andare direttamente a
cercare ciò che pensiamo di voler trovare, ma di aspettare di imbattercisi (differendo
l’incontro, ma anche provocandolo) è forse la strategia più adeguata in un’epoca di
information overlaod come quella in cui viviamo. Anzi essa è forse l’unico salvagente cui
aggrapparsi per naufragare dolcemente nel mare dell’informazione. Ma, come diceva
Pasteur, solo la mente preparata e creativa sa cogliere al volo l’occasione84.
84 Sulla dimensione serendipitosa della ricerca sul Web e nel mondo digitale in generale cfr. S. Vitali, Passato
digitale, cit., pp. 84-88.
26

Ordine e Caos Google e L Arte Della Memo PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Ordine e Caos Google e L Arte Della Memo PDF

Caricato da

Copyright:

Formati disponibili

0103_vitali.qxp 01/09/2005 13.

L’ordine è la madre della memoria.

Google è stato progettato per mettere

Prive di contesto, le parole

Il mondo secondo Google

I cosiddetti “motori di ricerca”, e Google in particolare, son diventati negli ultimi

* Stefano Vitali lavora presso l’Archivio di Stato di Firenze.

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

Questi professionisti sono gli archivisti e i bibliotecari che il successo di Google

gio 2005, http://www.apogeonline.com/Webzine/2005/05/30/01/2005053001; W. Roush, The Infinite Library, in

la connessione fra organizzazione e conservazione fa parte integrante del discorso sulla

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

Così, se “la memoria è la tecnica dell’ordinamento enciclopedico delle nozioni”, il

È proprio questa trasformazione nelle finalità dell’ars memorandi che, se da un lato

Così, esauritesi le utopie pansofiche che attraverso il “preciso e razionale ordina-

18 P. Rossi, Il passato, la memoria, l’oblio, cit., pp. 59-60.

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

Così, alle origini, le discipline bibliografiche sono praticamente indistinguibili dal-

te inserito all’interno di uno schema teologico di difesa dell’ortodossia cattolica, oppu-

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

do un determinato ordine”33. Nei quasi coevi scritti sull’organizzazione degli archivi,

D’altronde di problematiche non molto lontane da queste, è intessuta non poca

Torino 1999, pp. 63-63.

Retrieval, in “Adventures in Cybersound”, http://www.acmi.net.au/AIC/BUSH_LESK.html. Punti di riferimen-

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

Quest’insieme di strumenti e di metodologie per organizzare (secondo un ordina-

45 J. Yates, Business Use of Information and Technology, cit., p. 118.

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

Perché Google è “rivoluzionario”

48 M. Agosti, Ipertestualità e information retrieval, cit., p. 9.

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

Le classificazioni - ha scritto Serrai - sono, in generale, raggruppamenti ordinati di ogget-

Classificare vuol dire, quindi, individuare un attributo, un carattere o un punto di

53 A. Serrai, Le classificazioni, cit, pp. X-XI.

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

Luis Borges immagina estratta dall’apocrifo Emporio celeste di riconoscimenti benevoli,

la riduzione alla monodimensionalità diventa restrittiva, e le limitazioni della monodi-

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

Secondo Bush, occorreva quindi mettere a punto tecnologie che consentissero la

68 Cfr. “Guida alle funzioni di ricerca” di Google, http://www.google.it/intl/it/why_use.html.

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

re le migliaia se non le decine di migliaia. Nel bilanciamento fra la precision e il recall i

il messaggio è trattato in modalità monodimensionale, non problematica, presupponen-

La maggiore conseguenza di ciò è che, pur essendo i motori il principale strumento

Oltre i motori di ricerca

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

the Internet, http://www.shirky.com/writings/semantic_syllogism.html.

80Informazioni più dettagliate sul sito ufficiale dell’OAI, http://www.openarchives.org/index.html. Un moto-

ORDINE E CAOS: GOOGLE E L’ARTE DELLA MEMORIA

mira a individuare gli elementi essenziali necessari a descrivere materiali di diversa

Discovery Technologies for the Heritage Sector, cit., p. 9.

digitale, cit., pp. 84-88.

Potrebbero piacerti anche