Sei sulla pagina 1di 36

Googlecrazia

Indice

Introduzione ............................................................... Errore. Il segnalibro non definito. 1 1.1 Il mondo in una query............................................ Errore. Il segnalibro non definito. Impronte del sapere ........................................ Errore. Il segnalibro non definito. 1.1.1 1.1.2 1.1.3 1.1.4 1.1.5 1.2 1.2.1 1.2.2 1.3 1.3.1 1.3.2 1.3.3 1.3.4 1.3.5 1.3.6 1.3.7 1.3.8 1.3.9 1.4 1.4.1 1.4.2 1.4.3 1.4.4 2 2.1 Le societ digitali ................................... Errore. Il segnalibro non definito. Il successo del modello organizzativo ........ Errore. Il segnalibro non definito. Economia ed epistemofilia ....................... Errore. Il segnalibro non definito. Economia del dono ................................. Errore. Il segnalibro non definito. Google e Wikipedia ................................. Errore. Il segnalibro non definito. Epistemofilia e altri fanatismi ................... Errore. Il segnalibro non definito. La rete come leggibilit ........................... Errore. Il segnalibro non definito. Vita, morte e metamorfosi della rete ........ Errore. Il segnalibro non definito. Fisiologia, anarchia e dispotismo .............. Errore. Il segnalibro non definito. Simultaneit e visione aerea .................... Errore. Il segnalibro non definito. La raffigurazione geografica..................... Errore. Il segnalibro non definito. Il modello della citt ............................... Errore. Il segnalibro non definito. La citt dei portali .................................. Errore. Il segnalibro non definito. Una biblioteca universale su misura .......... Errore. Il segnalibro non definito.

Sapere sociale, sapere specialistico, sapere individualeErrore. Il segnalibro non definito.

Metafore della rete .......................................... Errore. Il segnalibro non definito.

La citt vista dallalto e la biblioteca ................... Errore. Il segnalibro non definito.

Scompaginazione delle unit narrative classiche e franchiseErrore. Il segnalibro non defin La responsabilit della domanda .............. Errore. Il segnalibro non definito. La rimozione della sfinge ......................... Errore. Il segnalibro non definito. Rompicapo scientifici .............................. Errore. Il segnalibro non definito. Il mondo normale di Google .................... Errore. Il segnalibro non definito.

Il bibliotecario e la sfinge ................................. Errore. Il segnalibro non definito.

Le macchine delloracolo ....................................................................................... 7 Caccia allinformazione .......................................................................................... 7 2.1.1 2.1.2 2.1.3 2.1.4 Dati e informazioni ...................................................................................... 7 Informazione, relazioni e formazione ............................................................. 9 Limprinting del telefono..............................................................................10 Precisione, recall, ordinamento ....................................................................11 Le anime contrastanti della rilevanza ............................................................12 Stanze, corde e spaventi .............................................................................14 Autismi e pertinenza ...................................................................................16 Software e conoscenze di Sfondo .................................................................18

2.2

La rilevanza ........................................................................................................12 2.2.1 2.2.2 2.2.3 2.2.4

2.2.5 2.3 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 2.3.6 2.4 2.4.1 2.4.2 2.4.3 3 3.1

Il talento dellintelligenza ............................................................................19 La focalizzazione tematica ...........................................................................20 Lintelligenza trilobata dei motori .................................................................21 Ragni con occhi meccanici ...........................................................................21 Unetichetta in ogni parola...........................................................................22 Larchivio ..................................................................................................24 Scheletri di discorsi ....................................................................................26 Un software accademico..............................................................................29 Un software pubblicitario .............................................................................31 Un uccellino mi ha detto ...........................................................................32

Lanalisi del contenuto .........................................................................................20

La sensibilit sociale di Google ..............................................................................28

La bacheca di quello che manca ............................. Errore. Il segnalibro non definito. Il lume della rilevanza e lidentificazione degli oggettiErrore. Il segnalibro non definito. 3.1.1 3.1.2 3.1.3 3.1.4 3.1.5 3.1.6 Donne, selvaggi e animali ....................... Errore. Il segnalibro non definito. Leducazione sociale alla rilevanza ............ Errore. Il segnalibro non definito. Cercare lumi .......................................... Errore. Il segnalibro non definito. Il gioco dellimpiccato ............................. Errore. Il segnalibro non definito. Criteri per la somiglianza......................... Errore. Il segnalibro non definito. La lampada: una, nessuna, centomila ....... Errore. Il segnalibro non definito. Porre e rendere disponibile ...................... Errore. Il segnalibro non definito. Le nuove terre disposte da Google ........... Errore. Il segnalibro non definito. Tre strategie di ricerca ............................ Errore. Il segnalibro non definito. Una tassonomia per le domande .............. Errore. Il segnalibro non definito. Una tassonomia per gli oggetti ................. Errore. Il segnalibro non definito. Lampada? Quale lampada? ...................... Errore. Il segnalibro non definito. Le impronte dellutente felice ................... Errore. Il segnalibro non definito. La ricerca perfetta .................................. Errore. Il segnalibro non definito. La coda lunga della domanda ................... Errore. Il segnalibro non definito. Un mondo di nicchie ............................... Errore. Il segnalibro non definito. Scrittori per forza ................................... Errore. Il segnalibro non definito. Scrivere e prescrivere ............................. Errore. Il segnalibro non definito. Plastica umana ...................................... Errore. Il segnalibro non definito. Luomo e il mondo come progetto tecnico.. Errore. Il segnalibro non definito. Il discorso delle tracce ............................ Errore. Il segnalibro non definito. Ritratto dal vero ..................................... Errore. Il segnalibro non definito. Ho costruito un post pi duraturo del bronzoErrore. Il segnalibro non definito.

3.2

Il dispositivo, questo sconosciuto ...................... Errore. Il segnalibro non definito. 3.2.1 3.2.2

3.3

Lintenzione della domanda .............................. Errore. Il segnalibro non definito. 3.3.1 3.3.2 3.3.3 3.3.4 3.3.5 3.3.6 3.3.7 3.3.8 3.3.9

3.4

Linformazione inconsapevole ............................ Errore. Il segnalibro non definito. 3.4.1 3.4.2 3.4.3

3.5

Sulle tracce dellintelligenza collettiva ................ Errore. Il segnalibro non definito. 3.5.1 3.5.2 3.5.3

3.5.4 3.5.5 3.5.6 3.5.7 3.5.8 3.5.9 3.5.10 3.5.11 3.5.12 3.5.13 4 4.1

Ci aiutano a essere noi stessi ............... Errore. Il segnalibro non definito. La testa di Mozart .................................. Errore. Il segnalibro non definito. Leroe senza corpo ................................. Errore. Il segnalibro non definito. Il gruppo senza individuo ........................ Errore. Il segnalibro non definito. Il motore dellintelligenza collettiva........... Errore. Il segnalibro non definito. Salva con nome ..................................... Errore. Il segnalibro non definito. La mente scritta ..................................... Errore. Il segnalibro non definito. Metabolismo linguistico della nicchia ......... Errore. Il segnalibro non definito. La deriva tecnicistica .............................. Errore. Il segnalibro non definito. Lo spettro del prototipo ........................... Errore. Il segnalibro non definito.

Il campionario del reale ......................................... Errore. Il segnalibro non definito. Lalbero delle classificazioni .............................. Errore. Il segnalibro non definito. 4.1.1 4.1.2 4.1.3 4.1.4 4.1.5 4.1.6 La verit che si progetta ......................... Errore. Il segnalibro non definito. I vincoli fisici del modello scolastico .......... Errore. Il segnalibro non definito. Alberi ed essenze ................................... Errore. Il segnalibro non definito. Lalbero di Dewey ................................... Errore. Il segnalibro non definito. I frutti bacati dellalbero di Dewey ............ Errore. Il segnalibro non definito. La strategia del dio degli scheletri ............ Errore. Il segnalibro non definito. Cosa c Derrire La Gare Sainte Lazare? .. Errore. Il segnalibro non definito. Mille e una tag ....................................... Errore. Il segnalibro non definito. Il senso di Google per i metadati .............. Errore. Il segnalibro non definito. Anche le formiche nel loro piccolo taggano Errore. Il segnalibro non definito. Classificazioni folk .................................. Errore. Il segnalibro non definito. I meccanismi di replica ........................... Errore. Il segnalibro non definito. Le Lezioni americane .............................. Errore. Il segnalibro non definito. Pubbliche relazioni digitali ....................... Errore. Il segnalibro non definito. Omogeneizzati sociali, usi e gratificazioni .. Errore. Il segnalibro non definito. I memi ................................................. Errore. Il segnalibro non definito. Linfluenza dei blog ................................. Errore. Il segnalibro non definito. Lidentikit dellutente .............................. Errore. Il segnalibro non definito. La fecondit memetica ............................ Errore. Il segnalibro non definito. Avatar e guru ........................................ Errore. Il segnalibro non definito. Dal possesso alla rete ............................. Errore. Il segnalibro non definito. Frammenti di eroi ................................... Errore. Il segnalibro non definito. Il mito del garage................................... Errore. Il segnalibro non definito. Leuforia artificiale della precariet ........... Errore. Il segnalibro non definito. La rilevanza dellinnovazione ................... Errore. Il segnalibro non definito. Lindustria della narrativa ........................ Errore. Il segnalibro non definito.

4.2

Etichettare il mondo ........................................ Errore. Il segnalibro non definito. 4.2.1 4.2.2 4.2.3 4.2.4 4.2.5

4.3

I memi e la riproduzione culturale ..................... Errore. Il segnalibro non definito. 4.3.1 4.3.2 4.3.3 4.3.4 4.3.5 4.3.6 4.3.7 4.3.8 4.3.9 4.3.10

4.4

Il mio regno per una storia! .............................. Errore. Il segnalibro non definito. 4.4.1 4.4.2 4.4.3 4.4.4 4.4.5

4.4.6 4.5 4.5.1 4.5.2 4.5.3 4.5.4 4.5.5 4.5.6 4.5.7 4.5.8 4.5.9 4.5.10 4.5.11 4.5.12 5 5.1

Eroi di pixel ........................................... Errore. Il segnalibro non definito. Scheletro di cane o di rinoceronte? ........... Errore. Il segnalibro non definito. Scheletri di racconti ................................ Errore. Il segnalibro non definito. Scheletri campioni .................................. Errore. Il segnalibro non definito. I colori non sono tutti uguali .................... Errore. Il segnalibro non definito. La doppia vita dellesempio...................... Errore. Il segnalibro non definito. Gli scheletri delle vacanze e delleconomia . Errore. Il segnalibro non definito. Gli scheletri nella selva legale .................. Errore. Il segnalibro non definito. Esperienza e formazione ......................... Errore. Il segnalibro non definito. Le leggi dellipotesi ................................. Errore. Il segnalibro non definito. Lintelligenza senza pensiero.................... Errore. Il segnalibro non definito. Linformazione senza formazione .............. Errore. Il segnalibro non definito. La filiera della violenza............................ Errore. Il segnalibro non definito.

Un mondo di scheletri ...................................... Errore. Il segnalibro non definito.

Il rubinetto dellintelligenza ................................... Errore. Il segnalibro non definito. La provvidenza di Google ................................. Errore. Il segnalibro non definito. 5.1.1 5.1.2 5.1.3 5.1.4 5.1.5 5.1.6 5.1.7 5.1.8 La liberalizzazione delle telecomunicazioni . Errore. Il segnalibro non definito. Davide e Golia ....................................... Errore. Il segnalibro non definito. Il lato oscuro di Google ........................... Errore. Il segnalibro non definito. Aste e clic ............................................. Errore. Il segnalibro non definito. Inserzionisti discriminati ......................... Errore. Il segnalibro non definito. Il nodo cinese ........................................ Errore. Il segnalibro non definito. Leredit del welfare ............................... Errore. Il segnalibro non definito. La redenzione tecnologica ....................... Errore. Il segnalibro non definito. La centralit di Gmail .............................. Errore. Il segnalibro non definito. Il caleidoscopio dei servizi ....................... Errore. Il segnalibro non definito. Lintegrazione dei dati ............................. Errore. Il segnalibro non definito. Lutente medium .................................... Errore. Il segnalibro non definito. Tutti i numeri dei quotidiani ..................... Errore. Il segnalibro non definito. Pubblicit personalizzata ......................... Errore. Il segnalibro non definito. Un mondo intelligente a portata di mano ... Errore. Il segnalibro non definito. Il migliore dei progetti possibili ................ Errore. Il segnalibro non definito. La circolazione del potere ........................ Errore. Il segnalibro non definito. La grande scordatura .............................. Errore. Il segnalibro non definito. La domanda critica ................................. Errore. Il segnalibro non definito. Lestensione del sapere sociale ................ Errore. Il segnalibro non definito. Le periferie dellaccademia ...................... Errore. Il segnalibro non definito. Le tassonomie commerciali ...................... Errore. Il segnalibro non definito. La legittimazione della personalit ............ Errore. Il segnalibro non definito.

5.2

Il labirinto di Google ........................................ Errore. Il segnalibro non definito. 5.2.1 5.2.2 5.2.3 5.2.4 5.2.5

5.3

Conclusioni provvisorie .................................... Errore. Il segnalibro non definito. 5.3.1 5.3.2 5.3.3 5.3.4 5.3.5 5.3.6 5.3.7 5.3.8 5.3.9 5.3.10

5.3.11 5.3.12

Lanonimato della cultura ........................ Errore. Il segnalibro non definito. Il senso come problem solving ................. Errore. Il segnalibro non definito.

2 Le macchine delloracolo
Qualche tempo fa unamica mi confidava di essersi rivolta a Google anche per cercare oggetti che aveva perso in casa. Le era capitato in un momento di distrazione ma come insegna Freud, i lapsus offrono molti indizi sulle verit che si vogliono nascondere, o che sono troppo evidenti per riuscire ancora a vederle. Il campo editabile di Google una frequentazione quotidiana per milioni di persone, che interrogano il motore attraverso la variet delle sue apparizioni dal dispositivo incorporato nelle barre dei browser, alla pagina bianchissima del portale in tutte le sue declinazioni nazionali. Secondo le analisi di Compete.com, Google.com ha ricevuto in America poco meno di 2.781 milioni di visite nel mese di gennaio 2010 da parte di circa 148 milioni di utenti unici.

1.1 Caccia allinformazione


Le ragioni di questo successo si trovano nellapprezzamento universale delle funzioni che vengono erogate dal motore di ricerca. Fin dalla sua apparizione nel 1998 Google ha sbaragliato i concorrenti con la qualit delle sue prestazioni. Pur senza approfondire gli aspetti tecnici degli algoritmi che garantiscono il funzionamento del software, necessario esplorare a grandi linee la loro configurazione. Solo in questo modo possibile chiarire la logica sottesa al concetto di domanda e di risposta che si trova nei servizi di Google, e che si diffonde allintera societ contemporanea grazie al suo uso indipendentemente dalla destinazione che gli viene attribuita dai singoli e dal tipo di ricerche che sono compiute da loro. Si tratta di un passaggio essenziale per comprendere con quale tipo di scheletri il motore popoli la ragione delluomo contemporaneo, e quale ambiente collabori a formare per accoglierli tra le reti della logica.

1.1.1 Dati e informazioni La ricognizione del funzionamento di Google impone un passaggio preliminare, in cui si gioca per di pi uno degli aspetti essenziali del suo successo. Lambito di indagine in cui lo sviluppo del motore ha preso le mosse quello dellinformation retrieval, che costituisce un salto paradigmatico rispetto al punto di partenza rappresentato dal semplice data retrieval. La configurazione concettuale e linsieme di strumenti pi semplici che possono intervenire nella formulazione della risposta, o dellinsieme di risposte, ad uninterrogazione rivolta ad un database quella del recupero di tutti i dati che riportano propriet congruenti rispetto a quelle che occorrono nella stringa di ricerca, senza alcuna valutazione della loro pertinenza rispetto al significato implicito nella domanda. Il data retrieval si limita a questo livello elementare, recuperando i documenti il cui contenuto, o porzioni di contenuto, corrispondono in modo puntuale agli elementi che figurano nella formulazione della query. La ricerca si conclude quando il Sistema riuscito a rintracciare allinterno del database tutti i documenti in cui si trova un calco esatto dei termini di cui si compone la stringa di ricerca, senza una stima della loro rilevanza rispetto al senso della domanda. Il passaggio allinformation retrieval si compie con lingresso del problema del significato nellanalisi della domanda. Il Sistema in questo caso assume la stringa di interrogazione come lo strumento per interpretare

linteresse informativo che lutente ha cercato di esprimere con la formulazione della query. Il lavoro di comprensione si esplicita nellelaborazione del listato delle risposte, che vengono mostrate al ricercatore secondo un ordine calcolato su una stima di gradi di rilevanza rispetto alla domanda. La differenza che corre tra il modello dellinformation retrieval e quello del data retrieval convoca alcuni concetti di definizione difficile, come informazione e significato. Il valore di questi termini sar esaminato nel corso di tutti i prossimi capitoli, almeno per la porzione della loro complessit che deve essere coinvolta in una discussione del ruolo dei motori di ricerca nella societ contemporanea. Vale la pena tuttavia cominciare ad introdurre alcune considerazioni che giustificano il loro valore essenziale nello sviluppo della tecnologia di archiviazione e di ricerca. Sia la nozione di informazione, sia quella di significato, rinviano ad una struttura di relazioni che impone di uscire dai dati cui sono riferite, per rintracciare i loro effetti in contesti sempre pi ampi. Un esempio affascinante della distinzione tra dato e informazione stato proposto da De Certeau1, che riferisce i risultati di unindagine condotta su alcune centinaia di residenti a New York, invitati ad esporre le strategie che essi adottano per descrivere il loro appartamento. La ricerca ha stabilito il rapporto quantitativo di rappresentazioni fondate sulla forma della mappa e sulla forma dellitinerario: solo il 3% degli intervistati ha descritto lappartamento come una mappa, scegliendo una modalit descrittiva che si fonda sulla staticit del luogo e su verbi connessi alla visione. Quasi la totalit degli intervistati invece ha descritto un itinerario, con verbi improntati alle dinamiche del movimento (cammini avanti, poi svolti, ecc.). Pu essere interessante comprendere in che modo la descrizione della mappa si incardini su quella dellitinerario: infatti esistono momenti in cui la descrizione dellitinerario sfocia in quella della mappa, come effetto stesso del movimento che si compiuto o come dato che postula un limite (c un muro), una possibilit (c una porta) o un obbligo (c un senso unico). La mappa la rappresentazione tipica della scienza relativamente allo spazio. La sua configurazione emerge nel XV-XVI secolo, a partire dalle descrizioni medievali degli itinerari (e per lungo tempo convive con le descrizioni degli itinerari di viaggio). Le mappe medievali sono sempre rettilinee: sono descrizioni di itinerari, composte con ordini temporali e non spaziali. Descrivono le tappe del cammino, soprattutto per i pellegrini. Le loro descrizioni sono in termini di giorni, di operazioni e di eventi. Litinerario dispiega lo spazio come una storia, non come una topografia. A partire dal XV secolo le mappe vengono sempre pi ampiamente colonizzate da un gesto raffigurativo che cancella le operazioni di esplorazione e di registrazione storica che hanno reso possibile la rappresentazione cartografica stessa. Col tempo tutta la parte narrativa ha finito per soccombere allastrazione che raffigura soltanto il dato, eliminando linsieme di pratiche che ne permettono la registrazione e la collocazione. La narrazione dei luoghi tuttavia non scomparsa: nella descrizione degli appartamenti, come nei racconti dei pellegrinaggi medievali, continua a comparire linsieme di pratiche che costruiscono dinamicamente lo spazio prima di qualunque sua fissazione in luoghi.

Cfr. M. De Certeau, Linvention du quotidien. I Arts de faire, Parigi, Editions Gallimard, 1990; tr. it. a cura di M. Baccianini, Linvenzione del quotidiano, Roma, Edizioni Lavoro, 2001, cap. 9.

1.1.2 Informazione, relazioni e formazione Linformazione rimanda a diversi sistemi di relazioni: esiste un rapporto che si stringe tra il soggetto e loggetto conosciuto, ed un insieme di nessi che collegano lelemento analizzato a tutto ci con cui esso pu essere correlato. Se per esempio si sta osservando limmagine di un servizio da t, la comprensione dellinformazione presentata dalla raffigurazione potrebbe rinviare a nozioni relative al design, alla cifra stilistica dellautore che ha progettato e prototipato gli oggetti inquadrati, alla fiera in cui viene presentato. Ma limmagine potrebbe essere lillustrazione di un romanzo britannico dei primi del Novecento, e linterpretazione del suo contenuto rinvierebbe in questo caso ai valori e alle abitudini dellepoca vittoriana, allaura emotiva dellImpero, ai fasti e allipocrisia della societ inglese del tempo, allaristocrazia del suo gusto e delle sue maniere. Se poi si trattasse del fotogramma di un film giapponese, lo stesso dato visivo esigerebbe uninterpretazione che ricostruisca il valore culturale della cerimonia del t nel paese del Sol Levante, la sua connessione con i temi religiosi e antropologici che vi possono essere connessi. In tutti questi casi, oltre alle variet nella contestualizzazione interpretativa, si profilano ulteriori passaggi di riflessione sempre meno esplicita, come la relazione che unisce un servizio da t di design contemporaneo e le strutture del marketing dellindustria degli oggetti, il panorama delle riviste che presentano il disegno industriale come una variante delle dinamiche della moda, il sistema economico che sostiene sia il reperimento dei materiali, sia lindustrializzazione dei processi di produzione, sia le strategie dei metodi di distribuzione e di divulgazione. Limmagine del servizio da t nellepoca vittoriana richiama non solo la dimensione della cucina e le abitudini collegate ai pasti che caratterizzano la cultura occidentale in generale, ma anche il vanto dellimpero, la struttura militare e amministrativa che gestiva limportazione di essenze e bevande esotiche dalle colonie, limplicazione politica e culturale di un primato antropologico del popolo britannico sulle razze dominate. La raffigurazione di provenienza giapponese avrebbe implicazioni ancora pi complesse, dal momento che rinvierebbe ad una tradizione consolidata nel periodo Edo, durante lisolamento dellImpero dal resto del mondo, laffermazione dellautarchia nipponica, la centralit dellimperatore e lunificazione delle sue terre, linterazione dei valori di classe in una societ tripartita tra monaci, guerrieri e contadini, la nascita della versione locale dello zen. Il contenuto rappresentato in unimmagine si trasforma in uninformazione nel momento in cui viene messo in relazione con molte altre cose, e da queste acquista una configurazione di significati per losservatore. Il soggetto viene guidato ad assumere una direzione di osservazione e di lettura dallinterazione che il dato stabilisce con tutto quello che non immediatamente presente in esso, ma che lo riguarda da distanze pi o meno prossime o remote; al contempo, la configurazione di senso che emerge dallinterazione con i significati che si presentano nellosservazione produce una trasformazione nel soggetto stesso che li sta esplorando. Linterpretazione non si limita ad inscenare un evento solo intellettuale; lesperienza della comprensione investe anche le dimensioni etiche ed estetiche degli individui. Essa si esplicita in una formazione del soggetto, nella costruzione di unopinione, di un comportamento, di una decisione, che non esistevano prima dellepisodio conoscitivo. Losservazione dellimmagine del servizio da t di design pu concludersi con la decisione di disporne lacquisto; lincontro con lillustrazione britannica pu indurre a procedere con la lettura del romanzo, o a distaccarsene completamente; allo stesso modo, la percezione del fotogramma giapponese pu invitare al proseguimento della visione del film, oppure alla decisione di abbandonare limpresa per dedicarsi ad altro.

A livello pi superficiali le reazioni pragmatiche potrebbero essere quelle elencate, o altre; ognuna di loro sarebbe interconnessa con altre strutture di ethos culturale, sulla base delle quali gli individui propendono a mostrare interesse nei confronti delle culture differenti (lontane nello spazio geografico o in quello storico), oppure a rifiutare il confronto, a tentare uninterpretazione delle differenze che sottolinei lalterit o che cerchi di ridurla o negarla. Tutti questi esperimenti interpretativi, dal semplice rifiuto alla ricerca pi profonda, determinano cambiamenti nei soggetti, i cui effetti saranno anche riscontrabili in momenti successivi della loro vita: al rifiuto potrebbe sostituirsi linteresse, oppure lostinazione al rigetto; la comprensione di alcuni aspetti dellesperienza ermeneutica potrebbe sviluppare la capacit di cogliere una quantit maggiore di aspetti del mondo circostante, anche a livello percettivo. E noto che lapprendimento tramite i documenti letterari delle abitudini tecniche dei pittori, o delle loro convinzioni ontologiche, permette ai critici di osservare nei loro quadri la presenza di alcuni elementi che prima della scoperta non sarebbero stati percepiti nemmeno con unindagine al microscopio. Il passaggio dalla macchia di colore ininfluente, allesistenza di una forma rappresentativa, reso possibile dalla conoscenza di una regola che insegna a rintracciare lunit di senso di un oggetto dove prima esistevano solo pigmenti casuali.

1.1.3 Limprinting del telefono Nella costruzione dellinformazione il soggetto conoscente e la struttura dei dati si condizionano reciprocamente. Il senso che emerge dalla configurazione degli elementi significanti innesca una formazione nellindividuo che compie lesperienza; ma allo stesso tempo la decisione del ricercatore che stabilisce in quale direzione inseguire le connessioni che devono attivare i significati dellinformazione, fino a che punto spingere la ricerca, in che momento arrestarla e convertirla nella base dei comportamenti futuri. La confusione tra dati e informazione stata introdotta dalla teoria dellinformazione di Shannon e dal modello della comunicazione cui connessa. Lo scopo sia della teoria, sia dello schema, era quello di fornire una legge matematica alla costruzione delle linee telefoniche, affinch il rumore di fondo non impedisse il passaggio delle notizie comunicate dalla voce dellinterlocutore al ricevente. Il modello prevede due poli della comunicazione, un emittente e un destinatario; la loro congiunzione assicurata da un canale fisico che trasferisce i dati audio, e che permette la formulazione del messaggio tramite unoperazione di codifica in uscita, ed una corrispondente di decodifica in ingresso. Dal momento che il problema cui Shannon cercava una soluzione era quello della dispersione fisica dei dati sulla linea telefonica, per il suo modello sufficiente assumere che la configurazione di significanti a disposizione del destinatario sia la riproduzione fedele di ci che era presente allemittente nel momento della produzione del messaggio. In questo schema non si apre lo spazio per un percorso interno al dispiegarsi della comunicazione, non avviene nessuna trasformazione negli interlocutori, la mente del ricevente deve apparire come il clone di quella dellindividuo allaltro capo della linea. I messaggi passano tra due menti che non interagiscono in alcun modo, non producono una storia della loro comprensione reciproca, ma si limitano a scambiarsi protocolli linguistici in modo asettico, senza equivoci e senza richieste di risposta. Lesperienza di tutti noi composta da una collezione di confutazioni di questo schema: una conversazione pu essere noiosa, entusiasmante, fastidiosa, ambigua, superficiale; ogni scambio di battute allude al mondo condiviso con linterlocutore, pu essere ironico, pu ambire a soddisfare desideri, pu tentare di

10

essere persuasivo o convocare allobbedienza, pu cercare di ridefinire la situazione per rendere le future interazioni pi vantaggiose o pi innocue. Pu anche perseguire lo scopo di offrire un quadro descrittivo che permetta al destinatario di formarsi unopinione quanto pi possibile autonoma, oppure una formazione personale che corrisponda ai programmi scolastici. In ogni caso il micro-contesto sociale della conversazione non sterilizzato, non innocuo dal punto di vista dei valori pragmatici, etici e politici. Qualunque tipologia di comunicazione condivide con la conversazione questa mancanza di innocenza. Il percorso interpretativo che viene innescato da uninformazione, qualunque sia il corpo significante che la esprime, comporta sempre un coinvolgimento di dimensioni dellesperienza pi estese rispetto al solo strato della decodifica cognitiva.

1.1.4 Precisione, recall, ordinamento Il concetto di rilevanza diviene comprensibile nel momento in cui lo si confronta con la pluralit di sfere sperimentali implicate nel processo ermeneutico. Gli elementi che possono entrare in relazione con loggetto dellanalisi vengono esaminati e distribuiti in un ordine di gradualit rispetto allinteresse che possono ricoprire nel soddisfare lesigenza informativa del soggetto. Ma questa necessit viene valutata sulla base del contesto culturale e di impiego in cui la sua azione di ricerca inserita, e che la motiva nel suo stesso sorgere. La pertinenza concettuale viene definita dal quadro di destinazione pragmatica che prefigura lo scopo dellinformazione, e che definisce lambito di applicazione linguistico dei termini ricercati. La decisione di approfondire lindagine tra le categorizzazioni proposte da Google nella direzione di servizio da t inghilterra, o di servizio da t in ceramica, oppure ancora di servizio da t prezzi, definita dal coinvolgimento del soggetto in una situazione dominata dalla volont di acquistare un servizio da t di design, magari per fare un regalo, oppure dalla necessit di scegliere unillustrazione per la copertina di un romanzo dellepoca vittoriana, o per realizzare la ricostruzione teatrale di un interno londinese fin de sicle. La valutazione del grado di rilevanza che i documenti del database possono presentare rispetto allinteresse informativo del ricercatore deve quindi riferirsi ad un insieme di istanze che intersecano sia la configurazione dei contenuti testuali, sia gli obiettivi pragmatici che il soggetto sta perseguendo. La complessit di questo orizzonte problematico viene parzialmente accolta nel dibattito sulla definizione dei criteri per la valutazione delle prestazioni di un motore di ricerca. I parametri che di regola vengono considerati sono tre: precisione, richiamo, ordinamento. Il primo criterio, quello della precisione, stabilisce che il Sistema non deve elencare nel listato delle risposte documenti irrilevanti rispetto allinterrogazione dellutente. Dal punto di vista del calcolo matematico, ad ogni documento corrisponde una classificazione binaria, decisa dal fatto che esso disponga o meno della propriet di essere rilevante; la precisione corrisponde al valore delle predizioni positive, ed calcolata dal rapporto tra lintersezione dei documenti rilevanti con tutti quelli trovati, da un lato e i documenti trovati dallaltro lato. Il valore 1 si ottiene quando il listato delle risposte contiene solo elementi rilevanti. Il secondo criterio, quello del richiamo (recall in inglese), esige che la ricerca provveda tutti gli elementi rilevanti che sono presenti nel database. In questo caso il calcolo si esegue dividendo lintersezione tra i documenti rilevanti e tutti i documenti rintracciati, da un lato e tutti i documenti rilevanti presenti nel database dallaltro lato. Il valore 1 si ottiene quando i documenti trovati sono tutti quelli rilevanti archiviati.

11

Il bilanciamento tra precisione e richiamo definisce la strategia di ricerca di un algoritmo, e produce come risultato lordinamento delle risposte. I parametri della precisione, del richiamo e dellordinamento dovrebbero quindi comporre i valori misurabili delle prestazioni del motore. Tuttavia, i concetti di rilevanza e di classificazione binaria, con la loro complessit e con il volume di polemiche che hanno suscitato, mostrano lirriducibilit del problema a termini cos semplici, e suggeriscono di non riposare con troppa fiducia su questo schema di valutazione nonostante la consuetudine della sua applicazione non sia certo tramontata.

1.2 La rilevanza
Il nodo critico pi banale riguarda latteggiamento con cui i soggetti umani si confrontano con la rilevanza delle informazioni: le indagini sperimentali che sono state condotte su questo tema hanno infatti messo in chiaro che le persone non tendono ad attribuire la propriet della rilevanza a oggetti e significati secondo unopposizione assoluta, ma preferiscono distribuire i loro giudizi su una scala continua. Le informazioni insomma non sono rilevanti o irrilevanti con un antagonismo senza sfumature, ma si dispongono su gradi di maggiore o minore pertinenza in modo progressivo. Tra il 1987 e il 2003 sono stati compiuti almeno nove studi sperimentali di interesse accademico sul comportamento spontaneo di chi giudica intorno alla rilevanza dei documenti che sta consultando per portare a termine un percorso di studio. Sette di queste indagini hanno evidenziato la natura non-oppositiva delle valutazioni dei campioni esaminati2.

1.2.1 Le anime contrastanti della rilevanza Ma la questione di maggiore complessit coinvolge il significato del concetto di rilevanza, le modalit per registrare le sue apparizioni nel comportamento umano, la possibilit di riprodurle attraverso un dispositivo informatico, gli strumenti e i criteri per misurarla. Gli studi sullinformation retrieval sono cominciati negli anni Cinquanta del secolo scorso ad opera di matematici come Mooers, Kent, Berry, Leuhrs, Perry. Agli ultimi quattro si deve lindagine che nel 1955 ha generato la formalizzazione dei criteri di precisione e richiamo; a Mooers risale invece il conio delletichetta della disciplina e la definizione delle sue fondamenta nel 19513. Nella sua ricognizione preliminare, Mooers esplicita lambiguit che continuer a ripresentarsi in tutta la polemica successiva, quando distingue una rilevanza che insiste sullambito delle macchine e degli algoritmi da un lato, e una rilevanza che invece proviene dagli atteggiamenti e dai giudizi degli utenti del Sistema dallaltro lato. Se il versante delle macchine prevede un insieme di istanze che riguardano lhardware e il calcolo delle relazioni nel programma di decisione il versante che incide sullutente si allarga a comprendere tutti gli elementi che emergono dalla vita della coscienza, dallesame dei temi su cui verte il giudizio, dagli aspetti emotivi, dallesperienza e dalla competenza del soggetto, dalla sua collocazione sociale e storica. Per molti anni la frattura tra i due lati dellindagine sulla rilevanza sembrata inconciliabile, con prese di posizione reciprocamente critiche ad opera dei sostenitori di ciascuna delle due
2

Cfr. T. Saracevic, Relevance: A review of the literature and a framework for thinking on the notion in information science. Part III: Behavior and effects of relevance, in Journal of the American Society for Information Science and Technology, 58(13), 2007, p. 2133 3 C.N. Mooers, Zatocoding applied to mechanical organization of knowledge, in American Documentation, 2, 1951, 2032

12

parti. Se tutti sono sembrati concordare sul fatto che solo lutente stabilisce con il suo giudizio spontaneo cosa sia rilevante, i metodi per indagare le propriet essenziali della valutazione, la misurazione della stima, le istanze che devono essere coinvolte nel calcolo, si sono trasformate in altrettante trincee ideologiche. Da un lato i ricercatori di provenienza umanistica accusano gli esperti di sviluppo tecnologico di aver trascurato gli aspetti fondamentali del concetto, dal momento che esso sviluppa le sue manifestazioni e la propria forza euristica negli stati psicologici e nei comportamenti degli uomini. Per converso, gli esponenti del versante tecnologico sostengono che sebbene le critiche degli oppositori possano essere accolte di principio, di fatto esse non si sono mai tradotte in una formalizzazione che in qualche modo potesse essere tradotta in termini operativi. Le proposte sono vaghe, espresse con un linguaggio ambiguo, senza alcuna attendibilit di misurazione e di calcolo. Di conseguenza, non possibile accogliere le obiezioni in forza della loro incapacit di rappresentarsi in condizioni condivisibili dal punto di vista operativo, e in requisiti che possano esplicarsi in un processo di tipo algoritmico. Il problema senza dubbio che la rilevanza una caratteristica della vita e del comportamento residente cos in profondit nella coscienza da non poter essere formalizzato in modo esplicito. O almeno da sembrare tale. Qualunque giudizio infatti la presuppone, piuttosto che poterla esplicitare e rendere comprensibile nei meccanismi di funzionamento. Labilit nel distinguere gli elementi interessanti da tutto ci che pu rimanere sullo sfondo, appare addirittura come un talento naturale in individui eccezionali, come gli investigatori osannati dai gialli della letteratura, del cinema e della televisione come i medici dotati di occhio clinico infallibile, o come gli esperti darte che sanno compiere attribuzioni corrette a partire da minimi indizi. Il fiuto per il dettaglio rivelatore una virt che affascina al punto da garantire il successo delle produzioni seriali in tutti i media di intrattenimento: lo si interpreta come una dote innata, un privilegio concesso a pochi eletti, che sanno coltivarlo ed affinarlo per il loro successo professionale. Ma la stessa spontaneit permette a tutti di distinguere con sicurezza le notizie interessanti da quelle la cui lettura rinviabile, fino a quelle del tutto trascurabili, nella scorsa che si getta sulla pagina del quotidiano di carta o on-line; di scegliere il negozio in cui probabilmente si potr ritracciare larticolo di cui si alla ricerca o il prodotto che nemmeno si sa ancora di stare cercando. Una calamita orientata verso la verit sembra guidare le nostre scelte nella selezione delle fonti quando compiamo una ricerca, il fornitore corretto per i servizi di cui abbiamo bisogno, la ragione e il torto tra coloro che stanno discutendo. La naturalezza con cui selezioniamo i dati nellambiente che ci circonda per assumere le scelte corrette in vista del nostro comportamento, rende molto difficile comprendere le caratteristiche della nostra ricognizione della rilevanza. E noto infatti che molto di rado le nostre scelte avvengono dopo adeguata ponderazione; anche quando ci siamo presi del tempo per riflettere, spesso la deliberazione finale coincide con quella che avremmo assunto distinto al primo colpo. La selezione nel quadro percettivo di ci che pertinente per il nostro scopo, sia esso cognitivo o pragmatico, sembra precedere qualunque forma di ragionamento, ed essere anzi alla base della possibilit stessa di una riflessione per lo pi invocata a confermare con strumenti razionali quello che si gi deciso di approvare. Stuart Mill ha reso celebre un episodio esemplare sotto questo riguardo, raccontandolo nel suo trattato sulla logica: Lord Mansfield avrebbe consigliato ad un amico incaricato di amministrare la giustizia in una colonia, pur senza avere alcuna esperienza di tribunali e di diritto, di prendere le proprie decisioni sui due piedi, perch allora

13

sarebbero state probabilmente giuste, ma di non avventurarsi mai a darne le ragioni, perch quasi infallibilmente queste sarebbero state sbagliate4.

1.2.2 Stanze, corde e spaventi Lesplorazione del concetto di rilevanza proceduta attraverso percorsi differenti e con diversi sguardi disciplinari, mettendo in luce di volta in volta alcune propriet che appaiono visibili dalla posizione analitica che lo sottopone ad esame e lo interroga. Un inquadramento ad ampio raggio del problema stato offerto da Schtz, che nella sua ultima opera ha tentato di sottoporre la nozione di rilevanza ad unindagine fenomenologica5. Il tentativo rimasto incompiuto a causa della morte dellautore, prima che egli esponesse i risultati della sua riflessione sulla sfera intersoggettiva. Le sue considerazioni si limitano di conseguenza al punto di vista del soggetto singolo, e non avvicinano le determinazioni influenti sui giudizi individuali ad opera delle concezioni maturate dalla verit pubblica e dalla sua incorporazione nel comportamento sociale. Schtz sostiene che non esista una rilevanza, ma un sistema di livelli ognuno dei quali genera una sua propria forma di giudizio. Se si osserva il comportamento naturale delle persone necessario distinguere almeno tre piani di interazione con la realt circostante e di reazioni del soggetto alla configurazione dellambiente. Il primo livello quello tematico, che si compone degli stimoli percettivi provenienti dalla distribuzione degli enti nel mondo circonvicino. Questo primo strato si profila come una struttura ecologica, dove tutto ci che si dispone alla portata della percezione diretta del soggetto si mostra come normale o come carico di una tensione di novit che attira lattenzione. Affiorano alla mia coscienza delle configurazioni problematiche soltanto se esiste una porzione del mio campo percettivo (la porzione peraltro pi ampia) che invece si ritrae su uno sfondo di famigliarit, dispiegandosi come qualcosa di scontato che non solleva dubbi. Se entro in casa mia posso essere assalito da un fremito di terrore se nellangolo del salotto si disegna qualcosa in cui di primo acchito non so se dover riconoscere una corda o un serpente; questo evento interrompe il mio flusso di pensieri precedente e focalizza la mia attenzione sullambiguit fenomenica di parte del mio mondo domestico. Ma ci accade solo perch il resto della stanza giace invece nella sua silenziosit, non sollevando problemi. Nonostante la mia consueta distrazione, la presenza di quelloggetto mi turba perch mi aspettavo di trovare una stanza identica a come lavevo lasciata o almeno a come ero convinto di averla lasciata e a colpo docchio il resto della camera rispetta i patti di confermare le mie convinzioni. Loggetto ridiventa problematico non appena si staglia contro e fuori dallorizzonte della famigliarit, la cui natura pu essere descritta secondo due direzioni divergenti: quella oggettiva, in forza della quale le cose si caricano di una sorta di terzo livello di qualit che le rende appunto scontate, note; quella soggettiva, che relativa agli intenti di analisi dellindividuo, alla sua volont di approfondire lesame dellambiente.

Cfr. J.S. Mill, A System of Logic, 1. II, cap. III, 3; tr. it. a cura di M. Trinchero, Sistema di logica induttiva e deduttiva, Utet, Torino, pag. 286. 5 Cfr. A. Schtz, Reflections on the Problem of Relevance, Greenwood Press Reprint; tr. it. a cura di G. Riconda, Il problema della rilevanza. Per una fenomenologia dell'atteggiamento naturale, Rosenberg & Sellier, Milano, 1975

14

La prima classe di rilevanza coincide con quella dellimposizione: lapparizione incongrua delloggetto nella stanza prescrive la sua presenza come problematica per me che entro, interrompendo il mio flusso di pensiero. Schtz chiama invece rilevanza interpretativa la seconda tipologia di inquadramento della nozione. Nel momento in cui entro nella stanza e vedo il rotolo di corda in un angolo, solo una parte del mio fondo di conoscenze pu essere utile per comprendere lidentit delloggetto che riuscito ad irrompere nella nebbia della mia distrazione e a conquistare il centro della mia attenzione tematica; questa porzione determinata in parte dalle mie caratteristiche soggettive, in parte dalle propriet dellambiente in cui mi muovo e delle dinamiche degli eventi in cui mi trovo coinvolto. Da un lato la prova di interpretazione connessa allistinto, allesperienza, alle abitudini e allo stato emotivo dellindividuo, che distilla queste contingenze personali nel risultato di ci che ha preso coscienza di aver visto, nel modo in cui lo descriverebbe se gli venisse domandato di dichiarare ci che ha percepito: se fossi entrato in casa con amici genovesi, pi avvezzi alle corde da imbarcazione (e forse meno timorosi dei serpenti), ciascuno di loro secondo la sua esperienza e le sue inclinazioni personali potrebbe spiegare di aver osservato un rotolo incidentalmente fatto di spago intrecciato, o una corda incidentalmente arrotolata, o una fune incidentalmente grigia, ecc. Dallaltro lato, se la corda si fosse trovata su una nave, dove la probabilit di rinvenire oggetti del genere molto elevata, la questione quasi di certo non sarebbe entrata nel campo nemmeno della mia tematizzazione a meno che qualcuno non avesse espresso una domanda specifica, per esempio un bambino. Le nozioni disponibili sullambiente e sulle sue caratteristiche intervengono a segmentare lambiente in aree di normalit, di interesse e di allarme, che corrispondono alle attese consuetudinarie sul contesto. Lo stesso evento nel mio salotto o sulla barca di un amico pu produrre effetti di rilevazione del tutto opposti: il contesto e le sue propriet determinano per questo strato fenomenologico i punti notevoli della mia attenzione e il programma della sequenza di ricognizione. Il terzo modo della rilevanza viene etichettato da Schtz della motivazione. Il punto di vista si sposta dalla percezione dellambiente e dalla comprensione della sua natura al comportamento: il tema diviene quello della relazione che stringe le azioni in vista della concretizzazione di un progetto. Nel caso della corda in un angolo della stanza, toccare la corda o il serpente con un bastone serve a comprendere se loggetto pericoloso o no. Potrei imitare James Bond e sferrare un colpo di bastone per scoprire se sia possibile rimuovere loggetto senza pericolo o se sia meglio ritenere sconsigliabile la permanenza nella stanza per la notte. La paura nei confronti dei serpenti la conseguenza di tracce della mia autobiografia, insorge da segmenti di vissuto che costituiscono il confine stesso dellinteresse soggettivo riguardo lazione che deve essere svolta. Il timore che giustifica lazione costituisce il primo segmento della rilevanza motivazionale, quello che fissa lo scopo complessivo delloperazione secondo le sollecitazioni della-causa-di. Infatti, questa istanza determina ragioni e obiettivi nel momento in cui il comportamento si deve produrre; viceversa, la rilevanza dellin-vista-di articola la destinazione generale nei singoli gesti che si succedono quando lo stato di cose da raggiungere stato determinato. Lanalisi di Schtz chiarisce di conseguenza che non esiste mai un contatto primordiale n con le cose, n con il loro ambiente, n con linteriorit del soggetto; tutto si inserisce in un flusso di pensiero che le istanze della rilevanza intervengono a modificare portando in primo piano gli elementi di interesse e lasciando sullo sfondo ci che appartiene alla familiarit anonima. Senza questa confidenza con uno sfondo

15

il cui significato consolidato, non sarebbe possibile nemmeno avviare il processo conoscitivo: non incontriamo gli oggetti come elementi precostituiti, perch simultaneo il processo attraverso il quale li percepiamo nella loro forma e quello attraverso il quale ricostruiamo il loro significato rispetto al contesto e alle nostre motivazioni pragmatiche. Il circolo descritto dalle diverse forme di rilevanza esaminate da Schtz muove da quella tematica, riferita alle propriet formali e strutturali delloggetto; passa a quella interpretativa, che riconduce linsieme delle caratteristiche percettive allunit di un significato; conclude con quella motivazionale, che stabilisce lobiettivo della condotta da assumere e la sua articolazione in sequenza di azioni. La rilevanza descritta da Schtz mostra quindi una natura isomorfa rispetto a quella dellinformazione, dal momento che si mostra come una configurazione di relazioni dalla quale emerge un significato, il cui valore si dispiega sia in ambito cognitivo sia in ambito pragmatico.

1.2.3 Autismi e pertinenza Lampiezza dello spazio dedicato alla ricostruzione dellanalisi di Schtz giustificata dal fatto che gran parte della letteratura sullinformation retrieval ha ripreso le sue considerazioni rielaborandole e approfondendole, ma di fatto confermando sia la tripartizione avanzata nel suo studio, sia la priorit assegnata alla rilevanza tematica (in inglese topic relevance). Le posizioni di Schtz sono state accettate come un sistema di riferimento comune da parte di tutte le scuole di pensiero che si oppongono nel dibattito sulla questione; un ruolo molto pi controverso toccato invece alla teoria della pertinenza formulata da Sperber e Wilson nel corso di un lavoro di analisi esteso per oltre un decennio tra gli anni Ottanta e Novanta del Novecento6. La loro ricognizione esplora la rilevanza dal punto di vista delle scienze della comunicazione e del versante della linguistica etichettato come pragmatica da Morris, in opposizione ai domini della sintassi e della semantica. Lambito di interesse di Sperber e Wilson in altre parole insiste sulle dinamiche effettive del linguaggio impiegato per fini concreti di comportamento e di comunicazione tra gli individui, al di l delle strutture di significazione che gli appartengono per la sua natura di macchina logica per eccellenza. A tutti sar capitato spesso di ascoltare o di essere protagonisti di una conversazione come la seguente:
Laura: stasera mia sorella propone una cena al Rigolo Paolo: alle otto comincia la partita del Milan

Un colloquio simile apparirebbe come una giustapposizione di frammenti linguistici del tutto irrelati se si cercasse di interpretarla alla luce delle sole regole della semantica modellistica: il significato di una proposizione verrebbe esaminato assumendo che coincida con le sue condizioni di verit in altre parole, con le circostanze possibili in cui la sua enunciazione vera. Se linterpretazione delle dichiarazioni linguistiche si fermasse a questo punto, il dialogo precedente sarebbe composto da due porzioni ognuna delle quali stabilisce un riferimento ad una situazione inconfrontabile con laltra: la formulazione di un invito a cena il primo, lorario di inizio di una gara calcistica il secondo. Per evitare che anche nelle conversazioni pi banali le persone appaiano sotto la lente degli studi di linguistica come pazienti affetti da autismo o da demenza senile, la teoria della pertinenza esige un modello di lettura della comunicazione di

Cfr. D. Sperber, D. Wilson, Relevance: Communication and Cognition, Oxford, Blackwell, 1986; 1995.

16

maggiore complessit, sia rispetto allo schema di Shannon, sia rispetto alla rigidit analitica della logica verofunzionale. Sperber e Wilson ereditano la convinzione di Grice che la comunicazione effettiva debba essere interpretata come il processo che permette al soggetto di comprendere, attraverso lo scambio linguistico, le intenzioni di significazione dellinterlocutore. Questa strategia di pensiero ha condotto i sostenitori della versione tecnologica dellinformation retrieval a dichiarare che mentre la rilevanza una condizione oggettiva e misurabile, la pertinenza deve essere stimata come una condizione soggettiva, che non si presta ad una traduzione in termini algoritmici. La comprensione del dialogo tra Laura e Paolo richiede un esercizio di razionalit che muove oltre lesercizio di codifica e decodifica dei messaggi; Laura comprende la risposta di Paolo non solo perch conosce litaliano, ma perch dispone di una competenza sul mondo in cui entrambi vivono, e pu trarre delle inferenze che le permettono di concludere di aver ricevuto una risposta negativa o limplorazione di una dispensa temporanea dagli obblighi di coppia. Gli individui procedono secondo un processo di cooperazione interpretativa in virt del quale assumono che le dichiarazioni dellinterlocutore rispondano in modo pertinente ed esauriente, siano tese ad affermare la verit in determinati contesti e procedano ordinatamente a questo scopo. Queste presupposizioni si attivano nellinterpretazione degli enunciati anche quando non sono state rispettate da chi li ha formulati; qualunque dichiarazione autorizza quindi la ricerca di implicature che permettano di intendere tutto quello che non stato affermato, al fine di renderlo coerente rispetto al contesto del discorso. Molto spesso la struttura del decorso interpretativo conduce a cercare un senso (e a trovarlo) anche l dove non ne esiste nessuno, con leffetto di arricchire il mondo di significati arbitrari o equivoci. Sperber e Wilson riassumono questa condizione nel Principio Comunicativo di Pertinenza, secondo il quale ogni enunciato veicola in se stesso la presunzione della propria pertinenza ottimale. Nel contesto di uno scambio dialogico ogni affermazione si presenta come i) abbastanza pertinente da meritare lattenzione dellinterlocutore; ii) la pi pertinente tra le dichiarazioni che il soggetto capace e preferisce formulare. Nel caso del dialogo esemplificativo esposto in precedenza, Laura pu comprendere la risposta di Paolo ritenendola pertinente alla domanda sulla cena, e confrontandola con la conoscenza di sfondo che ha accumulato per esperienza rispetto alla passione calcistica dellinterlocutore. A quanto pare Paolo ritiene irrinunciabile loccasione di trepidare davanti al televisore o allo stadio durante la partita del Milan, che si svolge nello stesso arco di tempo in cui di solito in Italia i ristoranti attendono i clienti per la cena. Sperber e Wilson sottolineano il fatto che la mente dispone di risorse limitate dal punto di vista della percezione, dei meccanismi cognitivi e della memoria; di conseguenza, obbligata a ottimizzare sia la selezione degli stimoli sensoriali, sia la quantit di informazioni che devono essere analizzate e processate, per poi essere anche conservate in memoria. Soltanto le istanze che guadagnano la massima priorit superano la soglia dellattenzione e sviluppano per la coscienza il loro potenziale informativo, con la ricerca e lelaborazione di tutte le relazioni con il contesto che sono richieste per la loro comprensione adeguata. Il collo di bottiglia dellattenzione governato dal Principio cognitivo di pertinenza, secondo il quale i processi cognitivi tendono alla massimizzazione della pertinenza. Questa massima si articola su almeno tre dimensioni. La prima riguarda le strutture della percezione, che individuano nel flusso di tutte le stimolazioni sensoriali solo quelle che manifestano un carattere potenzialmente pertinente. La seconda insiste sui dispositivi di recupero dellinformazione, che elaborano

17

le ipotesi interpretative pi efficienti rispetto al contesto. Infine la terza coinvolge i processi inferenziali, che si attivano sui dati pi pertinenti per lelaborazione di una comprensione adeguata. Gli effetti della selezione operata secondo criteri di pertinenza sono quelli di estendere il flusso di pensieri del soggetto con una maggiore comprensione degli elementi impliciti nel contesto, operando una corroborazione o un rigetto degli assunti esistenti nella sua mente intorno alla realt.

1.2.4 Software e conoscenze di Sfondo Sia Schtz sia Sperber e Wilson sottolineano che il giudizio di rilevanza si compie gi a livello della percezione; ma soprattutto evidenziano che la decisione pu essere assunta solo attraverso un sistema di conoscenze sul contesto e sul mondo. Solo in virt di questa cognizione di sfondo possibile assicurare leconomia di attenzione e di mezzi espressivi che sostiene lo sviluppo normale delle attivit cognitive e pragmatiche degli individui. La limitazione di risorse discussa dalla teoria della pertinenza non si verifica solo nellambito delle conversazioni, ma in qualunque contesto linguistico. Pu essere un esempio calzante quello proposto da Searle7 con lenunciato:
Lei diede a lui la sua chiave ed egli apr la porta

Ci che leggiamo in questa affermazione che un personaggio femminile passa una chiave ad un personaggio maschile; egli apre una porta con quella stessa chiave, inserendola nella toppa e liberando laccesso. Ma questa interpretazione si spinge molto oltre ci che viene dichiarato dallespressione linguistica, grazie ad una serie di inferenze che saturano tutte le lacune lasciate dalla formulazione esplicita. Searle osserva che la dichiarazione stabilisce solo una successione temporale tra il passaggio della chiave e lapertura della porta; ma in realt nulla viene detto intorno al fatto che luomo abbia aperto la porta con la chiave, o che lo abbia fatto girandola nella toppa. La chiave potrebbe essere pesata 20 Kg ed essere stata sagomata a forma di ascia, in modo da permettere al protagonista di abbattere luscio a colpi di scure. Oppure la porta potrebbe non essere stata chiusa a chiave ed essersi aperta semplicemente ruotando la maniglia. Searle suggerisce anche lipotesi che luomo possa aver aperto la porta inghiottendola e in ogni caso le congetture alternative allinterpretazione che si presenta a tutti per via diretta sono numerosissime; nessuna di loro pu essere esclusa in via di diritto per ci che viene esplicitamente dichiarato. La constatazione che queste varianti non vengano prese in considerazione da nessuno degli ascoltatori o dai lettori dellenunciato dipende dalle inferenze che tutti tendiamo a trarre a partire dallo Sfondo di conoscenze condivise sul mondo, sulle quali possono contare le formule reticenti di ci che viene affermato alla lettera. Il discorso pu procedere segnalando solo i punti notevoli dellevento, esibendo le istanze rilevanti della realt, e lasciando nellimplicito tutto ci che gli interlocutori possono inferire da soli. La necessit di attingere ad uno Sfondo di conoscenze sottintese rappresenta il momento di naufragio per i progetti pi ambiziosi di intelligenza artificiale. Le macchine sono in grado di processare solo istruzioni esplicite, mentre per definizione la struttura della conoscenza di Sfondo incorpora tutto ci che rimane

Cfr. J. Searle, The Construction of Social Reality, Free Press, New York, 1995; tr. it a cura di A. Bosco, La costruzione della realt sociale, Einaudi, Torino, 2006, p. 149.

18

sottinteso nella percezione, nella comunicazione, nella memorizzazione. Hofstadter ricorda come per lungo tempo si sia immaginato che la conoscenza potesse essere rappresentata con pacchetti di enunciati introdotti nelle macchine come moduli di dati dichiarativi; ora ci si rende conto invece che la rappresentazione della conoscenza costituisce uno dei problemi essenziali dellintelligenza artificiale. Infatti, le conoscenze che popolano la vita degli esseri umani non sono sequenze di regole e contenuti espliciti, ma affiorano nelle relazioni innescate tra gli enunciati: fanno parte della trama dellhardware, se si adotta la metafora informatica, che si metabolizzano nelle viscere delloperativit meccanica non sono dati immagazzinati. E questo il senso dellapprendimento dallesperienza8.

1.2.5 Il talento dellintelligenza Lo sforzo di analisi di Sperber e Wilson stato bollato come non-scientifico dal partito dellinformation retrieval schierato sul versante della tecnologia anche a causa dello stile informale con cui vengono esposte le loro argomentazioni. Lesplorazione delle implicature presenti in ogni forma di comunicazione viene condotta tramite dialoghi immaginari come quello riportato in precedenza tra Laura e Paolo: la strategia di costruire scene immaginarie ad hoc permette ai due ricercatori di mostrare la selezione dei soli tratti salienti nella composizione degli enunciati, e di indagare i meccanismi di inferenza con cui gli interlocutori tentano di colmare le lacune lasciate nelle dichiarazioni esplicite. Laccusa quella di non aver sottoposto ad un esame sperimentale queste intuizioni, e averle conservate in una condizione solo ipotetica di retorica espositiva. Lobiezione appare un po forzata, dal momento che gli esempi esaminati dagli studiosi di pragmatica sono immediatamente riconoscibili come eventi consueti di comunicazione da parte di tutti. Il lavoro di analisi sperimentale stato invece condotto da alcune decine di studi negli ultimi ventanni, con lo scopo di individuare sia le manifestazioni comportamentali della rilevanza, sia le modalit esplicite di giudizio da parte di campioni sottoposti ad intervista. Le ricognizioni hanno mostrato che i soggetti tendono ad usare tutti gli stessi criteri di valutazione della rilevanza: in primo luogo i parametri che vengono esaminatri sono quelli tematici, che abbracciano oltre alla pertinenza delloggetto anche la qualit, lapprofondimento, la chiarezza espositiva, lattualit. Anche le modalit di accesso allinformazione influenzano il giudizio, tendendo a premiare quelle che assicurano costi e disponibilit pi favorevoli, e che si mostrano con unorganizzazione dei dati pi agevole per la consultazione. Accuratezza, autorevolezza della fonte e verificabilit compongono un altro sistema di criteri; oltre a questi sono stati considerati quelli definiti dallambito emotivo, che insistono sia sulla credibilit assegnata a priori dal soggetto per affinit con le proprie opinioni, sia sulla novit dei concetti che vengono proposti, sia infine con la loro connessione rispetto alluso immediato cui devono essere adibiti. Si possono censire almeno 16 ricerche sperimentali di interesse accademico su questi temi: se i parametri di giudizio si ripetono piuttosto costanti attraverso i diversi panel di campioni osservati, il peso che viene attribuito a ciascuno di loro cambia da individuo a individuo. Ci che invece tende a rimanere costante la strategia che ogni soggetto applica nel corso del tempo a test differenti secondo quanto viene rilevato da

Cfr. D. Hofstadter, op. cit., cap. 18, pag. 665.

19

altri sette studi indipendenti dai precedenti; leffetto che i giudizi attribuiti ai documenti e agli oggetti da valutare appaiono sempre molto differenti tra i campioni intervistati. Non di sicuro sorprendente la conclusione che la variabilit individuale nella stima sia molto elevata: infatti essa corrisponde a ci che siamo abituati etichettare come intelligenza personale, nelluso abituale del termine. Coloro che sono ammirati per la loro perspicacia, per la finezza delle loro intuizioni, per la prontezza della loro comprensione e per lacutezza delle loro risposte, vengono apprezzati in fondo per la loro efficacia nella distribuzione dei pesi tra i diversi criteri di rilevanza; la capacit di separare gli elementi che compongono linformazione pertinente, ritagliandola dallo sfondo e separandola da tutto ci che inutile, che rallenta linterpretazione e la reazione, conquista per questi individui il plauso degli interlocutori.

1.3 Lanalisi del contenuto


La seduzione che ha esercitato Google fin dalla sua apparizione era quella di saper imitare il comportamento, la sicurezza di giudizio e la decisione, che caratterizza questi personaggi. Il motore di ricerca solitario nel mezzo della pagina bianchissima sapeva ordinare la sua conoscenza dellarchivio smisurato di pagine web, rispondendo alle domande come un interlocutore intelligente. Eppure Google non pu disporre della variet di ingredienti che intervengono nella stima di qualunque personaggio reale inclusi coloro che non sono apprezzati per il loro talento razionale n pu essere sensibile alle caratteristiche del contesto in cui viene posta la domanda, distinguere la facilit di applicazione dei risultati agli obiettivi immediati dellutente, riconoscere le sue inclinazioni di fede, n immergersi in atmosfere emotive proprie o porsi in empatia con quelle dellinterlocutore.

1.3.1 La focalizzazione tematica E possibile distinguere in due versanti linsieme dei parametri che intervengono sulle risposte di information retrieval. Da un lato si allineano tutti i fattori che gravitano intorno alla dimensione umana, con gli aspetti cognitivi, affettivi e situazionali che intersecano sia la formulazione della domanda, sia le attese relative alla risposte da accogliere come plausibili; sullaltro lato si sommano invece i momenti relativi allingegnerizzazione degli archivi e della ricerca di informazioni, a partire dalla rappresentazione linguistica dei contenuti, retrocedendo alle procedure di calcolo definite dagli algoritmi, fino alla configurazione hardware dello stoccaggio e della classificazione dei dati. La convinzione che ha governato lo sviluppo delle tecnologie di information retrieval legittima la proiezione di tutte le istanze coinvolte nel processo sul solo aspetto tematico, quindi sulle potenzialit di calcolo connesse con la rappresentazione semiotica dellinformazione considerata sia come formulazione della domanda, sia come struttura dei dati e dei loro metadati di classificazione. Nei prossimi paragrafi avr loccasione di esplorare pi nel dettaglio il significato dei termini che sono appena stati usati, e del quadro che stato accennato. Ora invece devo avanzare due considerazioni sulla soluzione che ha permesso in ogni caso levoluzione della tecnologia dellinformation retrieval e che lha imposta come il segmento degli studi di intelligenza artificiale che ha davvero invaso le abitudini di vita quotidiana per un pubblico di massa, e che ha trasformato il modo stesso di concepire laccesso allinformazione e al reperimento dei dati per tutti i settori delleconomia e della cultura.

20

In primo luogo si deve ricordare come gi Schtz avesse indicato nella dimensione tematica la dimensione primaria dei criteri di rilevanza: questa attenzione al parametro che diventato centrale per lavanzamento delle ricerche di information retrieval ha contribuito al successo della sua concezione sui processi coinvolti. Al contempo tuttavia le connessioni che il filosofo ha tracciato tra il primo strato dei giudizi di rilevanza e quelli riconducibili alle attivit di interpretazione e di definizione di una condotta pragmatica, sono state rimosse dallattenzione della ricerca e sviluppo, e hanno cessato di essere considerate come interagenti con la sfera tematica. Lambito del contesto, la pressione che esso esercita nei confronti della dimensione etica ed affettiva dei soggetti, appare dissolta sullo sfondo; anche lorizzonte culturale che innerva lindividuazione degli obiettivi e dei bisogni di ciascuno viene bandito dallanalisi della rilevanza. La seconda considerazione emerge come una conseguenza della prima: linformation retrieval che si profila da un calcolo condotto sulla sola rilevanza tematica, tende a focalizzare la questione dellintelligenza sulla dimensione esclusiva del problem solving. Di tutto lo spettro di senso che si racchiude nella domanda si perdono sia gli aspetti interpretativi, sia quelli motivazionali: ci che rimane lesercizio di raccolta e ordinamento dei documenti pertinenti rispetto alla formula dellinterrogazione, privo delle articolazioni che conferiscono un orientamento concreto al compito di selezione, classificazione e graduatoria dei risultati.

1.3.2 Lintelligenza trilobata dei motori Se si getta uno sguardo complessivo al funzionamento del motore di ricerca, possibile identificare tre moduli principali, ognuno dei quali offre un contributo specifico allesercizio di composizione del database, allinterpretazione della domanda e alla formulazione delle risposte. Il primo segmento presidia le attivit necessarie a rintracciare i documenti, analizzarli, archiviarli e indicizzarli. Il secondo costituito dallhardware che permette di ospitare i dati raccolti, e dalla strategia che governa la loro conservazione e la loro disponibilit al reperimento. Il terzo gestisce le strategie di interrogazione e di risposta, dallinterpretazione delle query, al recupero dei documenti alla loro organizzazione nella struttura di offerta dei risultati. Prima di esaminare un po pi nel dettaglio ciascuno dei blocchi elencati, occorre introdurre un secondo percorso di analisi che ha lobiettivo di intercettare il contributo specifico di novit introdotto da Google rispetto alla tradizione, e che sar esposto al 2.4. La strategia di indicizzazione e di valutazione che ha contribuito al suo successo planetario incrocia la scansione modulare del motore nelle sue porzioni estreme, quella di censimento e indicizzazione dei documenti, e quella di valutazione del ranking che deve organizzare lelenco delle risposte. La ricognizione porter quindi alla luce una matrice che mostrer il modo in cui Google ha esteso i compiti di ricognizione del motore oltre i limiti della registrazione delle caratteristiche interne ai singoli file, allargandola a comprendere alcune attivit di elaborazione sociale condotte su di loro.

1.3.3 Ragni con occhi meccanici Le operazioni richieste dal primo blocco sono affidate ad un sistema di software che navigano sulla rete spostandosi da un link allaltro con lo scopo di rintracciare tutte le pagine pubblicate, visitarle, registrarle nellarchivio del motore con un insieme adeguato di indici. Il nome di questi programmi molto vario, secondo la caratteristica del loro comportamento che si voglia mettere pi in rilievo e naturalmente

21

secondo le mode del momento: possono essere definiti crawler quando si voglia esaltare la loro attivit di moto o avanzamento per la Rete (non si dimentichi lespressione inglese pub crawl, che indica il giro dei pub compiuto la sera dai ragazzi); li si pu richiamare con lespressione oggi pi corrente di bot diminutivo di robot che sottolinea la loro autonomia nella ricerca e nellinterpretazione delle pagine che vengono lette; infine li si indicati con il nome amichevole di spider, per evidenziare la metafora del movimento compiuto sulla Rete dal re degli animali che dominano in questo tipo di ambiente, il ragno con la sua tela. Il bot di Google si chiama Googlebot e con questo battesimo elimina ogni dubbio di paternit e di attribuzione. Si possono immaginare i crawler come dei ragnetti meccanici che si spostano sulla Rete da un nodo allaltro, soffermandosi su ciascuna pagina incontrata per leggere i suoi contenuti, verificare il loro interesse, registrarla e censire tutti i link che la popolano, per raggiungere gli altri documenti cui connessa. Il passaggio da un link allaltro la chiave di volta del movimento dei software di ricognizione e di archiviazione dei motori di ricerca. In realt i bot non si muovono dai loro server, e si limitano a chiamare le pagine connesse ai link che incontrano nello stesso modo in cui si comportano i browser che usiamo tutti. Le directory che venivano compilate a mano dai redattori, come accadeva nella prima versione di Yahoo!, confidavano nella capacit di selezione umana, nella competenza degli esperti di individuare le espressioni di maggiore interesse su Internet per eseguire la loro segnalazione sullindice e per compilare la recensione dei contenuti. Le dimensioni della Rete sono diventate troppo vaste per poter ritenere che una redazione di grandezza economicamente sostenibile sia in grado di seguirne lo sviluppo e di compiere il lavoro di ricognizione necessario. Si gi accennato nel capitolo precedente al fatto che lespansione di Internet anche un effetto della nascita dei motori di ricerca che agiscono tramite bot, e si evidenziato come lestensione di Internet alimenti negli utenti-autori dei contenuti digitali lattesa che ogni singola pagina sia censita e sia archiviata con gli indici opportuni, affinch risulti rintracciabile anche dallunica altra persona oltre il suo autore che potrebbe essere interessata a consultarne i contenuti. Questa concezione, che si compone sul confine tra limpostazione ideologica e la forza dello stato di fatto, ha decretato il successo dellesplorazione meccanica dei file disponibili sulla Rete, e ha richiesto un potenziamento progressivo della capacit dei software di navigare tra gli indirizzi di Internet, di leggere i contenuti e di archiviarli in modo efficace.

1.3.4 Unetichetta in ogni parola Il programma che governa il motore di ricerca esegue tramite i bot unoperazione di indicizzazione di tutti i documenti da archiviare nel database: il primo passaggio che permette al dispositivo di comprendere la pertinenza del contenuto dei file rispetto alla domanda posta dallutente. Da molto tempo i bibliotecari eseguono un lavoro simile, redigendo gli indici dei volumi e degli articoli ospitati sui loro scaffali tramite la registrazione delle parole-chiave che permettono di definire largomento di cui parlano le opere. Il catalogo per soggetti presente nelle biblioteche permette di raggiungere gli scritti conservati sulla base dei contenuti che essi trattano. La quantit di parole-chiave attraverso le quali viene catalogato un volume, una rivista o un articolo, varia secondo le dimensioni del testo, le abitudini della singola biblioteca e la diligenza dellimpiegato che effettua il procedimento; tuttavia, il numero di indici che vengono registrati per ogni testo in vista della consultazione del catalogo per soggetti non supera di solito lordine di grandezza di qualche unit o di qualche decina. Al contrario, il dispositivo del motore di ricerca registra ogni lemma che compone il testo di un documento come un indice del file: ogni parola e sintagma che ricorre nel corpo

22

della pagina si innalza al ruolo di argomento tramite il quale essa pu essere rintracciata e consultata dallutente che vuole approfondire la nozione corrispondente. Il software esamina ogni singolo termine che compone il documento; lo analizza con una procedura denominata inverted index che consiste nel mappare il contenuto segmentandolo lemma per lemma e archiviando la sua URL (lindirizzo Internet della pagina) con lelenco delle parole e dei sintagmi che lo compongono in un formato che pu essere paragonato alle liste di parole che si trovano nei dizionari. Questo procedimento della massima importanza, dal momento che permette di compiere il passaggio inverso nel momento in cui lutente esprimer la sua necessit di ricerca tramite la stringa di interrogazione: la congruenza delle parole usate dal ricercatore con quelle collocate nelle liste di indicizzazione permette al dispositivo di proporre la URL della pagina archiviata come risposta alla query. Sui termini che vengono archiviati in questo modo, il programma interviene con procedure diverse al fine di semplificare la struttura del vocabolario: il metodo di indicizzazione provvede ad eliminare tutte le parole molto ricorsive e prive di valore distintivo (come gli articoli, le congiunzioni, le preposizioni, e, ma, o, di, a, ecc.), e compie le operazioni di stemming che riducono le coniugazioni e le declinazioni alla radice lessicale. Ma soprattutto, il dispositivo verifica la collocazione dei termini nella formattazione del documento, al fine di verificare il loro valore rispetto alla strategia espositiva del contenuto. Lobiettivo del motore di ricerca consiste nel comprendere largomento che viene trattato davvero nel corpo del testo: di conseguenza il software tenta di intuire attraverso la distribuzione dei lemmi nei punti strategici della pagina (titoli, inizi dei paragrafi, didascalie delle immagini, indirizzo informatico del documento, ecc.) quali siano le parole che definiscono in maniera pi efficace il vero soggetto discusso dal documento. Tutte le parole che compongono la pagina, in ciascuna posizione, concorrono a popolare il suo indice di rintracciabilit; ma lo scopo perseguito dal motore riuscire a compilare una classifica dei testi pi pertinenti rispetto alle interrogazioni che vengono proposte dagli utenti. Per raggiungere questo obiettivo il dispositivo informatico deve essere in grado di identificare quali etichette siano pi in grado di altre di descrivere il contenuto effettivo della pagina, al fine di proporla con un punteggio pi alto in classifica nel momento in cui i ricercatori sottopongono query che le includano nella stringa di interrogazione. Tutti i vocaboli svolgono quindi il ruolo di metadati per la rintracciabilit della pagina, ma alcuni ricoprono questo ruolo con maggiori probabilit di successo degli altri: i file pubblicati su Internet infatti sono costruiti con alcune porzioni dello script di programmazione destinate a segnalarle gi nella struttura formale del documento. Il title della pagina, la URL, tutti i titoli del testo, le didascalie delle immagini, i link, le parti in grassetto, le prime e le ultime parole dei capoversi, sono alcuni esempi di formattazione della pagina che vengono esaminati dal bot al fine di individuare gli elementi indicati dallautore come punti notevoli del contenuto pubblicato. Il dispositivo sa anche che largomento di cui si occupa il documento viene espresso da una collezione ridotta di lemmi: la loro ricorsivit deve essere maggiore rispetto a quella di tutte le altre parole del testo. La coerenza tra i termini che appaiono nelle posizioni pi importanti del documento, e le percentuali di ricorsivit lessicali nel corpo del testo, sanciscono lattribuzione finale del peso relativo ai singoli lemmi che compongono il dizionario del contenuto. Una pagina in cui le parole chiave figurano nei luoghi esaltati dalla formattazione del documento, e appaiono anche come le etichette che permettono di riassumere gli argomenti espressi dal testo, rassicura il bot sulla sua pertinenza per tutti coloro che ricercano informazioni

23

su quei temi. Grazie al lavoro di indicizzazione dei documenti, il software in grado di simulare una comprensione del senso del loro testo. In realt la quantit di parametri che vengono esaminati dal software sono molti pi di quelli sintetizzati nelle righe precedenti. La collocazione delle parole chiave nei punti strategici della formattazione della pagina, la frequenza della loro apparizione nel documento, la coerenza lessicale nella compilazione di tutti i contenuti, sono i criteri di analisi pi antichi nella lettura praticata dai bot; in una comunicazione informale della fine del 2009 Matt Cutts, uno dei manager di Google, ha dichiarato che lalgoritmo con cui lavora il motore di ricerca stima 200 parametri9 per compiere il lavoro di indicizzazione e di valutazione del ranking delle pagine. La dichiarazione pecca per difetto secondo molti ricercatori e secondo diversi consulenti del mondo SEO, dal momento che i giudizi di Google sembrerebbero essere il risultato di una somma di variabili molto pi alta. Nellelenco proposto da Cutts compaiono 16 elementi critici connessi al dominio del file che viene analizzato, 5 insistono sul server che ospita la pagina esaminata, 13 sullarchitettura tecnologica di implementazione, 14 sul contenuto e le sue caratteristiche, 5 sulla configurazione dei link interni al dominio, 10 sul genere di sito in cui incluso il documento in esame, 10 sulle propriet specifiche della pagina (dalla sua et di permanenza sulla Rete alla frequenza del suo aggiornamento fino al numero di volte che stata letta), 15 sulla prominenza delle parole chiave, 8 sui link in uscita, 22 sulla configurazione dei backlink che conducono alla pagina, 8 sulle propriet di ogni singoli backlink, 8 sul comportamento e la tipologia dei visitatori della pagina, 12 sulle penalizzazioni e sulle eventuali manipolazioni che sono state apportate al documento, 8 sullautorevolezza del creatore del file. Lelenco peraltro non dice ancora nulla sul peso relativo che ciascuno dei criteri vanta rispetto agli altri. Se vero che la distribuzione delle parole chiave, la formattazione del contenuto, laccortezza delle scelte lessicali e tecnologiche, continuano a farsi carico di un valore fondamentale nella strategia di indicizzazione i parametri che insistono sulla struttura dei link e quelli che riguardano laggiornamento della pagina, il rinnovamento dei contenuti, la rapidit di scaricamento del file da parte degli utenti, stanno conquistando unimportanza sempre crescente.

1.3.5 Larchivio Il secondo modulo del motore composto dallhardware che deve ospitare tutti i dati recuperati, e renderli disponibili con estrema rapidit ad ogni interrogazione sottoposta dagli utenti. La strategia di connessione dei server di Google protetta da brevetto fin dalla nascita dellimpresa. La potenza di calcolo del Sistema dipende infatti in modo sostanziale dalla prontezza con cui i dati vengono rintracciati sulle macchine che li ospitano. Il modulo di risposta alle query non spazia in tempo reale sulla Rete, ma compie selezioni e calcoli di pertinenza su un sistema di dati gi configurati dallazione di ricognizione e di raccolta operata dai bot. Per assicurare la velocit di reazione cui tutti gli utenti di Google sono abituati, i server del motore conservano anche un numero notevole di domande e di risposte gi pronte, in modo da non dover compiere ogni volta lo sviluppo del calcolo da capo. La rete hardware non si limita a registrare i dati che provengono dai bot e che custodiscono i contenuti e le caratteristiche delle pagine esaminate, ma

E possibile leggere lelenco dei criteri alla pagina http://spreadsheets.google.com/pub?key=tMc56KQJFjYOBMcEq263r4g&output=html (link verificato il 3 aprile 2010).

24

acquisisce anche tutte le informazioni lecite sulle interrogazioni che vengono formulate dagli utenti, le loro ricorrenze, le preferenze espresse da ogni individuo tramite la dichiarazione delle sue curiosit. Larchivio di Google non memorizza quindi solo pagine, ma anche domande, comportamenti, ricorrenze nelle richieste e nelle scelte degli utenti. Si accennato nellelenco dei 200 parametri allesistenza di un set di propriet che provengono dalla frequenza di lettura e dalla predilezione dei visitatori che scelgono una pagina cliccando nellelenco di risposte del motore di ricerca, oppure che ripetono i loro accessi tramite lingresso diretto dallinserimento dellindirizzo nei bookmark: tutte queste abitudini vengono registrate da Google e valutate dallalgoritmo che deve fornire le risposte. I tre moduli che cooperano nel funzionamento del dispositivo di ricerca non sono separati da confini invalicabili, ma interagiscono in uno scambio continuo di indicazioni. La variet di dati che devono essere conservati dai server molto pi varia della mole di propriet intrinseche dei contenuti pubblicati sulle pagine della Rete. La conservazione delle tracce che provengono dai comportamenti degli utenti dura 36 anni e persegue lobiettivo (dichiarato) di profilare sistemi di ricerca sempre pi prossimi alle esigenze informative personali degli utenti. Lideale che si vorrebbe raggiungere quello di proporre a ciascun individuo un set di risposte assolutamente unico, ritagliato sui criteri delle sue preferenze, costruito su un DNA informativo estratto dai comportamenti e dalle scelte iscritte nello storico delle sue query e delle sue scelte nei listati di risposte. La realt spesso meno romantica delle intenzioni e delle dichiarazioni commerciali: larchiviazione delle scelte compiute dagli utenti popola i calcoli statistici che permettono di non ripetere ogni volta la ricognizione sullintero database ma di recuperare listati gi confezionati e coronati dal successo delle prove sottoposte in precedenza agli altri utenti. Il meccanismo della classifica di risposta tende infatti a generare un circolo vizioso (o virtuoso, dal punto di vista di chi viene premiato), in forza del quale i documenti che vengono collocati nei primi posti del listato continuano a ricevere un numero di visite crescente, dal momento che gli utenti in generale non dispongono del tempo necessario per controllare gli item situati oltre la prima pagina di risposte. Lossimoro che emerge dalliterazione di questo modello quello di una personalizzazione dello standard, o di uno standard fondato sulla personalizzazione. Ci che viene scelto da molti finisce per coincidere con quello che serve a tutti, ma questa convergenza di tutti verso la stessa configurazione di contenuti rilevanti si presenta come la risposta effettivamente tracciata sul profilo degli interessi e delle esigenze informative personali. Il paradosso che si disegna in questa circostanza dovuto alla connessione che si ormai stabilita tra le dinamiche sociali e il ricorso collettivo al funzionamento dei motori di ricerca. Da un lato lintegrazione degli individui nel tessuto collettivo impone a tutti una conoscenza sempre aggiornata dei temi che sono ritenuti di attualit per assumere le decisioni opportune e per eseguire le pianificazioni corrette dal punto di vista delle occupazioni professionali, delle soluzioni produttive ma anche delle attivit compiute nel tempo libero, per non rimanere esiliati dai temi di conversazione che dominano in tutte le occasioni di dialogo, dal cinema allo sport alla televisione. Dallaltro lato i motori di ricerca pervadono ogni segmento della vita privata e pubblica, fornendo le risposte che servono entro i limiti di tempo che i soggetti si trovano imposti dal ritmo sociale. Il successo universale di dispositivi come Google ha ristretto le riserve cronometriche che gli interlocutori riconoscono come necessarie per compiere qualunque tipo di ricognizione su un argomento: il lusso di aggirare la ricerca su un motore distingue una cerchia sempre pi ristretta di

25

persone, ormai non pi significativa dal punto di vista statistico per la conoscenza dei comportamenti collettivi. Anche il presidente Obama dichiara di ricorrere a Google per il suo lavoro. Le elaborazioni di rilevanza che emergono dai motori di ricerca si trasformano di conseguenza in previsioni che si autoavverano: la loro adozione da parte di volumi di utenti con ordini di grandezza dei milioni di individui, trasforma lipotesi di calcolo dellalgoritmo nei temi che di fatto compongono lattualit economica e culturale di tutti. Le risposte di Google appaiono nelle presentazioni dei consulenti, nelle decisioni dei manager, nelle previsioni dei politici, nelle escussioni di avvocati e dei magistrati, nelle riflessioni degli intellettuali, nelle risoluzioni sugli eventi interessanti per la serata, nella scelta dei film imperdibili da vedere al cinema o in televisione. Anche un individuo scrupoloso nella sua indagine sullargomento che gli stato affidato proprio a causa della sua meticolosit non pu pi ignorare le conclusioni che vengono tratte dal dispositivo digitale di ricerca intorno al tema che sta trattando: sarebbe un errore imperdonabile ignorare il loro effetto sul decorso sociale del futuro.

1.3.6 Scheletri di discorsi Il problema degli effetti delladozione di massa dei motori di ricerca sar ripreso nei prossimi capitoli; al fine di comprendere meglio il funzionamento dei dispositivi che li governano necessario infatti esaminare ora il terzo modulo di cui sono composti, quello che presiede allinterpretazione delle esigenze informative racchiuse nella stringa di interrogazione e al calcolo della rilevanza dei documenti conservati nel database. La stringa di interrogazione imputata dallutente viene considerata come un testo, che pu essere registrato e collocato accanto a quelli che sono stati archiviati analizzando le pagine pubblicate in Rete. Lalgoritmo del motore confronta la domanda formulata con gli indici che etichettano i contenuti presenti nel database: la valutazione si compie quindi paragonando i lemmi che si succedono nella query con i sistemi di metadati che descrivono i contenuti analizzati per ciascuna delle URL visitate dal bot. Il Sistema assume che ad ogni URL corrisponda una sola pagina, e viceversa che ogni pagina sia dotata di un indirizzo univoco. Come si accennato in precedenza il calcolo della rilevanza delle pagine viene eseguito ponderando un numero di criteri molto ampio, ognuno dei quali contribuisce per la sua parte a misurare la pertinenza del contenuto rispetto alle attese dellutente. La congruenza tra il dizionario adottato dal ricercatore e quello che governa le espressioni lessicali dei metadati di una pagina contribuisce in modo significativo a convincere il motore sulla pertinenza dellargomento trattato nel file; ma oltre a questo parametro interno Google si avvale del contributo di molte altre indicazioni, che considerano questioni come lattendibilit della fonte, lautorevolezza del brand, la sicurezza tecnologica delle macchine che ospitano i contenuti originali, le tecnologie di implementazione delle pagine, laggiornamento dei contenuti, il favore che essi godono presso il pubblico, la frequenza delle visite da parte degli utenti, le categorie socio-demografiche dei visitatori, ecc. Tuttavia Google non si limita ad eseguire un confronto ponderato tra i singoli lemmi che compongono la stringa di ricerca e gli indici di classificazione dei contenuti che ha archiviato nel database. La sua forza consiste nel saper interpretare anche il significato di ci che viene richiesto dallutente, sulla base delle relazioni che si allacciano da un punto di vista semantico tra i termini che lutente ha scelto per esprimere la sua esigenza informativa identificando il loro contesto di applicazione lessicale. Larchitettura del motore

26

esamina le selezioni contestuali (seguo in questo caso la terminologia di Eco10; unespressione in questo contesto equivalente quella di classemi, presentata da Greimas11) della stringa di ricerca e del dizionario che emerge dai documenti in cui ricorrono i termini imputati dallutente. Ogni lemma latore di un sistema di valenze, che regolano la sua occorrenza nella struttura semantica degli enunciati in cui potrebbe essere applicato: ogni termine inviluppa dentro di s istruzioni enciclopediche che lo mostrano come una sorta di sintesi di testi virtuali in cui esso potr di fatto apparire. Non si poteva sfuggire ancora a lungo allatmosfera macabra delle metafore che affollano la razionalit e la sua espressione linguistica; eccoci quindi ad asserire che ogni parola lo scheletro di un discorso potenziale o forse sarebbe meglio dire del suo contesto tipico, del suo scenario atteso. Lo scheletro unarticolazione concettuale vincolante per gli altri vocaboli che possono apparire nello stesso enunciato insieme alla parola-chiave: solo alcuni gruppi semantici sono ammessi a concretizzare il corpo della frase, e ad ogni nuova apparizione lessicale la variabilit delle successive diventa sempre meno libera, e loccorrenza effettiva sempre pi prevedibile. Eco sceglie immagini meno funebri e descrive questa condizione sentenziando che ogni lemma un testo incoativo. Un termine esegue sempre una selezione contestuale degli altri lemmi che appartengono al suo campo semiotico: per esempio, finestra pu essere accompagnato da muro, parete, strada, fondo, ecc., e in questo caso il dominio semiotico di riferimento quello del varco che permette di illuminare gli interni delle abitazioni e di affacciarsi verso lesterno. Lo scenario che si prefigura in questo caso sarebbe quindi del tutto differente da quello in cui il lemma finestra apparisse in un insieme di selezioni contestuali come monitor, mouse, computer, utente, ecc. dove sarebbe invece la funzione informatica di interfaccia grafica ad essere presa in considerazione, e la finestra individuerebbe il luogo di mediazione nellinterazione tra luomo e la macchina. Lesame dei lemmi che figurano nella query permette di conseguenza di comprendere quale significato contestuale essi selezionino reciprocamente, in virt della loro co-occorrenza. Lalgoritmo LSI (Latent Semantic Indexing) in grado di sviluppare questo tipo di analisi linguistica, e di associare correttamente le intenzioni di indagine espresse nella stringa di ricerca ai contesti di applicazione dei termini impiegati anche qualora essi non appiano esplicitamente nel testo indicizzato. Le regole che governano il comportamento di questo paradigma di programmazione sono in grado di distinguere sinonimi e omonimi; sono quindi in grado di eliminare le pagine identiche dalla collezione di documenti che deve essere conservata nella memoria del motore, al fine di ottimizzarne la compressione. Ma soprattutto, sono capaci di eseguire una classificazione dei documenti disponibili nel database sulla base della domanda che stata rivolta dallutente: la catalogazione viene eseguita dal programma on-the-fly espressione che gli sviluppatori del software applicano alle circostanze in cui lazione viene eseguita sul momento, senza che il dispositivo abbia compiuto un ordinamento predefinito del materiale, costringendo linterrogazione del cliente entro limiti e percorsi obbligati. In altre parole, il motore di ricerca in grado di intuire in che modo deve essere ordinata la tassonomia dei documenti che esso conserva nel suo archivio, non sulla base di qualche regola predeterminata, ma esclusivamente sulla base degli interessi di indagine che lutente ha espresso mediante le parole che compongono la stringa di ricerca.

10 11

Cfr. Eco U., 1979, Lector in fabula, Milano, Bompiani, cap. 1. Cfr. Greimas A., 1966, Smantique structurale. Recherche de mthode, Parigi, Larousse; tr. it. a cura di P. Fabbri, Semantica strutturale, Meltemi, Roma, 2000, cap. 4

27

Per esempio: se si imputa la stringa di ricerca watt su Google, il software categorizza i documenti memorizzati nel suo database nelle seguenti otto categorie: ampere, power, joule, james watt, watt hour, watt volt amp, watt conversion, electrical watt. Se invece lutente digita nel campo di ricerca direttamente la stringa james watt, il sistema classifica in automatico i contenuti disponibili nelle seguenti categorie: thomas newcomen, matthew boulton james watt, james watt college, james watt steam engine, james watt pictures, james watt reagan, james g. watt, thomas edison. Se ricorriamo allesempio della saga di Harry Potter, possiamo osservare che la classificazione di una query formulata con il solo lemma potter suona cos: potter Anderson, miss potter, harry potter, pottery barn, potter puppet pals, potters house, potter wiki, potter definition. Se invece il punto di accesso una stringa di ricerca che specifica harry potter, la tassonomia prevede: harry potter pictures, emma watson, harry potter movies, harry potter trailer, harry potter books, harry potter cast, harry potter characters, harry potter wiki. La tassonomia viene stabilita dal motore sulla base dei lemmi presentati dallutente nella stringa di query, e sulle quantit relative di documenti che presentano contenuti pertinenti rispetto alla domanda: non scontato di conseguenza che le scelte di ordinamento avanzate dal software coincidano con quelle che un individuo potrebbe trovare ragionevoli sia dal punto di vista della coerenza nel grado di generalit logica dei termini, sia dal punto di vista della reciproca esclusione delle classi che i lemmi denotano12. Il progetto originario elaborato la Larry Page quando era ancora un dottorando di Stanford la hybris in cui affonda le radici tutta la storia di Google era quello di contenere tutto il Web in un computer13. Ladozione di alcune strategie software come quelle che sono state descritte in precedenza, dalla stemmizzazione delle parole alla complessit di funzionamento degli algoritmi LSI, motivata in prima battuta dalla necessit di restringere la quantit di dati da immagazzinare nel database. Leliminazione degli elementi senza valore e troppo ricorrenti, il riconoscimento dei casi di omonimia e sinonimia con leliminazione conseguente delle duplicazioni, permette di ridurre la mole di oggetti che devono essere conservati nellarchivio. Lintegrazione tra le esigenze dei diversi moduli che compongono larchitettura del motore di ricerca permette di trovare soluzioni a problemi che talvolta sono ben pi complessi di quelli che ci si era imposti al punto di partenza.

1.4 La sensibilit sociale di Google


Lalgoritmo che governa Google porta un nome fondato su un gioco di parole: PageRank allude sia alla classificazione delle pagine elettroniche, sia al cognome dellinventore, Larry Page. Il tratto caratteristico che lo ha distinto da ogni altro metodo di indicizzazione e di valutazione delle pagine si trova nel coinvolgimento di criteri sociali nella fissazione del ranking dei file quando il Sistema compila la classifica delle risposte. Il dispositivo non fonda il calcolo solo sulle propriet intrinseche del contenuto, ma esamina anche lattenzione che le altre pubblicazioni presenti sulla Rete gli hanno dedicato.

12

Per una comprensione dellapplicazione dellalgoritmo LSI ai motori di ricerca, cfr. C. Manning, P. Raghavan, H. Schtze, Introduction to Information Retrieval, Cambridge University Press, 2006, cap. 18, pag. 277-87. 13 Cfr. Vise e Malseed op. cit, cap. 2

28

1.4.1 Un software accademico La soluzione individuata da Page prende alla lettera la chiave di volta del processo di esplorazione dei bot, che viaggiano per Internet passando da un link allaltro: nel compimento del viaggio, la valutazione delle citazioni che ogni pagina conquista nella dimensione sociale delle pubblicazioni digitali diventa un criterio essenziale di stima della loro importanza. Ma soprattutto, Page e Brin hanno cablato in questo modo nel loro algoritmo di ricerca la concezione accademica della rilevanza che i testi assumono nel panorama della ricerca scientifica universitaria. La bibliometria la disciplina che calcola la rilevanza di unopera a partire dalle citazioni che essa si guadagna nei lavori degli altri membri della comunit cattedratica. Quanto maggiore la distanza della citazione dai lavori dellentourage dellautore, tanto superiore sar il merito che lopera guadagna; lo stesso criterio viene applicato sul grado dellautorevolezza dellistituzione che propone la menzione, nonch sul numero delle citazioni che vengono accumulate. Il libro o larticolo di un professore che venga citato nel saggio di un assistente dellautore guadagna un attestato di stima, ma dal valore contenuto: gli scambi di favori tra membri della stessa trib accademica non possono assumere un valore oggettivo particolarmente elevato. Se il testo viene citato da produzioni di accademici attivi in altre universit, il valore della menzione cresce in modo considerevole; se la citazione infine compare in lavori editoriali indipendenti e di prestigio riconosciuto, come lEnciclopedia Britannica, lautorevolezza del testo e del suo creatore diventa indiscutibile. Latmosfera istituzionale di Stanford, che stata la culla della prima elaborazione dellalgoritmo PageRank, ha influenzato lingegno di Page e Brin insinuandosi nei nodi fondamentali dellarchitettura del loro Sistema. Il criterio del riconoscimento attraverso le citazioni (e attraverso lautonomia della loro formulazione rispetto al potere accademico del testo-fonte) viene tradotto dal motore di ricerca nel calcolo dei link che puntano da file esterni verso la pagina esaminata. Google in grado di stimare lautorevolezza della fonte del link e la sua distanza dal contenuto che viene menzionato; in grado di conseguenza di calcolare la probabilit con la quale un utente potrebbe accedere al documento in esame seguendo le catene di link che si trovano sui portali di maggiore autorevolezza della sua area geografica (il cui indirizzo si suppone sia pi probabilmente gi noto al soggetto come accade alle pagine di Corriere.it o di Repubblica.it in Italia, selezionate come pagina di default allapertura del browser da un pubblico vastissimo) oppure dai siti di maggiore frequentazione nellambito della stessa classe di appartenenza. Google sa configurare una costellazione di relazioni tra le porzioni di testo che provenendo da opere differenti rispondono alla richiesta dellutente; sa ordinarle anche sulla base dellimportanza che viene socialmente assegnata a ciascuna opera e a ciascun segmento di testo proposto allutente. Quando il motore stava muovendo i primi passi, Page e Brin avevano assunto i siti segnalati dalla directory di Yahoo! come punti di riferimento del calcolo dellautorevolezza: si trattava in fondo di una collezione di pagine che erano state selezionate da una redazione umana, consapevole delle scelte di rilevanza che stava compiendo. Il risultato di questo lavoro editoriale era una garanzia di valore da fissare come trampolino di lancio per lesplorazione dellimmensa periferia della Rete che restava esclusa dalla ricognizione umana. In seguito il sistema automatico di passaggio tra i link si reso autonomo dalle scelte di qualunque redazione, e anche Yahoo! ha dismesso linfrastruttura redazionale che aveva garantito il successo dei primi anni del portale. In qualche modo Google sembra conservare qualche forma di sudditanza nei confronti delle

29

proposte media del Gruppo Yahoo!, se si considera che le immagini pubblicate su Flickr e i post che appaiono su YahooAnswers tendono a guadagnare sempre le prime posizioni nel ranking delle risposte avvantaggiandosi anche sul sistema di pubblicazione delle fotografie di propriet di Google, Picasa. In ogni caso, linfluenza della valutazione sociale, di cui le pagine si impossessano attraverso la distribuzione dei link sugli altri file presenti in Rete, rappresenta una delle questioni essenziali nel calcolo sviluppato dallalgoritmo di Google nella formazione del ranking delle risposte, e limportanza di questo parametro ha continuato a crescere nel corso del tempo. E possibile interpretare lattenzione dedicata da Page e Brin al tema dei link come una compensazione dellinteresse concentrato dallinformation retrieval sul solo criterio tematico della rilevanza. Le citazioni che puntano da siti esterni verso la pagina in esame vengono considerati come un sistema obiettivo di stima sociale sul contenuto: il bot registra il file sul quale si trova il link, la sua autorevolezza, la sua autonomia rispetto alla pagina citata, il grado di profondit gerarchica rispetto alla home page del dominio. La quantit e la qualit delle citazioni dovrebbero legittimare almeno il giudizio sullimportanza del documento in esame rispetto allattualit del dibattito che lo circonda. Lintensit dellattenzione che viene riversata dagli altri autori sulla pagina citata un indizio della sua centralit nelle discussioni che si animano intorno allargomento che essa tratta; di conseguenza la sua lettura deve rivestire un interesse sicuro per chiunque si stia occupando del tema. Il volume di lettori effettivi che hanno cliccato di fatto sul link e che hanno visitato il documento aggiunge un tassello ulteriore di verifica per il giudizio elaborato dal dispositivo: il comportamento del pubblico sancisce con la sua approvazione linfrastruttura di contenuti e di relazioni predisposta dagli autori. Naturalmente non mancano obiezioni a questa strategia di indicizzazione e di calcolo. Il Gruppo Ippolita 14 per esempio ne sottolinea il carattere del tutto formale ed esprime forti riserve rispetto alla sua capacit di rintracciare davvero tutto quello che potrebbe servire allutente. Loggettivit dei criteri di archiviazione e di compilazione della classifica dei risultati si riduce ad essere uno stratagemma pubblicitario per rendere accettabile il servizio offerto dal motore e nascondere i suoi limiti. Anche lanalisi presentata nei paragrafi precedenti ha evidenziato il fatto che il meccanismo della ricerca sia forzato ad appiattire tutti i fattori che di solito concorrono a stabilire il giudizio di rilevanza sulla sola dimensione obiettiva del tema trattato nelle pagine indicizzate. Il contesto di ricerca, le finalit pratiche, la sfera emotiva e lorizzonte di preconcetti che dispongono pi o meno favorevolmente il soggetto nei confronti delle fonti e delle opere, vengono annullati in favore della ricognizione dei contenuti. Lesame dei link somma ai dati che mappano la trattazione tematica della pagina uninformazione sullo spirito del tempo, sullo ZeitGeist come lo chiamano in Google richiamandosi al termine tedesco reso famoso da Hegel. La centralit di alcune pagine nel dibattito contemporaneo una misura della cultura in cui tutti viviamo: le sue caratteristiche possono infastidirci o contrariarci, per la loro povert intellettuale o per le posizioni ideologiche che appaiono come dominanti ma non si pu rifuggire dallobbligo di conoscerla se si intende partecipare alla discussione, per tentare di modificare il suo impianto ideale, per trarne profitto, o semplicemente per offrire il proprio contributo.

14

Cfr. Ippolita, Luci e ombre di Google, Feltrinelli, Milano, 2007, cap. 4 e passim.

30

1.4.2 Un software pubblicitario La ragione del successo economico della soluzione di Page e Brin tuttavia non si trova nel riconoscimento che la comunit accademica ha tributato alla loro invenzione, come segno di gratitudine per la loro opera di divulgazione della prassi universitaria nel mondo della tecnologia. Non stato certo per una deferenza nei confronti del metodo scientifico di pubblicazione che il mondo intero ha accettato di ricorrere ai servizi di Google, n questa motivazione poteva convincere i concorrenti del motore a farsi da parte per agevolare la sua crescita. AltaVista era nato anzitutto come un dispositivo di ricerca, e si era trasformato in un portale editoriale sul modello di Yahoo! per la miopia strategica dei gruppi finanziari che lo hanno acquistato; ma alla fine degli anni Novanta il panorama dei portali e degli strumenti di ricerca era pressoch saturo, e tutti i vertici manageriali che presidiavano il settore, da quelli di Yahoo! a quelli di Lycos, di HotBot, di Ask, di Infoseek, consideravano la tecnologia dellinformation retrieval gi abbastanza buona per i loro modelli di business. Nel 1.4 ho descritto la premura con cui i portali aspiravano a creare un ambiente chiuso in cui catturare gli utenti e conservarli sulle pagine del dominio offrendo ogni tipologia di servizi, senza lasciarli uscire per raggiungere altre destinazioni su Internet. Un dispositivo come quello di Google al contrario concepito per permettere ai visitatori di rimanere sul portale il minor tempo possibile, al fine di rintracciare il nodo della Rete pi interessante per il reperimento delle informazioni ricercate, e raggiungerlo immediatamente. Il criterio sembrava del tutto opposto a quello che dominava le logiche dei portali, in una fase della crescita di Internet in cui i volumi di traffico costituivano lunico, quanto grossolano, parametro di valutazione finanziaria delle societ dotcom. La bolla speculativa che si conclusa nel 2000 sembrava lasciare liberi gli imprenditori di abbandonare ogni legame con la realt economica, pur di riuscire ad attirare la mole pi ampia possibile di utenti sulle pagine del proprio sito, per renderli frequentatori fidelizzati. Dal momento che i criteri di valutazione procedevano per maglie molto larghe, nessuno sembrava preoccuparsi della qualit del traffico che veniva prodotto dai sistemi di ricerca: la debolezza dei meccanismi che governavano i dispositivi dellepoca era quella di non riuscire a tutelare la pertinenza dei risultati dalle manovre di spamming messe in opera da chiunque avesse intenzione di mostrare i propri contenuti tramite le parole pi ricercate sui motori. Era sufficiente inserire sulle pagine del proprio sito una porzione di testo compilata ad hoc, con caratteri bianchi su sfondo bianco (in modo da renderlo invisibile allutente reale), perch i bot le indicizzassero e le proponessero in corrispondenza delle richieste pi frequenti da parte del pubblico. Battelle ricorda come nel 1998 con questo metodo la maggior parte dei risultati rintracciati da Lycos per una stringa di ricerca che contenesse la parola-chiave automobili fosse composta da siti pornografici15. Anche il posizionamento dei banner sulle schermate dei portali avveniva in modo del tutto incontrollato: linvestimento pubblicitario degli inserzionisti non veniva guidato da alcuna logica di pertinenza rispetto alle esigenze informative degli utenti. La struttura della pubblicit negli ambienti Web seguiva di fatto il modello televisivo e radiofonico, con una distribuzione a pioggia della comunicazione commerciale, in cui era impossibile stabilire a priori il valore di ogni contatto stabilito dalla trasmissione del messaggio. Come nel caso dei media tradizionali, linserzionista doveva stimare che almeno la met del suo investimento non

15

Cfr. J. Battelle, The Search, Portfolio-Penguin Group, New York, 2005; tr. it. a cura di S. Garassini, Google e gli altri, Raffaello Cortina Editore, Milano, 2006, pag. 123.

31

sarebbe servita a stabilire alcuna forma di contatto con il pubblico interessato alla sua offerta senza nemmeno essere in grado di stabilire quale porzione dei suoi soldi non sarebbe servita a nulla. La soluzione intrapresa da Google ha offerto nel corso del periodo 2000-2002 la soluzione ad entrambi i problemi. Il meccanismo del controllo sociale dei link ha permesso di condurre verifiche intorno alleffettivo contenuto delle pagine sulla base del meccanismo delle citazioni, che valuta anche la natura e lautorevolezza della fonte da cui si attiva lncora. La qualit delle risposte che venivano formulate dal motore ha funzionato come strumento di promozione pubblicitaria per il brand stesso di Google, che in tutto il periodo delle spese incontrollate della new economy non ha investito nulla in campagne di marketing. Il passaparola si mostrato come la chiave di volta del successo nella creazione dei volumi di traffico convogliati sulla home page del motore: la simpatia alimentata dalle ottime prestazioni del dispositivo ha contagiato anche la stampa, che ha sempre sostenuto dalle colonne dei giornali e delle riviste il valore dei servizi di Google. Leliminazione dello spamming ha catturato da subito linteresse degli sviluppatori del Sistema, che hanno concentrato sulla qualit dei risultati il valore della proposta di servizi. La connessione tra lefficacia della ricerca e la pubblicit arrivata in un secondo momento, quando AdWords ha stabilito il modello di business vincente su cui cresciuta limpresa Google assumendo GoTo.com (poi Overture) come modello da imitare e perfezionare16. Daltra parte, anche nel contesto degli annunci a pagamento si insinua laspetto qualitativo dettato dalla valutazione sociale. La posizione dei messaggi pubblicati dagli inserzionisti veniva stabilita da Overture sulla base di unasta, in forza della quale chi fosse stato disponibile a pagare di pi per ogni clic ottenuto sul suo annuncio lo avrebbe visto apparire per primo nellelenco. AdWords, dalla sua versione del 2002, include nella compilazione della classifica anche una verifica del gradimento che gli utenti tributano ai messaggi cliccandoci sopra: lordinamento nel listato potrebbe quindi apparire rovesciato rispetto al semplice criterio dellasta, in forza del quale chi paga di pi viene proposto prima, se il testo del comunicato meno finanziato riesce a sedurre pi visitatori e a conquistare la loro fiducia con un clic. Linserzione meno finanziata ma pi cliccata produce un guadagno maggiore per Google, che trae profitti non dalla visualizzazione degli annunci, ma dalla loro selezione attiva da parte degli utenti. Tuttavia, anche questa strategia stata letta dalla stampa come un merito ulteriore del motore di ricerca, che sembrava preoccuparsi pi della qualit del servizio erogato ai visitatori che dei suoi incassi commerciali immediati. La forza delle pubbliche relazioni di Google era notevole, e la costruzione della sua immagine di gigante buono ha tratto profitto persino dai calcoli pi accorti di convenienza economica.

1.4.3 Un uccellino mi ha detto Sebbene non fosse la prima volta che si tentava la via del calcolo del successo di una pagina attraverso la ricognizione dei link e dellapprovazione del pubblico, Larry Page era giustamente convinto nel 1997 di aver concretizzato unidea vincente con il PageRank. In questo clima di attenzione per la contestualizzazione sociale delle pagine indicizzate non sfuggito ai vertici di Google il significato del successo raggiunto da Twitter negli ultimi anni. A tutti coloro che hanno lavorato in unimpresa con molti dipendenti noto che spesso non sufficiente rintracciare un documento o una pratica per accedere alle informazioni necessarie

16

Sul rapporto tra Google e GoTo.com, cfr. infra 5.1.4.

32

alla soluzione di un problema o allapprofondimento dellargomento connesso. La documentazione potrebbe essere infatti lacunosa, o non aggiornata; per lo pi in questi casi necessario conoscere non tanto cosa stato scritto nei file del dossier, ma chi li ha compilati o ha coordinato il lavoro della loro realizzazione. Soltanto lincontro con lautore in prima persona assicura laccesso effettivo alle informazioni di cui si ha bisogno. Ma questa condizione non confinata alle realt aziendali, bens si estende a tutti i domini delleconomia e della cultura: anche il giornalista neofita conosce bene la differenza tra il valore di una notizia che ha potuto raccogliere di prima mano, rispetto alla rielaborazione di unagenzia che ha gi fatto il giro del pianeta prima di finire sulla sua scrivania. La possibilit di dialogare con i diretti interessati lascia sempre aperto lo spiraglio alla possibilit che emergano lati insospettati della verit, dettagli non ancora usurati dagli equivoci che si accumulano con il passaparola. Daltra parte, anche quando lincontro non sia destinato al dissotterramento di verit nascoste, lintensit del contatto diretto inaugura loccasione di unesperienza autentica la cui intensit non raggiungibile in altri modi. Twitter ha raccolto il suo successo dalla combinazione dellattualit istantanea dei messaggi con il contatto diretto con i loro autori. Il contenuto sempre cronologicamente prossimo al presente, fino a coincidere quasi con lattimo che sta trascorrendo; lo spazio della comunicazione quello di un micro-blogging di 140 battute, appena sufficiente per dichiarare il tema dellinteresse e nominare il soggetto che se ne sta occupando. Twitter una colonia di interlocutori reticenti in tempo reale. Lurgenza del contatto e limmediatezza del presente sono gli ingredienti che Google ha tentato di cogliere dallesperienza della piattaforma di micro-blogging che allinizio del 2009 ha rifiutato la sua offerta di acquisto. Il nuovo sistema di compilazione della classifica dei risultati per le ricerche imputate dagli utenti che stato implementato ed in fase di collaudo dallagosto 2009 prevede un box dedicato alla presentazione in tempo reale dei messaggi che vengono pubblicati intorno al tema espresso dalla query. Il rullo compare prima del listato tradizionale con lelenco degli indirizzi utili, in cima alla colonna dei risultati organici estratti dal motore. Ma non si tratta soltanto di uno stratagemma di facciata, al fine di catturare lattenzione del pubblico affezionato al micro-blogging e alla socializzazione dassalto in Rete. La soluzione si affaccia in un quadro complessivo volto a premiare tutti coloro che condividono una concezione di Internet incentrata sullimmediatezza del dialogo, sulla prontezza nellaggiornamento dei contenuti, sulla partecipazione allo sviluppo quotidiano del dibattito, sulla disponibilit a sostenere lepistemofilia degli utenti. Caffeine stato il nome di lavoro con cui si designato dal primo annuncio nellagosto 2009 lalgoritmo che i laboratori di Google hanno sviluppato per configurare la nuova capacit del motore di selezionare le pagine digitali e di ordinare le risposte alle interrogazioni secondo la nuova opinione su ci che la Rete offre di pi rilevante per gli utenti. La caffeina la metafora della vitalit continua del dialogo, della freschezza nellaggiornamento delle proposte di contenuto, della rapidit di individuazione dellinteresse degli utenti e di rinnovamento delle proprie proposte di contenuto, della moltiplicazione e della dinamicit dei percorsi di evoluzione per ciascun tema, della sostituzione della velocit nello spostamento e nellavanzamento allapprofondimento della comprensione e dello scavo dei motivi. Caffeine connota lo stato di veglia perenne delle comunit che riversano il loro pensiero, la loro conoscenza e le loro richieste in Rete, dal momento che lintelligenza collettiva che scorre nelle interazioni on-line non cessa mai di essere attiva, disponibile alla consultazione, ispiratrice di nuove proposte, aperta alla critica e alla correzione, pronta alle

33

svolte radicali, inestinguibile nella conservazione del sapere che ha alimentato e dibattuto. Forum, blog, enciclopedie digitali, recensioni, commenti, post di ogni ordine di grandezza, non si spengono mai almeno fino a quando i server restano in funzione e il gestore paga i costi di hosting. Lideologia di Pierre Lvy17, che paragona la vita delle comunit virtuali su Internet alle intelligenze angeliche teorizzate dai teosofi medievali, alla fine ha avuto la meglio su ogni obiezioni e su ogni scetticismo grazie alle pagine dense di pragmatismo finanziario di Google. La rivincita della filosofia e il suo destino nello sviluppo delle tecnologie contemporanee sar esaminata nel prossimo capitolo; lamore che i tecnologi di Google mostrano per gli effetti eccitanti della caffeina si esplicita nella prosa di un elenco in cui si enumerano le propriet del nuovo algoritmo. Le sue prestazioni assicurano maggiore velocit al funzionamento del motore, una maggiore accuratezza nella connessione tra le stringhe di interrogazione e i testi che vengono rintracciati, una particolare attenzione al reperimento di risposte aggiornate in tempo reale. Velocit, attualit, aggiornamento, sono i criteri del valore per creare un valore distintivo nella competizione dellinformation retrieval. Ma questa scelta significa premiare le forme di comunicazione che obbediscono alla stessa strategia di frequenza di aggiornamento, velocit di caricamento delle pagine per gli utenti, capacit di orientamento per i visitatori, immediatezza di lettura, tempestivit informativa che vengono assicurati dalle risposte del motore. La classe di canali di comunicazione che si attiva sulle piattaforme tecnologiche dei blog, che si irradia attraverso i dispositivi dei social network, che condivide gli strumenti editoriali stessi con gli interlocutori del pubblico come accade per i progetti Wiki guadagna una visibilit massima con un punteggio di classifica elevato nel ranking di Google. Chi ha qualcosa da dire deve essere sincronizzato con gli eventi e con il progresso della discussione, non pu avere tempo da perdere nella ricerca di appesantimenti superflui per limmagine della propria presenza digitale: lornamento un delitto, sembra ripetere Google con Loos18, a poco meno di un secolo di distanza. Nel percorso della selezione naturale di ci che pu continuare a catturare lattenzione del grande pubblico, il motore di ricerca sembra voler sostenere la causa di chi interpreta la Rete come un luogo di comunicazione, e non come la pinacoteca delle proprie aspirazioni creative frustrate, o come la giostra degli effetti speciali della tecnologia fine a se stessa. Lattenzione riservata al micro-blogging e al real time pu apparire come un salto di paradigma rispetto alla concezione tradizionale dellinterrogazione di un archivio alla ricerca del documento corretto. La rilevanza non fissata solo dalla base testuale depositata tra gli scaffali di un luogo ritenuto la sede consolidata del sapere. La metafora della biblioteca, con la sua configurazione concettuale, il suo sistema di valori, si imposta in passato come guida pi o meno inconsapevole anche nel settore pi dinamico e lanciato verso una crescita furiosa come il Web. Era quello il modello a disposizione, per di pi con una scorta di successi pi o meno leggendari accumulati per secoli, e ha configurato a sua immagine somiglianza il modo in cui si ideato lo spazio di raccolta documentaria, linsieme dei bisogni degli utenti, i processi per esaudirli. Ma il pi pertinente dei testi a disposizione dal punto di vista della rilevanza tematica potrebbe non essere aggiornato rispetto al dibattito in corso, potrebbe non contenere le informazioni sufficienti per orientarsi nellattualit dellargomento, oppure potrebbe essere troppo dettagliato, troppo specifico per le necessit di chi deve comprendere le propriet

17

Cfr. P. Lvy, Lintelligence collective. Pour une antropologie du cyberspace, Editions La Dcouverte, Parigi, 1994; tr. it. Lintelligenza collettiva. Per unantropologia del cyberspazio, 1996, a cura di M. Col, Feltrinelli, Milano. 18 Cfr. A. Loos, Ornament und Verbrechen, in Ins Leere gesprochen Trotzdem, Verlag Herold, Vienna-Monaco 1962; tr. it. a cura di S. 5 Gessner, Ornamento e delitto, in Parole nel vuoto, Adelphi, Milano, 2001 .

34

generali del settore, distinguere le fazioni contrapposte nella discussione, rilevare i margini di evoluzione possibile, le aree ancora disponibili ad un approfondimento. Lincontro con chi sta coltivando largomento, sta partecipando alle discussioni, sta alimentando attivamente la propria epistemofilia attraverso tutte le possibilit aperte dalla Rete, rappresenta il percorso pi efficace per non limitarsi alla ricognizione dei dati disponibili in una biblioteca, ma per inaugurare volendolo un processo di formazione pi complesso. La ricerca abbandona la polvere delle mensole per incontrare gli interlocutori faccia a faccia e sollevarli secondo i casi al ruolo di maestro, di compagno di studi, di avversario, di sostenitore, di beta-lettore, di avvocato del diavolo, di conforto amichevole. Oppure il processo reale potrebbe rivelarsi linverso di quello prospettato finora, e di quello sostenuto dallideologia dei media contemporanei: la verit potrebbe essere che anche il ricercatore viene assorbito nelle stanze della biblioteca che sta interrogando, e ogni suo gesto si trasforma in un nuovo scaffale, in una nuova pagina conservata tra le altre che compongono linsonne intelligenza della cultura documentale. In questo caso anche Google verrebbe iscritto di diritto tra i protagonisti della nostra civilt in cui lansia collettiva governata dalla convinzione che solo un pensiero, delle abitudini, un gusto trascritti, assicurino la sopravvivenza e certifichino lesistenza sociale del corpo umano che li ha prodotti. La maieutica, il dialogo, la goliardia, la dialettica, vengono di nuovo valorizzate per la tempestivit del loro apparire nello scorrimento presente della vita ma nella condizione ambigua in cui oscillano dai tempi di Platone, che esalta la vitalit dellesperienza diretta attraverso la mediazione della scrittura. La proiezione bidimensionale nel mondo della documentazione grafica indispensabile a rassicurare i soggetti coinvolti sul loro valore, dal momento che solo la promessa della conservazione e della disponibilit pubblica, della trasformazione del documento in monumento potenziale, garantisce il riconoscimento sociale di ci che altrimenti sarebbe consegnato alla volatilit effimera dellistante vissuto. Se questo mutamento di paradigma sia una trasformazione radicale o una pura illusione si cercher di comprendere meglio nel capitolo 4; in ogni caso dal 1 aprile 2010 Caffeine entrato in funzione a pieno regime, con un nome un po modificato rispetto a quello adottato per il periodo di collaudo. Il battesimo si orientato sulla declinazione tedesca del concetto, Kaffein, che secondo alcune fonti autorevoli avrebbe permesso a Google di mostrare la sua accondiscendenza nei confronti della sensibilit dei Mormoni per le limitazioni dietetiche che caratterizzano le loro pratiche di vita, e la sua volont generale di non offendere alcuna fede religiosa19.

19

Cfr. p.e. http://www.seroundtable.com/archives/020578.html.

35

36

Potrebbero piacerti anche