Sei sulla pagina 1di 10

CARTE DEL NUOVO MONDO

La ricerca di informazione è un processo, rappresentabile in un diagramma di flusso (flow chart).


Quesito -> query
Parole chiave

Stampa “in batch” (in differita) -> la stampa si attivava nei tempi morti, nel momento in cui il computer non
era in uso per calcoli o altre funzioni

Metamorfosi delle banche dati da contenitori del sapere costosi ed elitari a risorse Open Access.

Digital Humanities (disciplina della Documentazione) per colmare il divario tra noi e la tecnologia, tra codice
umanistico e codice scientifico-tecnico.

Le banche dati e la rete di distribuzione trasformano il contenuto stesso e il valore d’uso del contenuto. Il
Movimento Open Access ha affrontato la questione tornando alla sorgente, offrendo il contenuto
potenzialmente a tutti. Il Movimento Open Access sposta verso un modello alternativo dove assumeranno
più peso la cooperazione, condivisione, etica, dono, memoria, identità.

CAPITOLO I

Metamorfosi delle banche dati da contenitori del sapere costosi ed elitari a risorse open Access. Attenzione
rivolta anche ai luoghi fisici in cui sono state prodotte le banche dati.

1991 creazione del primo repository a Los Alamos, New Mexico. Nei primi dieci anni era conosciuto come
l’archivio di Los Alamos o e-print Archive (raccoglie preprint, ovvero documenti non pubblicati). Adesso
invece è conosciuto con il nome di “arXiv” ed è fisicamente a Cornell University. La paternità è di un
giovane fisico teorico, Paul Ginsparg, presso il Los Alamos National Laboratory (LANL, uno dei massimi
centri di ricerca mondiali).

In quegli anni erano già attive banche dati di fisica (es. INSPEC, INIS) ma per accedervi erano richiesti costosi
abbonamenti e specifici linguaggi di interrogazione. Inoltre, erano prevalentemente bibliografiche, non
davano il testo completo (full-text).

Il nome repository si affermerà una decina di anni dopo, nel 1991 vengono usati termini quali e-print
archive, database, server, archivio digitale, archivio elettronico di preprint. Anche la tipologia dei documenti
è rilevante in quanto si trattava di preprint, articoli completi distribuiti direttamente online, senza il
passaggio intermedio della stampa (e-print).

REPOSITORY = banca dati ad accesso aperto, gratuita e senza password di identificazione dell’utente,
raggiunta tramite collegamento a un sito web.
- Repository disciplinari
- Repository istituzionali
Possono avere stesso server o server diversi; gli autori si occupano in prima persona di caricare il
documento (autoarchiviare/selfarchiving).
Originariamente l’archivio di Los Alamos si proponeva come miglioramento del sistema di distribuzione di
preprint, al posto di usare fotocopie per posta o fax.

L’accesso all’archivio elettronico è organizzato sul modello Bulletin Board System (BBS): il tema comune è la
disciplina della fisica e gli interventi individuali sono ciascun preprint.

Algoritmo di smistamento della posta: doveva essere in grado di funzionare anche se il destinatario non
controllava la posta per molti giorni o se veniva oltrepassato il limite di capienza della casella.

Il processo di apertura e inclusione verrà enfatizzato quando Ginsparg renderà possibile l’accesso tramite
web. Con l’accesso web si passa da un recupero dell’informazione spinto dall’offerta (push) a un
movimento attivato dalla domanda (pull).

L’archivio di Ginsparg si sviluppa con determinate caratteristiche proprio a causa del luogo dove è nato. I
finanziamenti dipendono da scelte di politica scientifica e di politica.

Mentre il preprint in passato costituiva il momento di attesa e anche di rifiuto, adesso l’autore ha il potere
di decidere tempi, spazi e modi di rappresentazione.

Il dominio xxx.lanl.gov rimanda al massimo grado di segretezza (di Los Alamos, dove è stata creata la
bomba atomica) e anche a X file, in contrapposizione con la natura dell’archivio che all’opposto è open e si
basa su principi di accessibilità e condivisione. Inoltre, si riferisce a TeX, il formato testo, adatto alle
esigenze di una comunità che fa ampio uso di grafici, tabelle etc. Le tre x vogliono suggerire inoltre l’idea di
un testo terminato ma ancora soggetto a verifiche, rimandando a un espediente adottato dai correttori di
bozze.

21 e 22 ottobre 1999: Primo incontro di Open Archives Initiative (OAI), presso Santa Fe (sede dell’università
di New Mexico). Importante convegno; gli incontri OAI hanno cadenza biennale e rappresentano
l’eccellenza internazionale nel Movimento Open Access. La metodologia è interdisciplinare. Dal 2001
l’istituzione ospitante sarà il CERN di Ginevra.

Nel 2001 Ginsparg si trasferirà a Ithaca. Non si sente più in sintonia con le nuove direttive della politica
scientifica di LANL, anche in conseguenza delle scelte della presidenza Bush. A seguito dell’11 settembre si
radicalizza la scelta di aumentare le enclosures piuttosto che le risorse common, anche con l’effetto sperato
di indirizzare il modello di comunicazione scientifica verso un’ottica di mercato. A questo si deve aggiungere
la preoccupazione verso la produzione di armi in laboratorio. La politica della ricerca è cambiata e ha preso
una direzione in controtendenza rispetto alle comunità scientifiche che di lì a un anno formalizzeranno
l’avvio del Movimento Open Access.

arXiv diventa modello ed espressione dell’intera istituzione del Movimento Open Access e dei suoi valori di
riferimento.

Il trasferimento dal laboratorio governativo (.gov) a una biblioteca universitaria (.org) mostra che la netta
divisione tra laboratori scientifici e biblioteche umanistiche sa perdendo significato. Secondo quanto
dichiara Ginsparg nel 2001 le biblioteche sono diventate sempre più dei laboratori in cui sperimentare:
- La conservazione a lungo termine dell’archivio (e di conseguenza una più accurata tutela del
patrimonio intellettuale e scientifico contemporaneo)
- Nuove metriche di valutazione per la ricerca scientifica
- Più adeguati sistemi di recupero dell’informazione, il che implica lo sviluppo di migliori algoritmi e
interfacce.

Ginsparg utilizza proprio arXiv dal momento che ormai offre una quantità sbalorditiva di dati. Ginsparg
applica all’universo dei documenti il metodo sperimentale: costruisce un modello sperimentale archivistico.

Viene affrontata la questione fondamentale dell’affidabilità e della qualità dei documenti: in arXiv al
momento di sottoporre per la prima volta un contributo viene richiesta agli autori non solo la registrazione
ma anche l’endorsement da parte di un autore già presente nel repository. Chi effettua l’endorsement pone
il suo nome a garanzia del nuovo autore e chi svolge questo ruolo deve essere qualified, ossia deve aver già
pubblicato un numero consistente di articoli su arXiv nello stesso ambito disciplinare.
Se viene individuato un errore o un plagio non si potrà procede alla rimozione: il giudizio negativo resta
indelebile e vengono quindi scoraggiati tentativi di plagio o ricerche non sufficientemente vagliate.

CAPITOLO II

Carte costituzionali dell’accesso aperto -> BBB Declarations, redatte tra il 2001 (Budapest) e il 2003
(Berlino), fissano un nuovo sistema di valori e regole, nonché uno specifico lessico. È proprio in quell’arco
temporale che si costituisce il Movimento open Access.
A partire da allora, repository e riviste online ad accesso aperto si proporranno come lo standard per la
comunità scientifica.

Il modello del repository raggiunge sia territori decentrati dal punto di vista geopolitico, sia aree disciplinari
appartenenti alle Humanities (inizialmente scienze cognitive – CogPrints -, studi economici – RepEc -e man
mano anche ambiti più tradizionali). Il processo di affermazione del modello del repository si conclude a
fine anni Novanta con la creazione di PubMed (di ambito biomedico).

La dichiarazione di Berlino, nel 2003, sancisce un inizio, ma è anche il punto di conclusione di un processo di
affermazione di riviste ad accesso aperto e repository.

L’ideatore di CogPrints è Stevan Harnad, che aveva teorizzato la necessità di rifondare il sistema-ricerca
sulla base delle infrastrutture e dei valori di internet (1990). Presenta un nuovo modello di scholarly
communication: quel che viene distribuito online non solo si mostra liberamente a tutti, ma finisce per
trasformare il concetto stesso di pubblicazione. Ne deriva un tipo di pubblicazione più vicina a un
organismo in divenire (omologo all’atto conoscitivo/creativo della ricerca scientifica) piuttosto che a un
documento che attesta un atto concluso.

CogPrints voleva dimostrare che era possibili offrire un accesso online completamente gratuito non solo per
lavori di fisica, ma in ogni campo disciplinare. Al contrario di Ginsparg, Harnad deve far anche accettare agli
umanisti il modello cognitivo dell’accesso aperto; il nome CogPrints evoca questo desiderio: il sistema della
stampa viene raffigurato come una macchina complessa, con parti interrelate tramite snodi (cog = ruota
dentata). Ma Cog è anche l’abbreviazione di cognitive, quindi si tratta di un repository disciplinare di
scienze cognitive.
Psycoloquy = lista di discussione attiva da 1990 al 2002, intesa come sincretismo tra le possibilità offerte
dalla rete e il rinnovamento del colloquio disciplinare.

Tuttora CogPrints è allocato presso il server di Southampton, School of Electronics and Computer Science e
conta circa 5000 documenti. Inoltre, dal luglio 2005 Harnad ha attivato un blog, Open Access
Archivangelism, dedicato alla diffusione della buona novella dell’accesso aperto. Il motto del blog è
“Maximizing research impact by maximizing research access”.

Per quanto riguarda le policy editoriali, CogPrints è meno radicale rispetto ad arXiv. I contenuti sono
autoarchiviati e metadatati, ma non vengono pubblicati immediatamente: agli autori viene chiesto di
iscriversi e fornire alcune informazioni relative a formazione, affiliazione, interessi e dovranno poi attendere
il parere dei valutatori, che possono accettare, respingere o indicare modifiche da fare. Nel caso di
discipline più conversazionali, la peer review è necessaria e la sua mancanza potrebbe causare un
abbassamento del livello di qualità. Open Access significa liberare la ricerca peer review dai costi di accesso
e non liberare la ricerca dalla peer review.
Inoltre, i documenti per cui sono dimostrati plagio o violazione di copyright vengono rimossi dal repository.
Quanto alle modalità di Information retrieval, c’è sia la possibilità di searching che di browsing.

Il repository di economia è attivo sin dal 1993 e nel 1997 prenderà il nome di REpEc, Research Papers in
Economics. L’ideatore, Thomas Krichel, è, come gli altri pionieri dell’Open Access, di formazione e attività
internazionale e i suoi campi di ricerca sono multidisciplinari e interdisciplinari.

REpEc conta quasi 2 milioni di documenti. Si basa su in sistema decentrato di server in istituzioni aderenti al
progetto. Gli utenti vengono invitati non solo a sottoporre un contributo, ma anche ad aprire un nuovo
server di REpEc nella propria istituzione di appartenenza. In particolare, viene incentivata la collaborazione
di studiosi in grado di leggere lavori in lingue diverse dall’inglese.

Per sottomettere un articolo bisogna iscriversi e rispondere a una serie di richieste. Nel momento del
debutto non viene richiesto l’endorsement. La procedura di iscrizione assume pertanto il compito di
screening per valutare il grado di affidabilità dell’autore e la pertinenza del contributo.
Per i casi di plagio, REpEc ha uno specifico comitato che valuta i casi sospetti segnalati dai lettori. Se viene
confermato il plagio, il contributo viene tolto dal repository e il nome di chi l’ha commesso viene inserito
nella lista degli offenders.

1 e 2 dicembre 2001, Budapest: redazione Carta costituzionale; principale finanziatore dell’Initiative è


George Soros, presidente di Open Society. Il Movimento per l’accesso aperto nasce simbolicamente dalle
ceneri dei totalitarismi, di cui Soros stesso è stato vittima. Anche i sedici firmatari di Budapest Open Access
Initiative (BOAI) hanno vissuto storie familiare analoghe a quella di Sorso. La dichiarazione dell’accesso
aperto viene resa pubblica il 14 febbraio 2002. Adesso, grazie alla modalità interattiva online. BOAI riporta
anche le firme di chiunque voglia controfirmare l’iniziativa.

Nella dichiarazione di Budapest, si propongono due azioni possibili:


- La cosiddetta “via verde” (la creazione di repository), una strada immediatamente praticabile senza
particolari oneri di spesa a patto che vengano adeguatamente coinvolte le istituzioni di riferimento
- La “via d’oro” (creazione di riviste Open Access o trasformazione in open di riviste già esistenti), per
la quale prima occorrerà patteggiare con il mercato dell’editoria.
La BOAI è composta di tre parti principali: incipit con azioni già avviate e future; parte centrale in cui
vengono illustrate le due vie; perorazione finale che chiama all’impegno attivo.

Il principale estensore del testo fu Peter Suber. La sua formazione intellettuale e politica (quaccheri)
permea il testo della BOAI.
Il linguaggio è figurato e retorico a sottolineare l’importanza del testo.

Effetto San Matteo (Robert Merton): vengono più facilmente assegnati fondi a gruppi già precedentemente
finanziati che abbiano dimostrato di essere produttivi, con la conseguenza che il ricco diventa sempre più
ricco e il povero sempre più povero. O come dice Peter Levine, solo i ricchi avranno i mezzi per fare ricerca.
La parabola dell’accesso aperto invece capovolge questa condizione. Il valore verrà giudicato solo
all’interno della comunità scientifica e solo in base a quante altre ricerche e scoperte innescherà.

La Dichiarazione di Budapest (Initiative) viene riaffermata nel giugno 2003 a Bethesda (Statement) e fissata
nella Costituzione dell’accesso aperto il 22 ottobre 2003 a Berlino (Declaration). Si conclude così il percorso
costituzionale scandito dalle cosiddette BBB Declaration.

Berlin-Declaration on Open Access to Knowledge in the Sciences and Humanities: istituzione ospitante è il
Max Planck Institute. Il testo, in meno di 5000 caratteri, definisce in modo preciso lo stato dell’arte e gli
obiettivi del Movimento. Si ribadisce la centralità della rete sia come infrastruttura tecnologia sia come
paradigma cognitivo e politico. Nella prima sezione vengono ripercorse le tappe raggiunte fino a quel
momento. Nella seconda sezione, Goals, si evidenziano i risultati, da estendere ulteriormente. La
Dichiarazione di Berlino intende i diritti “free, irrevocable, worldwide”, quindi non validi per un periodo
determinato di tempo. Il diritto vale sempre e ovunque ed è irrevocabile. Nella terza sezione, Definition of
an Open Access contribution, viene sancito cosa debba intendersi per pubblicazione. Si passa alla
concezione più estesa di contributo. Infine, nella sezione Supporting the transition to the electronic Open
Access paradigm, viene affermato che vanno garantite contemporaneamente equità ed efficienza.

Per dieci anni ogni anno ad ottobre verrà promossa una settimana per la diffusione dell’accesso aperto e
ogni anno la conferenza di Berlin Process si terrà in una diversa città: contestualmente si promuove
l’inclusione di paesi lontani dal mondo occidentale.

La parola contribution viene preferita a quella di publication e allo stesso tempo viene sostituito il concetto
di public con quello di common.

La Costituzione di Berlino intende riferirsi a tutto il mondo connesso in internet. La condizione di default è
quella propria del paradigma di rete: documenti (contribution) disseminati online in modalità open o
regolati da licenze di nuova generazione (Creative Commons) in un mondo globale percepito come
territorio comune (common) senza confini e frontiere.

Per un bene comune immateriale la criticità è nel rischio di stallo: finché non si riconoscerà piena legittimità
ai contributi in quanto pubblicazione e finché non si garantiranno da atti predatori e da plagi, gli autori non
saranno indotti a passare alla modalità open. Questo è lo scopo del seminario interdisciplinare Workshop
on Scholarly Communication As a Commons, coordinato da Elinor Ostrom (2004, Indiana University).

Uno spazio cerniera tra Sciences and Humanities è sempre stata la medicina. Il passaggio intermedio tra la
Dichiarazione di Berlino e quella di Budapest è significativamente rappresentato della Dichiarazione di
Bethesda (giugno 2003) che si concentra proprio sull’ambito biomedico. Il Bethesda Statement ribadisce la
necessità di estendere i principi dell’accesso aperto alla salute, la quale coincide però con un’area dove
prevalgono enormi interessi economici.

Nel settore biomedico si intenderà open una pubblicazione se soddisfa le seguenti due condizioni:
- L’autore e il detentore di diritti garantiscono a tutti gli utenti l’accesso gratuito e libero,
irrevocabile, globale e perpetuo; e la licena a copiare, usare e distribuire, trasmettere e mostrare
pubblicamente il lavoro e a farne e distribuirne opere derivate in ogni mezzo digitale a patto che
venga data adeguata attribuzione di paternità. Viene altresì concessa la possibilità di un piccolo
numero di copie stampate per uso personale.
- Viene immediatamente depositata una versione completa dell’opera e di tutti i materiali di corredo
in almeno un repository supportato da rinomate organizzazioni che si propongono di mettere in
atto l’acceso aperto, la distribuzione senza restrizioni, l’interoperabilità e l’archiviazione a lungo
termine (PubMed Central)

Vengono mantenuti il sistema di valutazione peer review e la pubblicazione su riviste, ma l’accessibilità è


garantita in modalità open già dal 1997 tramite PubMed. L’elemento innovativo espresso dalla
Dichiarazione di Bethesda è la rimozione dell’ostacolo economico.

Dal 26 giugno 1997, MEDLINE (Bethesda), una risorsa prima dai costi proibitivi, è consultabile
gratuitamente e liberamente da chiunque possa collegarsi a internet. Con questo atto ha inizio l’accesso
aperto nel campo sanitario, prima ancora dell’inizio formale del Movimento Open Access. Dal 1997 i costi
della banca dati MEDLINE vengono assunti dal Governo americano (tuttora il dominio è .gov). Dal 1997 la
banca dati si chiamerà PubMed (Pud = pubblico). Questa non è solo una scelta economica e politica
rivoluzionaria ma anche una scelta scientifica volta a favorire la qualità della ricerca.

La politica di Bush del periodo è in controtendenza. Negli anni della sua presidenza si afferma infatti una
solida scuola di pensiero antiliberista. C’è una grande sete di giustizia e una grande sete di bellezza. A
Bethesda viene offerto un nuovo punto dio osservazione rispetto a cosa sia giusto fare. A Bethesda viene
affermato che la salute, l’istruzione, la conoscenza, fanno parte di quello che i soldi non possono comprare.
Restando nel mercato, infatti, alcuni beni verrebbero immiseriti e corrotti. L’etica della rete ha sempre
saputo che il bene, se diventa un bene di mercato e non un valore, finisce per svalutarsi. Per stabilire dove
va collocato il mercato e a che distanza andrebbe tenuto, dobbiamo decidere come valutare i beni in
questione: non sono solo questioni economiche ma anche morali e politiche, per cui bisogna discutere caso
per caso per valutarli correttamente.

CAPITOLO III

La trasformazione di MEDLINE in PubMed segna l’uscita dal mercato di un bene comune quale la
conoscenza medica.

1995 – creazione del sistema operativo Windows ’95, del browser Internet Explorer e dei motori di ricerca
Yahoo e Altavista.
1998 – presentazione di Google al Convegno internazionale W3C-Web Consortium
A causa della creazione di questi sistemi, non si potevano più imporre sbarramenti visto che in altri luoghi
della rete questo non avveniva. Le banche dati quindi fanno il loro ingresso all’interno dei flussi
internazionali alla portata dell’utente comune, anche se nella maggioranza dei casi cambiano nome e man
mano non verranno nemmeno più percepite come banche dati ma come siti, motori di ricerca, blog, OPAC,
social network.

26 giugno 2000 – il presidente Clinton annuncia in conferenza stampa i risultati raggiunti dal Progetto
Genoma (Human Genome Project, HGP). Il risultato è frutto della cooperazione politica internazionale con
la comunità scientifica mondiale in un regime di competizione tra pubblico e privato. Inoltre, il buon esito è
dovuto anche alla convergenza interdisciplinare.

La banca dati GenBank nasce nel 1982 a Los Alamos. Dal 1992 anche GenBank è allocata a Bethesda. Il
progetto è stato incluso nella categoria dei commons.

1998 – nasce PubMed Plus, una versione rivolta ai “consumatori di salute”. Grazie alla nuova interfaccia,
l’utente di PubMed Plus potrà utilizzare anche termini di uso comune e lo spagnolo invece che l’inglese. Nel
2007 nasce PubMed Central, contenente articoli full-text tratti da riviste peer review del settore. Dal 2000
era anche attivo BioMed Central.

Le banche dati, operative già dai primi anni Sessanta, erano prevalentemente bibliografiche. Tali banche
dati consentivano di venire a conoscenza dell’esistenza di un articolo o di un libro, ma non indicavano la
localizzazione (informazione offerta da cataloghi). La bibliografia delinea una collezione ideale, una
mappatura del possibile. Forniscono indicazioni sulla fonte e non la fonte in sé.

Adesso possiamo usare gli OPAC per completare il recupero oppure troviamo il documento direttamente in
rete, ma al momento della nascita delle banche dati la localizzazione non era semplice. Negli USA gli OPAC
erano già in uso dalla fine degli anni Settanta.

Un’altra tipologia che si afferma agli albori degli anni Settanta è quella delle banche dati fattuali, dette
anche primarie o source. Offrono dati immediatamente usabili. Tale tipologia di banca dati è detta anche
full-text, a testo completo.

Nelle banche dati bibliografiche, ciascun elemento descrittivo del documento occupa uno specifico campo.
Ogni campo ha una sua denominazione, o tag. Tutti insieme i campi compongono un record, ossia l’unità
minima, necessaria e sufficiente, per descrivere il documento. Tutte le parole di tutti i campi di tutti i record
sono elencati in indici che il motore di ricerca della banca dati (search engine) utilizza per la ricerca
automatica della parola inserita. Gli indici delle banche dati sono denominati inverted file, indici invertiti (o
inversi) perché la ricerca automatica procede a partire dalla fine, cioè scorrendo l’indice e poi andandosi a
posizionare sullo specifico record. Con il comando expand si possono vedere i termini che immediatamente
precedono o seguono il termine cercato, così da individuare altre keyword che non erano state considerate.

La ricerca per campi è una modalità estremamente utile per disambiguare la richiesta e recuperare
informazioni pertinenti. Il numero e la sequenza dei campi in un record sono predeterminati dagli elementi
ritenuti essenziali per descrivere gli oggetti di cui la banca dati è espressione (es se una banca dati descrive
libri, dovrà essere presente il campo editore; se descrive acqua minerale, dovrà essere presente il campo
contenuto di sodio). Occorre attenersi strettamente a questa scelta per avere descrizioni omogenee e
confrontabili. Se alcuni campi vengono lasciati vuoti, vuol dire che gli indicizzatori non sono stati rigorosi o
che i produttori della banca dati non avevano correttamente individuato gli elementi costituivi di
quell’ambito. Anche l’elemento quantitativo è importante; deve rispondere a ciò che sarà necessario per
ricerche future e di conseguenza occorre porsi il problema di un adeguamento nella descrizione, inserendo
nuovi campi (in tal caso tutti i record presenti vanno aggiornati).
Ulteriori elementi che il produttore deve decidere preventivamente sono l’estensione temporale e spaziale.
Dal punto di visa cronologico, sia la copertura della banca dati (a partire da quale anno di pubblicazione
avviene lo spoglio), sia la cadenza con cui si procede all’aggiornamento. Occorre anche valutare quali
tipologie documentarie sono pertinenti.

Il principale valore aggiunto dalle banche dati bibliografiche rispetto alle bibliografie tradizionali è la
possibilità di incrociare i dati (specifici comandi AND, OR, NOT). Chi utilizzava una banca dati negli anni
dell’online classico doveva essere consapevole della logica che c’era dietro, del fatto che la banca dati
procede secondo calcoli effettuati con le parole. L’interfaccia era alfanumerica e non user friendly. Era
necessario apprendere i comandi per la ricerca di informazioni nelle banche dati, ma anche i principi
dell’information retrieval. Nel caso in cui la query avesse prodotto un risultato non soddisfacente, la ricerca
andava reimpostata.

Allargare il bacino di utenza ha costretto ad una semplificazione, con conseguente abbassamento del grado
di raffinatezza della ricerca.

Altro compito del produttore riguarda l’individuazione delle fonti da censire. Nelle banche dati vengono
indicizzati in prevalenza articoli e solo se apparsi su determinate riviste. Le riviste selezionate vengono
detto core journals, o “di fascia A”. Se una rivista smette di essere rappresentativa per il settore e invece
un’altra conquista autorevolezza, il canone cambia: l’una viene aggiunta e l’altra viene tolta. Può inoltre
cambiare la tipologia stessa di fonti. Per cui la banca dati non è una raccolta esaustiva ma una collezione
altamente selettiva.

All’interno delle banche dati online, il soggetto a cui vanno attribuiti i credits, la responsabilità, è il
produttore. Ma il produttore è anche il proprietario: gli vanno riconosciuti i diritti, le royalties. Il produttore
può essere un’università, un istituto di ricerca etc. Un soggetto talmente autorevole da attirare fondi.

La banca dati è di norma allocata nell’host computer (computer ospitante) nella sede del responsabile
scientifico. Nei primi tempi, l’utente doveva recarsi direttamente presso l’host computer e consultare la
banca dati in modalità locale.

Il produttore di MEDLINE è National Library of Medicine (NLM), la cui sede è Bethesda. Il più diretto e
prestigioso antesignano di MEDLINE è la bibliografia Index Medicus (1870, John Shaw Billings). Dal 1888
Index Medicus verrà distribuito anche a stampa e diventerà il principale punto di riferimento per gli studiosi
di medicina a livello internazionale.

Sin dal 1964 è attiva la banca dati Medical Literature Analysis and Retrieval System (MEDLARS), allora
consultabile in locale. Dal 1970 sarà poi raggiungibile in remoto e dal 1971 cambierà il nome in MEDLINE
(MEDLARS online). Nel 1994 MEDLINE si dota di un sito web; infine nel 1997 avviene l’apertura open con
PubMed. Nel 1998 diventa PubMed Plus, con interfaccia multilingue, comandi e linguaggio semplificati; nel
2000 diventa PubMed Central, repository di documenti full-text. Nel 2004 termina la gloriosa storia
dell’Index Medicus, i cui compiti saranno totalmente assunti da PubMed.

1961 – Education Resources Information Center (ERIC), istituito dalla presidenza Kennedy e poi ribattezzato
Institute of Education Sciences (IES) durante la prima presidenza Bush. La banca dati funzionerà a regime
sin dal 1966. È stata donata in accesso aperto dall’amministrazione Clinton nel 1998.
La maggior parte delle banche dati dell’online classico sono rimase chiuse e gli ingressi vengono
regolamentati da costosi abbonamenti. In molti casi si tratta proprio di quelle aree della conoscenza dove la
ricerca ha raggiunto grandi successi, grazie anche ai finanziamenti che abbondano. Un esempio significativo
è CAS (Chemical Abstracts Service), attiva dal 1966 sotto la responsabilità dell’American Chemical Society.
L’aggiornamento è settimanale e si basa su una lista di più di 1500 riviste scientifiche. La banca dati, oltre
che bibliografica, è anche fattuale. È stata uno dei primi campi di applicazione per il recupero content
based, ossia tramite un campione piuttosto che a parole (term based, per parole chiave). Prima di assestarsi
sulla sua scelta definitiva, l’American Chemical Society tenta per un breve periodo di gestire il servizio di
abstract in biblioteca e in forma gratuita, ma fu ritenuto costoso e poco efficiente. Quindi l’American
Chemica Society decide di gestire la banca dati ispirandosi alla sua anima produttiva e industriale, basata su
alte competenze tecnologiche e grandi disponibilità di fondi. Se PubMed ha attivato il servizio gratuito è
perché il Governo si è assunto gli oneri della banca. Se invece gli interessi del produttore non coincidono
con quelli della politica nazionale, allora ciò non può avvenire e le banche dati restano in enclosures,
proprietarie e a pagamento.
Solo dal 2004 viene proposta una banca dati di chimica e farmacologia ad accesso aperto: PubChem,
costruita sul modello di PubMed. Quindi ora sono disponibili due banche dati di chimica, entrambe con
autorevoli produttori e alta garanzia di qualità, ma ispirate a diversi modelli di trasferimento delle
conoscenze. Sembra però che il modello proprietario stia arrancando e che Chemical Abstract sia arrivata a
tentare di contrastare il Movimento Open Access tramite un’agenzia di pubbliche relazioni etc etc.

Esempi di banche dati offerte gratuitamente: Bibliography of the History of Art (BHA), Répertoire
international de la littérature de l’art (RILA), Abstracts of Music Literature.

Esempi di banche dati proprietarie: Modern Language Bibliography (MLA), America History & Life, Anneé
Philologique, Philosopher’s Index.

Sono state liberate quasi tutte le banche dati giuridiche e anche nel campo delle scienze. Ancora sono
proprietarie le banche dati brevettuali e quelle citazionali.
I luoghi di produzione del sapere restano nella quasi totalità negli USA e in particolare nei campus
universitari.

Per tutto il periodo dell’online classico, la fatturazione delle banche dati dipendeva da:
- Costo di abbonamento annuale per una banca dati, per un pacchetto o per tutta l’offerta
informativa di uno specifico provider.
- Costo dei dati (se facilmente reperibili, se soggetti ad aggiornamento etc)
- Costo di connessione (prima del web di massa l’utente doveva pagare al produttore oltre
all’abbonamento fisso anche i costi di consumo)
- Costo di invio dei dati (dati a schermo, stampa, download, invio per posta)

La politica dell’Open Access si scaglia contro tale ripartizione e fatturazione delle spese e cerca invece di
allargare gli orizzonti e le prospettive di ritorno economico e benessere nazionale.

All’epoca dell’online classico, il principale provider di banche dati è stato Dialog (Burbank, Los Angeles). La
prima banca dati commissionata a Dialog è ERIC. Agli inizi degli anni Novanta, Dialog offriva più di 400
banche dati.
Anche in Europa e in Russia vi furono investimenti nelle banche dati, ma non abbastanza rilevanti,
soprattutto in termini di longevità (molte delle banche dati sono ormai cessate).
Nel 2008 Dialog viene acquistato dal colosso editoriale Thomson Reuters che provvede a un restyling delle
interfacce, dotando tutte le banche dati di un sistema di interrogazione comune denominato ProQuest.

Molti distributori hanno anche provveduto a distribuire off-line, su cd-rom, le banche dati. Attualmente le
banche dati vengono offerte ad alcune comunità scientifiche (prevalentemente università) in forma
“gratuita” tramite accesso da computer dotati di indirizzi IP fisicamente all’interno dell’ateneo
(l’abbonamento viene compensato dalle rette di iscrizione e dalle tasse per l’istruzione pubblica).

Con la diffusione del web i livelli di consapevolezza si confondono: tutto ciò che appare sullo schermo di un
computer sembra appartenere ad un’unica dimensione, con l’effetto che adesso sembra che tutto possa
essere trovato in rete e gratuitamente, ma così non è.

Tommaso Maria Lazzari (1982) apprezza il fatto che accedere online apre le porte a un modo totalmente
nuovo di intendere la diffusione della conoscenza. Nel suo libro inserisce consigli utili per un abbonamento
a Dialog e per l’utilizzo delle banche dati con grande attenzione all’aspetto economico.
In Italia la rete Itapac (della compagnia pubblica, SIP) verrà varata nel 1983. La SIP forniva su richiesta a
pagamento un numero telefonico apposito e un modem.

EPILOGO
“La condizione postmoderna. Rapporto sul sapere” (1984?) di Jean-François Lyotard ha tre identità: nasce
come rapporto tecnico, commissionato dal Consiglio universitario del Québec ma con la pubblicazione
diventa un’opera teorica che entra in relazione con la tradizione filosofica. Contiene la formulazione del
concetto di “postmoderno”. La terza identità è politica, è un pamphlet con lo scopo di chiamare alla lotta il
maggior numero di persone in difesa di un ambito del sapere (filosofia) in pericolo. La domanda che muove
il lavoro di Lyotard è cosa conferisca valore al sapere, alla fine degli anni Settanta. In tale contesto,
l’informatica interessa Lyotard in quanto espressione privilegiata della pragmatica del sapere
contemporaneo.

In Italia i mezzi informatici di trasmissione della conoscenza non erano materialmente diffusi. Di
conseguenza, dell’opera di Lyotard viene messo in evidenza il discorso filosofico e cancellato il riscontro
materiale. Viene pertanto generalmente omessa la parola banca dati che è invece fondamentale per
l’intera argomentazione. L’opera di Lyotard dimostra che per poter dire quale sia la condizione del sapere in
età postmoderna si deve necessariamente visualizzare il contesto, la realtà tecnologica più avanzata.

In conclusione, quel che ha legittimato le banche dati come Enciclopedia del domani è l’intero sistema
politico ed economico messo in atto dal secolo americano. Il prestigio costruito intorno alle università
americane garantisce la qualità della ricerca e a loro volta le banche dati, oggetto-simbolo della ricerca
statunitense, risultano perfino più affidabili dei sensi umani. Tuttavia, solo chi può permettersi tali
strumenti potrà produrre scienza di qualità, valida, e attraverso essa potrà legittimarsi. Quindi le banche
dati possono essere prodotte solo in particolari condizioni favorevoli, sia dal punto di vista scientifico, sia
economico, sia politico. In questo modo gli USA si assicurano ulteriore ricchezza. Solo il Movimento Open
Access, vent’anni dopo Lyotard, tenterà di riequilibrare questa situazione.

Solo quando il pubblico potrà avere libero accesso alle memorie ed alle banche di dati si potrà affermare
una politica in cui saranno ugualmente rispettati il desiderio di giustizia e quello di ignoto.

Potrebbero piacerti anche