Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INDICE
1. La Documentazione
1.1 Definizioni
1.2 Un unico termine e tanti materiali scrittori :il documento
1.3 Un po di storia.
1.4 Archivistica, Biblioteconomia e Documentazione
1.5 Scienze dellinformazione, Informatica e Documentazione
2. Dal documento allinformazione
2.1 Linguaggi formali e naturali
2.2 I Linguaggi di descrizione documentaria
2.3 Linguaggi Documentari: SGML
2.4 La Rappresentazione
3. La classificazione e lindicizzazione
3.1 Definizioni
3.2 Le opinioni: P. Otlet, B. Bonifacio, E. Casanova, G. Cencetti
3.3 La classificazione ideologica
3.4 La Classificazione sistematica
3.4 Quadro di classificazione
3.5 Il protocollo
3.6 Analisi concettuale
4. I Thesauri
4.1 Definizioni
4.2 La strutturazione del campo
4.3 Termini d'indicizzazione
4.4 Struttura semantica e formalizzazione delle relazioni
4.5 Classificazione a Faccette
5. Ontologie, mappe cognitive e web semantico
5.1 L ontologia come nuovo strumento per gestire la conoscenza
5.2 Definizioni di ontologia
5.3 Funzioni dellontologia
5.4 Le mappe cognitive
5.5 Metodologie di estensione delle mappe
5.6 Le mappe cognitive e lanalisi documentale
5.7 Il web semantico (semantic web)
1. La Documentazione
1.1 Definizioni
La documentazione si pone come obiettivo il far conoscere ci che stato fatto per poter
fare e, pertanto, le sue differenziate attivit si presentano al mondo esterno come comunicazione
di conoscenze offerte sotto forma di dati elaborati con rigorosi criteri e omogenee procedure1. In
unottica pi corretta sarebbe forse il caso di dire che lobiettivo quello di far conoscere ci che
e non solo ci che stato fatto giacch in una societ in frenetico divenire nella quale
lobsolescenza delle informazioni estremamente rapida , molto spesso, il presente a
rappresentare la base per lastrazione informativa necessaria al supporto decisionale.
Il punto primo di ogni disciplina, specie se applicativa, dovrebbe essere quello di presentare ai
possibili discenti le motivazioni dellutilit della stessa che, poi, un tuttuno con la sua stessa
ragion dessere. Tanto pi queste ragioni sono vicine alla esigenze ed ai bisogni della vita
quotidiana tanto pi la disciplina sar diffusa e permeer la vita di una societ civile2.
Una delle ragioni che sta alla base dello sviluppo esponenziale dellinformatica e della
telematica proprio quella di essere pervasiva della vita quotidiana; questo genera mercato e la
forza del mercato, lungi dal banalizzarla come temono alcuni - attrae investimenti e muove la
ricerca. Non sempre le scienze documentarie hanno posto attenzione a questi precetti anzi, pi
spesso, hanno goduto dellessere destinate ad un ristretto pubblico di specialisti.
Se ad esempio -
Acquisizione dellinformazione
(inserzioni, pubblicit, in giro per negozi),
Classificazione
( per tipo, colore),
P. BISOGNO, Presentazione a: M.P. CAROSELLA M. VALENTi (a cura di), Documentazione e Biblioteconomia, Milano 1987, p. 16.
On peut sinterroger sriusement savoir si certains spcialistes de la gestion de linformation administrative nont pas perdue de
vue, ou nont peut ^etre jamais eu en te^te les besoins rels de leurs clients et se sont, avec le temps, cantonns dans une approche
nombriliste qui les servait avant tout comme professionnels dun domaine mal circonscrit. M. ROBERGE, La Gestion de lInformation
Administrative, Quebc, 1992, p18.
3
Ai fini dellanalisi dei processi decisionali e della problematica di un parziale utilizzo delle informazioni da parte dei decisori nelle scelte
si veda: R.M. AXELROD, The Structure of decision: cognitive maps of political elites, Princeton, 1976.
2
Analisi costi/benefici,
Decisione
(acquisto)
estrapolassimo, conseguentemente, dalla realt quotidiana la valenza teorica, faremmo diventare
immediatamente evidente il concetto e avremo
disciplina e della sua pratica utilit in una pluralit di contesti non necessariamente specialistici.
Ogni giorno noi attuiamo numerose sequenze di Bisogno/Informazione/Decisione,
indipendentemente dallo specifico settore di attivit nel quale lavoriamo. Conoscere le metodologie
e le tecniche per far si che questa azione involontaria diventi un processo di qualit
estremamente utile a tutti coloro i quali svolgono una qualche forma di attivit relazionale e/o
decisionale.
Dovendo comunque se non altro per necessit didattiche -
possiamo dire che la documentazione quella disciplina che si occupa di indicizzare e classificare
documenti da essi estraendo, mediante opportuni procedimenti, le informazioni necessarie a
orientare la decisione.
grandezza fisica che assume valori continui, come le tracce su carta, le immagini su film, le
magnetizzazioni su nastro. 4
DOCUMENTO AMMINISTRATIVO ogni rappresentazione, comunque formata, del contenuto di
atti, anche interni, delle pubbliche amministrazioni o, comunque, utilizzati ai fini dell'attivit
amministrativa. Le relative modalit di trasmissione sono quelle indicate al capo II, sezione III, del
presente testo unico.5
1.1 Un po di storia.
Gran parte della concettualit della definizione si gioca, dunque, sulla valenza del termine
documento, che polisemico, e che, come diremo pi avanti, ha conosciuto una pluralit di
accezioni e di significati che stanno, in gran parte, alla base delle diversificazioni esistenti.
Comunque, partendo da una definizione della disciplina siffatta e volendo individuare una data di
origine, sarebbe fin troppo facile dire che essa, in quanto scienza della conoscenza, nata con la
scrittura o con la formalizzazione del parlato facendone, quindi, impropriamente, risalire lorigine ai
primi ideogrammi del VI millennio A. C. o ai grafismi geometrici del paleolitico superiore6, ma cos
non . Essa nasce, di fatto, quando si cristallizza la consapevolezza della necessit di strutturare
lorganizzazione della conoscenza in quanto la vastit delle stesse ne ha reso, di fatto, impossibile
una gestione non sistematica.
Sarebbe complesso e, forse, non del tutto utile, ricercare i punti di contatto e di discordanza
con la storia e levoluzione delle altre discipline documentarie, dallarchivistica7 alla biblioteconomia
alla bibliografia, la documentazione legata da una comunanza di origini; certo che se si vuole,
comunque, individuare una data di nascita essa , probabilmente, collocabile al 12 settembre
1895 con la fondazione, da parte di Henry Otlet ed Henry La Fontaine dell Istituto Internazionale
per la Bibliografia avente la finalit di catalogare e classificare i risultati delle ricerche. Nel 1931
lIstituto diventer poi Istituto Nazionale per la
Documentazione
DECRETO 23 gennaio 2004 del MINISTERO DELL'ECONOMIA E DELLE FINANZE, Modalita' di assolvimento degli obblighi fiscali
relativi ai documenti informatici ed alla loro riproduzione in diversi tipi di suppporto.
5
Testo unico delle disposizioni legislative e regolamentari in materia di documentazione amministrativa (Testo A). (Gazzetta Ufficiale n.
42 del 20 febbraio 2001, S.O. n. 30/L).
6
Per una storia della scrittura Cfr G.R. CARDONA, Storia Universale della Scrittura, Milano 1987
7
Per una storia dellArchivistica cfr. E. LODOLINI, Lineamenti di Storia dellArchivistica Italiana, Roma, 1991;
8
Cfr. M.W.HILL, FID, Passato, presente e futuro. Breve storia della federazione internazionale di informazione e documentazione dal
1895 al 1995 e oltre, in A. M. PACI (a cura di), La Documentazione in Italia, Milano, 1996, pp. 24-43.
9
G. PEIGNOT, Dictionnaire raisonn de Bibliologie, Paris, 1802
scientificamente
fondato
ed
autonomo
rispetto
alle
discipline
bibliografiche
10
il rappelle les recherches du suisse Rothlisberger qui le premier labore la statistique internationale des imprims dans le droit
dauteurIl rappelle les travaux thorique quil a raliss avec son disciple Iwinskiil rappelle les travaux du clbre chercheur russe
Roubakine sur la psychologie bibliologique, sur les rapports mentaux entre la pense des auteurs et celle des lecteurs qui devaient
aboutir a une thorie fonctionelle de la cration littraire et aux mthodes de propagande et de publicit R. ESTIVALS, Preface a
P. OTLET, Trait de Documentation, rist. 1988, p. IV.
11
La Classificazione decimale Dewey (in inglese Dewey Decimal Classification) appartiene al tipo di classificazione enciclopedica, cio
che deriva da un tentativo filosofico di sistematizzare lo scibile umano: intende fornire un sistema per organizzare un universo di cose,
siano esse oggetti, concetti o registrazioni , L. CROCETTI - D. DANESI, Classificazione decimale Dewey ED 20, Roma, Associazione
Italiana Biblioteche, 1993.
12
A. BALDAZZI, Le radici storiche della documentazione in Europa, in: A. M. PACI (a cura di), La Documentazione in Italia, Milano,
1996, p. 44.
13
D. VERNON TATE, Introducing, in: American Documentation, vol. 1, n. 1(1950)
14
P. OTLET, Rapport sur la Bibliographie, Rome, 1911
introduzione del principio tecnico e industriale della divisione del lavoro anche
nellorganizzazione del lavoro intellettuale
definizione della funzione autonoma della documentazione come centro di studio e ricerca
dellente.
In questa ottica di integrazione informativa vengono introdotti da Otlet due principi fondamentali
della nascente disciplina documentaria; essi sono alla base di operazioni gestionali davanguardia:
(primo fra tutti) il principio monografico che sostiene lelaborazione dei dossier (fascicoli); lunit
bibliografica che consente di estrapolare elementi semantici ed orientare in senso bibliografico
comunicativo
anche
larchivio
di
corrispondenza15.
Che
lindiscusso
fondatore
della
Documentazione, cui si deve anche il nome della disciplina, sia stato, culturalmente, il precursore
dei sistemi di gestione automatica delle informazioni lo si riscontra anche nella sua pervicace
volont di standardizzare i mezzi ed i sistemi di descrizione, come, ad esempio, la scheda
bibliotecaria adopte par certains bibliothcaires des Etats Unis .
verso i media diversi dal documento inteso nella sua pi stretta accezione giuridico formale ,
15
Ibidem p. 56
L. SANDRI, Il De Archivis di Baldassarre Bonifacio, in Notizie degli Archivi di Stato, X(1950), pp. 95-111... tuttavia queste notizie
frammentarie erano per state sufficienti a mettere in luce come ci siano state epoche nelle quali il vocabolo biblioteca stesse in realt
ad indicare un archivum, in quanto si cominciato col conservare i documenti fondamentali alla vita dello Stato e come sia avvenuto
solo in un secondo tempo la separazione tra il materiale da conservarsi in uno piuttosto che in un altro istituto(p.101).
17
Ibidem, p.102.
16
comunque, di sostanziale chiusura: Non neghiamo neppure che diano e daranno sempre
maggiore risalto alla fredda dicitura o narrazione dei documenti che gioveranno immensamente
alla futura storiografia. Ma, in verit, preferiamo il sistema italiano di farne cosa separata dagli
archivi: poich non hanno alcuno dei requisiti di questi istituti, non ne hanno la multipla finalit, e
savvicinano assai meglio alle biblioteche e ai musei che non agli archivi18. E lopinione che, dieci
anni pi tardi, sar ribadita e compiutamente espressa dal Concetti nel suo SullArchivio come
Universitas Rerum19 che qualifica la biblioteca come destinataria di universalit volontarie e
larchivio come custode di universalit necessarie. E il prevalere della concezione dei giuristi latini,
da Servio Mauro ad Ulpiano, per i quali larchivio il luogo privilegiato di conservazione degli atti
pubblici. E una concezione giuridico formale, consolidatasi nel Medioevo, alla quale estranea
qualunque apertura verso concettualit informative e cognitive restringendo il campo dazione alla
specificit giuridica e diplomatistica. Senza volersi qui addentrare in una spinosa disquisizione
sullo jus archiviale, peraltro compiutamente trattato da illustri autori,
proprio nella difficolt di garantire a quanto conservato in biblioteca la pienezza della fides che
invece era appannaggio di quanto custodito in archivio. Ci derivava, ovviamente, da una
concezione limitante di questultima tipologia di materiali sostanzialmente i soli atti pubblici e
motiva le ritrosie del Casanova di fronte a tipologie archivistiche per cos dire anomale. Ma
quando lanomalia di queste tipologie , di fatto, non pi esistente e quando anche la limitazione
formale della diversit mediale venuta meno con lavvento dei documenti post cartacei, quando
assume piena dignit una tipologia border line, come la letteratura grigia20, non libro e non
documento, forse anche la suddivisione rigida teorizzata in altri contesti in gran parte destituita di
fondamento e si pu quindi riparlare con le dovute puntualizzazioni scientifiche di unicit o
convergenza delle discipline documentarie pur nel rispetto delle singole specialit e specificit21.
Ci che fino a un decennio fa sembrava difficilmente praticabile, in alcuni casi quasi eretico,
assume oggi una luce diversa alla luce del mutato quadro normativo di riferimento che ha dato
piena validit alla documentazione post cartacea rendendo di fatto indipendente il contenuto
dal materiale scrittorio utilizzato.
18
Ibidem, p. 251.
G. CENCETTI, SullArchivio come Universitas Rerum, in: Archivi, anno IV(1937) pp. 7-13. I singoli componenti della universalit
biblioteca , i libri, oltre ad aver ciascuno la sua origine in un autore, un editore, un libraio che, di regola, sono diversi, hanno altres fine
proprio, raggiungibile con mezzi propri: hanno cio una propria autonomia originariaBen diversamente stanno le cose per ci che
riguarda larchivio. Qui i singoli componenti, le carte non solo provengono dal medesimo individuo, aggregato familiare o ente, ma
poich costituiscono nientaltro che uno fra i mezzi usati dallente o individuo per raggiungere i propri scopi, portano in loro stessi, fin
dallorigine, il vincolo della destinazione comune
20
Cfr W. ALBERANI, La Letteratura Grigia, Roma, 1992; In tal senso pi che il termine di letteratura grigia indicante la letteratura non
convenzionale - esplicativo quello di Ephemeral materials usato negli Stati Uniti che identifica qualunque tipologia documentale
transeunte e non convenzionale.
21
Da pi parti, ormai, nella letteratura specializzata, si fa strada lidea della collaborazione tra le varie discipline documentarie specie in
presenza di massicce innovazioni tecnologiche. Cfr T. GIORDANO, Futuro No problem. Convergenza tecnologica e patrimonio
culturale, AIB-Web, n. 4 (1999); M. GUERCIO, Rischi e promesse dellinnovazione tecnologica. I conservatori del patrimonio
documentario e la cooperazione fra archivisti e bibliotecari, AIB-Web, n. 2 (2001).
19
di una
stretta interdipendenza di tali scienze da una pluralit di altri apporti disciplinari, dalla linguistica
alla psicologia cognitiva, alla tecnologia, la quale ultima vissuta con una forte accentuazione
strumentale. Partendo proprio dalla necessariet dellinterazione multipla ed utilizzando la teoria
del Piaget23 Ingwersen elabora la mappa epistemologica delle interconnessioni delle scienze
dellinformazione.
Al
livello
superiore,
che
chiama
dellinterdisciplinariet,
colloca
la
comunicazione, le scienze cognitive e le scienze dei sistemi; al livello inferiore o livello applicato,
situa la documentazione e la biblioteconomia ; al livello intermedio, di transizione o disciplinare,
trovano posto la psicologia, la linguistica, la scienza dellinformazione, la sociologia, la scienza dei
computer. Allinterno della rete generale, la scienza dellinformazione ha una sua specificit di link
con il livello transdisciplinare e con le discipline della documentazione e della biblioteconomia24.
Se oggetto delle scienze dellinformazione , quindi, lo studio di un processo, mentre la
documentazione e le scienze documentali studiano un oggetto: il documento, una differenziazione
sembrerebbe individuabile proprio nella diversificazione dellambito di interesse.
Daltronde lo si vede bene attraverso le formule. Le une difendono loggetto documento e/o
sinteressano al sistema tecnico (specifiche di un mestiere) mentre le altre vantano il dispositivo
persona o il sistema sociale (quadro di ricerca). Donde le divergenze di punti di vista sulla
formazione universitaria. Donde le incomprensioni reciproche sulla certificazione. Donde
lincompatibilit del contenuto tra rivista professionale e rivista scientifica..25.
22
Cfr H. FONDIN, La Scienza dellInformazione : postura epistemologica e specificit disciplinare, in AIDA Informazioni, anno 20, n.
1(gennaio marzo 2002), pp. 5-24.
23
J. PIAGET, Lpistemologie des relations interdisciplinaires, in : LInterdisciplinariet : problemes denseignement et de recherche
dans les universits, Paris, 1972 ;
24
A . BALDAZZI, Le scienze dellinformazione e le teorie della transizione, in AIDA Informazioni, anno 20, n. 1(gennaio marzo 2002),
p. 28.
Laccezione dellinformatica come strumentale alla scienza dellinformazione non ne totalmente accettata n condivisa tanto che il
sistema informatico , comunemente, considerato quella parte del sistema informativo in cui le informazioni sono raccolte, elaborate,
archiviate, scambiate mediante luso delle tecnologie dellinformazione e della comunicazione, concependolo quindi come una
evoluzione e non come una applicazione tecnologica. C. BATINI, B. PERNICI, G. SANTUCCI, Sistemi Informativi, Milano 2001, vol. 1,
p. 20.
25
Ibidem, p. 16.
una ulteriore
commistione allorquando Claire Guinchat e Michel Menou parlano, nel manuale edito dallUnesco,
di sciences et techniques de linformation et de la documentation26 si sforzano di trovare una
differenziazione concettuale tra il mestiere dellinformatico e le scienze dellinformazione e non gi
tra queste e la documentazione.
Certes la ligne de dmarcation existant entre le deux disciplines est aujordhui mal tablie,
mais le mtiers de linformation de demain ne passent pas seulement par le voies de
linformatique. Des nombreuses facettes du mtier chappent totalement lordinateur 27,
concludendo infine che Tous ces mtiers refletnt dans ces appellations diffrents le
dynamisme dune unique profession : celle de spcialiste du transfert de linformation .
Sicuramente in queste affermazioni hanno un peso rilevante i condizionamenti e le
esperienze personali degli autori non sempre assimilabili a quelle europee o nordamericane, ma,
il concetto di base che, esistendo ununica catena documentale che, partendo dai documenti da
trattare genera, alla fine, dei prodotti di varia complessit, le scienze dellinformazione e le scienze
documentarie si differenziano solo per loccuparsi di momenti diversi dello stesso processo non
potendosi, in nessun modo, scindere processo ed oggetto del processo mentre linformatica ha un
valore puramente tecnologico e strumentale 28.
Se complesso e controverso il rapporto tra le scienze documentarie e le scienze
dellinformazione, pi semplice si presentato almeno concettualmente - quello con linformatica
che era, in effetti, un falso problema.
nellultimo decennio, in molti casi, linformatica era vissuta ed applicata come un semplice
strumento tecnologico e non modificava, se non marginalmente, le concettualit delle discipline
oggetto dellapplicazione. Purtroppo, per decenni, anche in Italia, linformatica e le scienze
dellinformazione sono risultati quasi sinonimi sia nel senso comune che ancora pi grave
nella produzione legislativa. Il valore legale del documento elettronico e la gestione totalmente
non cartacea del ciclo di vita hanno radicalmente cambiato le cose sfumando ulteriormente le
polisemie a volte isteriche del termine documento obbligando ad una non pi procrastinabile
ridefinizione concettuale e avviando la realizzazione di un unico oggetto informativo, risultato
virtuale e transeunte della query estemporanea la cui durata corrisponde al ciclo di
dellinformazione cui si riferisce.
vita
C. GUINCHAT M. MENOU, Introduction gnrale aux sciences et techniques de linformation et de la documentation, Paris, 1990 ;
Ibidem, p. 518
28
A la multiplication et la diversification des utilisateurs rpond celle des services et produits fournis. La prolifration des termes qui
dsignent les diverses units dinformation (bibliothques, archives, bibliothques spcialises, centres ou services de documentation,
centre ou services danalyse, services de liaison, banques de donnes, bases de donnes, mdiatheques, services dorientation,
services de compilation des donnes, ecc.) traduit la richesse des possibilits dinformation documentaire. En fait, ces diverses units
se diffrencient rciproquement par laspect de la chaine documentaire suelles traitent en priorit C. GUINCHAT M. MENOU,
Introduction gnrale cit, , p. 31.
27
10
alimentare il web. Il controllo strategico dei contenuti e la loro fruizione e gestione diventato il
vero core business degli ultimi anni.
Lirrompere prepotente delle ICT ha tra laltro e conseguentemente - spostato lasse di
interesse dalla conservazione del supporto materiale, del quale la fruizione era un atto necessario
ma conseguente, alla gestione dei contenuti laddove la conservazione delloggetto tangibile
scindibile dalla fruizione. La scelta, operata da alcuni istituti di conservazione, dallo Smithsonian
Institute agli Archivi Nazionali del Canada29, di conservare i documenti su supporto fotografico e
di utilizzare il digitale per lattivit corrente non obbedisce solo ad una logica funzionale ma una
precisa scelta culturale che, separando i due momenti, consegna i contenuti
al mercato
29
Cfr P. Z. ALDESTEIN, La Permanence de linformation numrique, in Accs linformation questions de prservation, CITRA,
XXXIV, (1999), pp. 146-156.
11
Esempio: si consideri una scacchiera nella quale siano state rimosse due caselle agli angoli
opposti. Lobiettivo quello di riempire le rimanenti caselle con le tessere del domino, ognuna delle
quali copre due quadrati, senza sovrapposizioni e senza uscire dai limiti della scacchiera.
Rappresentazione (a): per risolvere il problema posso enumerare tutte le disposizioni e vedere se
una di esse corretta
Rappresentazione (b): evidenzia che ciascuna tessera del domino copre sempre una casella
bianca e una nera.
Rappresentazione (b) + informazione (c): evidenzia che il problema non ha soluzione.
12
potenza espressiva: capacit di esprimere in modo completo vari domini di conoscenza con
differenti caratteristiche;
L indicizzazione, le ontologie, le mappe cognitive e il web semantico sono strumenti che ben si
prestano per una corretta rappresentazione della conoscenza.
linguaggi naturali, utilizzati nella comunicazione quotidiana tra gli esseri umani, privi di una
definizione rigorosa ed in continua evoluzione; spesso presentano ambiguit ma hanno
enorme potenza espressiva;
linguaggi formali, creati dalluomo per scopi precisi, secondo regole convenzionali esplicite
che non ammettono eccezioni e non consentono sinonimi e omonimie. Il significato di una
13
Ambiguit : i linguaggi naturali ne sono pieni ed il significato viene ottenuto anche grazie ad
indizi ricavati dal contesto. I linguaggi formali sono progettati per essere completamente
non ambigui e ci significa che ciascuna dichiarazione ha esattamente un significato,
indipendente dal contesto.
Anche se siamo cresciuti apprendendo un linguaggio naturale, la nostra lingua madre, spesso
abbiamo difficolt ad adattarci ai linguaggi formali. In un certo senso la differenza tra linguaggi
naturali e formali come quella esistente tra poesia e prosa, ma in misura decisamente pi
evidente:
14
Poesia - le parole sono usate tanto per il loro suono che per il loro significato, e la poesia nel suo
complesso crea un effetto o una risposta emotiva. L'ambiguit non solo frequente, ma spesso
addirittura cercata.
Prosa - il significato delle parole estremamente importante, con la struttura che contribuisce a
fornire maggior significato. La prosa pu essere soggetta ad analisi pi facilmente della poesia, ma
pu risultare ancora ambigua.
I linguaggi formali sono molto pi ricchi di significato dei linguaggi naturali, cos
necessario pi tempo per leggerli e comprenderli. La struttura dei linguaggi formali molto
importante e solitamente non una buona idea leggerli dall'alto in basso, da sinistra a destra,
come avviene per un testo letterario: importante analizzare il programma nella tua testa,
identificandone i token ed interpretandone la struttura.
I dettagli sono importanti: piccole cose come errori di ortografia e cattiva punteggiatura sono
spesso trascurabili nei linguaggi naturali, ma possono fare una gran differenza in quelli formali.
15
Nel campo dei cosiddetti linguaggi documentari" possibile distinguere due grandi insiemi,
entrambi normati a pi riprese dal ISO. Il primo, per molti versi prototipale, riguarda
essenzialmente i Thesauri (che tratteremo compiutamente nel capitolo successivo) e quindi la
terminologia ed i rapporti gerarchici intercorrenti tra le variabili terminologiche e semantiche della
descrizione della realt capaci di produrre una artificiale rappresentazione dei concetti presenti, in
linguaggio libero, nei documenti esaminati.
La norma ISO 2788 - 1986 definisce il thesaurus come "vocabolario di un linguaggio di
indicizzazione controllato e formalizzato in modo da rendere esplicite le relazioni a priori tra i
termini", in ci parzialmente discostandosi dalla precedente stesura della stessa norma (27881974) che statuiva la possibilit di definire il thesaurus sia secondo la funzione che secondo la
struttura accentuando cos, in un certo senso, la funzionalit dello stesso come strumento per il
recupero dell'informazione; possibilit che invece sottesa ma non espressa nella pi concisa
formulazione successiva. All'indicizzazione e ai thesauri multilingue l' ISO dedica inoltre due
specifiche norme: la 5963-1985 e la 5964-1985.
Al secondo gruppo di linguaggi documentari appartengono invece quelli che pi che delle
relazioni linguistiche e semantiche si occupano della strutturazione e della descrizione formale del
documento e delle sue parti, specificatamente in relazione ai documenti in formato elettronico.
Lo standard ISO 88799 definisce le caratteristiche di un linguaggio di marcatura del testo
denominato SGML (Standard Generalized Mark-up Language) capace di descrivere la struttura e
gestire il contenuto di qualunque documento elettronico, prescindendo dalle restrizioni imposte
dalla diversit dei software applicativi e dei sistemi operativi utilizzati.
SGML permette di gestire il documento strutturato indipendentemente dal suo stile visuale
e dal sistema software utilizzato per scriverlo, in quanto del testo, suddiviso in tags logiche
dichiarate in una DTD (Docurnent Tyype Definition), esso vede i legami logici e contenutistici. Il
documento stesso potr poi essere visualizzato in forme e stili diversi a seconda dei viewer
utilizzati ma sempre obbedendo rigidamente alle regole strutturali definite. Per esempio se la DTD
dichiara che la sezione titolo viene dopo la sezione capitolo e non dopo la sezione paragrafo,
nessuna altra sequenza gerarchica sar ammessa se non preliminarmente modificando la DTD.
Facendo riferimento alla figura che segue, e semplificando il modello reale, la Divina Commedia ad esempio - composta da terzine e versi precedute dal titolo. Questi sono gli elementi strutturali
che compongono un tipico poema in versi. Questo struttura viene recepita dall' SGML come
segue:
16
<POEMA lingua=italiano>
<TITOLOPOEMA >
Divina Commedia
Nel mezzo del cammin di nostra </TITOLOPOEMA >
vita
<GRAFICA entit=selva_oscura>
<TERZINA>
<VERSO>
Nel mezzo del cammin di nostra vita </VERSO>
<VERSO>
mi ritrovai per una selva oscura </VERSO>
<VERSO>
che la diritta via era smarrita </VERSO>
</TERZINA>
<- altre terzine -->
</POEMA>
Nella parte sinistra della tabella viene indicata una possibile visualizzazione della divina commedia
mentre nella parte destra riportata la corrispondente istanza SGML che corrisponde al
documento. Come si pu notare ogni elemento documentale e racchiuso tra due "tag" che
definiscono il contenuto logico dell'elemento. Ad esempio la stringa "Divina Commedia"
contenuta all'Interno delle due "tag" <TITOLOPOEMA> </TITOLOPOEMA > che identificano e
limitano il titolo del poema.
Si noti come un attributo del poema specifichi che si tratta di un poema in lingua Italiana.
Viene anche definito un elemento <GRAFICA> il cui attributo permette di identificare una entit
grafica esterna.
Il corrispondente modello documentale, definito per l'appunto in linguaggio SGML :
< !DOCTYPE POEMA- questa e' una DTD[<!ELEMENT POEMA - (GRAFICA,TITOLOPOEMA,TERZINA+)>
<!ATTLIST POEMA lingua (italianolfranceselinglese) "italiano">
<!ELEMENT GRAFICA EMPTY>
<!ATTLIST GRAFICA entit CDATA #REQUIRED>
<!ELEMENT TITOLOPOEMA - (#PCDATA)>
<IELEMENT TERZINA - (VERSO,VERSO,VERSO)>
<!ELEMENT VERSO -0 (#PCDATA)>
]>
17
In questo semplice modello si pu notare come vengano definiti gli elementi poema, titolo del
poema, grafica, terzina e verso. Vengono inoltre definiti l'attributo lingua (relativo a poema) ed il
nome del file grafico da inserire dopo il titolo.
Il modello appena definito la "DTD" (Document Type Definition); e corrisponde alla struttura della
base dati nei data base relazionali.
Non si pu per parlare di SGML se non si introduce anche il concetto di stile.
Nell'esempio precedente il titolo della Divina Commedia era "Courier New centrato, grassetto,
corpo 18" mentre i versi erano "Courier New, italico, corpo 10". Nulla nella struttura SGML avrebbe
vietato di fare assolutamente il contrario o addirittura a mostrare il solo titolo e non i versi.
Avremmo solo applicato delle regole di visualizzazione diverse (stili) alla stessa istanza SGML.
Questa caratteristica di fondamentale importanza, e permette di applicare il concetto di
"report=stile" ai dati di tipo documentale.
Ad esempio un utente potrebbe decidere di utilizzare uno stile che non mostri le figure,
magari al fine di velocizzare la visualizzazione su un computer privo di capacit grafiche, e un
utente cieco potrebbe decidere si trasformare l'istanza SGML in caratteri Braille.
Il concetto di stile non si limita per alle sole caratteristiche editoriali, ma permette di
arrivare a sofisticatissime integrazioni tra il documento ed il processo cui il documento si riferisce
(manutenzioni automatiche, processi semiautomatici di controllo, etc..).
Anche le ISAD(G), norme internazionali di descrizione archivistica adottate dal Conseil
International des Archives e finalizzate ad assurer la creation de descriptions uniformes,
pertinentes et explicites; de faciliter le reprage et la communication d'informations sur les
documents d'archives ; de permettre l'echange de vedettesautorits, et de rendre possible
l'intgration de descriptions provenant de piusieurs depots dans un systme d'infor-mation unifi,
definiscono una struttura formale di descrizione delle unit archivistiche individuando degli
elementi determinati capaci, nella loro combinazione, di descrivere ogni unit documentaria e
precisando, contestualmente, una struttura formale all'interno della quale collocare gli elementi
individuati.
"Les rgles suiveni une structure que l'or prconise pour toute description incorporant les lments
rgis par les rgles. A l'intrieur de cette struclure, les lments sont regroups en cinq zones
d'in!ormation qui comprennent:
La zone d'identification
Tra la DTD di un documento SGML finalizzata alla definizione formale delle parti di un testo
elettronico e le zone di informazione delle ISAD(G) non esiste opposizione concettuale, ma bens
18
ravvisabile una convergenza sia sulle basi teoriche della strutturazione normalizzata della
conoscenza che sulle regole pratiche di standardizzazione e normalizzazione, con la semplice
diversit accessoria del target di destinazione, esclusivamente elettronico per gli uni e
multisupporto per gli altri. Nulla vieta di creare una DTD conforme alle ISAD(G). sia nelle aree di
informazione che negli elementi descrittivi, vincolando come obbligatori - ad esempio - i cinque
elementi considerati inizialmente come essenziali e generando, cos, un documento elettronico che
unisca il rigore descrittivo alla piena portabilit e diffusione su Web, ed i cui elementi informativi
possano - infine - essere tranquillamente parte di un thesaurus specializzato. E la diversit (dei
supporti, dei target di destinazione, degli ausili tecnologici e dei retaggi delle singole disciplina che
genera, a volte, delle partizioni che non hanno ragion d'essere se non nella piena e corretta
definizione dei compiti di ognuno. Tutto deve concorrere, per, al raggiungimento di un risultato
comune cos come avviene in molte altre branche della scienza nelle quali le singole specialistiche
convergono verso l'unicit dell'oggetto di studio. L'idea di questa sinergia anche alla base della
creazione delle Encoded Archival Description (EAD) DTD SGML per la descrizione documentale
sviluppate dalla University of California e accettate nel 1998 dalla Society of American Archivist30.
30
J. D. DOOLEY, Encoded Archival Description: context, theoy, and case studies, SAA, Chicago, 1998.
19
3. La classificazione e lindicizzazione
3.1 Definizioni
Indicizzazione
classificazione
sono
stati,
finora,
momenti
quasi
antitetici
di
organizzazione della conoscenza allinterno delle scienze documentarie giocati sul filo della
polisemia del termine documento. Oggi il tradizionale dualismo Indicizzazione/Classificazione va
rivisitato alla luce dei nuovi supporti scrittori e della validit dei nuovi media, aprendo cos singolari
ed affascinanti possibilit di integrazione interdisciplinare. Tradizionalmente la classificazione
riguarda lunit documentaria e lindicizzazione il suo contenuto informativo.
Lattivit di indicizzazione, definita nella norma ISO 5963/85 come linsieme delle
procedure necessarie per lanalisi dei documenti, la determinazione del loro contenuto e
lindividuazione dei termini di indicizzazione; essa si configura
Con il termine classificazione si definiscono attivit connesse alla categorizzazione sia del
materiale bibliografico che di quello pi specificatamente archivistico. Nella concezione di H.
Lafontaine e P. Otlet, che rielaborarono la classificazione decimale di Melvil Dewey, non vi erano
limiti di applicazione del sistema giacch si trattava di classificazione del sapere e dei risultati delle
ricerche e non gi di questa o quella tipologia di materiali.
Lintento primo di Otlet come gi precedentemente accennato - era quello della classificazione
del sapere scritto e, per questo si orient immediatamente verso la Classificazione Decimale
Dewey, in quanto riteneva potesse essere uno strumento funzionale al progetto di
categorizzazione universale della conoscenza. Pur se lo strumento utilizzato
apparentava la
31
20
Lintento di Otlet era quello di una rationalisation du livre et du document, la costituzione di una
unit documentaria/cognitiva primaria formata da libri e documenti, ognuno con la sua valenza e la
sua carica di informazioni e di specificit.
Nel 1953 la Commissione sulla Riforma della Pubblica Amministrazione propone una
classificazione ideologica. Essa prende in considerazione per unit di misura la divisione
ministeriale quale unit mobile da sistemare come si vuole e si deve, senza toccare gli atti che la
compongono, come le unit di un esercito che si muovono, si raggruppano, si spostano, senza far
loro perdere n forze n aspetto.
Esempio:
I Archivio segreto, atti riservati di Stato, ecc.
II Legislazione
III Organizzazione Giudiziaria
IV Organizzazione Amministrativa
A. Interna
B. Estera
C. Finanziaria
D. .
V Organizzazione militare
VI - .
32
A. BALDAZZI, Le radici storiche della documentazione in Europa, in: A. M. PACI (a cura di), La Documentazione in Italia, Milano,
1996, p. 44.
33
B. CROCE, La storia come pensiero e come azione, Bari 1943, p. 109
21
Questo sistema, previsto per lArchivio Centrale dello Stato e mai compiutamente attuato, si
ispirava a criteri molto vicini alla classificazione decimale universale e lasciava aperto ed irrisolto il
problema della classificazione interna dei singoli fondi nonch degli archivi correnti in quanto
postulava il concetto di archivio divisionale o ministeriale come unit archivistica primaria o livello
divisionale primario.
22
presidi ospedalieri,
g) dipartimento di prevenzione,
h) ex laboratorio di igiene e profilassi,
i)
gestioni liquidatorie.
3.5 Il protocollo
La classificazione, quale punto di avvio dellordinamento, dovrebbe avvenire gi al
momento della protocollazione degli atti.
In tal senso si esprimono gi nel 1806 - le Istruzioni ai vice Prefetti del Regno d'Italia che, nel
prescrivere l'obbligatoriet del registro di protocollo per tutte le Pubbliche Amministrazioni, legano
quest'obbligo, per la prima volta, alla necessit di correlare l'indice numerico ad un sistema di
classificazione capace di consentire la collocazione degli atti in un reticolo fisico/logico che, oltre a
categorizzare il sapere, permettesse, praticamente, il recupero delle unit documentarie:
La decima (colonna del protocollo) contiene le annotazioni per trovare le carte riposte in archivio:
essa suddivisa in due. Nella prima si marca il titolo, o sia la materia a cui appartiene la carta;
nella seconda il numero di fascicolo Perch l'archivio riunisca il doppio scopo di conservare con
sicurezza le carte e di offrire il modo di rinvenirle prontamente, vi saranno esse distinte per
materia. Ogni materia sar collocata in archivio per ordine alfabetico , cominciando da un punto
della camera e proseguendo gradatamente. Sul dorso di ciascuna cartella sar scritto il titolo della
materia , per esempio censo, acqua, strade, amministrazione dei comuni, imposta distrettuale,
ecc.34.
34
Istruzioni del Ministero degli Interni ai viceprefetti del Regno d'Italia, n. 16046 del 1 gennaio 1806.
23
Tutte le disposizioni ed i regolamenti dello Stato unitario hanno poi ripreso e confermato
quest'indirizzo ponendo l'accento proprio sulla necessit del recupero del documento come
supporto all'azione amministrativa anche se, nel 1894, Enrico De Paoli, soprintendente
dellArchivio di Stato di Roma, afferma che per quasi tutti gli uffici gli atti si registrano, si
dispongono, si conservano secondo che piace al protocollista; e le faccende di archivio sono
credute troppo umili perch il capo dellufficio debba mai occuparsene.35
L'azione classificatoria obbedisce quindi ad una duplice esigenza e finalit. Una necessit di
strutturazione del sapere ed una necessit di rinvenimento materiale degli atti del quale la prima
attivit la necessaria premessa metodologica. ovvio che sulla valenza centrale di questo tipo di
attivit ha influito, in maniera massiccia, la fisicit obbligatoria del documento che, fino al 1990, con
l'emanazione della L. 241 era, indissolubilmente, legata alla carta. Con le modificazioni introdotte
dall'art. 22 della citata L. 241/90, la successiva piena accettazione del documento informatico con
il Decreto Legislativo n. 39 del 1993 e la sanzione esplicita dell'art. 2 del D.P.R. 513 del 1997, la
liberalizzazione e delocalizzazione del supporto scrittorio ha profondamente minato la ratio stessa
della classificazione, non pi condizione necessaria per un recupero logico di elementi informativi.
Se il documento diventa di fatto - un insieme di unit informative che, virtualmente, vengono
assemblate in funzione delle chiavi ricerca o delle query dell'utente, ci che rilevante ai fini del
recupero dell'informazione la significativit semantica e non la strutturazione formale di una
griglia determinata a priori. Se la finalit del nostro precedere recuperare informazione perch,
opportunamente elaborata, diventi parte del nostro patrimonio cognitivo supportando cos l'attivit
dei decisori dell'amministrazione generando nuova conoscenza, ci che rilevante, in ambito
digitale, non pi o non solo la classificazione ma bens l'indicizzazione. Che poi questa prenda
il nome che pi le proprio o venga variamente definita secondo accezioni grammaticali
maggiormente appetibili al pubblico dei media moderni irrilevante in genere e, tanto pi al nostro
procedere, che pretende solo di essere uno spunto di riflessione teorica ed una provocazione
sull'argomento.
Ci non significa negare il vincolo archivistico, legame inscindibile di causalit che d senso e
significato alle unit documentarie ma, bens, prendere coscienza che questo, teorizzato in
un'epoca di unicit del supporto scrittorio, deve necessariamente essere rivisto e rivisitato in
conseguenza della profonda modificazione del contesto culturale e giuridico-amministrativo di
riferimento e che quindi, conseguentemente, la sua validit nell'attuale accezione
cronologicamente delimitata e determinata.
35
Relazione pubblicata in appendice a E. CALIFANO, Gli Archivi correnti dei Ministeri, in Amministrazione Civile, nn. 47/51 (1961).
24
Norma UNI ISO 5963/1985 Metodi per l'analisi dei documenti, la determinazione del loro
soggetto e la selezione dei termini di indicizzazione
(sintesi)
25
26
la specificit, che riguarda l'esattezza con cui un particolare concetto specificato dal
linguaggio d'indicizzazione. I concetti dovrebbero essere identificati il pi specificamente
possibile, fatta eccezione per i casi in cui l'eccessiva specificit possa influenzare
negativamente le prestazioni del sistema d'indicizzazione.
Giunto alla fase della traduzione dei concetti nei termini del linguaggio d'indicizzazione,
l'indicizzatore dovrebbe:
In una situazione ideale, termini assegnati e livello di esaustivit raggiunto dovrebbero essere
coerenti indipendentemente dall'indicizzatore, e rimanere tendenzialmente stabili nel tempo.
L'indicizzatore dovrebbe essere dotato di imparzialit, oggettivit, di una conoscenza adeguata
dell'area coperta dai documenti e delle lingue in cui i documenti sono scritti. Sarebbe bene anche
che avesse momenti di contatto diretto con gli utenti per verificare sul campo l'efficacia
27
28
4. I Thesauri
4.1Definizioni
Il thesaurus un vocabolario di un "linguaggio di indicizzazione" controllato, organizzato
in maniera formale, in maniera cio da rendere esplicite le relazioni "a priori" fra i concetti37.
Il thesaurus un insieme di parole e frasi che rappresentano relazioni di equivalenza e
associative che forniscono un vocabolario standardizzato per sistemi di archiviazione e recupero
dei documenti38.Esso uno strumento basilare per trasformare le idee in parole39., nonch uno
strumento
di
controllo
terminologico
nei
sistemi
postcoordinati40.
In termini di funzione uno strumento terminologico usato per tradurre il linguaggio naturale dei
documenti, degli indicizzatori o degli utenti in un linguaggio di sistema, pi strutturato, detto anche
linguaggio documentario o linguaggio di informazione. In termini di struttura un vocabolario
controllato e dinamico di termini semanticamente correlati che coprono un determinato ambito
disciplinare41.
L'ANSI42 non cita le relazioni gerarchiche, non chiarisce che le relazioni investono i concetti
rappresentati dai termini e non i termini stessi, pone l'accento sullo scopo di archiviazione e
recupero;
Il cosiddetto Thesaurus del Roget, che viene considerato lantenato dei moderni thesauri anche se,
in effetti, un dizionario tematico di sinonimi, contrari, ecc., ad uso di giornalisti, pubblicisti, scrittori
ecc., enuclea il problema principe non solo dei thesauru ma di qualsiasi sistema di indicizzazione,
cio
la
rappresentazione
dei
concetti
attraverso
codici
linguistici;
Ad oggi, comunque, la definizione vigente di thesaurus quella data nel 1986 dallo standard ISO
2788. La norma circoscrive innanzi tutto il thesaurus alla sola parte lessicale (semantica) di un
linguaggio d'indicizzazione e di ricerca, al quale, onde ottenere un codice documentario completo,
va abbinato il corpus di norme (sintassi) che regolano i rapporti sintagmatici tra gli elementi di un
enunciato di soggetto (che esprime quindi rapporti fra termini non aprioristici ma dipendenti dal
documento, ad es. l'ordine di citazione dei termini, l'impiego di simboli esprimenti determinate
relazioni, gli accorgimenti tipografici o la punteggiatura fra i termini, e cos via). Questo
"vocabolario" alfabetico in quanto adopera termini che, bench sottoposti a controllo,
appartengono al pi vasto insieme della lingua naturale, a differenza degli schemi di
classificazione, detti artificiali puri, nei quali i concetti sono rappresentati da notazioni numeriche o
alfanumeriche non portatrici di significato se non all'interno del proprio stesso sistema. Il concetto
di controllo si traduce, invece, in un requisito fondamentale volto a garantire l'incontro fra lessico
37
Guidelines for the establishment and development of monolingual thesauri. ISO (International Organization for Standardization),
2788/1986; trad. it. UNI/ISO 2788: 1993. Linee guida per la costruzione e lo sviluppo di thesauri monolingue.
38
Guidelines for thesaurus structure, construction and use. ANSI (American National Standard Institute), Z39.19-1974
39
Roget's International Thesaurus, 1977 (1. ed. 1852)
40
F.W. LANCASTER, Vocabulary control for information retrieval, 1972
41
ISO 2788/1974
42
ANSI: American National Standard Institute <www.ansi.org>
29
dell'indicizzatore e lessico del ricercatore, e cio la relazione biunivoca fra termine e concetto, fra
significante e significato: ci significa che in un thesaurus un termine esprime sempre uno ed un
solo concetto, e che un concetto sempre espresso da uno ed un solo termine. Poich questa
condizione tutt'altro che vera nel linguaggio naturale, affetto da ridondanze, ambiguit, polisemie,
omonimie, omografie ed altre specificit che ne garantiscono ricchezza ed espressivit, il
raggiungimento del controllo, cio dell'univocit semantica, nella costruzione e manutenzione del
thesaurus comporta due tipi di accorgimenti:
1. la raccolta e la collazione dei sinonimi, dei quasi sinonimi (cio termini non sinonimi in
senso proprio, ma considerabili tali ai fini della rappresentazione dei concetti dell'ambito
coperto dal thesaurus) e degli antonimi (cio degli opposti, o meglio dei termini collocati in
diversi punti dello stesso continuum semantico: non solo calore e freddo, ma anche tepore,
fresco e cos via) atti a descrivere il medesimo concetto e la scelta di uno solo di questi
termini: il termine prescelto diventa nel vocabolario termine preferito, TP (o PT, preferred
term), descrittore, cio termine abilitato a descrivere quel determinato concetto; tutti gli altri
termini (termini non preferiti, NPT, non descrittori), che non possono essere assegnati ai
documenti per esprimerne il contenuto concettuale, possono per vantaggiosamente
entrare nel vocabolario controllato come punti di accesso che rinviano al termine preferito;
2. la riduzione del contenuto semantico del termine preferito ad un solo significato, di solito il
pi tipico nell'ambito disciplinare del thesaurus per cui ad esempio in un thesaurus di
ornitologia il termine gru esprimer il concetto corrispondente all'"uccello dei Ralliformi" e
non alla "macchina dal braccio girevole per sollevare pesi", n al "carrello mobile per
riprese cinematografiche".
La definizione dello standard ISO 2788 pone inoltre in rilievo i due elementi strutturali
fondamentali:
1. che le relazioni da esso esplicitate sono formalizzate, cio che le relazioni fra i termini sono
definite da una relazione esplicita e formalizzata; questo significa che ogni termine
inserito in una rete relazionale che ne chiarisce ulteriormente il contenuto semantico, e che
mostra la distanza semantica fra i termini stessi;
2. che le relazioni trattate sono a priori, cio sono relazioni che appartengono all'ambito
semantico, del significato, dei termini, e pertanto sono sempre valide in qualsiasi contesto.
30
Nota dambito
SN
Termine preferito
USE
UF
Top term
TT
Termine generico
BT
BTG
BTP
Termine specifico
NT
NTG
NTP
31
dei
sottocampi
senza
categorizzarli
privi
di
informazioni
semantiche,
mentre nella CLASSIFICAZIONE PER FACCETTE una suddivisione esclusiva per faccette in un
campo complesso fa perdere articolazioni e specificazioni concretamente presenti nellesperienza
dellutente.
4.3 Termini d'indicizzazione
I concetti rappresentati dai termini di un thesaurus possono appartenere a diverse
categorie:
a. entit concrete
1. oggetti e loro parti fisiche
2. materiali
b. entit astratte
1. azioni e avvenimenti
2. entit astratte e propriet degli oggetti, dei materiali o delle azioni
3. discipline o scienze
4. unit di misura
c. entit individuali o "classi di uno" analoghe a nomi propri.
In fase di costruzione del thesaurus di fondamentale importanza il controllo dell'appartenenza dei
termini a queste categorie, poich esse possono influenzare determinate procedure, come ad
esempio la scelta del plurale o del singolare, o verificare la validit delle gerarchie (ad es.:non pu
esistere rapporto gerarchico fra termini appartenenti a categorie diverse).
32
mentre il rapporto reciproco, cio la segnalazione dei TNP nel corredo semantico (o blocco-parola)
del TP indicato dal simbolo UF:
Aerografo
UF Pistola a spruzzo
33
sideremia
USE Ferro AND Sangue
e:
Sangue
UF+ sideremia
All'interno della relazione di preferenza univoca distinguiamo ancora i due casi di:
1. sinonimia assoluta o accentuata
2. sinonimia relativa e convenzionale
Il primo si verifica se, indipendentemente dall'area semantica, dal grado di analiticit del thesaurus
e da quale dei due termini viene definito come preferito e quale come non preferito, tra TP e TNP
esiste sempre un rapporto sinonimico (si potrebbe perci dire che il rapporto sinonimico tale a
priori). Rientrano in questo caso diverse tipologie:
preferenza linguistica (a. fra termine straniero e italiano: week end e fine settimana,
mountain bike e bici da montagna; b. fra termine attuale e antico: bicicletta e velocipede; c.
fra termine corrente e scientifico: zucca e Cucurbita Maxima, mal di testa e cefalea; d. fra
termini di origini linguistiche differenti: poliglotta e multilingue; e. fra nomi comuni e marche
commerciali: penna a sfera e biro; f. fra varianti esprimenti nozioni, oggetti, discipline nuovi
o emergenti: calcolatori e cervelli elettronici, telefoni portatili, telefonini e telefoni cellulari)
Il secondo caso, quello della sinonimia convenzionale, si verifica quando la relazione tra due
termini di significato vicino, appartenenti alla stessa area semantica, non sinonimica in senso
stretto, non verrebbe considerata tale nel linguaggio naturale, non sempre considerata tale in
tutti i thesauru. In linea di massima si pu dire che tale relazione viene risolta in un rapporto
preferenziale (cio un termine assume il ruolo di TP e l'altro di TNP) se i due termini si collocano in
un'area di secondario rilievo per il thesaurus (la cosiddetta fringe, frangia, area marginale), in due
diversi Termini Preferiti se questi si collocano entro l'area centrale del thesaurus (core, nocciolo,
nucleo dell'area).
34
La relazione sinonimica l'unica relazione thesaurica che mette in rapporto tra di loro l'insieme dei
termini preferiti e quello dei termini non preferiti: tutte le altre relazioni, di cui stiamo per occuparci,
sono relazioni fra termini preferiti. La relazione di base che distingue tipicamente un thesaurus da
una semplice lista di termini non strutturati, e ne rivela le fondamenta sistematiche, la relazione
classificatoria per eccellenza, la relazione gerarchica. La relazione gerarchica esprime il concetto
ed il grado di subordinazione o sovraordinazione fra termini appartenenti allo stesso albero
gerarchico; in questo albero, il termine sovraordinato rappresenta una classe o un tutto, e il
termine subordinato rappresenta un suo elemento o parte. La sigla che nel blocco parola di un
termine individua i suoi sovraordinati BT (Broader Term), alla quale pu utilmente essere
aggiunta una cifra indicante la distanza in "gradini" gerarchici fra i due termini legati dal rapporto:
Geometria iperbolica
BT1 Geometria non euclidea
BT2 Geometria
BT3 Matematica
La sigla identificante il rapporto inverso, cio i subordinati del termine dato, NT (Narrower Term):
Geometria
NT1 Geometria euclidea
NT1 Geometria non euclidea
NT2 Geometria iperbolica
NT2 Geometria ellittica
35
|
alcuni
|
^---------Gatti---------v
alcuni elementi della classe Felini sono dei Gatti, tutti i Gatti sono sempre, per definizione e
indipendentemente dal contesto, dei Felini. Viceversa lo schema:
^--------Animali domestici---------v
|
alcuni
|
|
alcuni
|
^-------------Gatti---------------------v
chiarisce perch non possibile instaurare un rapporto gerarchico genere-specie fra Gatti e
Animali domestici: se vero che alcuni Animali domestici sono Gatti, non per vero che tutti i
Gatti sono sempre Animali domestici (esistono infatti anche i gatti selvatici), e i due termini devono
quindi appartenere a categorie diverse del thesaurus. Il test ha lo scopo di evitare che criteri
soggettivi del costruttore influenzino la stesura delle strutture tassonomiche, tuttavia s'intende che
36
per scopi o in ambiti particolari ci si possa sottrarre dal seguire rigidamente questa norma.
Riprendendo l'esempio appena citato, se si sta costruendo un thesaurus specializzato sugli
Animali domestici si potr a buon diritto fare dei Gatti un NT, dal momento che i Gatti selvatici non
compariranno nel thesaurus e non rivestono alcun interesse per l'utente.
La relazione partitiva o parte-tutto non considerata dallo standard una relazione gerarchica
universalmente valida, ma sottoposta ad una restrizione; essa ritenuta valida solo nelle
situazioni in cui il nome della parte implica il nome del corrispondente tutto, qualunque sia il
contesto. In tal caso i termini possono essere strutturati gerarchicamente come BT (tutto) e NT
(parte); lo standard elenca quattro casi rispondenti a questo requisito in un contesto generale:
1. sistemi e organi del corpo
2. luoghi geografici
Sistema circolatorio
Canada
NT1 Manitoba
NT2 Winnipeg
NT2 Vene
Scienze
Corpi d'armata
NT1 Chimica
NT1 Biologia
NT1 Divisioni
NT2 Reggimenti
NT2 Botanica
mentre riconosce la possibilit di organizzare gerarchicamente anche altri tipi di termini solo in
contesti particolarmente specializzati, in cui la specializzazione del campo di azione a garantire
che il nome del tutto sia univocamente implicato dal nome delle sue parti.
La relazione esemplificativa o specie-esempio identifica il legame che intercorre fra una classe o
categoria generale di cose o avvenimenti, espressa da un nome comune, ed un suo individuo,
rappresentato da un nome proprio, e costituente una "classe di uno". In realt la cosa pu
complicarsi ulteriormente, poich esistono classi di uno che possono avere in sottordine altre
classi di uno:
37
mentre
la
relazione
partitiva
tra
due
classi
tra
due
individui.
Aggiungiamo ancora che nella maggior parte dei thesauri la relazione esemplificativa del tutto
assente, per evitare che la presenza dei nomi propri sovraccarichi le categorie rendendole difficili
da gestire. Una soluzione frequentemente adottata consiste nello stendere elenchi a parte in cui gli
"individui" sono rappresentati da termini normalizzati nella forma detti identificatori (perch appunto
identificano gli individui) per analogia con descrittori (cio i termini che "descrivono" una classe). E'
chiaro che se nel thesaurus non sono presenti gli individui come TP inseriti in relazioni
esemplificative, l'indicizzatore dovr attribuire al documento che tratti di un "individuo" anche il
termine che indica la sua classe di appartenenza. Per completare il discorso sulle relazioni
gerarchiche, distinguiamo due tipi di thesauri, il monogerarchico e il poligerarchico, a seconda che
i termini possano appartenere, per ragioni logicamente fondate, ad una sola o a pi d'una
categoria.
Giochi
|---------------------------------------------|
v
|----------------------|----------------------|
|
v
Squash
38
Poligerarchico
Organo
BT1 Strumenti a fiato
BT1 Strumenti a tastiera
BT2 Strumenti
Strumenti a fiato
BT1 Strumenti
NT1 Organo
NT1 Flauto
Strumenti a tastiera
BT1 Strumenti
NT1 Organo
NT1 Pianoforte
Monogerarchico
Organo
BT1 Strumenti a fiato
BT2 Strumenti
RT Strumenti a tastiera
Strumenti a fiato
BT1 Strumenti
NT1 Organo
NT1 Flauto
Strumenti a tastiera
BT1 Strumenti
RT Organo
RT Pianoforte
39
L'ultima delle relazioni classiche, la relazione associativa, una relazione che si illustra pi
facilmente analizzandone le caratteristiche negative che non definendola in positivo; non a caso
detta anche relazione "residuale", in quanto in grado di collegare coppie di termini che non
rientrano n nella casistica della relazione sinonimica (non fanno parte dello stesso "insieme di
equivalenza"), n in quella della relazione gerarchica (non appartengono alla stessa catena
gerarchica), ma sono tuttavia cos fortemente associati che necessario esplicitarne il legame
all'interno del thesaurus in modo da poter suggerire all'indicizzatore o al ricercatore che acceda al
primo dei due il secondo termine. La relazione associativa reciproca, e viene indicata in
ambedue i casi con la sigla RT (Related Term). Proprio perch non sottoposta a rigidi test di
verifica e ammette un certo grado di discrezionalit, importante adottare metodi che garantiscano
la relazione associativa dallo scatenarsi delle opinioni personali e dei giudizi soggettivi del
costruttore del thesaurus: come regola generale, diciamo che uno dei due termini deve essere
fortemente implicato dall'altro, ovviamente nel quadro di riferimento condiviso dagli utenti. Un
esempio in particolare il rapporto di dipendenza fra la disciplina e il suo oggetto, fattispecie del
rapporto tipicamente associativo fra due termini, di cui uno necessario alla spiegazione o
definizione dell'altro. Ci sono due tipi di termini suscettibili di intrattenere rapporti associativi:
1. quelli appartenenti alla stessa categoria
2. quelli appartenenti a categorie diverse
Fra i termini appartenenti alla stessa categoria distinguiamo brevemente fra:
a) termini che hanno lo stesso termine sovraordinato, ed i cui significati hanno una zona di
sovrapposizione, e che quindi, anche se nel thesaurus hanno una definizione che li distingue
esattamente, potrebbero essere adoperati dagli utenti in maniera non rigorosa (e perci quasi
intercambiabile), per i quali quindi necessario ricordare l'esistenza dell'altro quando l'utilizzatore
impiega l'uno:
Barche
BT Veicoli
RT Navi
Navi
BT Veicoli
RT Barche
40
b) termini che rappresentano concetti legati da una relazione di tipo "familiare" o di tipo "derivato"
(un concetto che deriva dall'altro). Ad esempio, poich i Muli derivano dall'incrocio fra Asini e
Cavalli (rispetto ai quali sono per situati sullo stesso gradino gerarchico, cio come NT1 di
Equini), si possono configurare i seguenti blocchi-parola:
Equini
NT1 Asini
NT1 Cavalli
NT1 Muli
Asini
BT1 Equini
RT Cavalli
RT Muli
Cavalli
BT1 Equini
RT Asini
RT Muli
Muli
BT1 Equini
RT Asini
RT Cavalli
41
j.
accesso flessibile e multi-dimensionale alla informazione stessa. I contesti aziendali attuali sono
caratterizzati infatti, oltre che da una grande mole informativa, anche da rapidi mutamenti del modo
di produrre e organizzare tale informazione. Per far fronte a questo scenario (non solo allinterno di
sistemi di knowledge management propriamente detti ma anche, pi semplicemente, in siti,
intranet e data-repository di qualsiasi genere) necessario progettare e realizzare sistemi di
classificazione e di accesso allinformazione aperti, flessibili e adattivi, in grado cio di adeguarsi a
una pluralit di esigenze di archiviazione e/o interrogazione. A questo scopo, negli ultimi anni, si
sono intessute fitte relazioni fra discipline come larchitettura dellinformazione (che si interessa
dellorganizzazione dellinformazione allinterno di sistemi digitali), il Knowledge Management e la
biblioteconomia (la stessa architettura dellinformazione nasce da una applicazione al web della
biblioteconomia classica). La tesi sicuramente pi accattivante [...] quella di una interdisciplinarit
progressiva e marcata tra i diversi settori della conoscenza, a conferma di una eterna circolarit
del flusso informativo e in adesione ai moderni concetti di rete, integrazione e condivisione dei dati.
In questa dimensione intercomunicante di esperienze conoscitive, non si rivela dunque azzardato
ipotizzare accostamenti tra discipline quali biotecnologia, astrofisica e geopolitica, ad esempio,
aree di studio che solo una tradizione obsoleta perdura a confinare entro ambiti definiti privi di
connessioni44.
In un simile scenario, hanno cos conosciuto una nuova primavera le nozioni di faccette e di
classificazione a faccette (o classificazione multidimensionale), elaborati nellambito della
biblioteconomia classica da Ranganathan in avanti - con un importante incremento negli anni
60-70. La classificazione a faccette (in inglese Faceted Classification) come gi accennato -
un metodo di classificazione dellinformazione il cui valore distintivo consiste appunto nellessere
43
44
42
sono invariabili dal punto di vista semantico (ad es. la propriet COLORE di un oggetto
pu variare in termini di valori che pu assumere giallo, rosso etc. ma invariabile
come concetto; cio quelloggetto avr sempre un colore)
costituiscono un insieme aperto, per cui sempre possibile aggiungere nuove faccette
a quelle gi esistenti
sono utilizzabili come attributi di ricerca sia singolarmente sia in combinazione. Tali
caratteristiche rendono particolarmente efficace ladozione di questo sistema in
ambienti digitali, per un pi veloce ed efficiente recupero dellinformazione45 .
Per fare un esempio concreto, poniamo di dover costruire un catalogo di vini. Potremmo allora
rappresentare ciascun vino mediante questo set di propriet o faccette:
COLORE (C)
VITIGNO (V)
PROVENIENZA (P)
ANNATA (A)
...
Tali faccette sono mutuamente esclusive luna rispetto alle altre, vale a dire che fra esse non
vi sovrapposizione semantica (ci non significa per che un vino pu comparire solo in una di
esse; anzi, ogni vino rappresentato dallinsieme delle varie faccette). Ciascuna faccetta, potr
essere a sua volta suddivisa/scomposta in pi topic (o voci, o faccette di secondo livello la
nomenclatura pu variare da autore ad autore):
COLORE (C) o rosso (r) o bianco (b) o rosato (s)
VITIGNO (V) o aglianico (agl) o merlot (mr) o sangiovese (sg) o ...
PROVENIENZA (P) o campania (c) o piemonte (p) o sicilia (s) o ...
ANNATA (A) o 1961 o ...
Una bottiglia di Taurasi 1996, risulta descritta da queste coordinate: C(r), V(agl), P(c), A(96).
Ci significa che:
45
43
possibile ricercare questo vino utilizzando una sola delle sue faccette, oppure una
combinazione di esse (es. C(r) & V(agl) & P(c))
possibile in ogni momento implementare nuove faccette di primo livello (ad es.
PRODUTTORE, ABBINAMENTI, GRADAZIONE etc.)
possibile in ogni momento aumentare il numero dei topics o faccette di secondo livello
interni a una faccetta di primo livello.46
46
L. ROSATI, La classificazione a faccette fra Knowledge Management e Information Architecture (parte I), it Consult 2003
<www.itconsult.it>
44
45
46
47
seguire, per decidere quindi (dal latino de caedere, tagliare via, eliminare ogni possibilit
alternativa).
Nellambito della teoria neoclassica, questi elementi trovano una sistematizzazione di grande
rigore formale nella teoria della scelta razionale (von Neumann e Morgenstern, 1944) la quale
vede il decisore come homo oeconomicus e postula la perfetta ed oggettiva conoscibilit della
realt da parte di ogni soggetto, la disponibilit di uninformazione completa, tempestiva e gratuita
e la capacit illimitata degli individui di elaborare le informazioni. Grazie alla completezza ed alla
tempestivit delle informazioni, il decisore neoclassico sar sempre perfettamente in grado di
conoscere tutte le alternative possibili e di calcolare tutte le conseguenze delle opzioni individuate;
egli inoltre avr una capacit illimitata di adeguamento cognitivo alle nuove situazioni. Per quanto
riguarda la valutazione dei risultati previsti, il modello introduce il concetto di utilit perfettamente
misurabile che fornisce lunit di misura delle diverse opzioni e ne permette il confronto; la scelta,
ovviamente, cadr sullalternativa che ottimizza la funzione di utilit.
La reazione degli studiosi di management ed organizzazione allimpostazione neoclassica
riassunta in maniera molto chiara da Simon (1958) Durante lultima decade () la dottrina
economica ha raggiunto uno stato di scolastica raffinatezza che presenta notevole interesse
normativo, ma ben poca relazione con il comportamento reale, od anche solo possibile, di esseri
umani in carne ed ossa (p. 23). Ed Simon stesso che d vita a quel filone di ricerca che oggi
passa sotto il nome di comportamentismo e che costituisce il fondamento dellanalisi
contemporanea del comportamento organizzativo.
Gli individui sviluppano dei metodi per impegnarsi in uneconomia cognitiva volta a facilitare il
compito di gestire la miriade di stimoli potenzialmente significativi disponibili nella cornice
organizzativa. La prima chiave per accedere a tale efficienza cognitiva la capacit di interrelare
le informazioni in base a criteri di similitudine.
In un secondo momento necessario trattenere le informazioni nella memoria in modo da
preservare le interrelazioni tra parti diverse dellinformazione acquisita. Questa funzione
compiuta tramite strutture cognitive chiamate schemi (Gioia, 1986; Isenberg, 1986).
Uno
schema
una
struttura
cognitiva
costituita
da
un
network
di
aspettative
48
technique (Kelly, 1955), ma la metodologia pi diffusa sicuramente quella del cognitive mapping
(Huff, 1990; Weick e Bougon, 1986; Fiol e Huff, 1992; Fahey e Narayan , 1989, Moretti, 1994;
1997; Vicari e Troilo, 1997; Codara, 1998; Daniels, Johnson e de Chernatony, 2002).
Una mappa cognitiva la rappresentazione (grafica o matematica) del sistema di credenza di una
persona, o meglio, della porzione di belief-system attivato in una situazione specifica dal decisore
(Codara, 1998). La mappa descrive la percezione consapevole della realt, il modo in cui un
individuo coglie una particolare situazione o un determinato problema. Come accennato, la mappa
cognitiva non rappresenta tutti gli aspetti del belief-system individuale, ma soltanto la struttura delle
credenze causali di una persona; per questo, alcuni autori parlano pi specificamente di mappe
causali (Weick e Bougon, 1986). Alcuni autori (Narayan e Fahey, 1990) hanno avanzato dei dubbi
sulla possibilit di mappare le strutture cognitive organizzative: la correlazione tra le mappe causali
vere e quelle rivelate non sarebbe mai perfetta in quanto influenzata dalla natura delloccasione
in cui esse vengono manifestate (ad esempio un discorso pubblico) e dalla possibilit di situazioni
contingenti che suggeriscano un atteggiamento prudente (una situazione altamente competitiva).
Questi elementi potrebbero interferire con gli sforzi del ricercatore nel determinare la natura delle
lenti che filtrano i dati e costituiscono il mezzo attraverso cui i dati sono interpretati (Narayan e
Fahey, 1990, p. 111). Lo stesso Axelrod (1976), uno dei pionieri delle mappe causali, sostiene che
le mappe non costituiscono dei mezzi attraverso i quali si possa inferire cosa i decisori
effettivamente pensino, ma offrono unicamente una rappresentazione grafica ed ordinata di ci
che essi dichiarano. Un posizione simile stata adottata pi recentemente da Eden (1992) e da
Cossette e Audet (1992), i quali sottolineano come le mappe siano una rappresentazione della
rappresentazione e come tali non siano in grado di cogliere cosa sia nella mente dellattore. nfatti i
processi di pensiero e la struttura dei discorsi interagiscono tra loro ed interferiscono gli uni con gli
altri, specialmente in presenza di una metodologia rappresentativa e di un ricercatore che dia una
specifica configurazione al contesto allinterno del quale la mappa cognitiva viene costruita. In
questo contesto gli autori sostengono che le mappe devono essere considerate unicamente come
uno strumento di individuazione e rappresentazione a supporto della discussione e dellanalisi di
alcuni modi di pensare e spiegazioni di eventi.
49
50
ricostruzione delle mappe a partire dai discorsi rischia di ricadere nellobiezione di Cossette e
Audet (1992) secondo i quali la rappresentazione discorsiva un prodotto semiotico e non
lespressione di una realt oggettiva alla quale il discorso del soggetto corrisponde, anche se
spesso conveniente considerare come realt ci a cui il discorso si riferisce48.
Ma, in unottica cognitivista, ogni decisore agisce in funzione dei suoi schemi mentali preesistenti, i
quali gli forniscono una visione parziale, e comunque filtrata, della realt che lo circonda ed egli
stesso a costruire tale realt attraverso le scelte che opera ed il senso che attribuisce loro
attraverso il racconto.
Come afferma Weick, infatti proprio il racconto il mezzo attraverso cui avviene
lattribuzione di significato da parte del soggetto. Il concetto bene espresso dal noto aforisma
non posso sapere quello che penso fino a che non sento quello che dico (Weick, 1969, p.17).
La posizione di Weick ripresa dalla moderna psicologia cognitiva, la quale sostiene che
soltanto attraverso la narrazione che i soggetti riescono a dare un significato agli eventi della loro
vita e dunque il cognitive mapping si baserebbe sullassunto che il linguaggio costitutivo della
conoscenza, piuttosto che un semplice mezzo per rappresentarla (Codara, 1998).
In questa prospettiva, allora, il problema della scarsa corrispondenza tra la mappa
cartacea, estrapolata con tecniche di analisi narrativa, e quella mentale mal posto: le espressioni
verbali e scritte sono proprio gli strumenti attraverso cui il soggetto costruisce la sua mappa
cognitiva e non unimmagine di essa. Diverse sono le funzioni attribuite dai vari studiosi alle mappe
cognitive a seconda dello scopo dellanalisi; in particolare se ne evidenziano quattro (Codara,
1998).
48
P. COSSETTE , M. AUDET , Mapping Of An Idiosyncratic Schema, Journal of Management Studies 29:3.pp325-347 (1992)
51
52
Documentary Coding Method si applica alle asserzioni espresse dai soggetti in specifiche
occasioni decisionali. Esso composto da 4 fasi operative:
1. Codifica del testo: analisi logica/sintattica e del contesto per lindividuazione di concetti/nodi
e nessi causali
2. Stesura del dizionario: Index dictionary card e Merging tra i concetti che appaiono avere lo
stesso significato
3. Stesura della relationship card: tabella che comprende variabili concetto causa ed effetto
4. Stesura della Mappa Cognitiva
Esempio:
ricostruzione
della
cognitive
map
di
un
soggetto
decisore
allinterno
di
53
= Concetto causante
Capacit di innovare
= Concetto conseguente
= Concetto conseguente
&
Trattenere management storico
= Concetto causante
= Concetto conseguente
= Concetto conseguente
Policy
Variabili intervenienti
Goals
Capacit di
Trattenere
innovazione
management
storico
Sopravvivenza e
rilancio
dellimpresa
Continuit culturale e
professionale
Nellambito della funzione riflessiva, una delle pi immediate e significative che lo strumento
fornisce, la mappa cognitiva ricostruita viene usata come uno specchio delle credenze del
soggetto, uno strumento che il ricercatore mette a disposizione dellattore per renderlo
maggiormente consapevole dei concetti utilizzati nel definire la situazione e delle implicazioni delle
sue argomentazioni: di tutto ci, spesso, egli non conscio fino al momento in cui non ne vede la
rappresentazione grafica. Le mappe costituiscono dunque un prezioso feedback in grado di
agevolare, con laiuto del ricercatore, la revisione delle proprie rappresentazioni della situazione e
la conseguente modifica dei propri comportamenti, favorendo in questo modo la crescita personale
e lapprendimento organizzativo.49
49
CATERINA MUZZI, CLAUDIA ORTOLANI, Lanalisi dei processi decisionali attraverso le mappe cognitive: un caso di studio, 2003
54
Il World Wide Web uno strumento universale per il recupero delle informazioni. Esso
appare come un ipertesto50 che collega risorse remote distribuite in tutto il mondo. Allo stato
attuale, il World Wide Web contiene pi di 300 milioni doggetti statici che forniscono unampia
variet dinformazioni. Trovare ed estrarre una determinata informazione dal web gi da anni un
problema al centro dellattenzione degli studiosi. La sua ampia diffusione dovuta al fatto che non
esistono restrizioni sulla qualit e sul tipo di documenti pubblicati; non viene fatta alcuna
discriminazione sui contenuti: ogni cosa pu essere linkata a qualsiasi altra. Il linguaggio HTML,
con il quale si scrivono le pagine Web, infatti, non pone alcun vincolo, si limita a fornire una
formattazione che determina come il testo dovr essere visualizzato ed enfatizzato dal browser. Si
per sviluppato un sistema in cui i contenuti delle informazioni sono espressi in una forma non
adatta allelaborazione automatica attuata per mezzo dei calcolatori; il significato del testo risulta,
infatti, comprensibile solo all'uomo.
Migliaia di utenti accedono quotidianamente ai siti per ottenere informazioni di qualsiasi tipo. Molto
spesso, prima di trovare i documenti che trattano gli argomenti cui si interessati, bisogna
esaminarne molti altri che non hanno nulla a che vedere con essi (rumore informativo). Le ricerche
nella maggiorparte dei casi vengono, infatti, effettuate per parola chiave e i risultati comprendono
anche quelle fonti che utilizzano tali parole con un significato diverso rispetto a quello inteso
dallutente.
Per esempio immettendo in un motore di ricerca la parola capo si otterr una lista di documenti
contenente il termine; alcuni di essi potrebbero riferirsi a tale concetto come se fosse la parte
superiore del corpo, altri per indicare il leader di unorganizzazione. Questo perch tale parola ha
un significato diverso secondo il contesto in cui utilizzata e i search engine non sono in grado di
operare una discriminazione sul contenuto. Alcuni portali come Yahoo (http://www.yahoo.com)
utilizzano altre tecniche e mettono a disposizione servizi di ricerca guidati da categorie; queste
funzionalit necessitano comunque dellimpiego di personale umano che quindi rappresenta un
costo direttamente proporzionale ai documenti da analizzare oltre a consentire una certa quota
percentuale di soggettivit in dipendenza delloperatore/indicizzatore.
Mano a mano che la quantit di pubblicazioni tende a crescere a ritmi esponenziali la situazione
diventa sempre pi difficile da gestire con le tecniche attuali. Si corre il rischio di rendere nulla o
estremamente limitata lutilit di avere a disposizione un cos grande archivio. Una possibile
risposta a questa esigenza il Web semantico termine coniato per la prima volta da Tim BernersLee.
50
"Tecnicamente un ipertesto un insieme di nodi connessi da dei legami. I nodi possono essere delle parole, delle pagine , dei grafici
o parti di grafici, delle sequenze sonore, dei documenti completi che possono essere degli ipertesti a loro volta. Gli items di
informazione non sono collegati linearmente, come su una corda a nodi, ma ciascuno di essi, o la maggior parte , estendono i loro
legami a stella, secondo un modello reticolare.Navigare in un ipertesto, dunque, disegnare un percorso in una rete che pu essere
complessa quanto si vuole. Perch ogni nodo pu contenere, a sua volta, tutta la rete" - Pierre Levy, Le tecnologie dell'intelligenza,
Synergon, Bologna, 1992.
55
Esso vuole dare maggiore importanza ai contenuti ed al contesto nel quale i singoli termini
vengono utilizzati, in modo da ottenere degli strumenti che aumentino lefficacia delle ricerche e ne
consentano una effettuazione automatica.
il Web Semantico richiede linteroperabilit a livello semantico: non sono pi sufficienti standard
per la forma sintattica dei documenti, ma anche per il loro contenuto semantico; interoperabilit
semantica significa definire mapping tra termini sconosciuti e termini conosciuti nei dati.
Chiaramente il costo dellinteroperabilit semantica pi elevato di quello dellinteroperabilit
sintattica;
La ricerca di documenti non sar pi basata sulle parole chiave, ma sul significato di un concetto o
di pi concetti legati tra loro. In questo modo i motori di ricerca permetteranno di estrarre solo i
documenti cui si veramente interessati, anzich, come accade attualmente, restituire unalta
percentuale di documenti che non riguardano largomento specificatamente cercato dallutente.
56