Sei sulla pagina 1di 57

Facolt di Lettere e Filosofia

Corso di Laurea in Mediazione Linguistica

Dispensa del corso di


Documentazione a.a. 2004/05
prof. R. Guarasci

Materiale ad uso esclusivamente didattico

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

INDICE
1. La Documentazione
1.1 Definizioni
1.2 Un unico termine e tanti materiali scrittori :il documento
1.3 Un po di storia.
1.4 Archivistica, Biblioteconomia e Documentazione
1.5 Scienze dellinformazione, Informatica e Documentazione
2. Dal documento allinformazione
2.1 Linguaggi formali e naturali
2.2 I Linguaggi di descrizione documentaria
2.3 Linguaggi Documentari: SGML
2.4 La Rappresentazione
3. La classificazione e lindicizzazione
3.1 Definizioni
3.2 Le opinioni: P. Otlet, B. Bonifacio, E. Casanova, G. Cencetti
3.3 La classificazione ideologica
3.4 La Classificazione sistematica
3.4 Quadro di classificazione
3.5 Il protocollo
3.6 Analisi concettuale
4. I Thesauri
4.1 Definizioni
4.2 La strutturazione del campo
4.3 Termini d'indicizzazione
4.4 Struttura semantica e formalizzazione delle relazioni
4.5 Classificazione a Faccette
5. Ontologie, mappe cognitive e web semantico
5.1 L ontologia come nuovo strumento per gestire la conoscenza
5.2 Definizioni di ontologia
5.3 Funzioni dellontologia
5.4 Le mappe cognitive
5.5 Metodologie di estensione delle mappe
5.6 Le mappe cognitive e lanalisi documentale
5.7 Il web semantico (semantic web)

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

1. La Documentazione
1.1 Definizioni

La documentazione si pone come obiettivo il far conoscere ci che stato fatto per poter
fare e, pertanto, le sue differenziate attivit si presentano al mondo esterno come comunicazione
di conoscenze offerte sotto forma di dati elaborati con rigorosi criteri e omogenee procedure1. In
unottica pi corretta sarebbe forse il caso di dire che lobiettivo quello di far conoscere ci che
e non solo ci che stato fatto giacch in una societ in frenetico divenire nella quale
lobsolescenza delle informazioni estremamente rapida , molto spesso, il presente a
rappresentare la base per lastrazione informativa necessaria al supporto decisionale.
Il punto primo di ogni disciplina, specie se applicativa, dovrebbe essere quello di presentare ai
possibili discenti le motivazioni dellutilit della stessa che, poi, un tuttuno con la sua stessa
ragion dessere. Tanto pi queste ragioni sono vicine alla esigenze ed ai bisogni della vita
quotidiana tanto pi la disciplina sar diffusa e permeer la vita di una societ civile2.
Una delle ragioni che sta alla base dello sviluppo esponenziale dellinformatica e della
telematica proprio quella di essere pervasiva della vita quotidiana; questo genera mercato e la
forza del mercato, lungi dal banalizzarla come temono alcuni - attrae investimenti e muove la
ricerca. Non sempre le scienze documentarie hanno posto attenzione a questi precetti anzi, pi
spesso, hanno goduto dellessere destinate ad un ristretto pubblico di specialisti.
Se ad esempio -

al posto dellenunciazione del

concetto astratto dellinformazione come

supporto decisionale3, certo non immediatamente comprensibile ai pi, utilizzassimo la classica


situazione dello shopping per i negozi e, segmentando lazione :

Bisogno o identificazione del bisogno


(necessit o vanit),

Acquisizione dellinformazione
(inserzioni, pubblicit, in giro per negozi),

Classificazione
( per tipo, colore),

P. BISOGNO, Presentazione a: M.P. CAROSELLA M. VALENTi (a cura di), Documentazione e Biblioteconomia, Milano 1987, p. 16.
On peut sinterroger sriusement savoir si certains spcialistes de la gestion de linformation administrative nont pas perdue de
vue, ou nont peut ^etre jamais eu en te^te les besoins rels de leurs clients et se sont, avec le temps, cantonns dans une approche
nombriliste qui les servait avant tout comme professionnels dun domaine mal circonscrit. M. ROBERGE, La Gestion de lInformation
Administrative, Quebc, 1992, p18.
3
Ai fini dellanalisi dei processi decisionali e della problematica di un parziale utilizzo delle informazioni da parte dei decisori nelle scelte
si veda: R.M. AXELROD, The Structure of decision: cognitive maps of political elites, Princeton, 1976.
2

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Analisi costi/benefici,

Decisione
(acquisto)
estrapolassimo, conseguentemente, dalla realt quotidiana la valenza teorica, faremmo diventare
immediatamente evidente il concetto e avremo

sicuramente reso lidea della fisicit della

disciplina e della sua pratica utilit in una pluralit di contesti non necessariamente specialistici.
Ogni giorno noi attuiamo numerose sequenze di Bisogno/Informazione/Decisione,
indipendentemente dallo specifico settore di attivit nel quale lavoriamo. Conoscere le metodologie
e le tecniche per far si che questa azione involontaria diventi un processo di qualit
estremamente utile a tutti coloro i quali svolgono una qualche forma di attivit relazionale e/o
decisionale.
Dovendo comunque se non altro per necessit didattiche -

dare una definizione sintetica,

possiamo dire che la documentazione quella disciplina che si occupa di indicizzare e classificare
documenti da essi estraendo, mediante opportuni procedimenti, le informazioni necessarie a
orientare la decisione.

1.2 Un unico termine e tanti materiali scrittori :il documento


Il documento e, prima di tutto, la definizione del suo ambito concettuale quindi basilare
per la comprensione della disciplina. Il documento, nellaccezione della disciplina, pu essere
definito come un oggetto informativo costituito da un supporto scrittorio e da una o pi informazioni
su di esso registrate. La normativa italiana concepisce varie accezioni del termine:
DOCUMENTO rappresentazione analogica o digitale di atti, fatti e dati, intelligibili direttamente o
attraverso un processo di elaborazione elettronica, che ne consenta la presa di conoscenza a
distanza di tempo.
DOCUMENTO DIGITALE testi, immagini, dati strutturati, disegni, programmi, filmati formati tramite
una grandezza fisica che assume valori binari, ottenuti attraverso un processo di elaborazione
elettronica, di cui sia identificabile l'origine.
DOCUMENTO INFORMATICO rappresentazione informatica di atti, fatti o dati giuridicamente
rilevanti.
DOCUMENTO ANALOGICO si distingue in originale e copia ed formato utilizzando una

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

grandezza fisica che assume valori continui, come le tracce su carta, le immagini su film, le
magnetizzazioni su nastro. 4
DOCUMENTO AMMINISTRATIVO ogni rappresentazione, comunque formata, del contenuto di
atti, anche interni, delle pubbliche amministrazioni o, comunque, utilizzati ai fini dell'attivit
amministrativa. Le relative modalit di trasmissione sono quelle indicate al capo II, sezione III, del
presente testo unico.5

1.1 Un po di storia.

Gran parte della concettualit della definizione si gioca, dunque, sulla valenza del termine
documento, che polisemico, e che, come diremo pi avanti, ha conosciuto una pluralit di
accezioni e di significati che stanno, in gran parte, alla base delle diversificazioni esistenti.
Comunque, partendo da una definizione della disciplina siffatta e volendo individuare una data di
origine, sarebbe fin troppo facile dire che essa, in quanto scienza della conoscenza, nata con la
scrittura o con la formalizzazione del parlato facendone, quindi, impropriamente, risalire lorigine ai
primi ideogrammi del VI millennio A. C. o ai grafismi geometrici del paleolitico superiore6, ma cos
non . Essa nasce, di fatto, quando si cristallizza la consapevolezza della necessit di strutturare
lorganizzazione della conoscenza in quanto la vastit delle stesse ne ha reso, di fatto, impossibile
una gestione non sistematica.
Sarebbe complesso e, forse, non del tutto utile, ricercare i punti di contatto e di discordanza
con la storia e levoluzione delle altre discipline documentarie, dallarchivistica7 alla biblioteconomia
alla bibliografia, la documentazione legata da una comunanza di origini; certo che se si vuole,
comunque, individuare una data di nascita essa , probabilmente, collocabile al 12 settembre
1895 con la fondazione, da parte di Henry Otlet ed Henry La Fontaine dell Istituto Internazionale
per la Bibliografia avente la finalit di catalogare e classificare i risultati delle ricerche. Nel 1931
lIstituto diventer poi Istituto Nazionale per la

Documentazione

e, nel 1938, Federazione

Internazionale di Documentazione (FID) .


Rispetto agli autori precedenti, come ad esempio, Peignot,9 che concepisce la bibliologie
come strettamente legata alle scienze librarie, Otlet ne cambia la prospettiva facendone

DECRETO 23 gennaio 2004 del MINISTERO DELL'ECONOMIA E DELLE FINANZE, Modalita' di assolvimento degli obblighi fiscali
relativi ai documenti informatici ed alla loro riproduzione in diversi tipi di suppporto.
5
Testo unico delle disposizioni legislative e regolamentari in materia di documentazione amministrativa (Testo A). (Gazzetta Ufficiale n.
42 del 20 febbraio 2001, S.O. n. 30/L).
6
Per una storia della scrittura Cfr G.R. CARDONA, Storia Universale della Scrittura, Milano 1987
7
Per una storia dellArchivistica cfr. E. LODOLINI, Lineamenti di Storia dellArchivistica Italiana, Roma, 1991;
8
Cfr. M.W.HILL, FID, Passato, presente e futuro. Breve storia della federazione internazionale di informazione e documentazione dal
1895 al 1995 e oltre, in A. M. PACI (a cura di), La Documentazione in Italia, Milano, 1996, pp. 24-43.
9
G. PEIGNOT, Dictionnaire raisonn de Bibliologie, Paris, 1802

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

lantesignana delle scienze della comunicazione e dellinformazione documentale e operando una


singolare commistione di esperienze e prospettive diverse.10
Lintento primo era, quindi, quello della classificazione del sapere scritto ed, in questa
direzione ci si orient immediatamente verso la Classificazione Decimale Dewey11 in quanto si
riteneva potesse essere uno strumento funzionale al progetto di categorizzazione universale della
conoscenza. Pur se lo strumento di classificazione utilizzato apparenta la nascente disciplina alla
biblioteconomia introducendo il termine documentazione per indicare un nuovo campo di studi e di
ricerca,

scientificamente

fondato

ed

autonomo

rispetto

alle

discipline

bibliografiche

biblioteconomiche tradizionali, Otlet dimostra di concepire la documentazione in termini di


progettualit futura che coinvolge globalmente il disegno di un sistema di produzione intellettuale
mondiale12
Egli, dunque, concepiva la documentazione come una disciplina autonoma e non come
una semplice filiazione della biblioteconomia in quanto la sua concezione del documento non era
meramente conservativa ma bens operativa. Esso oggetto, magma, da ridurre ad unit
informative semplici da integrare per costruire un nuovo sapere basato sulla interrelazione
cognitiva.
Questa autonomia della documentazione dalla biblioteconomia non sar per, n pacifica
n unanimemente accettata tanto che la sua concettualit osciller tra la definizione di aspetto
specialistico della prima dato dal Bradford negli anni 40 e quella di Watson Davis e Vernon Tate13
che, accentuando laspetto comunicativo, sostanzialmente spostano la disciplina nellalveo delle
scienze dellinformazione aprendo la strada allutilizzazione massiccia dell Information Technology
degli anni seguenti.
Queste sue teorizzazioni Otlet le dettaglia e le esplicita compiutamente nello studio di fattibilit
per la gestione della documentazione dellIstituto Internazionale di Agricoltura14 commissionatogli
dal presidente, marchese Cappelli. La sequenza delle fasi operative allepoca delineatesi - di
estreme modernit:

definizione del campo di interesse dellistituzione

ricognizione di enti affini come potenziali collaboratori e utenti

gestione della documentazione corrente e pregressa

10

il rappelle les recherches du suisse Rothlisberger qui le premier labore la statistique internationale des imprims dans le droit
dauteurIl rappelle les travaux thorique quil a raliss avec son disciple Iwinskiil rappelle les travaux du clbre chercheur russe
Roubakine sur la psychologie bibliologique, sur les rapports mentaux entre la pense des auteurs et celle des lecteurs qui devaient
aboutir a une thorie fonctionelle de la cration littraire et aux mthodes de propagande et de publicit R. ESTIVALS, Preface a
P. OTLET, Trait de Documentation, rist. 1988, p. IV.
11
La Classificazione decimale Dewey (in inglese Dewey Decimal Classification) appartiene al tipo di classificazione enciclopedica, cio
che deriva da un tentativo filosofico di sistematizzare lo scibile umano: intende fornire un sistema per organizzare un universo di cose,
siano esse oggetti, concetti o registrazioni , L. CROCETTI - D. DANESI, Classificazione decimale Dewey ED 20, Roma, Associazione
Italiana Biblioteche, 1993.
12
A. BALDAZZI, Le radici storiche della documentazione in Europa, in: A. M. PACI (a cura di), La Documentazione in Italia, Milano,
1996, p. 44.
13
D. VERNON TATE, Introducing, in: American Documentation, vol. 1, n. 1(1950)
14
P. OTLET, Rapport sur la Bibliographie, Rome, 1911

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

introduzione del principio tecnico e industriale della divisione del lavoro anche
nellorganizzazione del lavoro intellettuale

adozione di forme di incremento della funzione informativa

definizione della funzione autonoma della documentazione come centro di studio e ricerca
dellente.

In questa ottica di integrazione informativa vengono introdotti da Otlet due principi fondamentali
della nascente disciplina documentaria; essi sono alla base di operazioni gestionali davanguardia:
(primo fra tutti) il principio monografico che sostiene lelaborazione dei dossier (fascicoli); lunit
bibliografica che consente di estrapolare elementi semantici ed orientare in senso bibliografico
comunicativo

anche

larchivio

di

corrispondenza15.

Che

lindiscusso

fondatore

della

Documentazione, cui si deve anche il nome della disciplina, sia stato, culturalmente, il precursore
dei sistemi di gestione automatica delle informazioni lo si riscontra anche nella sua pervicace
volont di standardizzare i mezzi ed i sistemi di descrizione, come, ad esempio, la scheda
bibliotecaria adopte par certains bibliothcaires des Etats Unis .

1.2 Archivistica, Biblioteconomia e Documentazione

Lintento di Otlet quello di una rationalisation du livree et du document , la costituzione di


una unit documentaria/cognitiva primaria formata da libri e documenti, ognuno con la sua valenza
e la sua carica di informazioni e di specificit. Non a caso nei Fondamenta del suo Trait, la
Documentazione non solo una evoluzione della Biblioteconomia ma una vera e propria nuova
creazione sinergica composta da sette

parti principali: Les documents particuliers, La

Bibliothque, la Bibliographie, Les Archives documentaires, Les Archives Administratives, Les


Archives anciennes, Les documents autres que bibliographique et graphique, Les collection
Musographiques, e lEncyclopdie. Questa concezione unitaria di archivio e biblioteca come
contenitori cognitivi sostanzialmente assimilabili non per prerogativa esclusiva dellOtlet. Gi nel
De Archivis di Baldassarre Bonifacio si avanza la possibilit che le biblioteche possano essere
definite archivia quaedam librorum e, nellintroduzione allo stesso testo, curata da L. Sandri,16in pi
di una occasione si ribadisce non solo la complementariet ma la loro stessa originaria unicit:
oggi sono due gli istituti che conservano le antiche documentazioni: archivi e biblioteche ma
mentre i primi asservantur acta pubblica le seconde invece doctorum virorum lucubrationes;
tuttavia una simile distinzione relativamente recente; in antico, alle origini, i due istituti erano una
cosa sola17. Tre secoli dopo, per, La posizione del Casanova

pur se non di totale ostilit

verso i media diversi dal documento inteso nella sua pi stretta accezione giuridico formale ,
15

Ibidem p. 56
L. SANDRI, Il De Archivis di Baldassarre Bonifacio, in Notizie degli Archivi di Stato, X(1950), pp. 95-111... tuttavia queste notizie
frammentarie erano per state sufficienti a mettere in luce come ci siano state epoche nelle quali il vocabolo biblioteca stesse in realt
ad indicare un archivum, in quanto si cominciato col conservare i documenti fondamentali alla vita dello Stato e come sia avvenuto
solo in un secondo tempo la separazione tra il materiale da conservarsi in uno piuttosto che in un altro istituto(p.101).
17
Ibidem, p.102.
16

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

comunque, di sostanziale chiusura: Non neghiamo neppure che diano e daranno sempre
maggiore risalto alla fredda dicitura o narrazione dei documenti che gioveranno immensamente
alla futura storiografia. Ma, in verit, preferiamo il sistema italiano di farne cosa separata dagli
archivi: poich non hanno alcuno dei requisiti di questi istituti, non ne hanno la multipla finalit, e
savvicinano assai meglio alle biblioteche e ai musei che non agli archivi18. E lopinione che, dieci
anni pi tardi, sar ribadita e compiutamente espressa dal Concetti nel suo SullArchivio come
Universitas Rerum19 che qualifica la biblioteca come destinataria di universalit volontarie e
larchivio come custode di universalit necessarie. E il prevalere della concezione dei giuristi latini,
da Servio Mauro ad Ulpiano, per i quali larchivio il luogo privilegiato di conservazione degli atti
pubblici. E una concezione giuridico formale, consolidatasi nel Medioevo, alla quale estranea
qualunque apertura verso concettualit informative e cognitive restringendo il campo dazione alla
specificit giuridica e diplomatistica. Senza volersi qui addentrare in una spinosa disquisizione
sullo jus archiviale, peraltro compiutamente trattato da illustri autori,

lorigine del problema

proprio nella difficolt di garantire a quanto conservato in biblioteca la pienezza della fides che
invece era appannaggio di quanto custodito in archivio. Ci derivava, ovviamente, da una
concezione limitante di questultima tipologia di materiali sostanzialmente i soli atti pubblici e
motiva le ritrosie del Casanova di fronte a tipologie archivistiche per cos dire anomale. Ma
quando lanomalia di queste tipologie , di fatto, non pi esistente e quando anche la limitazione
formale della diversit mediale venuta meno con lavvento dei documenti post cartacei, quando
assume piena dignit una tipologia border line, come la letteratura grigia20, non libro e non
documento, forse anche la suddivisione rigida teorizzata in altri contesti in gran parte destituita di
fondamento e si pu quindi riparlare con le dovute puntualizzazioni scientifiche di unicit o
convergenza delle discipline documentarie pur nel rispetto delle singole specialit e specificit21.
Ci che fino a un decennio fa sembrava difficilmente praticabile, in alcuni casi quasi eretico,
assume oggi una luce diversa alla luce del mutato quadro normativo di riferimento che ha dato
piena validit alla documentazione post cartacea rendendo di fatto indipendente il contenuto
dal materiale scrittorio utilizzato.

18

Ibidem, p. 251.
G. CENCETTI, SullArchivio come Universitas Rerum, in: Archivi, anno IV(1937) pp. 7-13. I singoli componenti della universalit
biblioteca , i libri, oltre ad aver ciascuno la sua origine in un autore, un editore, un libraio che, di regola, sono diversi, hanno altres fine
proprio, raggiungibile con mezzi propri: hanno cio una propria autonomia originariaBen diversamente stanno le cose per ci che
riguarda larchivio. Qui i singoli componenti, le carte non solo provengono dal medesimo individuo, aggregato familiare o ente, ma
poich costituiscono nientaltro che uno fra i mezzi usati dallente o individuo per raggiungere i propri scopi, portano in loro stessi, fin
dallorigine, il vincolo della destinazione comune
20
Cfr W. ALBERANI, La Letteratura Grigia, Roma, 1992; In tal senso pi che il termine di letteratura grigia indicante la letteratura non
convenzionale - esplicativo quello di Ephemeral materials usato negli Stati Uniti che identifica qualunque tipologia documentale
transeunte e non convenzionale.
21
Da pi parti, ormai, nella letteratura specializzata, si fa strada lidea della collaborazione tra le varie discipline documentarie specie in
presenza di massicce innovazioni tecnologiche. Cfr T. GIORDANO, Futuro No problem. Convergenza tecnologica e patrimonio
culturale, AIB-Web, n. 4 (1999); M. GUERCIO, Rischi e promesse dellinnovazione tecnologica. I conservatori del patrimonio
documentario e la cooperazione fra archivisti e bibliotecari, AIB-Web, n. 2 (2001).
19

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

1.3 Scienze dellinformazione, Informatica e Documentazione

Il Rapporto tra le scienze dellInformazione, linformatica e le scienze documentarie non


riconducibile a parametri univoci di valutazione. Sia perch la concettualit stessa di scienza
dellinformazione a presentare dei problemi epistemologici sia perch allinterno delle scienze
documentarie nel mentre chiaro un possibile utilizzo strumentale dellinformatica, si ingenerato,
in molti casi, una sostanziale commistione e sovrapposizione di competenze22 per ci che attiene
le scienze dellinformazione.
Del resto la stessa definizione data da Taylor (1967) al momento della creazione
dellAmerican Society of Information Science: La scienza dellinformazione indaga le
caratteristiche e il comportamento dellinformazione, le forze che governano il processo di
trasferimento e la tecnologia necessaria al trattamento dellinformazione per ottimizzarne
laccessibilit e luso, conferma questa sovrapposizione dichiarando la necessariet

di una

stretta interdipendenza di tali scienze da una pluralit di altri apporti disciplinari, dalla linguistica
alla psicologia cognitiva, alla tecnologia, la quale ultima vissuta con una forte accentuazione
strumentale. Partendo proprio dalla necessariet dellinterazione multipla ed utilizzando la teoria
del Piaget23 Ingwersen elabora la mappa epistemologica delle interconnessioni delle scienze
dellinformazione.

Al

livello

superiore,

che

chiama

dellinterdisciplinariet,

colloca

la

comunicazione, le scienze cognitive e le scienze dei sistemi; al livello inferiore o livello applicato,
situa la documentazione e la biblioteconomia ; al livello intermedio, di transizione o disciplinare,
trovano posto la psicologia, la linguistica, la scienza dellinformazione, la sociologia, la scienza dei
computer. Allinterno della rete generale, la scienza dellinformazione ha una sua specificit di link
con il livello transdisciplinare e con le discipline della documentazione e della biblioteconomia24.
Se oggetto delle scienze dellinformazione , quindi, lo studio di un processo, mentre la
documentazione e le scienze documentali studiano un oggetto: il documento, una differenziazione
sembrerebbe individuabile proprio nella diversificazione dellambito di interesse.
Daltronde lo si vede bene attraverso le formule. Le une difendono loggetto documento e/o
sinteressano al sistema tecnico (specifiche di un mestiere) mentre le altre vantano il dispositivo
persona o il sistema sociale (quadro di ricerca). Donde le divergenze di punti di vista sulla
formazione universitaria. Donde le incomprensioni reciproche sulla certificazione. Donde
lincompatibilit del contenuto tra rivista professionale e rivista scientifica..25.
22

Cfr H. FONDIN, La Scienza dellInformazione : postura epistemologica e specificit disciplinare, in AIDA Informazioni, anno 20, n.
1(gennaio marzo 2002), pp. 5-24.
23
J. PIAGET, Lpistemologie des relations interdisciplinaires, in : LInterdisciplinariet : problemes denseignement et de recherche
dans les universits, Paris, 1972 ;
24
A . BALDAZZI, Le scienze dellinformazione e le teorie della transizione, in AIDA Informazioni, anno 20, n. 1(gennaio marzo 2002),
p. 28.
Laccezione dellinformatica come strumentale alla scienza dellinformazione non ne totalmente accettata n condivisa tanto che il
sistema informatico , comunemente, considerato quella parte del sistema informativo in cui le informazioni sono raccolte, elaborate,
archiviate, scambiate mediante luso delle tecnologie dellinformazione e della comunicazione, concependolo quindi come una
evoluzione e non come una applicazione tecnologica. C. BATINI, B. PERNICI, G. SANTUCCI, Sistemi Informativi, Milano 2001, vol. 1,
p. 20.
25
Ibidem, p. 16.

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Ci che, in punta di penna, sembra chiaramente delineato conosce per -

una ulteriore

commistione allorquando Claire Guinchat e Michel Menou parlano, nel manuale edito dallUnesco,
di sciences et techniques de linformation et de la documentation26 si sforzano di trovare una
differenziazione concettuale tra il mestiere dellinformatico e le scienze dellinformazione e non gi
tra queste e la documentazione.
Certes la ligne de dmarcation existant entre le deux disciplines est aujordhui mal tablie,
mais le mtiers de linformation de demain ne passent pas seulement par le voies de
linformatique. Des nombreuses facettes du mtier chappent totalement lordinateur 27,
concludendo infine che Tous ces mtiers refletnt dans ces appellations diffrents le
dynamisme dune unique profession : celle de spcialiste du transfert de linformation .
Sicuramente in queste affermazioni hanno un peso rilevante i condizionamenti e le
esperienze personali degli autori non sempre assimilabili a quelle europee o nordamericane, ma,
il concetto di base che, esistendo ununica catena documentale che, partendo dai documenti da
trattare genera, alla fine, dei prodotti di varia complessit, le scienze dellinformazione e le scienze
documentarie si differenziano solo per loccuparsi di momenti diversi dello stesso processo non
potendosi, in nessun modo, scindere processo ed oggetto del processo mentre linformatica ha un
valore puramente tecnologico e strumentale 28.
Se complesso e controverso il rapporto tra le scienze documentarie e le scienze
dellinformazione, pi semplice si presentato almeno concettualmente - quello con linformatica
che era, in effetti, un falso problema.

In assenza delle modificazioni legislative intervenute

nellultimo decennio, in molti casi, linformatica era vissuta ed applicata come un semplice
strumento tecnologico e non modificava, se non marginalmente, le concettualit delle discipline
oggetto dellapplicazione. Purtroppo, per decenni, anche in Italia, linformatica e le scienze
dellinformazione sono risultati quasi sinonimi sia nel senso comune che ancora pi grave
nella produzione legislativa. Il valore legale del documento elettronico e la gestione totalmente
non cartacea del ciclo di vita hanno radicalmente cambiato le cose sfumando ulteriormente le
polisemie a volte isteriche del termine documento obbligando ad una non pi procrastinabile
ridefinizione concettuale e avviando la realizzazione di un unico oggetto informativo, risultato
virtuale e transeunte della query estemporanea la cui durata corrisponde al ciclo di
dellinformazione cui si riferisce.

vita

Al di l dei problemi legati alla concreta applicazione delle

disposizioni sui documenti post cartacei un oggetto-documento totalmente immateriale ha per


comunque cominciato a viaggiare nel cyberspazio e la sua valenza informativa ha iniziato a
confrontarsi con quella degli altri e-media andando a costituire serbatoi di conoscenza capaci di
26

C. GUINCHAT M. MENOU, Introduction gnrale aux sciences et techniques de linformation et de la documentation, Paris, 1990 ;
Ibidem, p. 518
28
A la multiplication et la diversification des utilisateurs rpond celle des services et produits fournis. La prolifration des termes qui
dsignent les diverses units dinformation (bibliothques, archives, bibliothques spcialises, centres ou services de documentation,
centre ou services danalyse, services de liaison, banques de donnes, bases de donnes, mdiatheques, services dorientation,
services de compilation des donnes, ecc.) traduit la richesse des possibilits dinformation documentaire. En fait, ces diverses units
se diffrencient rciproquement par laspect de la chaine documentaire suelles traitent en priorit C. GUINCHAT M. MENOU,
Introduction gnrale cit, , p. 31.
27

10

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

alimentare il web. Il controllo strategico dei contenuti e la loro fruizione e gestione diventato il
vero core business degli ultimi anni.
Lirrompere prepotente delle ICT ha tra laltro e conseguentemente - spostato lasse di
interesse dalla conservazione del supporto materiale, del quale la fruizione era un atto necessario
ma conseguente, alla gestione dei contenuti laddove la conservazione delloggetto tangibile
scindibile dalla fruizione. La scelta, operata da alcuni istituti di conservazione, dallo Smithsonian
Institute agli Archivi Nazionali del Canada29, di conservare i documenti su supporto fotografico e
di utilizzare il digitale per lattivit corrente non obbedisce solo ad una logica funzionale ma una
precisa scelta culturale che, separando i due momenti, consegna i contenuti

al mercato

globalizzato dellinformazione ed i documenti al circoscritto ambito della ricerca storica.


Il vero punto nodale diventa la possibilit e la capacit di padroneggiare e gestire una
quantit rilevante di oggetti informativi il cui numero e la cui complessit in rapidissima crescita.
Le tradizionali tecniche di classificazione archivistica, di catalogazione bibliografica e di
indicizzazione, pur se utili, mostrano vistosamente i loro limiti di fronte ad una variabilit tipologica
e semantica senza precedenti. La conoscenza esplicita prende coscienza dellesistenza della
conoscenza tacita e della necessit della reciproca integrazione. Nasce lera del Knowledge
Management e del Semantic Web.

29

Cfr P. Z. ALDESTEIN, La Permanence de linformation numrique, in Accs linformation questions de prservation, CITRA,
XXXIV, (1999), pp. 146-156.

11

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

2. Dal documento allinformazione


2.1 La Rappresentazione

E il risultato di un procedimento mentale di astrazione con il quale si sostituiscono ad un


oggetto (concetto, evento, persona, ecc.) uno o pi segni linguistici e/o grafici che rappresentino
delloggetto solo le caratteristiche utili allo scopo per il quale la rappresentazione viene fatta. Il
Documento, nella sua pi ampia accezione di oggetto che reca informazioni, , quindi, il prodotto
di una rappresentazione.
Per Knowledge (conoscenza) si intende qualsiasi informazione o risorsa che possa essere
sfruttata al fine di rendere pi produttive altre risorse o per consentire un miglior processo
decisionale.
Ma che rapporto esiste tra informazione e conoscenza? LInformazione riduce lo stato di
incertezza e quindi opera un cambiamento nel contesto; i dati divengono informazioni quando si
aggiunge loro un descrittore/valore.

La conoscenza ingloba linformazione e la combina con

lesperienza, le competenze specialistiche, le procedure e i processi. Anche la conoscenza, per


poter essere agevolmente recuperata necessita di un processo di rappresentazione composto,
sostanzialmente, da un insieme di convenzioni e formalismi.

Esempio: si consideri una scacchiera nella quale siano state rimosse due caselle agli angoli
opposti. Lobiettivo quello di riempire le rimanenti caselle con le tessere del domino, ognuna delle
quali copre due quadrati, senza sovrapposizioni e senza uscire dai limiti della scacchiera.

Rappresentazione (a): per risolvere il problema posso enumerare tutte le disposizioni e vedere se
una di esse corretta
Rappresentazione (b): evidenzia che ciascuna tessera del domino copre sempre una casella
bianca e una nera.
Rappresentazione (b) + informazione (c): evidenzia che il problema non ha soluzione.

Le caratteristiche di un metodo di rappresentazione devono obbedire, comunque, a degli specifici


requisiti:

12

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

potenza espressiva: capacit di esprimere in modo completo vari domini di conoscenza con
differenti caratteristiche;

facile comprensione della notazione;

efficienza: capacit di strutturare la conoscenza in modo che ne venga facilitato e


velocizzato

lutilizzo e laccesso durante la risoluzione del problema evitando ridondanze;

flessibilit, modificabilit, estensibilit: che costituiscono caratteristiche essenziali per una


base di conoscenza.

In base al grado di accessibilit la conoscenza pu essere suddivisa in:

Tacita: mente umana e organizzazione

Implicita: processi consuetudinari, informazioni non strutturate

Esplicita: documenti e dati formalizzati

L indicizzazione, le ontologie, le mappe cognitive e il web semantico sono strumenti che ben si
prestano per una corretta rappresentazione della conoscenza.

2.2 Linguaggi formali e naturali

Il linguaggio consente la comunicazione, intesa come scambio di informazioni (elementi di


conoscenza significativa). Uninformazione (dato+descrittore) pu:

essere acquisita tramite rilevamento diretto di un evento reale, mediante percezione


sensoriale;

essere trasmessa intenzionalmente (messaggio) da un emittente al ricevente per mezzo di


un canale.

Nel secondo caso la sorgente dellinformazione sceglie la rappresentazione pi opportuna,


affinch il messaggio sia compreso in modo univoco ed obiettivo. Lemittente colui dal quale
parte linformazione, il mezzo che trasporta linformazione detto canale. Il ricevente il
destinatario dellinformazione.
La funzione fondamentale del linguaggio quella di sostituire ad oggetti o concetti dei simboli.
Ogni parola (significante) rappresenta un oggetto concreto, una persona, un ente astratto
(significato). Distinguiamo tra:

linguaggi naturali, utilizzati nella comunicazione quotidiana tra gli esseri umani, privi di una
definizione rigorosa ed in continua evoluzione; spesso presentano ambiguit ma hanno
enorme potenza espressiva;

linguaggi formali, creati dalluomo per scopi precisi, secondo regole convenzionali esplicite
che non ammettono eccezioni e non consentono sinonimi e omonimie. Il significato di una

13

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

frase di tali linguaggi sempre privo di ambiguit ed sempre possibile determinarne la


correttezza (grammaticale); per contro essi hanno potere espressivo limitato.
I linguaggi naturali sono le lingue parlate, come l'inglese, l'italiano, lo spagnolo. Non sono
linguaggi "progettati" e anche se stato imposto un certo ordine nel loro sviluppo si sono evoluti
naturalmente. Diversamente, i linguaggi formali sono linguaggi progettati per specifiche
applicazioni.
Ad esempio, la notazione matematica un linguaggio formale particolarmente indicato ad
esprimere relazioni tra numeri e simboli; i chimici usano un linguaggio formale per rappresentare la
struttura delle molecole, i linguaggi di programmazione sono linguaggi formali che sono stati
progettati per esprimere elaborazioni.
Le regole sintattiche si possono dividere in due categorie: la prima riguarda i token, la
seconda la struttura. I token sono gli elementi di base del linguaggio (quali possono essere le
parole in letteratura, i numeri in matematica e gli elementi chimici in chimica).
Il secondo tipo di regola riguarda la struttura della dichiarazione, cio il modo in cui i token sono
disposti; quando si legge una frase in italiano o una dichiarazione in un linguaggio formale occorre
comprendere quale sia la struttura della dichiarazione. Questo processo in un linguaggio naturale
viene realizzato in modo inconscio e spesso non ci si rende conto della sua intrinseca complessit.
Ad esempio, quando sentiamo la frase "La scarpa caduta", capiamo che "la scarpa" il soggetto
e che " caduta" il verbo. Dopo aver analizzato la frase opportuno comprendere cosa essa
significa (cio la semantica della frase). Partendo dal presupposto che si conosca cosa sia una
"scarpa" e cosa significhi "cadere" si riesce a comprendere il significato generale della frase.
Anche se i linguaggi formali e quelli naturali condividono molte caratteristiche (token, struttura,
sintassi e semantica) ci sono tuttavia molte differenze:

Ambiguit : i linguaggi naturali ne sono pieni ed il significato viene ottenuto anche grazie ad
indizi ricavati dal contesto. I linguaggi formali sono progettati per essere completamente
non ambigui e ci significa che ciascuna dichiarazione ha esattamente un significato,
indipendente dal contesto.

Ridondanza: per evitare l'ambiguit e ridurre le incomprensioni i linguaggi naturali


impiegano molta ridondanza. I linguaggi formali sono meno ridondanti e pi concisi.

Letteralit: i linguaggi naturali fanno uso di paragoni e metafore, e possiamo parlare in


termini astratti intuendo immediatamente che ci che sentiamo ha un significato simbolico. I
linguaggi formali invece esprimono esattamente ci che dicono.

Anche se siamo cresciuti apprendendo un linguaggio naturale, la nostra lingua madre, spesso
abbiamo difficolt ad adattarci ai linguaggi formali. In un certo senso la differenza tra linguaggi
naturali e formali come quella esistente tra poesia e prosa, ma in misura decisamente pi
evidente:

14

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Poesia - le parole sono usate tanto per il loro suono che per il loro significato, e la poesia nel suo
complesso crea un effetto o una risposta emotiva. L'ambiguit non solo frequente, ma spesso
addirittura cercata.
Prosa - il significato delle parole estremamente importante, con la struttura che contribuisce a
fornire maggior significato. La prosa pu essere soggetta ad analisi pi facilmente della poesia, ma
pu risultare ancora ambigua.
I linguaggi formali sono molto pi ricchi di significato dei linguaggi naturali, cos
necessario pi tempo per leggerli e comprenderli. La struttura dei linguaggi formali molto
importante e solitamente non una buona idea leggerli dall'alto in basso, da sinistra a destra,
come avviene per un testo letterario: importante analizzare il programma nella tua testa,
identificandone i token ed interpretandone la struttura.
I dettagli sono importanti: piccole cose come errori di ortografia e cattiva punteggiatura sono
spesso trascurabili nei linguaggi naturali, ma possono fare una gran differenza in quelli formali.

2.3 I Linguaggi di descrizione documentaria

Il linguaggio documentario (o indexing) la lingua convenzionale usata per descrivere il


contenuto dei documenti con particolare attenzione alla registrazione ed al reperimento delle
informazioni. Esistono diversi tipi di linguaggi documentari che si differenziano dal loro scopo,
organizzazione, utilizzo, ecc.
Storicamente, le classificazioni ed i titoli di indice sono stati lungamente utilizzati a tale scopo, ma
le nuove tecniche ed i nuovi bisogni hanno condotto alla formulazione di nuovi tipi di linguaggi, a
volte contrapposti con il metodo precedente.
Tuttavia, se parliamo delle classificazioni, dei titoli di indice, delle parole chiavi, delle liste dei
descrittori, dei thesauri o dei lessici, tutti questi linguaggi appartengono alla stessa famiglia, hanno
lo stesso scopo ed hanno molte caratteristiche in comune.
Un linguaggio documentario usato per l'elaborazione intellettuale dei documenti, cio per il loro
inserimento nel sottosistema di registrazione e di recupero dell'informazione e per i processi di
diffusione dell'informazione stessa.

15

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

2.4 Linguaggi Documentari: SGML

Nel campo dei cosiddetti linguaggi documentari" possibile distinguere due grandi insiemi,
entrambi normati a pi riprese dal ISO. Il primo, per molti versi prototipale, riguarda
essenzialmente i Thesauri (che tratteremo compiutamente nel capitolo successivo) e quindi la
terminologia ed i rapporti gerarchici intercorrenti tra le variabili terminologiche e semantiche della
descrizione della realt capaci di produrre una artificiale rappresentazione dei concetti presenti, in
linguaggio libero, nei documenti esaminati.
La norma ISO 2788 - 1986 definisce il thesaurus come "vocabolario di un linguaggio di
indicizzazione controllato e formalizzato in modo da rendere esplicite le relazioni a priori tra i
termini", in ci parzialmente discostandosi dalla precedente stesura della stessa norma (27881974) che statuiva la possibilit di definire il thesaurus sia secondo la funzione che secondo la
struttura accentuando cos, in un certo senso, la funzionalit dello stesso come strumento per il
recupero dell'informazione; possibilit che invece sottesa ma non espressa nella pi concisa
formulazione successiva. All'indicizzazione e ai thesauri multilingue l' ISO dedica inoltre due
specifiche norme: la 5963-1985 e la 5964-1985.
Al secondo gruppo di linguaggi documentari appartengono invece quelli che pi che delle
relazioni linguistiche e semantiche si occupano della strutturazione e della descrizione formale del
documento e delle sue parti, specificatamente in relazione ai documenti in formato elettronico.
Lo standard ISO 88799 definisce le caratteristiche di un linguaggio di marcatura del testo
denominato SGML (Standard Generalized Mark-up Language) capace di descrivere la struttura e
gestire il contenuto di qualunque documento elettronico, prescindendo dalle restrizioni imposte
dalla diversit dei software applicativi e dei sistemi operativi utilizzati.
SGML permette di gestire il documento strutturato indipendentemente dal suo stile visuale
e dal sistema software utilizzato per scriverlo, in quanto del testo, suddiviso in tags logiche
dichiarate in una DTD (Docurnent Tyype Definition), esso vede i legami logici e contenutistici. Il
documento stesso potr poi essere visualizzato in forme e stili diversi a seconda dei viewer
utilizzati ma sempre obbedendo rigidamente alle regole strutturali definite. Per esempio se la DTD
dichiara che la sezione titolo viene dopo la sezione capitolo e non dopo la sezione paragrafo,
nessuna altra sequenza gerarchica sar ammessa se non preliminarmente modificando la DTD.
Facendo riferimento alla figura che segue, e semplificando il modello reale, la Divina Commedia ad esempio - composta da terzine e versi precedute dal titolo. Questi sono gli elementi strutturali
che compongono un tipico poema in versi. Questo struttura viene recepita dall' SGML come
segue:

16

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

<POEMA lingua=italiano>
<TITOLOPOEMA >
Divina Commedia
Nel mezzo del cammin di nostra </TITOLOPOEMA >
vita

<GRAFICA entit=selva_oscura>

mi ritrovai per una selva oscura

<TERZINA>

che la diritta via era smarrita

<VERSO>
Nel mezzo del cammin di nostra vita </VERSO>
<VERSO>
mi ritrovai per una selva oscura </VERSO>
<VERSO>
che la diritta via era smarrita </VERSO>
</TERZINA>
<- altre terzine -->
</POEMA>

Nella parte sinistra della tabella viene indicata una possibile visualizzazione della divina commedia
mentre nella parte destra riportata la corrispondente istanza SGML che corrisponde al
documento. Come si pu notare ogni elemento documentale e racchiuso tra due "tag" che
definiscono il contenuto logico dell'elemento. Ad esempio la stringa "Divina Commedia"
contenuta all'Interno delle due "tag" <TITOLOPOEMA> </TITOLOPOEMA > che identificano e
limitano il titolo del poema.
Si noti come un attributo del poema specifichi che si tratta di un poema in lingua Italiana.
Viene anche definito un elemento <GRAFICA> il cui attributo permette di identificare una entit
grafica esterna.
Il corrispondente modello documentale, definito per l'appunto in linguaggio SGML :
< !DOCTYPE POEMA- questa e' una DTD[<!ELEMENT POEMA - (GRAFICA,TITOLOPOEMA,TERZINA+)>
<!ATTLIST POEMA lingua (italianolfranceselinglese) "italiano">
<!ELEMENT GRAFICA EMPTY>
<!ATTLIST GRAFICA entit CDATA #REQUIRED>
<!ELEMENT TITOLOPOEMA - (#PCDATA)>
<IELEMENT TERZINA - (VERSO,VERSO,VERSO)>
<!ELEMENT VERSO -0 (#PCDATA)>
]>

17

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

In questo semplice modello si pu notare come vengano definiti gli elementi poema, titolo del
poema, grafica, terzina e verso. Vengono inoltre definiti l'attributo lingua (relativo a poema) ed il
nome del file grafico da inserire dopo il titolo.
Il modello appena definito la "DTD" (Document Type Definition); e corrisponde alla struttura della
base dati nei data base relazionali.
Non si pu per parlare di SGML se non si introduce anche il concetto di stile.
Nell'esempio precedente il titolo della Divina Commedia era "Courier New centrato, grassetto,
corpo 18" mentre i versi erano "Courier New, italico, corpo 10". Nulla nella struttura SGML avrebbe
vietato di fare assolutamente il contrario o addirittura a mostrare il solo titolo e non i versi.
Avremmo solo applicato delle regole di visualizzazione diverse (stili) alla stessa istanza SGML.
Questa caratteristica di fondamentale importanza, e permette di applicare il concetto di
"report=stile" ai dati di tipo documentale.
Ad esempio un utente potrebbe decidere di utilizzare uno stile che non mostri le figure,
magari al fine di velocizzare la visualizzazione su un computer privo di capacit grafiche, e un
utente cieco potrebbe decidere si trasformare l'istanza SGML in caratteri Braille.
Il concetto di stile non si limita per alle sole caratteristiche editoriali, ma permette di
arrivare a sofisticatissime integrazioni tra il documento ed il processo cui il documento si riferisce
(manutenzioni automatiche, processi semiautomatici di controllo, etc..).
Anche le ISAD(G), norme internazionali di descrizione archivistica adottate dal Conseil
International des Archives e finalizzate ad assurer la creation de descriptions uniformes,
pertinentes et explicites; de faciliter le reprage et la communication d'informations sur les
documents d'archives ; de permettre l'echange de vedettesautorits, et de rendre possible
l'intgration de descriptions provenant de piusieurs depots dans un systme d'infor-mation unifi,
definiscono una struttura formale di descrizione delle unit archivistiche individuando degli
elementi determinati capaci, nella loro combinazione, di descrivere ogni unit documentaria e
precisando, contestualmente, una struttura formale all'interno della quale collocare gli elementi
individuati.
"Les rgles suiveni une structure que l'or prconise pour toute description incorporant les lments
rgis par les rgles. A l'intrieur de cette struclure, les lments sont regroups en cinq zones
d'in!ormation qui comprennent:

La zone d'identification

La zone du contexte et du contenu

La zone sur les conditions ci'accs et ci'utilisation

La zone sur les documenis connexes

La zone des notes

Tra la DTD di un documento SGML finalizzata alla definizione formale delle parti di un testo
elettronico e le zone di informazione delle ISAD(G) non esiste opposizione concettuale, ma bens

18

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

ravvisabile una convergenza sia sulle basi teoriche della strutturazione normalizzata della
conoscenza che sulle regole pratiche di standardizzazione e normalizzazione, con la semplice
diversit accessoria del target di destinazione, esclusivamente elettronico per gli uni e
multisupporto per gli altri. Nulla vieta di creare una DTD conforme alle ISAD(G). sia nelle aree di
informazione che negli elementi descrittivi, vincolando come obbligatori - ad esempio - i cinque
elementi considerati inizialmente come essenziali e generando, cos, un documento elettronico che
unisca il rigore descrittivo alla piena portabilit e diffusione su Web, ed i cui elementi informativi
possano - infine - essere tranquillamente parte di un thesaurus specializzato. E la diversit (dei
supporti, dei target di destinazione, degli ausili tecnologici e dei retaggi delle singole disciplina che
genera, a volte, delle partizioni che non hanno ragion d'essere se non nella piena e corretta
definizione dei compiti di ognuno. Tutto deve concorrere, per, al raggiungimento di un risultato
comune cos come avviene in molte altre branche della scienza nelle quali le singole specialistiche
convergono verso l'unicit dell'oggetto di studio. L'idea di questa sinergia anche alla base della
creazione delle Encoded Archival Description (EAD) DTD SGML per la descrizione documentale
sviluppate dalla University of California e accettate nel 1998 dalla Society of American Archivist30.

30

J. D. DOOLEY, Encoded Archival Description: context, theoy, and case studies, SAA, Chicago, 1998.

19

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

3. La classificazione e lindicizzazione
3.1 Definizioni

Indicizzazione

classificazione

sono

stati,

finora,

momenti

quasi

antitetici

di

organizzazione della conoscenza allinterno delle scienze documentarie giocati sul filo della
polisemia del termine documento. Oggi il tradizionale dualismo Indicizzazione/Classificazione va
rivisitato alla luce dei nuovi supporti scrittori e della validit dei nuovi media, aprendo cos singolari
ed affascinanti possibilit di integrazione interdisciplinare. Tradizionalmente la classificazione
riguarda lunit documentaria e lindicizzazione il suo contenuto informativo.
Lattivit di indicizzazione, definita nella norma ISO 5963/85 come linsieme delle
procedure necessarie per lanalisi dei documenti, la determinazione del loro contenuto e
lindividuazione dei termini di indicizzazione; essa si configura

come una serie di azioni che

mirano a riassumere la significativit semantica dellunit documentale in una stringa di testo o in


uno o pi termini singoli rappresentativi dellintero contesto. Primo step metodologico di tale attivit
lanalisi concettuale, che consiste, proprio nellesame del documento, nella determinazione del
suo contenuto concettuale e nellidentificazione dei concetti che si ritiene possano utilmente
rappresentare quel contenuto in uno strumento di recupero.
La classificazione una operazione quanto mai delicata, che deve consentire di ricondurre la
molteplicit degli affari trattati ad un determinato numero di categorie gerarchicamente ordinate, in
modo che gli atti prodotti quotidianamente vengano a sedimentarsi secondo un ordine logico che
rispecchi, storicamente, lo sviluppo e levoluzione dellattivit svolta, nonch le finalit raggiunte31

3.2 Le opinioni: P. Otlet, B. Bonifacio, E. Casanova, G. Concetti

Con il termine classificazione si definiscono attivit connesse alla categorizzazione sia del
materiale bibliografico che di quello pi specificatamente archivistico. Nella concezione di H.
Lafontaine e P. Otlet, che rielaborarono la classificazione decimale di Melvil Dewey, non vi erano
limiti di applicazione del sistema giacch si trattava di classificazione del sapere e dei risultati delle
ricerche e non gi di questa o quella tipologia di materiali.
Lintento primo di Otlet come gi precedentemente accennato - era quello della classificazione
del sapere scritto e, per questo si orient immediatamente verso la Classificazione Decimale
Dewey, in quanto riteneva potesse essere uno strumento funzionale al progetto di
categorizzazione universale della conoscenza. Pur se lo strumento utilizzato

apparentava la

nascente disciplina la documentazione - alla biblioteconomia, introducendo il termine

31

R. DE FELICE, La classificazione degli atti negli archivi moderni, RAS, n. 2 (1964).

20

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

documentazione per indicare un nuovo campo di studi e di ricerca, scientificamente fondato ed


autonomo rispetto alle discipline bibliografiche e biblioteconomiche tradizionali, Otlet dimostra di
concepire la documentazione in termini di progettualit futura che coinvolge globalmente il disegno
di un sistema di produzione intellettuale mondiale32
La sua concezione unitaria dellattivit classificatoria si basava su una concettualit
operativa e non meramente conservativa del termine documento. Esso oggetto, magma, da
ridurre a unit informative semplici da integrare per costruire un nuovo sapere basato sulla
interrelazione cognitiva. Giova ricordare la definizione di B. Croce Per documenti sono da
intendersi tutte le opere del passato ancora rievocabili nei segni delle scritture, nelle notazioni
musicali, nelle pitture, sculture e architetture, nei ritrovati tecnici, nelle trasformazioni fatte della
superficie terrestre, in quelle fatte nelle profondit degli animi, ossia begli istituti politici, morali,
religiosi, nelle virt e nei sentimenti via via formati lungo i secoli e ancora vivi e operosi in noi33.

Lintento di Otlet era quello di una rationalisation du livre et du document, la costituzione di una
unit documentaria/cognitiva primaria formata da libri e documenti, ognuno con la sua valenza e la
sua carica di informazioni e di specificit.

3.3 Un tentativo di sinergia: La classificazione ideologica

Nel 1953 la Commissione sulla Riforma della Pubblica Amministrazione propone una
classificazione ideologica. Essa prende in considerazione per unit di misura la divisione
ministeriale quale unit mobile da sistemare come si vuole e si deve, senza toccare gli atti che la
compongono, come le unit di un esercito che si muovono, si raggruppano, si spostano, senza far
loro perdere n forze n aspetto.
Esempio:
I Archivio segreto, atti riservati di Stato, ecc.
II Legislazione
III Organizzazione Giudiziaria
IV Organizzazione Amministrativa
A. Interna
B. Estera
C. Finanziaria
D. .
V Organizzazione militare
VI - .

32

A. BALDAZZI, Le radici storiche della documentazione in Europa, in: A. M. PACI (a cura di), La Documentazione in Italia, Milano,
1996, p. 44.
33
B. CROCE, La storia come pensiero e come azione, Bari 1943, p. 109

21

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Questo sistema, previsto per lArchivio Centrale dello Stato e mai compiutamente attuato, si
ispirava a criteri molto vicini alla classificazione decimale universale e lasciava aperto ed irrisolto il
problema della classificazione interna dei singoli fondi nonch degli archivi correnti in quanto
postulava il concetto di archivio divisionale o ministeriale come unit archivistica primaria o livello
divisionale primario.

3.4 La Classificazione sistematica

A livello di singolo complesso archivistico, di archivio quindi originante da un singolo


soggetto produttore il sistema finora pi utilizzato in Italia stato quello della classificazione
sistematica per competenze da mantenere o, eventualmente, ripristinarsi, in sede di
riordinamento, secondo il criterio del metodo storico, trasposizione nazionale del Respect des
fonds di Natalis de Wailly, teorizzato dal Bonaini e dal Casanova e poi, con alterne vicende e
accentuazioni, discusso, raffinato ed applicato fino ad oggi. Senza voler qui entrare nellannoso
problema di quale sia lordine originario cui fare riferimento, se quello formalmente determinato o
quello pragmaticamente applicato e se un ordinamento palesemente illogico ed erroneo nella
linea tracciata dal Brenneke - sia da considerarsi comunque originario, la definizione che meglio
a nostro giudizio si presta a definirne la concettualit quella data dal Cencetti nel suo gi
citato lArchivio come Universitas rerum nel quale mette laccento sulla necessariet della funzione
documentale come mezzo per lamministrazione di esplicare la propria attivit nel contesto socioeconomico nel quale si trova ad operare. Da questo presupposto ne discende naturalmente
che lordinamento , esso stesso, un fatto spontaneo in quanto listituzione produce i documenti
perch necessariamente deve farlo per poter agire e, altrettanto necessariamente, li tratta, li
gestisce e li ordina secondo un autonomo schema di funzionamento che quello delle proprie
specifiche funzionali.

3.4 Quadro di classificazione


In questottica non si pu parlare di ordinamento senza postulare un Titolario o Quadro di
Classificazione. Esso altro non che una astrazione delle competenze dellente allinterno del
quale ad ogni funzione associato un indicatore alfa/numerico gerarchicamente ordinato in un
albero logico.

Esempio: (estratto dallAtto Aziendale)


Alla data di entrata in vigore del presente regolamento lA.S.L. organizzata in:
a) direzione generale,
b) direzione amministrativa,
c) direzione sanitaria,

22

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

d) servizi centrali e di staff,


e) distretti sanitari,
f)

presidi ospedalieri,

g) dipartimento di prevenzione,
h) ex laboratorio di igiene e profilassi,
i)

gestioni liquidatorie.

Ne consegue una struttura di titolario:


Titolo I
DIREZIONE GENERALE
classe
A. Segreteria Direzione;
B. Settore Gabinetto :
sottoclasse:
1. attivit di collegamento con organi statali, regionali, enti locali e altri enti istituzionali e territoriali;
2. organi di stampa;
3. direzioni operative dellA.S.L.;
4. corrispondenza e attuazione procedimenti facenti capo al direttore generale.
C. Segreteria Organi e rapporti con le OO.SS

3.5 Il protocollo
La classificazione, quale punto di avvio dellordinamento, dovrebbe avvenire gi al
momento della protocollazione degli atti.
In tal senso si esprimono gi nel 1806 - le Istruzioni ai vice Prefetti del Regno d'Italia che, nel
prescrivere l'obbligatoriet del registro di protocollo per tutte le Pubbliche Amministrazioni, legano
quest'obbligo, per la prima volta, alla necessit di correlare l'indice numerico ad un sistema di
classificazione capace di consentire la collocazione degli atti in un reticolo fisico/logico che, oltre a
categorizzare il sapere, permettesse, praticamente, il recupero delle unit documentarie:

La decima (colonna del protocollo) contiene le annotazioni per trovare le carte riposte in archivio:
essa suddivisa in due. Nella prima si marca il titolo, o sia la materia a cui appartiene la carta;
nella seconda il numero di fascicolo Perch l'archivio riunisca il doppio scopo di conservare con
sicurezza le carte e di offrire il modo di rinvenirle prontamente, vi saranno esse distinte per
materia. Ogni materia sar collocata in archivio per ordine alfabetico , cominciando da un punto
della camera e proseguendo gradatamente. Sul dorso di ciascuna cartella sar scritto il titolo della
materia , per esempio censo, acqua, strade, amministrazione dei comuni, imposta distrettuale,
ecc.34.
34

Istruzioni del Ministero degli Interni ai viceprefetti del Regno d'Italia, n. 16046 del 1 gennaio 1806.

23

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Tutte le disposizioni ed i regolamenti dello Stato unitario hanno poi ripreso e confermato
quest'indirizzo ponendo l'accento proprio sulla necessit del recupero del documento come
supporto all'azione amministrativa anche se, nel 1894, Enrico De Paoli, soprintendente
dellArchivio di Stato di Roma, afferma che per quasi tutti gli uffici gli atti si registrano, si
dispongono, si conservano secondo che piace al protocollista; e le faccende di archivio sono
credute troppo umili perch il capo dellufficio debba mai occuparsene.35
L'azione classificatoria obbedisce quindi ad una duplice esigenza e finalit. Una necessit di
strutturazione del sapere ed una necessit di rinvenimento materiale degli atti del quale la prima
attivit la necessaria premessa metodologica. ovvio che sulla valenza centrale di questo tipo di
attivit ha influito, in maniera massiccia, la fisicit obbligatoria del documento che, fino al 1990, con
l'emanazione della L. 241 era, indissolubilmente, legata alla carta. Con le modificazioni introdotte
dall'art. 22 della citata L. 241/90, la successiva piena accettazione del documento informatico con
il Decreto Legislativo n. 39 del 1993 e la sanzione esplicita dell'art. 2 del D.P.R. 513 del 1997, la
liberalizzazione e delocalizzazione del supporto scrittorio ha profondamente minato la ratio stessa
della classificazione, non pi condizione necessaria per un recupero logico di elementi informativi.
Se il documento diventa di fatto - un insieme di unit informative che, virtualmente, vengono
assemblate in funzione delle chiavi ricerca o delle query dell'utente, ci che rilevante ai fini del
recupero dell'informazione la significativit semantica e non la strutturazione formale di una
griglia determinata a priori. Se la finalit del nostro precedere recuperare informazione perch,
opportunamente elaborata, diventi parte del nostro patrimonio cognitivo supportando cos l'attivit
dei decisori dell'amministrazione generando nuova conoscenza, ci che rilevante, in ambito
digitale, non pi o non solo la classificazione ma bens l'indicizzazione. Che poi questa prenda
il nome che pi le proprio o venga variamente definita secondo accezioni grammaticali
maggiormente appetibili al pubblico dei media moderni irrilevante in genere e, tanto pi al nostro
procedere, che pretende solo di essere uno spunto di riflessione teorica ed una provocazione
sull'argomento.
Ci non significa negare il vincolo archivistico, legame inscindibile di causalit che d senso e
significato alle unit documentarie ma, bens, prendere coscienza che questo, teorizzato in
un'epoca di unicit del supporto scrittorio, deve necessariamente essere rivisto e rivisitato in
conseguenza della profonda modificazione del contesto culturale e giuridico-amministrativo di
riferimento e che quindi, conseguentemente, la sua validit nell'attuale accezione
cronologicamente delimitata e determinata.

35

Relazione pubblicata in appendice a E. CALIFANO, Gli Archivi correnti dei Ministeri, in Amministrazione Civile, nn. 47/51 (1961).

24

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

3.6 Analisi concettuale


Come gi detto, l'attivit di indicizzazione si configura come una serie di azioni che mirano
a riassumere la significativit semantica dell'unit documentale in una stringa di testo o in uno o
pi termini singoli rappresentativi dell'intero contesto. Primo step metodologico di tale attivit
l'analisi concettuale, che consiste, proprio nell'esame del documento, nella determinazione del
suo contenuto concettuale e nell'identificazione dei concetti che si ritiene possano utilmente
rappresentare quel contenuto in uno strumento di recupero36. Quando ad esempio - il
protocollista provvede alla compilazione del campo oggetto, pur non sempre conoscendo regole e
tecniche codificate, compie un'azione chiaramente riconducibile a quella metodologia o, per meglio
dire, alla prima fase della metodologia di estrazione che l'individuazione del tema principale del
documento oggetto di annotazione. La mancanza di specifiche competenze fa s che il livello di
affidabilit scientifica della metodologia utilizzata e, conseguentemente, dei risultati non sia
tipizzabile e determinabile genericamente ma questo un fatto accidentale e non un
condizionamento concettuale.

Norma UNI ISO 5963/1985 Metodi per l'analisi dei documenti, la determinazione del loro
soggetto e la selezione dei termini di indicizzazione
(sintesi)

La norma descrive le procedure raccomandate per l'analisi dei documenti, la determinazione


del loro contenuto e la scelta dei termini d'indicizzazione appropriati, senza occuparsi degli
aspetti pratici di alcun tipo particolare di sistema d'indicizzazione sia pre-coordinato che
postcoordinato.
Descrive anche le tecniche generali per l'analisi dei documenti applicabili a tutti i
casi di indicizzazione.
Le tecniche descritte dalla norma sono adottabili nell'ambito dell'indicizzazione 'umana' e non
automatica.
La norma si propone come guida per gli indicizzatori nelle fasi dell'analisi e
dell'identificazione dei concetti, ma pu anche essere utile per analizzare le richieste degli
utenti ai fini del recupero dell'informazione, o essere di aiuto ai compilatori di riassunti
analitici.
Scopo della norma promuovere procedure normalizzate nell'ambito di una organizzazione o
fra diversi organismi, soprattutto quelli che scambiano notizie bibliografiche.
Altre norme correlate sono:
ISO 2788: Orientamenti per la creazione e lo sviluppo di thesauri monolingue;
ISO 5964: Orientamenti per la creazione e lo sviluppo di thesauri multilingue.
36

ALBERTO CHETI, Manuale di analisi concettuale, <www.unibo.it>.

25

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

La norma fornisce proprie definizioni per alcuni dei termini usati:


documento: qualsiasi unit, a stampa o no, che sia riconducibile ad un'operazione di catalogazione
o di indicizzazione
concetto: un'unit di pensiero
soggetto: ogni concetto o combinazione di concetti che rappresentino un tema all'interno di un
documento
termine di indicizzazione: la rappresentazione di un concetto sotto forma di un termine derivato dal
linguaggio naturale o di un simbolo di classificazione
termine preferenziale (preferito) o descrittore: un termine usato coerentemente nell'indicizzazione
per rappresentare un dato concetto
termine non preferenziale (preferito) o non descrittore: sinonimo o quasi-sinonimo di un termine
preferenziale, che non viene assegnato ai documenti ma costituisce un punto di acesso da cui
l'utente viene indirizzato al termine preferenziale
indice: una lista alfabetica o sistematica di soggetti che localizzi ciascun soggetto all'interno di
un documento o di una raccolta di documenti
indicizzazione: l'azione di descrivere o identificare un documento nei termini del suo contenuto
concettuale.
Nel corso del processo di indicizzazione i concetti sono estratti dai documenti mediante un
procedimento di analisi intellettuale, quindi sono tradotti nelle voci.
L'indicizzazione composta delle tre fasi seguenti:
1. esame del documento e individuazione del suo contenuto concettuale;
2. identificazione dei concetti principali presenti in un soggetto;
3. traduzione nei termini di un linguaggio di indicizzazione.
5. Analisi del documento
Con particolare riferimento per i documenti a stampa, le principali fonti per l'esame del
documento e l'accertamento del contenuto sono:
1. titolo e sottotitolo,
2. riassunto analitico, se presente,
3. indice o sommario,
4. introduzione, frasi iniziali dei capitoli e dei paragrafi, conclusione,
5. illustrazioni, diagrammi, tavole con relative didascalie,
6. parole o gruppi di parole sottolineate o stampate con caratteri speciali.
E' assolutamente sconsigliato indicizzare valendosi solo del titolo.
Dovrebbe avvenire seguendo un approccio sistematico, con l'ausilio di liste di controllo dei
fattori riconosciuti importanti nel campo disciplinare coperto dall'indice.
Le domande sottoelencate illustrano i criteri generali che tale lista di controllo dovrebbe
stabilire:

26

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

1. L'attivit trattata dal documento esercitata su di un soggetto particolare?


2. Il soggetto contiene un concetto che indica attivit (per es. un'azione, un'operazione, un
processo, ecc.)?
3. L'oggetto subisce l'attivit identificata?
4. Il documento tratta dell'agente di questa azione?
5. Si riferisce a mezzi particolari per compiere l'azione (per esempio strumenti, tecniche o
metodi speciali)?
6. E' identificata una variabile dipendente o indipendente?
7. Il soggetto stato considerato da un particolare punto di vista normalmente non
associato a quel campo di studio?
Altre domande possono essere identificate all'interno di ogni particolare disciplina.
La scelta dei concetti da selezionare e tradurre in termini di indicizzazione dipende dagli scopi
previsti, dall'unit materiale che si sta indicizzando, ecc. Le due carattestiche influenzate da
questi fattori sono
l'esaustivit, che si riferisce alla quantit di elementi che vengono rappresentati dai termini
assegnati dall'indicizzatore al documento. Nella selezione dei concetti, l'indicizzatore dovrebbe
sempre valutare la potenzialit di ogni elemento (concetto) per l'espressione del soggetto del
documento e per il suo recupero, nel contesto del sistema informativo, della comunit di utenti,
delle finalit dell'indice, senza porsi limiti arbitrari al numero di termini assegnabili al documento;

la specificit, che riguarda l'esattezza con cui un particolare concetto specificato dal
linguaggio d'indicizzazione. I concetti dovrebbero essere identificati il pi specificamente
possibile, fatta eccezione per i casi in cui l'eccessiva specificit possa influenzare
negativamente le prestazioni del sistema d'indicizzazione.

Giunto alla fase della traduzione dei concetti nei termini del linguaggio d'indicizzazione,
l'indicizzatore dovrebbe:

tradurre con termini preferiti i concetti gi presenti nel linguaggio

utilizzare strumenti di consultazione come dizionari ed enciclopedie disciplinari

autorevoli, thesauri e tavole di classificazione per controllare i termini esprimenti


concetti nuovi.
Qualit e omogeneit dell'indicizzazione dipendono da fattori come:

l'esperienza e la competenza dell'indicizzatore

la qualit degli strumenti d'indicizzazione.

In una situazione ideale, termini assegnati e livello di esaustivit raggiunto dovrebbero essere
coerenti indipendentemente dall'indicizzatore, e rimanere tendenzialmente stabili nel tempo.
L'indicizzatore dovrebbe essere dotato di imparzialit, oggettivit, di una conoscenza adeguata
dell'area coperta dai documenti e delle lingue in cui i documenti sono scritti. Sarebbe bene anche
che avesse momenti di contatto diretto con gli utenti per verificare sul campo l'efficacia

27

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

delle loro indicizzazioni.


Il linguaggio dovrebbe essere flessibile, ammettere con facilit termini nuovi o variazioni
terminologiche, essere in grado di rispondere alle nuove esigenze degli utenti, avere una
politica di aggiornamento frequente.
La qualit dell'indicizzazione dovrebbe essere controllata analizzando i risultati del recupero,
per esempio calcolando il rapporto fra richiamo e precisione.

28

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

4. I Thesauri
4.1Definizioni
Il thesaurus un vocabolario di un "linguaggio di indicizzazione" controllato, organizzato
in maniera formale, in maniera cio da rendere esplicite le relazioni "a priori" fra i concetti37.
Il thesaurus un insieme di parole e frasi che rappresentano relazioni di equivalenza e
associative che forniscono un vocabolario standardizzato per sistemi di archiviazione e recupero
dei documenti38.Esso uno strumento basilare per trasformare le idee in parole39., nonch uno
strumento

di

controllo

terminologico

nei

sistemi

postcoordinati40.

In termini di funzione uno strumento terminologico usato per tradurre il linguaggio naturale dei
documenti, degli indicizzatori o degli utenti in un linguaggio di sistema, pi strutturato, detto anche
linguaggio documentario o linguaggio di informazione. In termini di struttura un vocabolario
controllato e dinamico di termini semanticamente correlati che coprono un determinato ambito
disciplinare41.
L'ANSI42 non cita le relazioni gerarchiche, non chiarisce che le relazioni investono i concetti
rappresentati dai termini e non i termini stessi, pone l'accento sullo scopo di archiviazione e
recupero;
Il cosiddetto Thesaurus del Roget, che viene considerato lantenato dei moderni thesauri anche se,
in effetti, un dizionario tematico di sinonimi, contrari, ecc., ad uso di giornalisti, pubblicisti, scrittori
ecc., enuclea il problema principe non solo dei thesauru ma di qualsiasi sistema di indicizzazione,
cio

la

rappresentazione

dei

concetti

attraverso

codici

linguistici;

Ad oggi, comunque, la definizione vigente di thesaurus quella data nel 1986 dallo standard ISO
2788. La norma circoscrive innanzi tutto il thesaurus alla sola parte lessicale (semantica) di un
linguaggio d'indicizzazione e di ricerca, al quale, onde ottenere un codice documentario completo,
va abbinato il corpus di norme (sintassi) che regolano i rapporti sintagmatici tra gli elementi di un
enunciato di soggetto (che esprime quindi rapporti fra termini non aprioristici ma dipendenti dal
documento, ad es. l'ordine di citazione dei termini, l'impiego di simboli esprimenti determinate
relazioni, gli accorgimenti tipografici o la punteggiatura fra i termini, e cos via). Questo
"vocabolario" alfabetico in quanto adopera termini che, bench sottoposti a controllo,
appartengono al pi vasto insieme della lingua naturale, a differenza degli schemi di
classificazione, detti artificiali puri, nei quali i concetti sono rappresentati da notazioni numeriche o
alfanumeriche non portatrici di significato se non all'interno del proprio stesso sistema. Il concetto
di controllo si traduce, invece, in un requisito fondamentale volto a garantire l'incontro fra lessico
37

Guidelines for the establishment and development of monolingual thesauri. ISO (International Organization for Standardization),
2788/1986; trad. it. UNI/ISO 2788: 1993. Linee guida per la costruzione e lo sviluppo di thesauri monolingue.
38
Guidelines for thesaurus structure, construction and use. ANSI (American National Standard Institute), Z39.19-1974
39
Roget's International Thesaurus, 1977 (1. ed. 1852)
40
F.W. LANCASTER, Vocabulary control for information retrieval, 1972
41
ISO 2788/1974
42
ANSI: American National Standard Institute <www.ansi.org>

29

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

dell'indicizzatore e lessico del ricercatore, e cio la relazione biunivoca fra termine e concetto, fra
significante e significato: ci significa che in un thesaurus un termine esprime sempre uno ed un
solo concetto, e che un concetto sempre espresso da uno ed un solo termine. Poich questa
condizione tutt'altro che vera nel linguaggio naturale, affetto da ridondanze, ambiguit, polisemie,
omonimie, omografie ed altre specificit che ne garantiscono ricchezza ed espressivit, il
raggiungimento del controllo, cio dell'univocit semantica, nella costruzione e manutenzione del
thesaurus comporta due tipi di accorgimenti:
1. la raccolta e la collazione dei sinonimi, dei quasi sinonimi (cio termini non sinonimi in
senso proprio, ma considerabili tali ai fini della rappresentazione dei concetti dell'ambito
coperto dal thesaurus) e degli antonimi (cio degli opposti, o meglio dei termini collocati in
diversi punti dello stesso continuum semantico: non solo calore e freddo, ma anche tepore,
fresco e cos via) atti a descrivere il medesimo concetto e la scelta di uno solo di questi
termini: il termine prescelto diventa nel vocabolario termine preferito, TP (o PT, preferred
term), descrittore, cio termine abilitato a descrivere quel determinato concetto; tutti gli altri
termini (termini non preferiti, NPT, non descrittori), che non possono essere assegnati ai
documenti per esprimerne il contenuto concettuale, possono per vantaggiosamente
entrare nel vocabolario controllato come punti di accesso che rinviano al termine preferito;
2. la riduzione del contenuto semantico del termine preferito ad un solo significato, di solito il
pi tipico nell'ambito disciplinare del thesaurus per cui ad esempio in un thesaurus di
ornitologia il termine gru esprimer il concetto corrispondente all'"uccello dei Ralliformi" e
non alla "macchina dal braccio girevole per sollevare pesi", n al "carrello mobile per
riprese cinematografiche".
La definizione dello standard ISO 2788 pone inoltre in rilievo i due elementi strutturali
fondamentali:
1. che le relazioni da esso esplicitate sono formalizzate, cio che le relazioni fra i termini sono
definite da una relazione esplicita e formalizzata; questo significa che ogni termine
inserito in una rete relazionale che ne chiarisce ulteriormente il contenuto semantico, e che
mostra la distanza semantica fra i termini stessi;
2. che le relazioni trattate sono a priori, cio sono relazioni che appartengono all'ambito
semantico, del significato, dei termini, e pertanto sono sempre valide in qualsiasi contesto.

30

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Nota dambito

SN

Termine preferito

USE

Termine non preferito

UF

Top term

TT

Termine generico

BT

Termine generico (generico )

BTG

Termine generico (partitivo)

BTP

Termine specifico

NT

Termine specifico (generico )

NTG

Termine specifico (partitivo)

NTP

TABELLA - Simboli delle relazioni di un thesaurus: Inglese standard

4.2 La strutturazione del campo


Esistono due tipi di classificazioni finalizzate alla strutturazione del campo allinterno dei
Thesauri:

La classificazione tematico disciplinare: un campo viene diviso in sotto-temi che ne


rappresentano ciascuno una specificazione; ad esempio:
Arti decorative
arte del cuoio
borsa, bulino, conciatura, cuoio grezzo, sella, sellaio
arte del legno
cornice, doratura, ebanista, intaglio, legno pregiato
arte vetraria
artigiano del vetro, cristallo, lampadario, molatura ecc.

La classificazione per faccette: un campo viene tagliato sulla base di categorie


fondamentali dette faccette che possono essere applicate a qualsiasi tema e/o settore.
Ad esempio:
Arti decorative:
- Tipologie borsa, bulino, conciatura, cuoio grezzo, sella, sellaio

- Materiali cristallo, cuoio grezzo, legno pregiato


- Strumenti bulino, traforo, ecc.
- Persone

31

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

artigiano del vetro, ebanista, sellaio, ecc.


- Tecniche conciatura, doratura, molatura, ecc.
- Prodotti cornice, borsa, lampadario, ecc.

I limiti della CLASSIFICAZIONE TEMATICA si riscontrano nella raccolta di termini eterogenei


allinterno

dei

sottocampi

senza

categorizzarli

privi

di

informazioni

semantiche,

mentre nella CLASSIFICAZIONE PER FACCETTE una suddivisione esclusiva per faccette in un
campo complesso fa perdere articolazioni e specificazioni concretamente presenti nellesperienza
dellutente.
4.3 Termini d'indicizzazione
I concetti rappresentati dai termini di un thesaurus possono appartenere a diverse
categorie:
a. entit concrete
1. oggetti e loro parti fisiche
2. materiali
b. entit astratte
1. azioni e avvenimenti
2. entit astratte e propriet degli oggetti, dei materiali o delle azioni
3. discipline o scienze
4. unit di misura
c. entit individuali o "classi di uno" analoghe a nomi propri.
In fase di costruzione del thesaurus di fondamentale importanza il controllo dell'appartenenza dei
termini a queste categorie, poich esse possono influenzare determinate procedure, come ad
esempio la scelta del plurale o del singolare, o verificare la validit delle gerarchie (ad es.:non pu
esistere rapporto gerarchico fra termini appartenenti a categorie diverse).

32

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

4.4 Struttura semantica e formalizzazione delle relazioni


La struttura relazionale consente al thesaurus di diventare una sorta di "mappa" dei
significati espressi da un determinato linguaggio di indicizzazione, che consente sia
all'indicizzatore, in fase di attribuzione dei descrittori al documento, sia al ricercatore in fase di
costruzione del profilo di ricerca, di scandirne la rete semantica percorrendo nei sensi desiderati
relazioni e strutture classificatorie.
Abbiamo gi differenziato e definito i componenti lessicali del thesaurus in due categorie
fondamentali, quella dei TP e quella dei TNP: tra queste due categorie di termini si instaura la
prima fondamentale relazione semantica, cio la relazione preferenziale o sinonimica o di
equivalenza.
La relazione preferenziale quella deputata a rapportare uno o pi termini non preferiti ad un
termine preferito che esprime lo stesso concetto o un concetto molto simile, che sar
rappresentato sempre univocamente dal TP. Il gruppo di termini che si assume rappresentino lo
stesso concetto, che si considerano, ai fini dell'indicizzazione, equivalenti, e fra i quali viene scelto
il termine preferito, si definisce gruppo di equivalenza.
Le relazioni vengono abitualmente esplicitate e rappresentate da un corredo di simboli o sigle, fra
cui le pi usate sono quelle suggerite dallo standard ISO. In particolare, per la relazione
preferenziale, il rinvio dal TNP al TP viene indicato dal simbolo USE:
Pistola a spruzzo
USE Aerografo

mentre il rapporto reciproco, cio la segnalazione dei TNP nel corredo semantico (o blocco-parola)
del TP indicato dal simbolo UF:
Aerografo
UF Pistola a spruzzo

Possiamo ulteriormente distinguere varie sottospecie di relazioni preferenziali, determinate, ad


esempio, dal tipo di relazione fra TNP e TP, univoca se si tratta di un rapporto 1:1, cio se ad un
TNP corrisponde un solo TP, biunivoca se si tratta di un rapporto 1:2, cio se ad un TNP,
rappresentante un concetto complesso, corrispondono due distinti TP rappresentanti suoi concetti
costitutivi pi semplici, che devono essere usati obbligatoriamente insieme:

33

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

sideremia
USE Ferro AND Sangue

il cui reciproco si esprime con:


Ferro
UF+ sideremia

e:
Sangue
UF+ sideremia

All'interno della relazione di preferenza univoca distinguiamo ancora i due casi di:
1. sinonimia assoluta o accentuata
2. sinonimia relativa e convenzionale
Il primo si verifica se, indipendentemente dall'area semantica, dal grado di analiticit del thesaurus
e da quale dei due termini viene definito come preferito e quale come non preferito, tra TP e TNP
esiste sempre un rapporto sinonimico (si potrebbe perci dire che il rapporto sinonimico tale a
priori). Rientrano in questo caso diverse tipologie:

sinonimia vera (regola e norma)

variante ortografica (psicopedagogia e psico-pedagogia)

sigle e acronimi (CNR e Centro Nazionale Ricerche)

preferenza linguistica (a. fra termine straniero e italiano: week end e fine settimana,
mountain bike e bici da montagna; b. fra termine attuale e antico: bicicletta e velocipede; c.
fra termine corrente e scientifico: zucca e Cucurbita Maxima, mal di testa e cefalea; d. fra
termini di origini linguistiche differenti: poliglotta e multilingue; e. fra nomi comuni e marche
commerciali: penna a sfera e biro; f. fra varianti esprimenti nozioni, oggetti, discipline nuovi
o emergenti: calcolatori e cervelli elettronici, telefoni portatili, telefonini e telefoni cellulari)

Il secondo caso, quello della sinonimia convenzionale, si verifica quando la relazione tra due
termini di significato vicino, appartenenti alla stessa area semantica, non sinonimica in senso
stretto, non verrebbe considerata tale nel linguaggio naturale, non sempre considerata tale in
tutti i thesauru. In linea di massima si pu dire che tale relazione viene risolta in un rapporto
preferenziale (cio un termine assume il ruolo di TP e l'altro di TNP) se i due termini si collocano in
un'area di secondario rilievo per il thesaurus (la cosiddetta fringe, frangia, area marginale), in due
diversi Termini Preferiti se questi si collocano entro l'area centrale del thesaurus (core, nocciolo,
nucleo dell'area).

34

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Anche in questo caso possiamo distinguere diverse tipologie:

quasi-sinonimia (punizione e sanzione)

upward posting o rinvio al superiore gerarchico (microformati e microfilm, microformati e


microfiche); si tratta di una tecnica che accomuna nello stesso "insieme di equivalenza"
termini in realt non sinonimi ma appartenenti a diversi gradini della scala gerarchica.
Viene scelto come TP quello di livello superiore, pi generico

antinomia (pace e guerra, malattia e salute, secchezza e umidit); improprio collocare


questo caso fra le sottospecie della sinonimia, in quanto ovviamente due termini
opposti, o, come detto sopra, due termini collocati sullo stesso continuum semantico,
valori diversi della stessa variabile, non sono certo sinonimi. Si assume tuttavia che lo
siano ai fini dell'indicizzazione e della ricerca in quanto un documento che tratta di un
certo aspetto di un problema tratter anche presumibilmente del suo opposto, o
comunque potr essere descritto concettualmente utilizzando il termine che indica il
suo opposto.

La relazione sinonimica l'unica relazione thesaurica che mette in rapporto tra di loro l'insieme dei
termini preferiti e quello dei termini non preferiti: tutte le altre relazioni, di cui stiamo per occuparci,
sono relazioni fra termini preferiti. La relazione di base che distingue tipicamente un thesaurus da
una semplice lista di termini non strutturati, e ne rivela le fondamenta sistematiche, la relazione
classificatoria per eccellenza, la relazione gerarchica. La relazione gerarchica esprime il concetto
ed il grado di subordinazione o sovraordinazione fra termini appartenenti allo stesso albero
gerarchico; in questo albero, il termine sovraordinato rappresenta una classe o un tutto, e il
termine subordinato rappresenta un suo elemento o parte. La sigla che nel blocco parola di un
termine individua i suoi sovraordinati BT (Broader Term), alla quale pu utilmente essere
aggiunta una cifra indicante la distanza in "gradini" gerarchici fra i due termini legati dal rapporto:
Geometria iperbolica
BT1 Geometria non euclidea
BT2 Geometria
BT3 Matematica

La sigla identificante il rapporto inverso, cio i subordinati del termine dato, NT (Narrower Term):
Geometria
NT1 Geometria euclidea
NT1 Geometria non euclidea
NT2 Geometria iperbolica
NT2 Geometria ellittica

35

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Rientrano nella categoria delle relazioni gerarchiche tre sottospecie di relazioni:


1. la relazione generica o relazione genere-specie (distinta eventualmente dalle sigle BTG e
NTG)
2. la relazione partitiva o relazione parte-tutto (distinta eventualmente dalle sigle BTP e NTP)
3. la relazione esemplificativa o classe-istanza o specie-esempio
ognuna delle quali corrisponde ad una diversa situazione logica e conduce a gerarchie verificabili
attraverso un test di verifica di tipo logico. Resta inteso che la relazione gerarchica pu intercorrere
solo fra termini che fanno riferimento a concetti appartenenti alla stessa categoria di nozioni (ad
esempio oggetti, azioni, propriet, discipline; per l'elenco completo delle categorie vedi il paragrafo
Termini d'indicizzazione).
La relazione generica o relazione genere-specie identifica il legame che intercorre fra una classe o
categoria ed i suoi elementi, membri o specie, ed la tipica relazione delle classificazioni
zoologiche o botaniche. Per soddisfare a questo tipo di relazione i termini non solo devono
appartenere alla stessa categoria, ma rispondere anche alla condizione "tutti e sempre" in senso
ascendente, ovvero alla condizione "alcuni/tutti" nei due sensi discendente e ascendente. Un
esempio per chiarire:
^--------Felini---------v
|
tutti e sempre
|

|
alcuni
|

^---------Gatti---------v

alcuni elementi della classe Felini sono dei Gatti, tutti i Gatti sono sempre, per definizione e
indipendentemente dal contesto, dei Felini. Viceversa lo schema:
^--------Animali domestici---------v
|
alcuni
|

|
alcuni
|

^-------------Gatti---------------------v

chiarisce perch non possibile instaurare un rapporto gerarchico genere-specie fra Gatti e
Animali domestici: se vero che alcuni Animali domestici sono Gatti, non per vero che tutti i
Gatti sono sempre Animali domestici (esistono infatti anche i gatti selvatici), e i due termini devono
quindi appartenere a categorie diverse del thesaurus. Il test ha lo scopo di evitare che criteri
soggettivi del costruttore influenzino la stesura delle strutture tassonomiche, tuttavia s'intende che

36

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

per scopi o in ambiti particolari ci si possa sottrarre dal seguire rigidamente questa norma.
Riprendendo l'esempio appena citato, se si sta costruendo un thesaurus specializzato sugli
Animali domestici si potr a buon diritto fare dei Gatti un NT, dal momento che i Gatti selvatici non
compariranno nel thesaurus e non rivestono alcun interesse per l'utente.
La relazione partitiva o parte-tutto non considerata dallo standard una relazione gerarchica
universalmente valida, ma sottoposta ad una restrizione; essa ritenuta valida solo nelle
situazioni in cui il nome della parte implica il nome del corrispondente tutto, qualunque sia il
contesto. In tal caso i termini possono essere strutturati gerarchicamente come BT (tutto) e NT
(parte); lo standard elenca quattro casi rispondenti a questo requisito in un contesto generale:
1. sistemi e organi del corpo

2. luoghi geografici

Sistema circolatorio

Canada

NT1 Sistema vascolare


NT2 Arterie

NT1 Manitoba
NT2 Winnipeg

NT2 Vene

3. discipline e campi di studio

4. strutture sociali gerarchizzate

Scienze

Corpi d'armata

NT1 Chimica
NT1 Biologia

NT1 Divisioni
NT2 Reggimenti

NT2 Botanica

mentre riconosce la possibilit di organizzare gerarchicamente anche altri tipi di termini solo in
contesti particolarmente specializzati, in cui la specializzazione del campo di azione a garantire
che il nome del tutto sia univocamente implicato dal nome delle sue parti.
La relazione esemplificativa o specie-esempio identifica il legame che intercorre fra una classe o
categoria generale di cose o avvenimenti, espressa da un nome comune, ed un suo individuo,
rappresentato da un nome proprio, e costituente una "classe di uno". In realt la cosa pu
complicarsi ulteriormente, poich esistono classi di uno che possono avere in sottordine altre
classi di uno:

37

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Regioni montuose (classe)


<rel. specie-es.>
NT1 Alpi (individuo)
<rel. parte-tutto>
NT2 Alpi Graie (individuo)

L'esempio mostra come la prima relazione, quella classe-individuo, una relazione


esemplificativa, mentre la seconda, quella individuo-individuo, una relazione partitiva. Possiamo
concludere perci che la relazione esemplificativa sempre tra un BT di tipo classe e un NT di tipo
individuo,

mentre

la

relazione

partitiva

tra

due

classi

tra

due

individui.

Aggiungiamo ancora che nella maggior parte dei thesauri la relazione esemplificativa del tutto
assente, per evitare che la presenza dei nomi propri sovraccarichi le categorie rendendole difficili
da gestire. Una soluzione frequentemente adottata consiste nello stendere elenchi a parte in cui gli
"individui" sono rappresentati da termini normalizzati nella forma detti identificatori (perch appunto
identificano gli individui) per analogia con descrittori (cio i termini che "descrivono" una classe). E'
chiaro che se nel thesaurus non sono presenti gli individui come TP inseriti in relazioni
esemplificative, l'indicizzatore dovr attribuire al documento che tratti di un "individuo" anche il
termine che indica la sua classe di appartenenza. Per completare il discorso sulle relazioni
gerarchiche, distinguiamo due tipi di thesauri, il monogerarchico e il poligerarchico, a seconda che
i termini possano appartenere, per ragioni logicamente fondate, ad una sola o a pi d'una
categoria.
Giochi
|---------------------------------------------|
v

Giochi con la palla

Giochi con la racchetta

|----------------------|----------------------|
|
v
Squash

Mentre nei thesauri poligerarchici un termine pu appartenere a pi di una gerarchia, nei


monogerarchici ogni termine pu avere uno ed un solo BT1, poich pu essere inserito in una sola
catena gerarchica: con le gerarchie ulteriori esso pu intrattenere solo un rapporto di tipo
associativo; questo significa che, bench i legami fra i termini siano gli stessi, il thesaurus
poligerarchico evidenzia un maggior numero di strutture rispetto al monogerarchico:

38

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Poligerarchico
Organo
BT1 Strumenti a fiato
BT1 Strumenti a tastiera
BT2 Strumenti
Strumenti a fiato
BT1 Strumenti
NT1 Organo
NT1 Flauto

Strumenti a tastiera
BT1 Strumenti
NT1 Organo
NT1 Pianoforte
Monogerarchico
Organo
BT1 Strumenti a fiato
BT2 Strumenti
RT Strumenti a tastiera
Strumenti a fiato
BT1 Strumenti
NT1 Organo
NT1 Flauto
Strumenti a tastiera
BT1 Strumenti
RT Organo
RT Pianoforte

39

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

L'ultima delle relazioni classiche, la relazione associativa, una relazione che si illustra pi
facilmente analizzandone le caratteristiche negative che non definendola in positivo; non a caso
detta anche relazione "residuale", in quanto in grado di collegare coppie di termini che non
rientrano n nella casistica della relazione sinonimica (non fanno parte dello stesso "insieme di
equivalenza"), n in quella della relazione gerarchica (non appartengono alla stessa catena
gerarchica), ma sono tuttavia cos fortemente associati che necessario esplicitarne il legame
all'interno del thesaurus in modo da poter suggerire all'indicizzatore o al ricercatore che acceda al
primo dei due il secondo termine. La relazione associativa reciproca, e viene indicata in
ambedue i casi con la sigla RT (Related Term). Proprio perch non sottoposta a rigidi test di
verifica e ammette un certo grado di discrezionalit, importante adottare metodi che garantiscano
la relazione associativa dallo scatenarsi delle opinioni personali e dei giudizi soggettivi del
costruttore del thesaurus: come regola generale, diciamo che uno dei due termini deve essere
fortemente implicato dall'altro, ovviamente nel quadro di riferimento condiviso dagli utenti. Un
esempio in particolare il rapporto di dipendenza fra la disciplina e il suo oggetto, fattispecie del
rapporto tipicamente associativo fra due termini, di cui uno necessario alla spiegazione o
definizione dell'altro. Ci sono due tipi di termini suscettibili di intrattenere rapporti associativi:
1. quelli appartenenti alla stessa categoria
2. quelli appartenenti a categorie diverse
Fra i termini appartenenti alla stessa categoria distinguiamo brevemente fra:
a) termini che hanno lo stesso termine sovraordinato, ed i cui significati hanno una zona di
sovrapposizione, e che quindi, anche se nel thesaurus hanno una definizione che li distingue
esattamente, potrebbero essere adoperati dagli utenti in maniera non rigorosa (e perci quasi
intercambiabile), per i quali quindi necessario ricordare l'esistenza dell'altro quando l'utilizzatore
impiega l'uno:
Barche
BT Veicoli
RT Navi
Navi
BT Veicoli
RT Barche

40

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

b) termini che rappresentano concetti legati da una relazione di tipo "familiare" o di tipo "derivato"
(un concetto che deriva dall'altro). Ad esempio, poich i Muli derivano dall'incrocio fra Asini e
Cavalli (rispetto ai quali sono per situati sullo stesso gradino gerarchico, cio come NT1 di
Equini), si possono configurare i seguenti blocchi-parola:
Equini
NT1 Asini
NT1 Cavalli
NT1 Muli
Asini
BT1 Equini
RT Cavalli
RT Muli
Cavalli
BT1 Equini
RT Asini
RT Muli
Muli
BT1 Equini
RT Asini
RT Cavalli

Fra termini appartenenti a categorie diverse, sempre rispondenti al requisito dell'implicazione


dell'uno dall'altro, si configurano diverse tipologie di rapporti che possono motivare una relazione
associativa:
a. una disciplina e il suo oggetto di studio (zoologia e animali);
b. un processo od operazione e il suo agente o strumento (termometro e misurazione della
temperatura);

41

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

c. una azione e il suo prodotto (scrittura e documenti);


d. una azione e chi o cosa la subisce (potatura e piante; pesca e pesci);
e. oggetti e fenomeni e loro propriet (magneti e magnetismo);
f.

concetti e loro origini (Tedeschi e Germania);

g. concetti legati da rapporti causali (inquinamento e sostanze inquinanti);


h. una cosa e il suo antidoto (piante ed erbicidi);
i.

un concetto e la sua unit di misura (frequenza e hertz);

j.

locuzioni sincategorematiche (cio termini composti) e loro nomi sottocategoriali (piante


fossili e piante). 43
4.5 Classificazione a Faccette
Per poter trasformare linformazione in conoscenza necessario anzitutto assicurare un

accesso flessibile e multi-dimensionale alla informazione stessa. I contesti aziendali attuali sono
caratterizzati infatti, oltre che da una grande mole informativa, anche da rapidi mutamenti del modo
di produrre e organizzare tale informazione. Per far fronte a questo scenario (non solo allinterno di
sistemi di knowledge management propriamente detti ma anche, pi semplicemente, in siti,
intranet e data-repository di qualsiasi genere) necessario progettare e realizzare sistemi di
classificazione e di accesso allinformazione aperti, flessibili e adattivi, in grado cio di adeguarsi a
una pluralit di esigenze di archiviazione e/o interrogazione. A questo scopo, negli ultimi anni, si
sono intessute fitte relazioni fra discipline come larchitettura dellinformazione (che si interessa
dellorganizzazione dellinformazione allinterno di sistemi digitali), il Knowledge Management e la
biblioteconomia (la stessa architettura dellinformazione nasce da una applicazione al web della
biblioteconomia classica). La tesi sicuramente pi accattivante [...] quella di una interdisciplinarit
progressiva e marcata tra i diversi settori della conoscenza, a conferma di una eterna circolarit
del flusso informativo e in adesione ai moderni concetti di rete, integrazione e condivisione dei dati.
In questa dimensione intercomunicante di esperienze conoscitive, non si rivela dunque azzardato
ipotizzare accostamenti tra discipline quali biotecnologia, astrofisica e geopolitica, ad esempio,
aree di studio che solo una tradizione obsoleta perdura a confinare entro ambiti definiti privi di
connessioni44.
In un simile scenario, hanno cos conosciuto una nuova primavera le nozioni di faccette e di
classificazione a faccette (o classificazione multidimensionale), elaborati nellambito della
biblioteconomia classica da Ranganathan in avanti - con un importante incremento negli anni
60-70. La classificazione a faccette (in inglese Faceted Classification) come gi accennato -
un metodo di classificazione dellinformazione il cui valore distintivo consiste appunto nellessere

43

S. SPINELLI, Introduzione ai thesauri , <http://mail.biocfarm.unibo.it/~spinelli>


E. POLTRONIERI, RECENSIONI E SEGNALAZIONI: Hemalata Iyer. Classificatory structures: concepts, relations and
representation. Frankfurt/Main: Indeks Verlag, 1995. 229 p. (Textbooks for knowledge organization; 2). ISBN 3-88672-501-4. DM
42.80., in: Bollettino AIB, n. 1(anno), pp. 104-106.

44

42

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

un sistema aperto e adattivo. La classificazione mediante faccette sfrutta un sistema di attributi


(metadati) mutuamente esclusivi rappresentanti ciascuno un aspetto o propriet persistente
delloggetto e capaci nel loro insieme di descrivere esaustivamente loggetto stesso. Tali
attributi sono detti faccette (termine introdotto in questa accezione dal biblioteconoo e matematico
indiano Ranganathan), e sono contraddistinti da queste peculiarit:

sono invariabili dal punto di vista semantico (ad es. la propriet COLORE di un oggetto
pu variare in termini di valori che pu assumere giallo, rosso etc. ma invariabile
come concetto; cio quelloggetto avr sempre un colore)

costituiscono un insieme aperto, per cui sempre possibile aggiungere nuove faccette
a quelle gi esistenti

sono utilizzabili come attributi di ricerca sia singolarmente sia in combinazione. Tali
caratteristiche rendono particolarmente efficace ladozione di questo sistema in
ambienti digitali, per un pi veloce ed efficiente recupero dellinformazione45 .

Per fare un esempio concreto, poniamo di dover costruire un catalogo di vini. Potremmo allora
rappresentare ciascun vino mediante questo set di propriet o faccette:
COLORE (C)
VITIGNO (V)
PROVENIENZA (P)
ANNATA (A)
...
Tali faccette sono mutuamente esclusive luna rispetto alle altre, vale a dire che fra esse non
vi sovrapposizione semantica (ci non significa per che un vino pu comparire solo in una di
esse; anzi, ogni vino rappresentato dallinsieme delle varie faccette). Ciascuna faccetta, potr
essere a sua volta suddivisa/scomposta in pi topic (o voci, o faccette di secondo livello la
nomenclatura pu variare da autore ad autore):
COLORE (C) o rosso (r) o bianco (b) o rosato (s)
VITIGNO (V) o aglianico (agl) o merlot (mr) o sangiovese (sg) o ...
PROVENIENZA (P) o campania (c) o piemonte (p) o sicilia (s) o ...
ANNATA (A) o 1961 o ...
Una bottiglia di Taurasi 1996, risulta descritta da queste coordinate: C(r), V(agl), P(c), A(96).
Ci significa che:

45

cf. WYNAr, cit. da P. MURRAY, Faceted classification of information, <http://www.kmconnection.com/DOC100100.htm>

43

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

possibile ricercare questo vino utilizzando una sola delle sue faccette, oppure una
combinazione di esse (es. C(r) & V(agl) & P(c))
possibile in ogni momento implementare nuove faccette di primo livello (ad es.
PRODUTTORE, ABBINAMENTI, GRADAZIONE etc.)
possibile in ogni momento aumentare il numero dei topics o faccette di secondo livello
interni a una faccetta di primo livello.46

46

L. ROSATI, La classificazione a faccette fra Knowledge Management e Information Architecture (parte I), it Consult 2003
<www.itconsult.it>

44

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

5. Ontologie, mappe cognitive e web semantico

5.1 L ontologia come nuovo strumento per gestire la conoscenza

Lontologia, lo studio dellessere in quanto essere, - diceva Aristotele usualmente


concepita come una disciplina strettamente filosofica. Eppure, negli ultimi anni grazie
allesplosione delle comunicazioni in rete, gli aspetti ontologici dellinformazione hanno acquistato
un valore strategico. Tali aspetti sono intrinsecamente indipendenti dalle forme di codifica
dellinformazione che pu essere quindi isolata, recuperata, organizzata, integrata in base a ci
che pi conta: il suo contenuto.
Sebbene lontologia sia nata in ambito filosofico, negli ultimi anni, si affermata una nuova
scuola di pensiero, che propone una caratterizzazione logica rigorosa delle categorie ontologiche
fondamentali utilizzate nei sistemi informativi, con lo scopo di aumentarne la trasparenza
semantica e linteroperabilit. Tale approccio coinvolge attivit di modellazione concettuale e di
ingegneria della conoscenza in una prospettiva fortemente interdisciplinare. Una definizione del
termine ontologia largamente adottata, soprattutto nellambito delle artificial intelligence
communities, quella proposta da Gruber, secondo cui unontologia una specifica esplicita e
formale di una concettualizzazione condivisa.
La concettualizzazione si riferisce ad un modello astratto di un qualche fenomeno, avendone
identificato i concetti; esplicita significa che i tipi di concetti usati e i vincoli sul loro uso sono
esplicitamente definiti; formale si riferisce al fatto che lontologia dovrebbe essere machinereadable (comprensibile dai sistemi informatici); condivisa riflette il fatto che lontologia cattura la
conoscenza consensuale, cio quella non propria di un individuo, ma accettata da un gruppo.
Esistono, comunque, altre definizioni del termineche pongono anche laccento sulle sue specifiche
funzionali.

5.2 Definizioni di ontologia

1. Unontologia identifica i termini basilari e le relazioni di un determinato dominio,


definendone in questo modo il vocabolario, e le regole per combinare tali termini e tali relazioni,
andando oltre il vocabolario stesso (Neches).
Tale definizione indica il modo di procedere per costruire unontologia: identificare i termini basilari
e le loro relazioni; identificare le regole che li combinano; provvedere a definizioni di tali termini e
relazioni. In base a tale definizione, unontologia non include solo i termini che sono esplicitamente
definiti in essa, ma anche quelli che possono essere derivati usando tali regole.
2. Unontologia un insieme di termini gerarchicamente strutturati per descrivere un dominio che
pu essere usato come fondamenta per una base di conoscenza (Swartout).

45

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

3. Unontologia un mezzo per descrivere esplicitamente la concettualizzazione presente dietro la


conoscenza rappresentata in una base di conoscenza (Bernaras).
4. Le ontologie sono punti di incontro tra le concettualizzazione condivise. Le concettualizzazioni
condivise includono strutture concettuali per modellare la conoscenza di dominio, protocolli
specifici per la comunicazione tra gli agenti e accordi circa la rappresentazione di particolari teorie
di dominio. In un contesto di condivisione della conoscenza, le ontologie sono specificate nella
forma di un vocabolario di termini 47.
5. Lontologia la specificazione esplicita di una concettualizzazione (Gruber 1995), in altre
parole una caratterizzazione assiomatica di una certa concettualizzazione di un linguaggio, usata
per esprimere il significato inteso del vocabolario.
Con ontologia dunque ci si riferisce a quellinsieme di termini che, in un particolare dominio
applicativo, denotano in modo univoco una particolare conoscenza e fra i quali non esiste
ambiguit poich sono condivisi dallintera comunit dutenti dello stesso dominio applicativo.
Unontologia pu essere vista come un thesaurus arricchito in cui, oltre alle definizioni e alle
relazioni tra i termini di un dato dominio (fornite dal thesaurus), viene rappresentata e fornita una
conoscenza pi concettuale.

5.3 Funzioni dellontologia

In base alla definizione dontologia e al significato della nozione di concettualizzazione,


possiamo dedurre che unontologia consiste di:
termini o concetti termini generali che esprimono le categorie principali in cui
organizzato il mondo, come cosa, entit, sostanza, uomo, oggetto
fisico, ecc. oppure termini particolari che descrivono un dominio dapplicazione specifico (ontologie
di dominio);
definizione dei termini;
relazioni che li associano o impongono particolari vincoli.

Lontologia svolge la funzione di:


- un lessico comune. La descrizione di un ambiente target necessita di un lessico concordato tra le
persone coinvolte. Un notevole contributo dato dai termini contenuti in unontologia;
- spiegazione di ci che stato lasciato implicito. In tutte le attivit umane, si trovano assunzioni e
presupposti impliciti, come la definizione di termini comuni e basilari, le relazioni ed i vincoli tra
questi e i punti di vista nellinterpretazione dei fenomeni;
- sistematizzazione della conoscenza. Richiede concetti/lessico ben stabiliti, in base ai quali le
persone descrivono fenomeni, teorie, ecc. Unontologia, perci, fornisce la backbone della
47

T. GRUBER. Shared Re-usable Knowledge Bases, 1994.

46

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

sistematizzazione della conoscenza;


- Funzione di meta-modello. Un modello generalmente unastrazione di un oggetto reale.
Unontologia fornisce concetti e relazioni che sono usati come blocchi costitutivi del modello, cio
specifica il modello da costruire, dando le direttive e i vincoli che dovrebbero essere soddisfatti in
questo modello; Unontologia pu presentarsi in varie forme, ma include sempre un
vocabolario di termini e una descrizione dettagliata del loro significato.

5.4 Le mappe cognitive

Le scelte strategiche di una organizzazione ne definiscono in primo luogo la relazione con


lambiente concorrenziale, e permettono inoltre, ad unanalisi pi approfondita, di svelarne le
dinamiche interne, la struttura cognitiva e la cultura dominante.
Il processo decisionale che sottende ad ogni scelta strategica il frutto dell interazione di una
serie di fattori sia contingenti sia idiosincratici che si combinano tra loro ogni volta che un problema
si presenta ed una scelta deve essere effettuata.
Lorientamento strategico di una organizzazione, pur essendo in via generale il frutto della
ricomposizione degli interessi e delle esigenze dei diversi stakeholders aziendali, presenta in
ultima analisi una forte impronta soggettiva data dalle competenze, dalle capacit e dallesperienza
del top management. In questottica, dunque, lanalisi delle strutture cognitive dei decision-makers
consente al ricercatore, ed agli stessi manager, di individuare le relazioni ed i nessi causali tra i
diversi fattori contingenti, idiosincratici ed anche soggettivi che contribuiscono alla strutturazione di
ogni processo decisionale, fornendo un valido strumento di approfondita osservazione ed
apprendimento a livello organizzativo. Si pone dunque il problema di analizzare gli schemi
decisionali, e i processi cognitivi che ne sono alla base, dei decision-makers per cogliere pi a
fondo le premesse dellazione strategica, almeno di quella intenzionale e consapevole, ma anche
per evidenziare le criticit dellazione strategica emergente.
Le mappe cognitive permettono di rappresentare in maniera grafica la parte del sistema di
credenze (Steinbruner, 1974) dei decision makers che viene attivato in risposta ad un determinato
stimolo/problema proveniente dallambiente competitivo. La metafora della mente sottostante
questo tipo di rappresentazione implica che linterpretazione della realt sia esterna sia interna di
unorganizzazione sia basata sugli schemi cognitivi dei decisori aziendali i quali, attraverso di essi,
costruiscono la loro rappresentazione del mondo ed il loro scenario di riferimento.
In questo contesto il processo decisionale visto come linsieme di operazioni di elaborazione
cognitiva comprese tra il momento della percezione di una situazione come problematica da parte
del decision-maker ed il momento dellazione (Codara, 1998). Elementi fondamentali di un
processo decisionale sono lanalisi delle alternative che si presentano ad ogni decisore ed i criteri,
o i nessi causali, che egli utilizza per ordinare tali alternative e quindi per scegliere la strada da

47

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

seguire, per decidere quindi (dal latino de caedere, tagliare via, eliminare ogni possibilit
alternativa).
Nellambito della teoria neoclassica, questi elementi trovano una sistematizzazione di grande
rigore formale nella teoria della scelta razionale (von Neumann e Morgenstern, 1944) la quale
vede il decisore come homo oeconomicus e postula la perfetta ed oggettiva conoscibilit della
realt da parte di ogni soggetto, la disponibilit di uninformazione completa, tempestiva e gratuita
e la capacit illimitata degli individui di elaborare le informazioni. Grazie alla completezza ed alla
tempestivit delle informazioni, il decisore neoclassico sar sempre perfettamente in grado di
conoscere tutte le alternative possibili e di calcolare tutte le conseguenze delle opzioni individuate;
egli inoltre avr una capacit illimitata di adeguamento cognitivo alle nuove situazioni. Per quanto
riguarda la valutazione dei risultati previsti, il modello introduce il concetto di utilit perfettamente
misurabile che fornisce lunit di misura delle diverse opzioni e ne permette il confronto; la scelta,
ovviamente, cadr sullalternativa che ottimizza la funzione di utilit.
La reazione degli studiosi di management ed organizzazione allimpostazione neoclassica
riassunta in maniera molto chiara da Simon (1958) Durante lultima decade () la dottrina
economica ha raggiunto uno stato di scolastica raffinatezza che presenta notevole interesse
normativo, ma ben poca relazione con il comportamento reale, od anche solo possibile, di esseri
umani in carne ed ossa (p. 23). Ed Simon stesso che d vita a quel filone di ricerca che oggi
passa sotto il nome di comportamentismo e che costituisce il fondamento dellanalisi
contemporanea del comportamento organizzativo.
Gli individui sviluppano dei metodi per impegnarsi in uneconomia cognitiva volta a facilitare il
compito di gestire la miriade di stimoli potenzialmente significativi disponibili nella cornice
organizzativa. La prima chiave per accedere a tale efficienza cognitiva la capacit di interrelare
le informazioni in base a criteri di similitudine.
In un secondo momento necessario trattenere le informazioni nella memoria in modo da
preservare le interrelazioni tra parti diverse dellinformazione acquisita. Questa funzione
compiuta tramite strutture cognitive chiamate schemi (Gioia, 1986; Isenberg, 1986).
Uno

schema

una

struttura

cognitiva

costituita

da

un

network

di

aspettative

appresedallesperienza e raccolte nella memoria. E un repertorio costituito dalla conoscenza tacita


usata per imporre una struttura su - e per attribuire significato a - informazioni sociali e situazionali
altrimenti ambigue. Gli schemi forniscono dunque la base per linterpretazione dellinformazione,
degli eventi, delle azioni e sono il prodotto di una storia particolare, oltre che dello specifico ciclo
percettivo in cui sono inseriti. Steinbruner (1974) ha introdotto il concetto di sistemi di credenza
(belief-systems) per definire una configurazione di assunzioni riguardo alla realt, tra loro legate da
interdipendenza funzionale.
Lanalisi dellinsieme dei concetti e delle relazioni che costituiscono gli schemi cognitivi stata in
letteratura affrontata con strumenti diversi, dalloperational code (George, 1967) alla repertory grid

48

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

technique (Kelly, 1955), ma la metodologia pi diffusa sicuramente quella del cognitive mapping
(Huff, 1990; Weick e Bougon, 1986; Fiol e Huff, 1992; Fahey e Narayan , 1989, Moretti, 1994;
1997; Vicari e Troilo, 1997; Codara, 1998; Daniels, Johnson e de Chernatony, 2002).
Una mappa cognitiva la rappresentazione (grafica o matematica) del sistema di credenza di una
persona, o meglio, della porzione di belief-system attivato in una situazione specifica dal decisore
(Codara, 1998). La mappa descrive la percezione consapevole della realt, il modo in cui un
individuo coglie una particolare situazione o un determinato problema. Come accennato, la mappa
cognitiva non rappresenta tutti gli aspetti del belief-system individuale, ma soltanto la struttura delle
credenze causali di una persona; per questo, alcuni autori parlano pi specificamente di mappe
causali (Weick e Bougon, 1986). Alcuni autori (Narayan e Fahey, 1990) hanno avanzato dei dubbi
sulla possibilit di mappare le strutture cognitive organizzative: la correlazione tra le mappe causali
vere e quelle rivelate non sarebbe mai perfetta in quanto influenzata dalla natura delloccasione
in cui esse vengono manifestate (ad esempio un discorso pubblico) e dalla possibilit di situazioni
contingenti che suggeriscano un atteggiamento prudente (una situazione altamente competitiva).
Questi elementi potrebbero interferire con gli sforzi del ricercatore nel determinare la natura delle
lenti che filtrano i dati e costituiscono il mezzo attraverso cui i dati sono interpretati (Narayan e
Fahey, 1990, p. 111). Lo stesso Axelrod (1976), uno dei pionieri delle mappe causali, sostiene che
le mappe non costituiscono dei mezzi attraverso i quali si possa inferire cosa i decisori
effettivamente pensino, ma offrono unicamente una rappresentazione grafica ed ordinata di ci
che essi dichiarano. Un posizione simile stata adottata pi recentemente da Eden (1992) e da
Cossette e Audet (1992), i quali sottolineano come le mappe siano una rappresentazione della
rappresentazione e come tali non siano in grado di cogliere cosa sia nella mente dellattore. nfatti i
processi di pensiero e la struttura dei discorsi interagiscono tra loro ed interferiscono gli uni con gli
altri, specialmente in presenza di una metodologia rappresentativa e di un ricercatore che dia una
specifica configurazione al contesto allinterno del quale la mappa cognitiva viene costruita. In
questo contesto gli autori sostengono che le mappe devono essere considerate unicamente come
uno strumento di individuazione e rappresentazione a supporto della discussione e dellanalisi di
alcuni modi di pensare e spiegazioni di eventi.

49

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

- SCHEMA MAPPE COGNITIVE -

5.5 Metodologie di estensione delle mappe

Indubbiamente il problema della validit e della rappresentativit delle mappe cognitive


riveste unimportanza fondamentale ed il dibattito su questo punto ancora molto acceso (Nicolini,
1999; Daniels e Johnson, 2002) investendo anche la questione metodologica dellestensione delle
mappe stesse.
Tra le metodologie pi diffuse troviamo il Documentary coding method (Wrightson, 1976), la
compilazione della matrice di adiacenza (Bougon, Weick e Binkhorst,1977) e la Self-Q interview
technique (Bougon, 1983). Il denominatore comune di questi metodi il tentativo, perseguito con
modalit differenti, di ridurre linfluenza del ricercatore nellestensione della mappa. Nel metodo di
codifica dei documenti, i testi da analizzare provengono da fonti diverse quali scritti dellattore,
discorsi da lui pronunciati in diverse occasioni e opportunamente registrati e trascritti, questionari e
interviste dirette. Il testo viene poi attentamente letto dal ricercatore per individuare le variabiliconcetto e le relazioni causali tra esse. Dopo alcune fasi intermedie che conducono allestensione
della mappa da parte del ricercatore, un momento fondamentale la validazione di tale mappa da
parte dellattore che deve valutare se ed in quale misura essa rappresenta la sua struttura
cognitiva in relazione a quel particolare problema (Codara, 1998).

50

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Nella compilazione della matrice di adiacenza, il ricercatore fa compilare direttamente al


soggetto indagato la matrice con i concetti che il ricercatore ha individuato come rilevanti. Anche in
questo caso prevista successivamente una procedura di validazione della mappa. Infine la
tecnica del Self-Q prevede che sia il soggetto indagato a porre a se stesso una serie di domande
che lo conducano ad una migliore comprensione della situazione organizzativa oggetto dellanalisi.
La scelta

di analizzare i discorsi e le dichiarazioni, opinabile nella misura in cui la

ricostruzione delle mappe a partire dai discorsi rischia di ricadere nellobiezione di Cossette e
Audet (1992) secondo i quali la rappresentazione discorsiva un prodotto semiotico e non
lespressione di una realt oggettiva alla quale il discorso del soggetto corrisponde, anche se
spesso conveniente considerare come realt ci a cui il discorso si riferisce48.
Ma, in unottica cognitivista, ogni decisore agisce in funzione dei suoi schemi mentali preesistenti, i
quali gli forniscono una visione parziale, e comunque filtrata, della realt che lo circonda ed egli
stesso a costruire tale realt attraverso le scelte che opera ed il senso che attribuisce loro
attraverso il racconto.
Come afferma Weick, infatti proprio il racconto il mezzo attraverso cui avviene
lattribuzione di significato da parte del soggetto. Il concetto bene espresso dal noto aforisma
non posso sapere quello che penso fino a che non sento quello che dico (Weick, 1969, p.17).
La posizione di Weick ripresa dalla moderna psicologia cognitiva, la quale sostiene che
soltanto attraverso la narrazione che i soggetti riescono a dare un significato agli eventi della loro
vita e dunque il cognitive mapping si baserebbe sullassunto che il linguaggio costitutivo della
conoscenza, piuttosto che un semplice mezzo per rappresentarla (Codara, 1998).
In questa prospettiva, allora, il problema della scarsa corrispondenza tra la mappa
cartacea, estrapolata con tecniche di analisi narrativa, e quella mentale mal posto: le espressioni
verbali e scritte sono proprio gli strumenti attraverso cui il soggetto costruisce la sua mappa
cognitiva e non unimmagine di essa. Diverse sono le funzioni attribuite dai vari studiosi alle mappe
cognitive a seconda dello scopo dellanalisi; in particolare se ne evidenziano quattro (Codara,
1998).

Funzione esplicativa: ricostruire le premesse del comportamento dellattore indagato per


comprendere le ragioni delle scelte e delle azioni intraprese, mettendo in luce le eventuali
distorsioni e limiti presenti nella sua rappresentazione della situazione;

Funzione predittiva: prevedere decisioni ed azioni future, o le argomentazioni che lattore


indagato utilizzer per spiegare eventuali nuovi accadimenti;

Funzione riflessiva: aiutare il decisore a riflettere sulla rappresentazione della

situazione per verificarne ladeguatezza ed eventualmente sollecitare lintroduzione delle


modifiche necessarie;

48

P. COSSETTE , M. AUDET , Mapping Of An Idiosyncratic Schema, Journal of Management Studies 29:3.pp325-347 (1992)

51

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Funzione strategica: generare una descrizione pi accurata di una situazione problematica


suggerendo il cammino causale migliore da intraprendere.

5.6 Le mappe cognitive e lanalisi documentale

Uno strumento metacognitivo molto efficace per rappresentare la conoscenza e riflettere


sul proprio processo di apprendimento consiste nella costruzione di mappe concettuali.
In queste strutture reticolari la conoscenza viene rappresentata con due elementi fondamentali:
- i concetti, individuati con parole-chiave inserite in un ovale, il nodo. In ciascun ovale va posto un
solo concetto non necessariamente una sola parola - che non pu essere ripetuto in parti diverse
della stessa mappa;
- le relazioni, linee che collegano i concetti evidenziandone la sovraordinazione, la sottoordinazione e la coordinazione, in altre parole la gerarchia. Esse si possono orientare ed
etichettare per mezzo di parole-legame sistemate sulle linee;
Rispetto all'argomento da affrontare, il nodo centrale, si individuano i concetti pertinenti e tra questi
viene stabilito un ordine gerarchico. E' fondamentale stabilire la gerarchia perch il disegno della
mappa visualizza il grado di inclusivit di ciascun concetto per mezzo della disposizione
topologica. Una volta costruita, la mappa pu essere interrogata con lo scopo di approfondire
meglio la definizione di uno o pi concetti, oppure percorsa da un nodo all'altro, in altre parole
navigata; in questo caso l'attenzione va soprattutto alle relazioni stabilite tra i concetti.
Si possono utilizzare due tipi di mappe, le mappe cognitive e le mappe concettuali. Le prime sono
soggettive perch rappresentano la conoscenza individuale, ai nodi infatti si possono trovare
conoscenze fatte da immagini e ricordi; le seconde invece sono oggettive, disciplinari, nel caso
delle scienze ad esempio ai nodi sono sistemati i concetti della "scienza accreditata".
Lapplicazione delle mappe cognitive come supporto allanalisi documentale di grande utilit nella
rappresentazione grafica dei documenti.
Dopo aver individuato concetti e parole chiave presenti allinterno di un documento, la successiva
rappresentazione su carta mediante mappe cognitive consente di interpretare il documento al fine
di assumere delle decisioni.
Il Documentary Coding Method il metodo utilizzato per rappresentare graficamente il contenuto
di un documento con le mappe cognitive.

52

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Costruzione di una Mappa Cognitiva utilizzando il Documentary Coding Method


(Wrighston, 1976)

Documentary Coding Method si applica alle asserzioni espresse dai soggetti in specifiche
occasioni decisionali. Esso composto da 4 fasi operative:
1. Codifica del testo: analisi logica/sintattica e del contesto per lindividuazione di concetti/nodi
e nessi causali
2. Stesura del dizionario: Index dictionary card e Merging tra i concetti che appaiono avere lo
stesso significato
3. Stesura della relationship card: tabella che comprende variabili concetto causa ed effetto
4. Stesura della Mappa Cognitiva
Esempio:

ricostruzione

della

cognitive

map

di

un

soggetto

decisore

allinterno

di

unorganizzazione in fase di riposizionamento strategico, dunque di cambiamento.


La fase propedeutica consiste nella raccolta del materiale documentale rilevante:
Testi/scritti del soggetto indagato
Discorsi pronunciati e trascritti
Resoconti di riunioni
Role-play attivati ad hoc

- Step 1 Analisi documentale generale e focalizzazione su uno dei testi (Analisi/codifica)


Frammento di un discorso tenuto dal decisore:
.. Ci siamo prefissi di trattenere soprattutto gli uomini nati e cresciuti in azienda e in
particolare i manager, infatti erano proprio loro i soli in grado di innovare e di avere idee per
uscire dalla situazione di crisi. Il piano prevedeva infatti di garantire una continuit sia culturale
sia professionale che solo il management storico poteva assicurare

- Step 2 Fase di Index dictionary Card e Merging


1. In grado di innovare = capacit di innovare
2. Avere le idee=1
3. Continuit culturale e professionale
4. Uscire dalla situazione di crisi = Sopravvivenza e rilancio dellimpresa

53

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

- Step 3 Stesura della Relationship Card

Trattenere management storico

= Concetto causante

= Segno della relazione (+,-)

Capacit di innovare

= Concetto conseguente

= Segno della relazione (+,-)

Sopravvivenza e rilancio dellimpresa

= Concetto conseguente

&
Trattenere management storico

= Concetto causante

= Segno della relazione (+,-)

Continuit culturale e professionale

= Concetto conseguente

= Segno della relazione (+,-)

Sopravvivenza e rilancio dellimpresa

= Concetto conseguente

- Step 4 Frammento della Cognitive Map

Policy

Variabili intervenienti

Goals

Capacit di
Trattenere

innovazione

management
storico

Sopravvivenza e
rilancio

dellimpresa
Continuit culturale e

professionale

Nellambito della funzione riflessiva, una delle pi immediate e significative che lo strumento
fornisce, la mappa cognitiva ricostruita viene usata come uno specchio delle credenze del
soggetto, uno strumento che il ricercatore mette a disposizione dellattore per renderlo
maggiormente consapevole dei concetti utilizzati nel definire la situazione e delle implicazioni delle
sue argomentazioni: di tutto ci, spesso, egli non conscio fino al momento in cui non ne vede la
rappresentazione grafica. Le mappe costituiscono dunque un prezioso feedback in grado di
agevolare, con laiuto del ricercatore, la revisione delle proprie rappresentazioni della situazione e
la conseguente modifica dei propri comportamenti, favorendo in questo modo la crescita personale
e lapprendimento organizzativo.49

49

CATERINA MUZZI, CLAUDIA ORTOLANI, Lanalisi dei processi decisionali attraverso le mappe cognitive: un caso di studio, 2003

54

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

5.7 Il web semantico (semantic web)

Il World Wide Web uno strumento universale per il recupero delle informazioni. Esso
appare come un ipertesto50 che collega risorse remote distribuite in tutto il mondo. Allo stato
attuale, il World Wide Web contiene pi di 300 milioni doggetti statici che forniscono unampia
variet dinformazioni. Trovare ed estrarre una determinata informazione dal web gi da anni un
problema al centro dellattenzione degli studiosi. La sua ampia diffusione dovuta al fatto che non
esistono restrizioni sulla qualit e sul tipo di documenti pubblicati; non viene fatta alcuna
discriminazione sui contenuti: ogni cosa pu essere linkata a qualsiasi altra. Il linguaggio HTML,
con il quale si scrivono le pagine Web, infatti, non pone alcun vincolo, si limita a fornire una
formattazione che determina come il testo dovr essere visualizzato ed enfatizzato dal browser. Si
per sviluppato un sistema in cui i contenuti delle informazioni sono espressi in una forma non
adatta allelaborazione automatica attuata per mezzo dei calcolatori; il significato del testo risulta,
infatti, comprensibile solo all'uomo.
Migliaia di utenti accedono quotidianamente ai siti per ottenere informazioni di qualsiasi tipo. Molto
spesso, prima di trovare i documenti che trattano gli argomenti cui si interessati, bisogna
esaminarne molti altri che non hanno nulla a che vedere con essi (rumore informativo). Le ricerche
nella maggiorparte dei casi vengono, infatti, effettuate per parola chiave e i risultati comprendono
anche quelle fonti che utilizzano tali parole con un significato diverso rispetto a quello inteso
dallutente.
Per esempio immettendo in un motore di ricerca la parola capo si otterr una lista di documenti
contenente il termine; alcuni di essi potrebbero riferirsi a tale concetto come se fosse la parte
superiore del corpo, altri per indicare il leader di unorganizzazione. Questo perch tale parola ha
un significato diverso secondo il contesto in cui utilizzata e i search engine non sono in grado di
operare una discriminazione sul contenuto. Alcuni portali come Yahoo (http://www.yahoo.com)
utilizzano altre tecniche e mettono a disposizione servizi di ricerca guidati da categorie; queste
funzionalit necessitano comunque dellimpiego di personale umano che quindi rappresenta un
costo direttamente proporzionale ai documenti da analizzare oltre a consentire una certa quota
percentuale di soggettivit in dipendenza delloperatore/indicizzatore.
Mano a mano che la quantit di pubblicazioni tende a crescere a ritmi esponenziali la situazione
diventa sempre pi difficile da gestire con le tecniche attuali. Si corre il rischio di rendere nulla o
estremamente limitata lutilit di avere a disposizione un cos grande archivio. Una possibile
risposta a questa esigenza il Web semantico termine coniato per la prima volta da Tim BernersLee.
50

"Tecnicamente un ipertesto un insieme di nodi connessi da dei legami. I nodi possono essere delle parole, delle pagine , dei grafici
o parti di grafici, delle sequenze sonore, dei documenti completi che possono essere degli ipertesti a loro volta. Gli items di
informazione non sono collegati linearmente, come su una corda a nodi, ma ciascuno di essi, o la maggior parte , estendono i loro
legami a stella, secondo un modello reticolare.Navigare in un ipertesto, dunque, disegnare un percorso in una rete che pu essere
complessa quanto si vuole. Perch ogni nodo pu contenere, a sua volta, tutta la rete" - Pierre Levy, Le tecnologie dell'intelligenza,
Synergon, Bologna, 1992.

55

CORSO DI DOCUMENTAZIONE 2004/05 Prof. R. Guarasci

Esso vuole dare maggiore importanza ai contenuti ed al contesto nel quale i singoli termini
vengono utilizzati, in modo da ottenere degli strumenti che aumentino lefficacia delle ricerche e ne
consentano una effettuazione automatica.
il Web Semantico richiede linteroperabilit a livello semantico: non sono pi sufficienti standard
per la forma sintattica dei documenti, ma anche per il loro contenuto semantico; interoperabilit
semantica significa definire mapping tra termini sconosciuti e termini conosciuti nei dati.
Chiaramente il costo dellinteroperabilit semantica pi elevato di quello dellinteroperabilit
sintattica;
La ricerca di documenti non sar pi basata sulle parole chiave, ma sul significato di un concetto o
di pi concetti legati tra loro. In questo modo i motori di ricerca permetteranno di estrarre solo i
documenti cui si veramente interessati, anzich, come accade attualmente, restituire unalta
percentuale di documenti che non riguardano largomento specificatamente cercato dallutente.

56

Potrebbero piacerti anche