Introduzione...................................................................................................... 2
Capitolo 1...........................................................................................................5
Capitolo 2......................................................................................................... 15
Capitolo 3........................................................................................................ 35
Conclusioni......................................................................................................53
Appendice........................................................................................................54
Bibliografia...................................................................................................... 64
1
Introduzione
Introduzione
L'acutezza del pensiero, la
chiarezza nell'espressione,
l'esattezza nella comunicazione, la
prontezza nella risposta, e la
precisione nel servizio dipendono in
ultima analisi dalla successione
conveniente, ovvero dalla
Classificazione.
[S. R. Ranganathan 1967]
Sin dalla sua comparsa, l'uomo ha dovuto sempre affrontare l'ostacolo della
comunicazione, per comprendere ed essere compreso. Nei secoli il linguaggio, sia verbale
che scritto, si è evoluto distinguendosi nei diversi idiomi e producendo un ingente quantità
di materiali e documenti che oggi costituiscono il patrimonio dell'umanità. Questa è una
realtà dinamica, un insieme aperto, non definitivo, ma in perenne ampliamento; di cui
vengono a far parte ritrovamenti e acquisizioni continui di dati e materiali.
Il punto di partenza di qualsiasi ricerca è sapere quali conoscenze sono già note e come
sono strutturate, infatti reperire informazioni da un sistema ben strutturato agevola l'attività
di ricerca, risparmiando tempo prezioso. Per cui, gestire l'architettura dell'informazione, in
2
una società in cui la reperibilità del dato è fondamentale, diventa un lavoro prioritario da
estendere a tutti i settori e ambiti disciplinari.
Nell'era in cui viviamo adesso, l'era della digitalizzazione, le informazioni viaggiano per
mezzo di un nuovo canale, ossia quello virtuale di Internet. Il World Wide Web, elidendo le
barriere fisiche e geografiche, ha messo in comunicazione l'intero pianeta con uno scambio
di informazioni senza limiti e ha raccolto in un unico grande contenitore tutto lo scibile
umano. In questo contesto, la progettazione dell'architettura dell'informazione diviene
l'obiettivo primario per soddisfare l'esigenza dell'utente, ossia reperire l'informazione che ci
è utile dal flusso continuo di documenti.
Già da tempo, Internet offre la possibilità, a tutti gli utenti, di reperire, caricare e
pubblicare qualsiasi informazione, che giorno dopo giorno aumenta esponenzialmente. Se
prima la responsabilità di classificare, organizzare e fornire accesso ai dati era
principalmente di bibliotecari o addetti ai lavori, adesso è l'utente a farsi carico di tutto ciò,
nel momento stesso in cui li pubblica. Allora, risulta necessario etichettare i contenuti,
adottare uno schema di classificazione specifico, e gestire nel migliore dei modi
l'amministrazione del perenne flusso di informazioni.
3
classificazione maggiormente adottati, sull'importanza delle strutture e dei
sistemi organizzativi.
4
Capitolo 1
Capitolo 1
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
1.1 Le origini dell'enciclopedia collaborativa.
Wikipedia nella sua accezione più elementare è un database Internet che permette a
chiunque, indipendentemente da competenze o qualifiche, di scrivere e modificare voci su
qualsiasi argomento. L'insieme dei contenuti di diversi autori volontari è autodefinito
“Enciclopedia” dal gestore del servizio (Wikimedia Foundation, Inc., una società no-profit
statunitense) e come tale riconosciuta dai medesimi collaboratori non necessariamente
specialisti.
Wikipedia, autodefinitasi “enciclopedia libera” sceglie il World Wide Web come mezzo
di distribuzione e scrittura delle voci enciclopediche, ed in particolare una tecnologia web
denominata Wiki, da cui prende il nome. Un wiki (un termine in lingua hawaiana che
significa “veloce”, “rapido”) è un software collaborativo per il Web ideato nel 1995
dall'ingegnere informatico statunitense Ward Cunningham per permettere la pubblicazione
di ipertesti direttamente modificabili dagli utenti, che possono scrivervi usando una sintassi
più semplice di HTML. Il termine wiki è usato sia per indicare il software in sé, più
precisamente software wiki o wiki engine, che l'ipertesto modificabile.
5
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
Nel giro di dieci anni questa enciclopedia online ha raggiunto il quattordicesimo posto
nella graduatoria mondiale di Alexa1 per richieste, superando fra gli altri il sito della
Biblioteca del Congresso statunitense (dal 2003-12) e dell'Enciclopedia Britannica (dal
2003-06), diventando l'enciclopedia online più consultata al mondo.
1
La Alexa Internet Inc. è un'azienda statunitense sussidiaria di Amazon.com che si occupa di statistiche sul
traffico di Internet. Alexa è anche un motore di ricerca con un servizio di web directory.
6
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
Per molti secoli, l’organizzazione aristotelica del sapere, è stato un punto di riferimento
principale, raggruppando tutti i campi della conoscenza in tre classi: teoretica, pratica e
poetica.
Fino a quando, attorno al 1600 il filosofo inglese Francis Bacon distingueva le scienze a
seconda delle facoltà conoscitive che le producono: memoria, immaginazione e ragione.
Tale successione arriverà fino al 1873, quando Mervil Dewey, un bibliotecario di un college
di New York, sviluppò un Sistema Decimale di classificazione, che prese il suo nome. Uno
strumento per classificare e fornire accesso al crescente numero di libri.
[…] Dewey suddivise ogni disciplina in sottoclassi e queste a loro volta in sotto-
sottoclassi e così via, in modo da distinguere anche argomenti molto specifici. Per indicare
ciascuna classe, Dewey utilizzò dei numeri, inizialmente di tre cifre: così 800 significava
Letteratura in genere, ma 810 significava Letteratura Americana, […] potenzialmente
all’infinito, poiché le cifre decimali di un numero possono essere infinite. Il nuovo sistema
prese quindi il nome di Classificazione Decimale di Dewey (Gnoli, Marino, & Rosati,
2006).
L’esplosione della quantità di conoscenze pubblicate sul Web ha reso più arduo il
reperimento delle informazioni, in particolare trovare quello che ci interessa in breve
tempo. Perciò, occorre una buona Architettura dell’informazione.
Peter Morville (Morville & Rosenfeld, 2002) definisce tale concetto in quattro punti
fondamentali:
7
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
3. L’arte e la scienza della strutturazione e classificazione dei siti Web e delle intranet
per assistere gli utenti a trovare e gestire le informazioni.
A questo scopo vengono utilizzate, più o meno consapevolmente, varie forme di sistemi
per l'organizzazione della conoscenza (knowledge organization system, KOS), come parole-
chiave, tesauri, stringhe di soggetto, tassonomie, ontologie, schemi di classificazione.
Gli schemi di classificazione sono forse i più classici tra i KOS. Sono stati sviluppati
soprattutto a partire dalla fine dell'Ottocento, per far fronte alla crescente quantità di
documenti da ordinare e gestire nelle biblioteche e nelle bibliografie. La maggior parte degli
8
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
9
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
Il file system del nostro computer ci da un buon esempio di alcuni schemi esatti di
organizzazione. Quando navighiamo le cartelle del nostro hard disk possiamo ordinarne i
contenuti per nome, data di ultima modifica, tipo di file o dimensione. Un'altro buon
esempio è il client di posta elettronica. Generalmente ordiniamo le mail in entrata in base
alla data di arrivo, ma possiamo ordinarle anche per oggetto o per mittente. Nome, data,
dimensione di un file, oggetto, mittente di una mail sono schemi di ordinamento esatti,
perché sono informazioni che si basano su quantità che possono essere su scala ordinale,
come l'ordine alfabetico, o ad intervalli, come le date, o a rapporti, come la dimensione di
un file. Un altro schema esatto può essere quello geografico. La open directory
www.dmoz.org, ad esempio, presenta anche una categorizzazione per area geografica, e
dunque i siti internet dedicati alla città di Rovereto si trovano sotto il percorso
Regional > Europe > Italy > Trentino Alto Adige > Trento > Rovereto
Il vantaggio degli schemi esatti è che l'ordinamento può essere fatto automaticamente
dall'applicazione. Non è necessario, dunque, ordinare a mano le mail ricevute in base alla
data di arrivo, in quanto è il programma stesso a farlo per noi. Ma soprattutto se si conosce
la data di arrivo di un'e-mail risulta facile trovarla.
A volte, però, gli utenti si trovano in difficoltà nell'usare gli schemi esatti, in quanto le
loro conoscenze in merito a ciò che cercano non sono precise. Se, ad esempio, non ricordo
la data precisa di un'e-mail che sto cercando, né il mittente, né l'oggetto trovare quell’e-mail
in base agli schemi esatti può risultare un'impresa non facile.
In altre circostanze, poi, è l'informazione stessa che non si presta a schemi esatti, in
quanto è per sua natura ambigua. Gli schemi ambigui sono meno semplici da
implementare, ed introducono degli elementi di soggettività. Ciononostante risultano
spesso estremamente utili. C’è un semplice motivo per cui la gente trova i sistemi di
classificazione ambigui così utili: non sempre sappiamo cosa cercare (Morville &
Rosenfeld, 2002).
I responsabili delle biblioteche usano molto spesso schemi ambigui per argomento
come il Dewey Decimal. Vi sono differenti tipologie di schemi ambigui. Un corpus di
informazioni può essere classificato ad esempio per argomento, per compito, per tipologia
di utenza. Immaginiamo, ad esempio, il sito web di una facoltà universitaria. Le risorse
10
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
possono essere raggruppate per argomento, e allora potremo avere le categorie: didattica,
ricerca, servizi. Possono essere raggruppate per tipologia di utente, e allora avremo un
ingresso diverso per studenti, docenti, personale, aziende, persone interessate ad iscriversi ai
corsi di laurea e così via. Nella sezione dedicata alla didattica on line le risorse possono
essere raggruppate per argomento: consultare il programma di un insegnamento, seguire le
lezioni online, iscriversi all'esame. Naturalmente in questo caso la classificazione è soggetta
ad ambiguità e difficoltà. Dove collochiamo, ad esempio, la pagina dedicata alla biblioteca;
nella categoria Ricerca, nella categoria Didattica o nella categoria Servizi?
È proprio nella creazione di questa tipologia di schemi che diviene necessario, in fase di
design, coinvolgere gli utenti utilizzando degli strumenti di conoscenza.
11
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
12
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
Le categorie diventano così il secondo metodo di navigazione legato alla voce subito
dopo i link interni, ma il loro utilizzo non è esente da controversie.
L'albero delle categorie di Wikipedia è stato pensato originariamente come uno schema
di classificazione del tipo “dove inserisco questa voce” piuttosto di “come la descrivo” per
cui ogni categoria ha nome univoco, che non è detto sia anche il più rappresentativo. La
catalogazione è però applicata in modo disomogeneo, per cui ognuno finisce per usare le
categorie che preferisce o conosce 2.
2
Essendo integrati semplicemente come link in un namespace differente, ad oggi è possibile
categorizzare a piacimento qualsiasi voce, e la classificazione non è sottoposta ad alcun controllo
semantico automatico prima della pubblicazione, che impedirebbe ad esempio l'inserimento della
medesima voce in più categorie collegate in linea retta.
13
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
3
Sulla navigazione contestuale, cfr. Rosenfeld – Morville 2002, 116-118. I template di navigazione
forniscono una serie di link contestuali comuni ad un gruppo di voci.
14
Capitolo 2
Capitolo 2
Due schemi di classificazione a confronto
2.1 La classificazione gerarchico – enumerativa
Alla base di quasi tutte le architetture dell’informazione ben riuscite c’è una gerarchia o
tassonomia ben progettata […]. Da sempre le informazioni sono state organizzate in modo
gerarchico. Gli alberi genealogici sono gerarchici. La suddivisione di libri in capitoli,
sottocapitoli, paragrafi, frasi, parole, lettere. La gerarchia è ovunque nella nostra vita. A
causa di tale pervasività delle strutture gerarchiche, gli utenti sono in grado di comprendere
facilmente e rapidamente quei siti che utilizzano modelli organizzativi gerarchici […]
(Morville & Rosenfeld, 2002).
15
Due schemi di classificazione a confronto
Ogni giorno abbiamo a che fare con procedure simili, anche quando usiamo il computer
domestico. Se vogliamo memorizzare un file nello spazio fisico riservato ai documenti non
facciamo altro che assegnare un nome significativo, che ricordi il suo contenuto, in modo
da trovarlo facilmente in mezzo agli altri. Ma dopo qualche tempo i documenti cominciano
ad essere così numerosi che scorrerli solo per nome diventa scomodo. Per risolvere il
problema è consuetudine creare delle cartelle che ordineranno i documenti affini. In questo
modo si viene a creare una “gerarchia”, ossia per arrivare al file desiderato è necessario
compiere più passaggi (aprire la cartella giusta e scorrere i file ivi contenuti per trovare il
documento). In questo caso le cartelle rappresentano le “classi”, in cui disporre unità di
conoscenza affini. Raggruppando le singole unità in classi, siamo partiti dal basso verso
l’alto (Bottom-up), ossia abbiamo adottato un approccio a posteriori.
Nel caso in cui dobbiamo progettare uno schema è necessario farci un’idea iniziale di
quale sarà la sua struttura generale, sin dall’inizio ci immaginiamo l’insieme delle
conoscenze da organizzare e ci chiediamo come dovranno essere suddivise. In questo
modo, stiamo adottando un approccio dall'alto verso il basso (Top-down), ossia a priori.
Possiamo stabilire di suddividere i nostri oggetti secondo una prima caratteristica, per
esempio la data, quindi tutti i documenti del 2006, quelli riguardanti il 2005, e così via.
Queste saranno quindi le classi principali del nostro schema. A loro volta esse potranno
essere divise secondo un’altra caratteristica.
Stabilendo una serie di classi, sottoclassi e così via, possiamo formare un albero
gerarchico, ramificato quanto vogliamo. Con la Classificazione Decimale Dewey possiamo
contrassegnare ogni nodo dell’albero con una notazione decimale, potenzialmente
all’infinito.
16
Due schemi di classificazione a confronto
17
Due schemi di classificazione a confronto
Oltre alla categoria “Regional”, sono infatti presenti classi come “Kids and Teens”,
“World” o “Shopping”. Se un utente vuole acquistare on-line un gioco per bambini, da
quale categoria del top-level di Open Directory deve cominciare? È probabile che siano previsti
rinvii tra i vari rami di Open Directory e che quindi si riesca ugualmente ad arrivare alla
categoria desiderata partendo da tutti e quattro i top-level possibili, ma l'effetto labirinto dello
schema ibrido rimane.
È ancora aperta la questione sul Web, se impiegare un principio di divisione alla volta, o
rispettare la mutua esclusività delle categorie al fine di rendere gli schemi di classificazione
coerenti. Vizine-Goetz (1996) dimostra come la Classificazione della Library of Congress e
la Classificazione decimale Dewey prevedano una copertura di argomenti sufficientemente
ampia per classificare le risorse di Internet. Nel proporre le classificazioni bibliografiche per
il Web, i bibliotecari sono consapevoli del fatto che l'impianto tradizionale deve essere
opportunamente modificato per la sostanziale differenza tra la fisicità del libro e la virtualità
del Web. Ma le classificazioni bibliografiche classiche, in quanto enumerative e condivise,
sono di fatto strutturalmente chiuse, istituzionalizzate e centralizzate. Gli schemi
tradizionali non consentono in fase di indicizzazione l'inserimento, da parte del
classificatore, di una nuova categoria. Solo il compilatore può modificare la classificazione,
redigendo un foglio di revisione ufficiale o pubblicando un'edizione successiva dello
schema. Ciò può avvenire anche a distanza di molti anni: tempi troppo lunghi per il Web.
18
Due schemi di classificazione a confronto
bibliografiche condivise, ma ciò è dovuto solo alla loro natura home-grown, che permette ai
compilatori di modificare la gerarchia in qualsiasi momento.
19
Due schemi di classificazione a confronto
Perciò, egli dedicò molto del suo lavoro a identificare dei principi fondanti per la
classificazione, per risolvere il problema di rappresentare le sfumature del sapere umano. In
alternativa agli schemi di classificazione già esistenti da diversi decenni, come la tradizionale
Classificazione Decimale Dewey, Ranganathan studiò un sistema meno rigido e più
articolato, che definì classificazione a faccette.
• sono invariabili dal punto di vista semantico (ad es. la proprietà “colore” di un
oggetto può variare in termini di valori che può assumere – giallo, rosso etc. – ma è
invariabile come concetto; cioè quell’oggetto avrà sempre un colore).
20
Due schemi di classificazione a confronto
• personalità
• materia
• energia
• spazio
• tempo
Esse possono essere immaginate come dei binari sui quali l'oggetto viene scomposto e
attraverso i quali è possibile individuare la singola manifestazione, ovvero la faccetta. Le
faccette sono dunque le molteplici espressioni della realtà, dei modi di essere, individuati
dalle categorie che a loro volta possono essere espresse da concetti elementari, gli isolati,
contenuti in quella certa area concettuale individuata dalla faccetta. (Lavazza, 2003).
Es.:
Storia delle religioni (categoria)
Storia del cristianesimo (faccetta)
Patristica (isolato)
22
Due schemi di classificazione a confronto
Polmoni = personalità
Tubercolosi = materia/proprietà
Raggi X = materia/metodo
L'energia (le caratteristiche dinamiche dei processi che lo interessano), o attività secondo
il CRG, rappresenta l'azione che quel certo soggetto con quelle date caratteristiche compie.
Secondo lo stesso Ranganathan le difficoltà di focalizzazione che questa categoria presenta
potevano essere ovviate attraverso l'esperienza classificatoria: componendo ogni frase del
linguaggio naturale era possibile individuare volta per volta il concetto di energia.
Spazio (i suoi elementi geografici o spaziali).
Tempo (le sue fasi cronologiche).
Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X
Trattamento = energia
Infine abbiamo le categorie di spazio e tempo che sono le meno difficili da definire:
India = spazio
1950 = tempo
Una volta individuate le categorie del soggetto le singole faccette vengono messe in
relazione tra di loro attraverso segni d'interpunzione che rimangono anche nella sequenza
numerica:
23
Due schemi di classificazione a confronto
P = , (virgola)
M = ; (punto e virgola)
E = : (due punti)
S = . (punto)
T = . (punto)*
Una volta individuate le faccette e gli isolati il soggetto analizzato viene sintetizzato
numericamente. Il piano notazionale della Colon prevede numerose tavole indicate da
lettere maiuscole e minuscole e da numeri. Si scompone la stringa individuando i settori di
interesse: per "tubercolosi" si vede la faccetta "medicina". Ecco dunque che il soggetto
presenta il seguente risultato:
• 1: Piano verbale
o Categorie (PMEST)
o Faccette
o Isolati
24
Due schemi di classificazione a confronto
• 2: Analisi e sintesi
• 3: Piano notazionale
o Sequenza alfanumerica
25
Due schemi di classificazione a confronto
stringa di citazione:
riso - raccolta - India – Stagione X
Come si può notare, non tutte le faccette vengono sempre espresse in ogni documento.
Se dovessimo avere un documento sulla raccolta del riso in genere, poiché
nell'organizzazione della conoscenza il niente equivale a generalità, secondo il principio
della gradazione della specificità, lo elencheremo prima degli altri:
riso: raccolta: India
riso: raccolta: India: stagione x
riso: raccolta: India: stagione y
…
26
Due schemi di classificazione a confronto
questo significa che all'interno di una singola voce (stringa) in orizzontale le proprietà
precedono le azioni, mentre elencando diverse voci, le azioni precedono le proprietà. Tale
sottile, ma importante, principio è chiamato principio di inversione.
Il contributo di Ranganathan nel campo della scienza della classificazione può essere
sintetizzato attraverso gli elementi fondamentali che caratterizzano l'impianto della Colon:
Malgrado sia stata accolta dagli esperti di tutto il mondo in maniera entusiasta, la Colon
classification è stata poi abbandonata ovunque in favore della Dewey. Le indubbie difficoltà
di applicazione potevano in qualche modo essere ovviate qualora il sistema si fosse rivelato
rivoluzionario, come si era preannunciato. Rispetto alla Dewey, la Colon prevedeva uno
27
Due schemi di classificazione a confronto
Non si deve però cadere nell'errore di considerare tale apertura assoluta. È infatti chiaro
che il numero di categorie potenziali previste ha un limite che, sebbene molto elevato,
rappresenta in ogni caso un vincolo nelle capacità rappresentative del sistema. Ma gli
schemi a faccette rimediano a questo problema attraverso un alto livello di scalabilità, assai
maggiore rispetto alle classificazioni gerarchico - enumerative classiche. Queste ultime sono
infatti difficilmente scalabili: l'aggiunta di una nuova categoria rende spesso necessaria la
modifica delle classi dello stesso livello (per assicurarne la mutua esclusività) e/o di una
grossa parte della struttura ad albero dello schema. La colpa di tale imperfezione delle
classificazioni gerarchico - enumerative è da imputare anche alla loro struttura gerarchica.
In uno schema ad albero tradizionale ci sono infatti forti relazioni per ogni ramo: le classi
inferiori dipendono da quelle superiori. Negli schemi a faccette è, invece, sempre possibile
aggiungere una nuova faccetta descrittiva di un nuovo aspetto dell'oggetto (Rosati, 2003) e
non si avranno ripercussioni di alcun tipo sulle altre faccette. In una classificazione analitico
- sintetica ogni faccetta è infatti autonoma dalle altre: determina una proprietà
("sfaccettatura") dell'oggetto da classificare indipendentemente dalle proprietà descritte
dalle altre faccette.
Però se il sistema può accogliere nuove faccette senza doversi “aggiustare” globalmente,
ed è quindi intrinsecamente scalabile, si ripropone tuttavia anche in questo caso, così come
per le classificazioni gerarchico - enumerative, la questione della riclassificazione. L'aggiunta
di una faccetta rende infatti necessaria la riclassificazione di tutte le entità secondo la nuova
faccetta e, quando gli oggetti già classificati sono migliaia, il lavoro non è certo di poco
conto. Tale riclassificazione assume connotati ancora più gravi persino di quelli causati nelle
28
Due schemi di classificazione a confronto
È consigliabile allora prestare sempre molta attenzione alla preliminare analisi a faccette:
tale fase è infatti di strategica importanza nello sviluppo di un sistema di classificazione
analitico - sintetico e, se compiuta con cura, evita poi problemi di riclassificazione.
anche una navigazione per approfondimenti (scegliendo prima il colore, poi il tipo, poi
l’origine e così via) consente comunque all’utente di trovare il prodotto, anche se con più
fatica e in modo non ottimale, rispetto alle sue esigenze, che potrebbero, per esempio, voler
privilegiare il prezzo come punto di inizio della ricerca. In altri casi, la classificazione a
faccette è l’unico modo per rendere disponibile l’informazione a diverse categorie di utenti.
Anche il sito Elastic lists (figura 8) rende il principio di navigazione e di lettura molto rapido,
migliora la presentazione delle informazioni riguardo ai primi Nobel.
Figura 7: Schermata di “Elastic List Demo”: classificazione a faccette dei premi Nobel
31
Due schemi di classificazione a confronto
32
Due schemi di classificazione a confronto
Esempio:
Possiamo riportare come esempio un documento sulla prevenzione del virus della pianta
del riso in Giappone nel 1970.
risultato: J,381;421:5.42,NT
33
Due schemi di classificazione a confronto
Come si è potuto notare la sequenza alfanumerica delle due stringhe presenta la stessa
forma rappresentativa insita nella logica delle due differenti classificazioni: la Dewey appare
il prodotto di una elencazione/enumerazione, la Colon come una frase scomponibile
frutto di una sintesi analitica.
34
Capitolo 3
Capitolo 3
Il caso studio: WikiArte e la classificazione a faccette.
3.1 Lo stato dell'arte
Con la locuzione stato dell'arte si intende il più alto livello di sviluppo finora raggiunto
da una tecnologia o un campo scientifico, sinonimo de “all'avanguardia”, “dell'ultima
generazione”. Il fine del progetto è quello di realizzare un enciclopedia sull'arte, avvalendosi
di strumenti, come il software libero Mediawiki 4, messo a disposizione dalla “Wikimedia
foundation 5”, permettendo di ridurre i tempi di lavoro.
Un wiki è un sito web (o comunque una collezione di documenti ipertestuali) che viene
aggiornato dai suoi utilizzatori e i cui contenuti sono sviluppati in collaborazione da tutti
coloro che vi hanno accesso. La modifica dei contenuti è aperta, nel senso che il testo può
essere modificato da tutti gli utenti (a volte soltanto se registrati, altre volte anche anonimi)
procedendo non solo per aggiunte, ma anche cambiando e cancellando ciò che hanno
scritto gli autori precedenti. Ogni modifica è registrata in una cronologia che permette in
caso di necessità di riportare il testo alla versione precedente; lo scopo è quello di
condividere, scambiare, immagazzinare e ottimizzare la conoscenza in modo collaborativo.
Spesso sul Web ci si avvale di sistemi automatici di gestione dei contenuti per rendere
più semplice la realizzazione di un sito e la manutenzione dei sui documenti. Questo
strumento software non è altro che un CMS (content management system).
4
http://www.mediawiki.org/wiki/MediaWiki
5
http://wikimediafoundation.org/wiki/Home
35
Il caso studio: WikiArte e la classificazione a faccette.
supervisionare la produzione dei contenuti, e la sezione applicativa (front end), che l'utente
web usa per fruire dei contenuti e delle applicazioni del sito. Date queste caratteristiche
comuni Mediawiki può essere considerato un CMS.
36
Il caso studio: WikiArte e la classificazione a faccette.
37
Il caso studio: WikiArte e la classificazione a faccette.
38
Il caso studio: WikiArte e la classificazione a faccette.
Questo tipo di navigazione non agevola la ricerca nel momento in cui si vuole
consultare un documento in particolare, poiché costringe l'utente a scorrere tutti i risultati
sino a trovare quello giusto. Volendo fare un esempio pratico su WikiArte, alla luce di
quello che è stato detto, possiamo cercare tutte le opere di Marinetti che fanno parte di
“Parole in libertà”. In questo caso non basta digitare la stringa “parole+libertà+marinetti”,
poiché il software troverà tutte le pagine che contengono i termini su citati non
consentendo una ricerca mirata e minuziosa delle opere in questione, ossia Dune (parole in
libertà, 1914), Zang Tumb Tumb (Adrianopoli ottobre 1912. Parole in libertà), ecc...
Per un ritrovamento veloce ed efficiente del documento gli architetti dell'informazione
prediligono la classificazione a faccette per le caratteristiche già discusse. Per tale motivo, al
fine di estendere le potenzialità di WikiArte e
permettere più interrogazioni possibili, risulta
utile adottare una struttura multidimensionale.
L’architettura a faccette offre a tutti uno
strumento adeguato al reperimento
dell’informazione in un sito Web. Classificare il
prodotto, la notizia, secondo diverse categorie,
che nel complesso lo descrivono è utile per
Figura 14: Struttura multidimensionale trovare l’informazione più velocemente.
Probabilmente la classificazione a faccette è, al
momento, un metodo da tenere in considerazione in quanto consente la coesistenza di
diverse logiche di ricerca, diversi livelli di competenza e motivazioni dell'utente, senza
sacrificare le esigenze di nessuno.
39
Il caso studio: WikiArte e la classificazione a faccette.
Ai fini del progetto, gli esempi esplicativi sono applicati al solo movimento del
Futurismo, poiché come avanguardia ha abbracciato più discipline, dalla Letteratura
all'Architettura, con un corollario di artisti poliedrici che ci permettono di rivolgere il
progetto a tutto il Patrimonio artistico-culturale. Nella figura 15 viene presentata la logica
multidimensionale delle faccette, in cui ogni elemento è associato ad una serie di
caratteristiche che lo identificano da vari punti di vista. In questo caso in particolare, sono
state selezionate due faccette che hanno raffinato la ricerca, ottenendo come risultato solo
gli oggetti che corrispondono a quelle proprietà.
40
Il caso studio: WikiArte e la classificazione a faccette.
utenti. Il vantaggio consiste nel poter incrociare facilmente più caratteristiche dello stesso
oggetto, ottenendo risultati mirati e soddisfacenti. L'utente può intraprendere percorsi
diversi per arrivare al medesimo risultato.
41
Il caso studio: WikiArte e la classificazione a faccette.
6
Python è un linguaggio di programmazione ad alto livello, orientato agli oggetti, adatto, tra gli altri
usi, per sviluppare applicazioni distribuite, scripting, computazione numerica e system testing.
Python è spesso paragonato a Tcl, Perl, Java, JavaScript, Visual Basic o Scheme[1]. Ideato da Guido
van Rossum all'inizio degli anni novanta. Sito ufficiale: http://www.python.org/
7
Le licenze BSD sono una famiglia di licenze permissive per software. Molte sono considerate libere
ed open source. Il loro nome deriva dal fatto che la licenza BSD originale (detta anche licenza BSD
con 4 clausole) fu usata originariamente per distribuire il sistema operativo Unix Berkeley Software
Distribution (BSD), una revisione libera di UNIX sviluppata presso l'Università di Berkeley.
43
Il caso studio: WikiArte e la classificazione a faccette.
E’ necessario notare che le faccette rappresentano non tanto un contenitore dei dati a
nostra disposizione ma un loro descrittore semantico (proprietà o aspetto dei dati stessi). E’
possibile effettuare, sfogliando la directory, una selezione progressiva, in pratica un
filtraggio. Una volta operata una prima selezione è sempre possibile raffinare ulteriormente
la ricerca all'interno del sottoinsieme estratto utilizzando le altre faccette che vengono
sempre ripresentate assieme ai risultati.
Figura 19: Home page Flamenco Fine Arts: Fine Arts Museums of San Francisco
Inoltre, per ogni insieme di risultati vengono specificate le sue coordinate semantiche
rispetto a tutte le faccette del sistema: oltre a mostrare l’insieme dei risultati, Flamenco
rende visibile la collocazione di tali risultati rispetto alle varie faccette. Quando si opera una
ricerca diretta, esso non esegue una semplice ricerca full-text, ma si appoggia al sistema di
classificazione a faccette per estrarre i risultati. L’utente, impiegando in modo combinato e
complementare searching e browsing, può:
44
Il caso studio: WikiArte e la classificazione a faccette.
45
Il caso studio: WikiArte e la classificazione a faccette.
Conviene sempre eseguire dei test con utenti per controllare la coerenza dello schema
architetturale, la sua chiarezza, le etichette scelte per faccette e foci. Inoltre, è opportuno
tenere aggiornato lo schema, affinché sia possibile rispondere a eventuali difetti che il
comportamento degli utenti può manifestare, adeguare la terminologia al cambiamento o
alle nuove esigenze e adattare lo schema per l'introduzione di nuovi elementi non previsti al
momento della costruzione.
5 Categorie di
13 Categorie del CRG Faccette
Ranganathan
Oggetti Manufatti
Personalità
Tipi
Materiale Materiale
Processi Stile e Movimento
Energia
Operazioni Discipline
Prodotto
Sottoprodotto
Pazienti
Agenti Realizzatori
Spazio Spazio Luoghi
Tempo Tempo Periodo
Questo può essere un buon punto di partenza per riflettere su come realizzare una
classificazione a faccette, le quali possono essere rinominate e riadattate per ogni
circostanza particolare.
I criteri adottati per la definizione di queste faccette sono legati all'usabilità di un sito
Web, ossia dare la possibilità ai visitatori d'interrogare il sistema e ricevere delle risposte
sensate e veloci, senza rimanere intrappolati nel labirinto della rete. Il punto di partenza è
46
Il caso studio: WikiArte e la classificazione a faccette.
stato quello di ideare un sistema centrato sull'utente. Poiché il Web e le faccette si fondono
bene insieme, è necessario mostrare all'utente una lista di faccette sotto forma di menù da
cui selezionare e scegliere ciò che gli interessa maggiormente. Tali faccette rappresentano
un descrittore semantico delle proprietà o degli aspetti dei dati immagazzinati, che
agevolano l'operazione di ricerca dell'utente rendendola mirata ed efficace.
William Denton (2003) affermò che:
“[...]The user can make quick choices, thinking, "I'd like to see something
with that, and that, and a bit of that, and I don't care about the rest,[...]”
Di seguito, la tabella 1 riporta le faccette con la relativa definizione e alcuni dei propri
foci (in Appendice viene riportato il file di riferimento di ogni faccetta con la lista completa
dei foci).
47
Il caso studio: WikiArte e la classificazione a faccette.
48
Il caso studio: WikiArte e la classificazione a faccette.
Francesco Cangiullo,
Giovanni Papini, Carlo
Belloli, Carlo Dalmazzo
Carrà, Federico De Maria,
Piero Bellanova, Ardengo
Soffici, Filippo Tommaso
Marinetti, Fortunato Depero
49
Il caso studio: WikiArte e la classificazione a faccette.
elementi in categorie, mentre i valori degli attributi sono visualizzati solo con i singoli
elementi.
Per esempio, nella nostra collezione “Manufatti” è la faccetta che indica il tipo di oggetto,
(bene artistico) che è stato raccolto, mentre “titolo” è l'attributo per il titolo del manufatto.
Questo perché, ha senso raggruppare i manufatti in categorie in base al tipo di oggetto, ma
non per il suo titolo.
• attrs.tsv
• facets.tsv
• items.tsv
• facet_terms.tsv (per ogni faccetta)
• facet_map.tsv (per ogni faccetta)
50
Il caso studio: WikiArte e la classificazione a faccette.
Il file attrs.tsv racchiude la lista degli attributi. Ogni linea rappresenta un attributo.
Campo 1 Campo 2
attribute identifier displayable name
Il campo attribute identifier deve essere un nome corto e univoco che contiene solo
lettere e “_” (no spazi o punteggiatura) mentre displayable name è ciò che viene
visualizzato dall’utente.
Il file facets.tsv contiene la lista delle faccette. Il campo facet identifier deve essere un
nome corto e univoco (anche rispetto agli attributi) che contiene solo lettere o underscores ,
displayable name è ciò che viene visualizzato dall’interfaccia utente e long description
Ogni oggetto ha un suo ID univoco che può essere una stringa o un numero. Il campo item
identifier è seguito dai valori degli attributi per l’oggetto nell’ordine in cui gli attributi sono
inseriti nel file attrs.tsv.
term grandparent
top-level term ... parent term category term
identifier term
E’ l’unico file che, in ogni riga, può avere un diverso numero di campi. Ogni linea
rappresenta una categoria e fornisce l’intera catena di categorie “padre”. Il campo term
identfer deve essere un numero univoco all’interno della faccetta.
51
Il caso studio: WikiArte e la classificazione a faccette.
Il file facet_map.tsv collega, per ogni faccetta, gli oggetti ai termini della categoria. Ogni
linea in questo file ha 2 campi:
Campo 1 Campo 2
item identifier term identifier
Il Campo 1 contiene l'ID del file item.tsv il Campo 2 contiene l'ID del file facet_terms.tsv.
52
Conclusioni
Conclusioni
Lungi da voler intraprendere una classificazione di tutto il Patrimonio Artistico-culturale,
il progetto vuole dimostrare la possibilità e l'efficacia di acquisire informazioni da fonti
strutturate e non strutturate e presentarli all'utente in forma semplice e facilmente
consultabile.
Tutti i vantaggi di una classificazione a faccette possono essere realizzati in pieno sul
web, a partire dal lavoro dei designer ed architetti dell'informazione che possono affidarsi
ad un sistema aperto, facilmente scalabile e flessibile; sino ad arrivare al miglioramento
sensibile dell'esperienza dell'utente in diverse situazioni di navigazione e ricerca. Gli utenti
possono iniziare la ricerca dalla faccetta che interessa maggiormente. Ognuno può trovare i
documenti che rispondono alla caratteristica selezionata, senza l'obbligo di effettuare un
unico percorso che parta da una faccetta specifica e senza dover controllare diverse sotto
categorie. Infatti, il sistema garantisce una pluralità di accessi, modalità di ricerca e
navigazione differenti, che rispondono ai bisogni informativi dei vari utenti, permettendo la
coesistenza di diversi livelli di competenza e migliorando la reperibilità dell'informazione.
53
Appendice
Appendice
Elenco dei file .tsv necessari a Flamenco
Attr.tsv Facets.tsv
artista nome artista manufatti Manufatti tipo di oggetto
nascita data di nascita temiSoggettiGen Temi Soggetti e Tematiche artistiche
eri Generi
morte data di morte
materiali Materiali materiale usato
realizzazione data di realizzazione
stileMovimenti Stile e stile e Movimento
titolo titolo dell' oggetto
Movimenti Artistico
fotografia Fotografia
disciplina Disciplina Ambito disciplinare
biografia Biografia dell'artista di riferimento
realizzatori Realizzatori chi ha realizzato il
bene culturale
luoghi Luoghi luogo in cui il bene è
stato prodotto
periodo Periodo periodo storico e
anno di riferimento
Gli articoli che contengono le descrizioni dei manufatti e le biografie degli artisti sono
contenuti nel file item.tsv, una tabella che fornisce ID e attributi per tutti gli oggetti. Di
seguito un esempio del modo in cui è strutturato il file, per ogni attributo corrisponde un
campo della tabella.
Attr.tsv Item.tsv
Artista nome artista Ardengo Soffici
nascita data di nascita 1879
morte data di morte 1964
realizzazione data di realizzazione 1914
titolo titolo dell' oggetto Natura morta con uovo rosso
fotografia Fotografia http://192.168.1.2:8888/mediawiki/image
s/thumb/8/83/1469_Ardengo_Soffici_Co
i_Natura_morta_con_uovo_rosso.jpg/350
px-
1469_Ardengo_Soffici_Coi_Natura_morta
_con_uovo_rosso.jpg
http://192.168.1.2:8888/mediawiki/index.
54
Appendice
MANUFATTI_TERM MANUFATTI_MAP
39 Stampa Litografia
40 Stampa Manifesto
41 Stampa Mezzotinto
42 Stampa Puntasecca
43 Stampa Serigrafia
44 Stampa Xilografia
45 Video
TEMISOGGETTIGENERI_TERM TEMISOGGETTIGENERI_MAP
MATERIALI_TERM MATERIALI_MAP
12 Pietra
13 Plastica
14 Sabbia
15 Seta
16 Stoffa
17 Tavola
18 Tela
19 Terracotta
20 Vetro
STILEMOVIMENTI_TERM STILEMOVIMENTI_MAP
57
Appendice
33 Purismo
34 Realismo
35 Realismo cubista
36 Realismo magico
37 Realismo sociale
38 Rinascimento
39 Rococò
40 Romanisto
41 Romanticismo
42 Scuola di Parigi
43 Simbolismo
44 Sintetismo
45 Suprematismo
46 Surrealismo
47 Umanesimo
48 Valori Plastici
49 Verismo
50 Vorticismo
DISCIPLINE_TERM DISCIPLINE_MAP
REALIZZATORI_TERM REALIZZATORI_MAP
13 Drammaturgo
14 Drammaturgo Filippo Tommaso Marinetti
15 Drammaturgo Paolo Buzzi
16 Fondazioni
17 Giornalista
18 Giornalista Paolo Buzzi
19 Giornalista Enrico Cavacchioli
20 Giornalista Gesualdo Manzella Frontini
21 Giornalista Federico De Maria
22 Medico
23 Medico Piero Bellanova
24 Mercanti d'arte
25 Mosaicista
26 Mosaicista Gino Severini
27 Musei
28 Pittore
29 Pittore Francesco Cangiullo
30 Pittore Carlo Dalmazzo Carrà
31 Pittore Giacomo Balla
32 Pittore Ardengo Soffici
33 Pittore Uberto Boccioni
34 Pittore Fortunato Depero
35 Pittore Enrico Prampolini
36 Pittore Luigi Russolo
37 Pittore Gino Severini
38 Poeta
39 Poeta Paolo Buzzi
40 Poeta Enrico Cavacchioli
41 Poeta Corrado Govoni
42 Poeta Libero Altomare
43 Poeta Luciano Folgore
44 Poeta Gesualdo Manzella Frontini
45 Poeta Auro D'alba
46 Poeta Francesco Cangiullo
47 Poeta Federico De Maria
48 Poeta Ardengo Soffici
49 Poeta Filippo Tommaso Marinetti
50 Pubblicitario
51 Pubblicitario Fortunato Depero
52 Scenografo
53 Scenografo Giacomo Balla
54 Scenografo Enrico Prampolini
55 Scenografo Fortunato Depero
56 Scrittore
57 Scrittore Paolo Buzzi
58 Scrittore Aldo Palazzeschi
59 Scrittore Giuseppe Carrieri
60 Scrittore Auro D'alba
61 Scrittore Francesco Cangiullo
62 Scrittore Giovanni Papini
59
Appendice
LUOGHI_TERM LUOGHI_MAP
60
Appendice
33 Europa
34 Europa Austria
35 Europa Belgio
36 Europa Boemia
37 Europa Cecoslovacchia
38 Europa Cipro
39 Europa Danimarca
40 Europa Francia
41 Europa Germania
42 Europa Gran Bretagna
43 Europa Grecia
44 Europa Irlanda
45 Europa Italia
46 Europa Norvegia
47 Europa Olanda
48 Europa Paesi Bassi
49 Europa Polonia
50 Europa Portogallo
51 Europa Scozia
52 Europa Spagna
53 Europa Svezia
54 Europa Svizzera
55 Europa Ungheria
56 America
57 America
58 Oceania
59 Oceania Australia
60 Oceania New Zelanda
61 Oceania Polinesia
62 Oceania Micronesia
63 Oceania Melanesia
PERIODO_TERM PERIODO_MAP
17 1910s 1915
18 1910s 1916
19 1910s 1917
20 1910s 1918
21 1910s 1919
22 1920s
23 1920s 1920
24 1920s 1921
25 1920s 1922
26 1920s 1923
27 1920s 1924
28 1920s 1925
29 1920s 1926
30 1920s 1927
31 1920s 1928
32 1920s 1929
33 1930s
34 1930s 1930
35 1930s 1931
36 1930s 1932
37 1930s 1933
38 1930s 1934
39 1930s 1935
40 1930s 1936
41 1930s 1937
42 1930s 1938
43 1930s 1939
44 1940s
45 1940s 1943
46 1940s 1944
47 1940s 1945
48 1940s 1946
49 1940s 1947
50 1940s 1948
51 1940s 1949
52 1950s
53 1950s 1950
54 1950s 1951
55 1950s 1952
56 1950s 1953
57 1950s 1954
58 1950s 1955
59 1950s 1956
60 1950s 1957
61 1950s 1958
62 1950s 1959
63 1960s
64 1960s 1960
65 1960s 1961
66 1960s 1962
62
Appendice
67 1960s 1963
68 1960s 1964
69 1960s 1965
70 1960s 1966
71 1960s 1967
72 1960s 1968
73 1960s 1969
74 1970s
75 1970s 1970
76 1970s 1971
77 1970s 1972
78 1970s 1973
79 1970s 1974
80 1970s 1975
81 1970s 1976
82 1970s 1977
83 1970s 1978
84 1970s 1979
85 1980s
86 1980s 1980
87 1980s 1981
88 1980s 1982
89 1980s 1983
90 1980s 1984
91 1980s 1985
92 1980s 1986
93 1980s 1987
94 1980s 1988
95 1980s 1989
96 1990s
97 1990s 1990
98 1990s 1991
99 1990s 1992
100 1990s 1993
101 1990s 1994
102 1990s 1995
103 1990s 1996
104 1990s 1997
105 1990s 1998
106 1990s 1999
107 2000s
108 2000s 2000
109 2000s 2001
110 2000s 2002
111 2000s 2003
112 2000s 2004
63
Bibliografia
Broughton,V. (2004, Gennaio 26), Una classificazione per il 21' secolo. Tratto il giorno Giugno
13, 2010 da AIB-WEB: <http://www.aib.it/aib/contr/broughton1.htm>
Bussolon, S. (s.d.). Organizzazione - Schemi organizzativi. Tratto il giorno Marzo 17, 2010 da
Hyperlabs <http://www.cardsorting.info/it/architettura/03.html>
Denton, W. (2003). How to Make a Faceted Classification and Put It On the Web. Tratto il giorno
10 Giugno, 2010 da Miskatonic university press,
<http://www.miskatonic.org/library/facet-web-howto.html>
Gnoli, C. (2000, Novembre 03). Il tavolino di Ranganathan. Tratto il giorno Giugno 14, 2010
da <http://didattica.spbo.unibo.it/bibliotime/num-iii-3/gnoli.htm>
Gnoli, C. (2002, Ottobre 17). Indicizzazione semantica nell'era digitale, ESB forum. Tratto il
giorno Marzo 22, 2010 da <http://www.burioni.it/forum/gnoli-sem.htm>
Gnoli, C., Marino, V., & Rosati, L. (2006). Organizzare la conoscenza - Dalle biblioteche
all'architettura dell'informazione per il Web. Milano: Tecniche Nuove.
Hearst M. , English J., Sinha R., Swearingen K., & Yee K.-P. (Settembre 2002). Finding the
flow in web site search. Communications of the ACM.
Hearst M. A., Smalley P., & Chandler C., (2006, Aprile 26) Faceted Metadata for Information
Architecture and Search. New York: Association for Computing Machinery.
Instone, K. (2004, Luglio 8), Faceted Browsing - How User Interfaces Represent and Benefit from a
Faceted Classification System, SOASIST meeting, Dayton, Ohio
Jacob, Elin (1999). Utilizing Faceted Structures for Information Systems Design, Proceedings of the
62st Annual Meeting of ASIS. Uta Priss
Lavazza, C., Fiacchi, A., & Lauro, B. (2006, Novembre 06). Breve guida alla classificazione.
Tratto il giorno Marzo 18, 2010 da Trovabile <http://trovabile.org/articoli/guida-
alla-classificazione>
64
Marino, V. (2004, Febbraio 12). Classificazioni per il Web - I vantaggi dell'adozione di schemi a
faccette. Tratto il giorno Marzo 09, 2010 da AIB-WEB:
<http://www.aib.it/aib/contr/marino1.htm>
Ménard E., Mas S., & Alberts I., (2010) Faceted Classification for Museum Artefacts: A
Methodology to Support Web Site Development of Large Cultural Organizations tratto il
giorno 15 Giugno, 2010 da <www.cais-
acsi.ca/proceedings/2010/CAIS045_MenardMasAlbert_Final.pdf>
Morville, P., & Rosenfeld, L. (2002). Architettura dell'informazione per il World Wide Web.
Milano: Hops Libri.
-(2003). La classificazione a faccette fra Knowledge Management e Information Architecture (parte II).
Tratto il giorno Marzo 2010, 16 da itConsult:
<http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM_2.pdf>
Rosati, L. (2007). Architettura dell'informazione - Trovabilità: dagli oggetti quotidiani al Web. Milano:
Apogeo.
Spiteri L. (Aprile-Luglio 1998). A simplified model for facet analysis: Ranganathan 101. Canadian
Journal of Information and Library Science 23.
Vickery, B.C. (1972.) La classificazione a faccette. Guida per la costruzione e la utilizzazione di schemi
speciali. Roma, Consiglio nazionale delle ricerche.
65