Sei sulla pagina 1di 74

Introduzione ai metadati

amministrativo-gestionali
Scuola vaticana di
biblioteconomia
anno accademico 2007-2008

Paul Gabriele Weston


paul.weston@unipv.it
Conservazione digitale
 comprende un’ampia serie di attività volte ad estendere la durata
degli archivi digitali e di salvaguardarli dal danneggiamento del
supporto, dalla perdita di dati e dall’obsolescenza
 si è soliti ripartire le attività tra
 quelle intese a favorire la conservazione della codifica binaria dei
dati: l’informazione deve essere intatta e leggibile nel supporto di
archiviazione
 quelle che garantiscono l’accesso nel tempo ai contenuti:
l’informazione deve essere visibile e trattabile da utenti e
apparecchiature e comprensibile per gli utenti
 non è perciò sufficiente limitare la conservazione alla codifica
binaria dei dati, ma occorre che dei documenti siano preservati il
contenuto, la forma, lo stile, l’aspetto e la funzionalità
 la conservazione digitale richiede pertanto
 l’uso delle tecnologie migliori e più adeguate
 la messa in atto di strategie e procedure accuratamente
pianificate
Risoluzione del Consiglio
d’Europa (25 giugno 2002)
 [...] PRENDENDO ATTO dei grandi cambiamenti metodologici che
investono la creazione, la memorizzazione e la conservazione delle
registrazioni, dei documenti e degli archivi, specialmente in formato
digitale, e SOTTOLINEANDO l'esigenza di continuare a definire
metodi e linee guida per la conservazione a lungo termine di quelle
registrazioni, documenti, collezioni e archivi che sono indispensabili
per la salvaguardia del patrimonio europeo; [...]
Risoluzione del Consiglio
d’Europa (25 giugno 2002)
PROPONE di analizzare ulteriormente i seguenti obiettivi e misure:
 stimolare la messa a punto di politiche di conservazione della cultura e del patrimonio
digitali nonché la loro accessibilità
 mediante la creazione di quadri e meccanismi di cooperazione tra gli Stati membri finalizzati allo
scambio di esperienze su politiche, programmi e questioni regolamentari connesse, nonché allo
sviluppo di una metodologia condivisa,
 sostenendo, a livello collettivo ed individuale, le pertinenti organizzazioni preposte alla
conservazione (ad esempio archivi, biblioteche e musei) nella responsabilità che incombe loro
di raccogliere e di mantenere disponibili nel tempo i contenuti digitali,
 esaminando quali infrastrutture organizzative e norme tecniche siano necessarie per sostenere
reti stabili e compatibili di raccolte protette,
 rafforzare il consenso e la sensibilizzazione tramite reti che appoggino la condivisione
delle esperienze e dei progressi compiuti, l'adozione di norme appropriate come pure la
valutazione e la divulgazione delle buone pratiche,
 valutare le possibilità di opportuni investimenti, nonché analizzare i costi e l'impatto sui
finanziamenti attuali efuturi, come pure le potenziali sinergie tra finanziamenti pubblici e
privati,
 migliorare la base di competenza, creando dei meccanismi per lo scambio di
conoscenze e competenze, nonché per la continua identificazione dei nuovi requisiti in
termini di competenze e dei nuovi requisiti in fatto di formazione,
 stimolare la ricerca sui problemi e le relative soluzioni, mediante lo sviluppo di
programmi di ricerca, sperimentazioni tecnologiche ed applicazioni sperimentali su larga
scala
Gruppo di lavoro per la
conservazione delle memorie digitali
Conferenza internazionale di Firenze (16-17 ottobre 2003) sotto il
coordinamento della Presidenza italiana dell’Unione Europea
A livello europeo, ha fatto proprio l’obiettivo di procedere a una ricognizione
dello stato dell’arte in materia di conservazione digitale e allo sviluppo di
un piano d’intervento necessario a diffondere e dar seguito ai principi
contenuti nella risoluzione.
Il gruppo di lavoro ha avuto come referenti principali i progetti ERPANET e
MINERVA, sotto la guida della Commissione Europea e della Presidenza
italiana.
La Risoluzione del Consiglio sollecita la Commissione Europea e gli stati
membri a fare il punto e promuovere un’indagine conoscitiva sulla
situazione corrente, sulle emergenze e sui rischi, sulle criticità che
ostacolano la conservazione del patrimonio culturale digitale, a
intraprendere le attività  e un piano d’azione adeguati.
Fanno parte del gruppo di lavoro alcuni esperti già coinvolti nell’elaborazione
della Risoluzione, altri esperti  nominati dalle autorità nazionali attraverso
il  NRG (National Representatives Group), altri ancora riconosciuti per il
loro impegno in  iniziative rilevanti a livello internazionale.
Attività del Gruppo di lavoro
Il gruppo di lavoro punta a realizzare tre obiettivi principali:
 delineare il quadro delle iniziative attualmente in corso e favorire lo
scambio di “buone pratiche”
 definire una agenda di priorità come punto di partenza per un piano
d’azione condiviso dagli Stati-membri
 definire le basi per la formazione di una rete europea e per lo sviluppo
di iniziative nazionali.
La prima attività del gruppo è consistita nel favorire un processo di
cooperazione, nel definire priorità e meccanismi capaci di incrementare
il coordinamento e l’efficacia delle iniziative di carattere nazionale o di
settore sulla conservazione digitale in Europa.
Questa prima fase di lavoro è confluita nell’Agenda di Firenze, presentata
alla Conferenza internazionale di Firenze. Nel corso della Conferenza
sono stati anche presentati due rapporti: l’uno documenta alcuni casi di
emergenza e di rischio; l’altro pubblica un’indagine conoscitiva sullo
stato delle normative, procedure e linee guida per la conservazione,
attualmente vigenti in alcuni paesi in Europa e nel mondo.
Dopo Firenze
L’ICCU ha profuso un impegno scientifico e organizzativo di primo piano
sia nell’ideazione della Conferenza internazionale di Firenze sia nel
garantire al progetto e al gruppo di lavoro sviluppo, continuità,
possibilità di radicamento e di coordinamento in Italia.
L’agenda di Firenze è stata sottoscritta da 27 paesi (stati-membri, nuovi
stati aderenti, Russia, Israele) nel corso del V° Convegno del Gruppo
dei Rappresentanti Nazionali (NRG) a Parma il 19 novembre 2003. Il
NRG ha riconosciuto l’attività del gruppo di lavoro sulla conservazione
come complementare all’impegno per la digitalizzazione del patrimonio
culturale e ha offerto il suo sostegno sia partecipando al gruppo di
esperti, sia offrendo l’infrastruttura di rete.
Dopo la Conferenza di Firenze il gruppo di lavoro ha continuato e continua
a svolgere la sua attività con l’obiettivo di favorire la cooperazione a
livello europeo e di rafforzare la crescita di  consapevolezza e 
consenso sui temi della conservazione digitale. 
Metadati per la conservazione
Saving Digital Heritage
 Considering that the disappearance of
heritage in whatever form constitutes
an impoverishment of the heritage of
all nations …
 Recognising that … resources of
information and creative expression
are increasingly produced, distributed,
accessed and maintained in digital
form, creating a new legacy—the
digital heritage …
 Understanding that this digital heritage
is at risk of being lost and that its
preservation for the benefit of present
and future generations is an urgent
issue of worldwide concern …
Le azioni dell’UNESCO (1/3)
 Draft Charter on the Preservation of the Digital Heritage
 vengono analizzate le barriere alla continuità digitale per prevenire
l’insorgere di un ulteriore fenomeno di “digital divide”: gli strumenti per la
conservazione digitale vengono applicati al patrimonio di pochi Paesi
maggiormente dotati di risorse
 come gli altri documenti dell’UNESCO non è vincolante, ma si limita ad
esprimere auspici e a formulare priorità
 patrimonio digitale: “consists of unique resources of human knowledge
and expression, whether cultural, educational, scientific or administrative,
while embracing technical, legal, medical and other kinds of information
that more and more are being created digitally, or converted into digital
form from existing analogue resources.… Many of these resources have
lasting value and significance, and therefore constitute a heritage that
should be protected and preserved for current and future generations.
This heritage may exist in any language, in any part of the world, and in
any area of human knowledge or expression”
Le azioni dell’UNESCO (2/3)
 viene espresso l’auspicio che si trovi un compromesso tra i
legittimi diritti dei creatori e degli altri aventi diritto e l’interesse
del pubblico all’accesso al patrimonio documentale, nel rispetto
degli accordi internazionali
 tra le minacce al patrimonio digitale, vengono citate
 la rapida obsolescenza delle tecnologie per l’accesso
 l’assenza di una legislazione che persegua la conservazione
 le incertezze internazionali riguardanti risorse, responsabilità
e metodologie
 tra le priorità, si collocano
 campagne di sensibilizzazione alle tematiche della
conservazione
 formazione di specialisti in tecnologie della conservazione
 progetti internazionali di cooperazione finalizzati alla
conservazione del patrimonio digitale
Le azioni dell’UNESCO (3/3)
 Guidelines for the Preservation of Digital Heritage
 si rivolgono a più tipologie di destinatari
 amministratori con responsabilità di tipo politico che necessitino di
informazioni sulle quali basare la strategia della digitalizzazione
 amministratori di alto livello che abbiano necessità di conoscere le
questioni gestionali relative alla conservazione nell’ambito del proprio
ruolo di coordinamento
 gestori che abbiano bisogno di comprendere in dettaglio le questioni
pratiche per assumere consapevolmente le decisioni quotidiane
 operatori con responsabilità di implementare programmi che
necessitino di una prospettiva generale su come le diverse questioni
pratiche e i processi operativi si combinino fra loro
 due approcci
 concetti base della conservazione digitale (definizioni di patrimonio
digitale, conservazione digitale, programmi di conservazione,
responsabilità, gestione e cooperazione)
 descrizione delle procedure e delle decisioni relative alle diverse fasi
del ciclo di vita dell’oggetto digitale (cosa conservare, operare con i
produttori, organizzare e documentare gli oggetti digitali, gestire i diritti,
proteggere i dati, garantire l’accessibilità)
Alcuni principi (1/3)
1. Non tutti i materiali digitali debbono essere conservati; soltanto quelli dei
quali è accertato un valore permanente costituiscono il patrimonio digitale
3. Non si possono ritenere conservati quei materiali digitali a cui non è più
possibile accedere. Lo scopo della conservazione è mantenere la capacità
di presentare gli elementi essenziali di materiali digitali autentici
4. La conservazione digitale deve contrastare ogni minaccia nei confronti di tutti
i livelli dell’oggetto digitale: fisico, logico, concettuale e sostanziale
5. La conservazione digitale ha successo soltanto se le istituzioni e gli individui
se ne assumono la responsabilità. Punto di inizio dell’azione è la decisione
riguardante le responsabilità
6. Nessuno deve fare tutto. Niente deve essere fatto in una sola volta
7. Programmi di conservazione affidabili ed esaustivi sono fortemente
auspicabili, ma non sempre possono essere realizzati quando vi sia una
situazione critica. E’ opportuno pertanto procedere gradualmente, in modo
limitato, piuttosto che non procedere affatto
Alcuni principi (2/3)
8. Nell’agire gli amministratori debbono essere consapevoli della complessità
delle questioni. Poiché è fondamentale non provocare danni, essi
dovrebbero adoperarsi a comprendere l’intero processo e i suoi obiettivi,
evitando le decisioni che potrebbero compromettere futuri interventi per la
conservazione
15. I programmi di conservazione debbono esplicitare il diritto di raccogliere,
copiare, denominare, modificare, archiviare e fornire l’accesso ai materiali
digitali dei quali si assumono la responsabilità
24. L’autenticità è protetta meglio da misure che assicurino che l’integrità dei
dati non sia compromessa e da documentazione che dimostri chiaramente
l’identità del materiale
26. L’obiettivo di garantire l’accessibilità consiste nel trovare modalità
economiche di fornire l’accesso in qualunque momento sia necessario, sia
nel breve, che nel lungo termine
27. Gli standard sono un fondamento della conservazione digitale, ma
occorre trovare il modo di conservare anche materiali poco aderenti agli
standard, in un ambiente di standard in costante cambiamento
28. La conservazione non deve essere procrastinata in attesa dello “standard
della conservazione digitale”
Alcuni principi (3/3)
29. I dati digitali dipendono sempre da una combinazione di hardware e
software. Dalla proporzione tra le due componenti dipendono le strategie
fra le quali scegliere ai fini della conservazione
30. E’ buona norma che si diversifichino le strategie per la conservazione,
specialmente nel caso di collezioni eterogenee
32. I programmi di conservazione debbono talvolta definire un livello
accettabile di perdita in termini di oggetti, elementi e bisogni degli utenti
33. Attendere la disponibilità di soluzioni affidabili e omnicomprensive prima di
intraprendere qualunque tipo di intervento probabilmente comporta che del
materiale vada perso
34. I programmi di conservazione richiedono buone capacità gestionali, le
quali implicano una conoscenza delle questioni connesse al trattamento
del materiale digitale adeguata alle decisioni da prendere al momento
giusto
35. La conservazione digitale implica l’individuazione e la gestione dei rischi
39. Sebbene i service provider spesso prevedano una limitata funzione di
conservazione, la responsabilità principale ricade sui programmi di
conservazione specificamente realizzati e su coloro che li sovrintendono e
li supportano
Archivi / depositi digitali
 i due termini (archive e repository) vengono utilizzati
indifferentemente per indicare un sistema
organizzativo finalizzato a preservare l’informazione
per l’accesso e l’uso da parte di una specifica
comunità di utenti
 altro è invece la biblioteca digitale (digital library)
con la quale si intende un sistema organizzativo
finalizzato a rendere possibile la ricerca e l’accesso
a documenti ed informazioni digitali da parte di
comunità di utenti, senza che ciò implichi
necessariamente la messa in atto di strategie di
conservazione nel tempo dei dati
Open Archival Information System
 è una tipologia di archivio che
consiste nell’insieme organizzato di
soggetti e di sistemi che perseguono
l’obiettivo di preservare l’informazione
per una o più di una determinata
comunità di utenti
 http://www.ccsds.org/docu/dscgi/ds.py/Get/File-1
43/650x0b1.pdf
 Il modello OAIS / Gloria Cirocchi
http://www.iccu.sbn.it/PDF/Cirocchi.pdf
Origine di OAIS
 il modello svolge nel contesto dei metadati gestionali-
amministrativi e strutturali una funzione per qualche
verso analoga alla funzione svolta da FRBR per i
metadati relativi alla ricerca e al recupero delle risorse
informative
 è stato sviluppato dal Consultative Committee for
Space Data Systems della NASA come standard per
la conservazione a lungo termine dei dati derivati
dall'osservazione dello spazio e del pianeta
 nonostante la sua origine, il modello OAIS è adeguato
alle finalità della conservazione a lungo termine anche
per altre comunità utenziali e tipologie di documenti
Diffusione di OAIS (1/2)
 pur essendo fortemente orientato al trattamento dei
documenti elettronici, infatti,
 è applicabile a qualsiasi tipo di archivio (digitale o analogico)
 non specifica nessun tipo di implementazione
 può essere applicato indifferentemente a oggetti digitali nativi, a
prodotti di attività di digitalizzazione (quali file di immagini), e
persino a oggetti fisici
 si sta affermando come lo standard per la conservazione
delle risorse digitali in quanto affronta la tematica della
responsabilità della conservazione a lungo termine
dell'informazione digitale
Diffusione di OAIS (2/2)
 è stato adottato come modello di riferimento da alcune importanti
esperienze del mondo di biblioteche ed archivi
 NEDLIB (Networked European Deposit Library) che ha formulato un
modello di deposito delle pubblicazioni elettroniche
http://www.kb.nl/coop/nedlib
 CEDARS (CURL Exemplars in Digital Archives), promosso dalle
Università di Cambridge, Oxford e Leeds, che ha sviluppato uno schema
di metadati per la conservazione basato sul modello OAIS
http://www.leeds.ac.uk/cedars/index.html
 PANDORA (Preserving and Accessing Networked Documentary
Resources of Australia) della National Library of Australia, che mira alla
conservazione di siti Web selezionati http://pandora.nla.gov.au/
index.html
 NDIIPP (National Digital Information Infrastructure and Preservation
Program) http://www.digitalpreservation.gov/
 ARSBNI (Arricchimento dei Servizi della Bibliografia Nazionale Italiana
http://www.bncf.firenze.sbn.it/progetti/arsbni/
Il modello OAIS
L’ambiente OAIS
 è formato dall'interazione di quattro entità, definite
come:
 i produttori: sulla base di accordi formalizzati per
l'immissione dei dati nell'archivio forniscono i dati in base
alle componenti logiche e al modello di rappresentazione
OAIS
 i consumatori: i soggetti, o sistemi clienti, che
interagiscono con i servizi OAIS per reperire e acquisire
l'informazione conservata di proprio interesse
 il management: esterno all'archivio, si occupa delle
politiche dell'archivio: cosa archiviare, come trovare i fondi
ecc.
 l'archivio stesso: inteso come sistema organizzato che si
propone di conservare l'informazione per consentirne
l'accesso e l'uso ad una determinata comunità utenziale
Le componenti funzionali di OAIS
 sono definite come:
 Immissione (Ingest): riceve l'informazione dai produttori e la
prepara per l'archiviazione
 Archiviazione dei dati (Archival Storage): tratta l'archiviazione,
la manutenzione e la gestione della informazione archiviata
 Gestione dei dati (Data Management): coordina i metadati
descrittivi relativi sia all'informazione archiviata sia ai dati
amministrativi interni all’archivio
 Accesso (Access): è la funzione che aiuta i consumatori a
identificare e ottenere informazione dall'archivio
 Amministrazione dell'archivio (Administration): ha in carico le
procedure quotidiane di gestione dell'archivio
 Pianificazione della conservazione (Preservation Planning):
specifica e rende visibili le attività di conservazione effettuate, a
prescindere dalla strategia adottata
La strutturazione dei dati
 oltre alle componenti funzionali, OAIS fornisce anche un modello
di strutturazione dei dati adeguato a rappresentare l'informazione
digitale da un punto di vista orientato alla conservazione
 centrale è la definizione di Oggetto Informativo (Information
Object), di qualsiasi tipo esso sia, come composto da due
elementi:
 Dati
 Informazione sulla rappresentazione (Representation
information), necessaria per conferire significato ed interpretabilità
ai dati
 la conservazione nel tempo dei due elementi è un requisito
fondamentale nel funzionamento del modello
Informazione sulla rappresentazione
 nell’ambiente digitale, occorre che i Dati (una sequenza di bit)
siano collegati ad una R.I. (Representation Information) perché è
questa componente che contiene le informazioni che rendono
comprensibili quei bit
 dal punto di vista strutturale (specificazione del formato,
descrizione del s/w di accesso, etc.)
 e semantico (p. es. in quale lingua è un testo in caratteri ASCII).
 il medesimo modello si applica anche al documento analogico
 l'informazione contenuta in un libro espressa da caratteri a
stampa (i dati), in combinazione con una conoscenza della lingua
del testo (la Conoscenza di Base), si converte in informazione
 poiché la lingua non rientra tra le conoscenze del ricevente, il
testo (i dati) dovrà essere accompagnato da un dizionario e da
informazioni grammaticali espresse in una forma compresa nella
Conoscenza di Base di chi riceve l'informazione: questi due
elementi costituiscono l'Informazione sulla Rappresentazione
 in generale, perciò si può dire "i Dati, in unione alla loro
Informazione sulla Rappresentazione, veicolano significato".
Rete di informazioni sulla rappresentazione

 l’Informazione sulla Rappresentazione, in ambiente


digitale, è dotata di una natura ricorrente
 per essere interpretata, una I.R. avrà bisogno di
un'altra I.R., e così via, creando una Rete di
Informazioni sulla Rappresentazione,
(Representation Network), fino ad incontrare la
Conoscenza di Base della Comunità per cui
l'informazione viene conservata
 Il modello OAIS raccomanda che la Rete termini con
un documento in formato analogico che dia avvio
all'intera sequenza di interpretazione
Pacchetti di informazione
 ogni scambio di informazione, da e per l'archivio, e all'interno di
OAIS, avviene attraverso l'utilizzazione di Pacchetti di
Informazione (I.P.-Information Packages), che sono dei
contenitori concettuali di dati
 gli Oggetti Informativi possono comporre 3 tipi di I.P., utilizzati a
seconda che il flusso di informazioni avvenga dal Produttore
all'OAIS, al suo interno, o dall'archivio stesso verso l’utente (il
Consumatore):
 SIP - (Submission Information Package - Pacchetto di
Informazioni per l'Immissione): utilizzato nella fase di
immissione/acquisizione dei dati, inviato dal produttore in base al
Submission Agreement stipulato con l'OAIS
 AIP - (Archival Information Package - Pacchetto di Informazioni
per l'Archiviazione): destinato alla conservazione a lungo
termine
 DIP - (Dissemination Information Package - Pacchetto di
Informazioni per la Distribuzione): trasferito dall'OAIS all'utente
in base ad una richiesta di accesso
L’Oggetto Informativo (1/2)
 un I.P. è costituito dall'aggregazione di quattro classi
di Oggetto Informativo:
 Informazione sul Contenuto (Content Information):
l'oggetto primario destinato ad essere conservato
dall'archivio (p.es. un documento in formato PDF (i dati),
più la documentazione del formato PDF (la R.I.)
 Informazione Descrittiva per la Conservazione /
(Preservation Description Information): è il set di
informazioni necessarie a conservare adeguatamente, per
un periodo di tempo indefinito, il Contenuto cui sono
associate:
 si focalizza sulla descrizione degli stati passati e presenti
del Contenuto
 assicura che sia identificato univocamente,
 che non sia alterato senza che ciò venga registrato.
L’Oggetto Informativo (2/2)
 Il Contenuto e l’Informazione Descrittiva per la Conservazione
sono viste come incapsulate e identificabili per mezzo della:
 Informazione di Impacchettamento (Packaging Information):
come reperire 1) e 2), ovvero come sono collegati i componenti
di un Pacchetto di Informazioni in un'entità identificabile su uno
specifico supporto (p. es. in che disco, in che directory, ecc.)
 Il “pacchetto di informazione” che ne risulta è ricercabile
attraverso la
 Informazione Descrittiva (Descriptive Information): finalizzata
alla ricerca e al recupero dell'informazione, p. es.: Manzoni,
Alessandro - Autore principale - RICA. Essa può basarsi su
informazioni contenute nell’Informazione sul Contenuto e
nell’Informazione Descrittiva per la Conservazione, ma ne è
distinta sul piano logico
Informazione Descrittiva per la
Conservazione
 vengono individuate quattro categorie di informazioni:
 Identificazione (Reference Information): enumera e descrive gli
identificatori assegnati al Contenuto (p. es. l'URN di 1.
Informazione sul Contenuto e il riferimento alla normativa
sull'URN)
 Contesto (Context Information): documenta le relazioni del
Contenuto con il suo ambiente (perché è stato creato, in che
relazione è con altri Contenuti) (p.es. altri O.I. nella stessa
collezione, manifestazioni precedenti dello stesso Oggetto)
 Provenienza (Provenance Information): documenta la storia del
Contenuto e i cambiamenti da esso subiti, oltre che la catena di
custodia (p. es. il formato originale dei dati, quale specifico
processo ha permesso la creazione / trasformazione di un
determinato oggetto informativo, chi è stato responsabile di quel
processo)
 Autenticazione (Fixity Information): documenta i meccanismi di
autenticazione destinati ad assicurare l'integrità del Contenuto (p.
es. l'impronta digitale calcolata con l'algoritmo MD5)
Trattamento dell’oggetto digitale
 un oggetto digitale entra nel sistema sotto forma di Submission
Information Package (SIP), comprendente l’oggetto e il set di metadati
richiesto. La sua trasmissione in tale forma è responsabilità del Produttore
 il SIP passa attraverso le procedure di Immissione (Ingest) nel quale
viene trattato e reso conforme ai criteri e alle norme applicate nel sistema
diventando un Archival Information Package (AIP). L’AIP comprende il
contenuto di SIP più i metadati previsti dal sistema ai fini della
conservazione. Ad ogni successivo trattamento di AIP corrisponde
l’aggiunta di metadati.
 oltre che delle procedure di Immissione, il Gestore è responsabile delle
procedure di aggiornamento costante dell’AIP, nonché della consegna
degli AIP agli utenti sotto forma di Dissemination Information Packages
(DIP)
 la distribuzione dei DIP presuppone l’esecuzione di diverse funzioni:
Amministrazione, Gestione dei dati e Servizi comuni. Un sistema OAIS vi
aggiunge due funzioni basilari: Archiviazione e Conservazione. Queste
applicano le strategie necessarie a protrarre nel tempo la fruizione degli
AIP sotto forma di consultazione, utilizzazione e comprensione
Metadata Encoding and
Transmission Standard (METS)
 sviluppato dalla comunità bibliotecaria, fornisce una struttura ai dati
per consentire lo scambio, la visualizzazione e l’archiviazione di
oggetti digitali
 nel quadro di OAIS rappresenta un dispositivo utile al trasferimento
di dati internamente ed esternamente all’archivio OAIS
 qualunque comunità desideri implementare OAIS deve identificare o
creare un formato di scambio che funga da information package.
METS appare una soluzione ideale per la comunità delle risorse
culturali. Esso incorpora i surrogati digitali – file immagini, audio,
video – insieme ai metadati amministrativi e descrittivi in un unico
documento XML.
 il cuore di un oggetto METS è la mappa strutturale (structural map),
che funge da indice dei contenuti per l’accesso da parte degli utenti.
La gerarchia della mappa strutturale consente la navigazione tra i
file incorporati o citati dall’oggetto METS. Consente di scorrere le
pagine di un diario o puntare a specifici segmenti di un programma a
tempo, come un frammento di videoclip
METS come formato di scambio
 poiché METS raggruppa i dati sull’oggetto e le
informazioni sul surrogato digitale e codifica tutte
queste informazioni in XML, viene sempre più di
frequente utilizzato per trasferire dati dai sistemi
locali agli archivi centrali collettivi
 nell’ambito della rete RLG una istituzione
partecipante può conferire una collezione sotto
forma di singoli oggetti METS e il programma di
caricamento immette i dati in un database DB2,
utilizzando le funzioni di METS come Pacchetto di
informazioni per l’immissione (SIP)
METS come formato di
gestione e di conservazione
 le specifiche METS comprendo una sezione di
metadati amministrativi che consentono all’oggetto
digitale di portare con sé informazioni sul contesto
amministrativo (diritti sulla proprietà intellettuale) o
sull’ambiente tecnologico nel quale i surrogati
digitali sono stati creati (metadati tecnici)
 grazie alla presenza di metadati amministrativi,
METS si presta a fungere da Paccheto di
informazioni per l’archiviazione (AIP) nel quadro di
OAIS
METS come formato di consegna
 mediante il software di visualizzazione di METS il
file XML produce uno slide show o un media player
standard. Rendendo i file immagine, audio e video
navigabili, METS consente la ricomposizione di un
oggetto mutiparte in un insieme organizzato e
coerente. La mappa strutturale consente la
suddivisione di un file audio video in segmenti che
possono essere eseguiti singolarmente
eventualmente associati alle immagini. Secondo la
logica di OAIS, METS si può configurare come un
DIP (dissemination information package)
La struttura di METS (1/2)
 un header descrive l’oggetto di METS stesso. Contiene informazioni
del tipo “chi ha creato questo oggetto, quando, ecc.” L’informazione
presente nell’header consente la corretta gestione del file METS
 la sezione dei metadati descrittivi contiene informazioni che
descrivono la risorsa informativa rappresentata dall’oggetto digitale. I
metadati descrittivi consentono la ricerca della risorsa
 la mappa strutturale rappresentata dai singoli fogli e dai dettagli
organizza i file digitali dell’oggetto in una gerarchia che consente lo
scorrimento
 la sezione del file di contenuto rappresentato dalle immagini 1-5
dichiara quali file digitali costituiscono l’oggetto. I file possono essere
annidati nell’oggetto o citati
La struttura di METS (2/2)
 la sezione dei metadati amministrativi contiene informazioni
sui file digitali dichiarati nella sezione dei file di contenuto. La
sezione si divide in
 metadati tecnici: specificano le caratteristiche tecniche di un file
 metadati della fonte: specificano la fonte della riproduzione
(scansione, ecc.)
 metadati della provenienza digitale: specificano i cambiamenti
intervenuti sul file dalla sua creazione
 metadati dei diritti: specifica le condizioni di accesso e fruizione
 la sezione con i metadati tecnici, fonte e della provenienza
digitale contengono informazioni necessarie alla conservazione
digitale
 la sezione informazioni di comportamento associano
all’oggetto METS programmi eseguibili (per esempio, filigrana
digitale)
Caratteristiche di METS
 i creatori di METS hanno combinato le specifiche W3C di XML e
i Namespaces in XML per creare uno standard flessibile.
 lo schema XML consente di specificare le regole di un
documento XML valido. Lo schema può essere utilizzato per fare
il parsing di un documento XML (verificare che la marcatura XML
sia conforme allo standard formalizzato dallo schema)
 l’uso dei Namespaces mette in grado METS di delegare alcuni
compiti riguardanti i metadati ad altri schemi XML. Per esempio,
lo schema METS non prescrive il modo di descrivere la risorsa
rappresentata dall’oggetto digitale, non vi sono metadati
descrittivi. Tuttavia può puntare ad uno schema di metadati
esterno nel quale sia ospitata la descrizione
Vantaggi e opportunità (1/2)
 ciascuna comunità utenziale può introdurre gli elementi descrittivi
ritenuti utili, purchè formalizzati in uno schema. Nel caso di
risorse audiovisive può essere utilizzato lo schema VRA Core.
Per le risorse bibliografiche le biblioteche possono preferire il
MARC o il Metadata Object Description Schema (MODS)
prodotto dalla Library of Congress. In altri casi può essere più
opportuno l’uso di Dublin Core (DC). La flessibilità e la ospitalità
di METS consente l’implementazione di un ampio numero di
standard, eventualmente anche contemporaneamente per
descrivere il medesimo oggetto a beneficio di più comunità di
utilizzatori
 la medesima logica si applica a tutte le componenti dei metadati
amministrativi. Ogni comunità può decidere quali siano i dati
necessari per il trattamento dell’informazione, li formalizza in uno
schema XML e usa questo schema come una estensione di
METS
Vantaggi e opportunità (2/2)
 l’alternativa consiste nel riferirsi a dati contenuti in
un database esterno al quale l’oggetto METS può
puntare
 la possibilità di annidare i dati (embedding) o di fare
riferimento a dati esterni (referencing) si applica fino
al livello dei singoli file
 vi è persino la possibilità di incorporare (wrapping)
all’interno del documento XML il file digitale in forma
di codifica binaria, ciò che potrebbe essere
particolarmente utile ai fini dell’archiviazione di lunga
durata
Esempio di header
<?xml version="1.0" ?>
<METS:mets xmlns:xsi="http://www.w3.org/2000/10/XMLSchema-instance"
xmlns:METS="http://www.loc.gov/METS/"
xmlns:fedoraAudit="http://fedora.comm.nsdlib.org/audit"
xmlns:uvadesc="http://dl.lib.virginia.edu/bin/dtd/descmeta/"
xmlns:uvadigiprov="http://dl.lib.virginia.edu/bin/admin/digiprov/"
xmlns:uvasource="http://dl.lib.virginia.edu/bin/admin/source/"
xmlns:uvarights="http://dl.lib.virginia.edu/bin/admin/rights/"
xmlns:uvatech="http://dl.lib.virginia.edu/bin/admin/tech/"
xmlns:xlink="http://www.w3.org/TR/xlink"
xsi:schemaLocation="http://www.loc.gov/standards/mets/
http://www.cs.cornell.edu/payette/mellon/fedora/mets-fedora.xsd"
OBJID="uva-lib:1225" TYPE="FedoraObject“
LABEL="Saskia/AICT Image Collection - Mycenae"
PROFILE="fedora:IMAGE-W"> 
Esempio di header
<METS:metsHdr ID="H1" CREATEDATE="2002-05-20T06:32:00"
LASTMODDATE="2002-05-22T12:25:00" RECORDSTATUS="A">

<METS:agent ID="A1" ROLE="CREATOR“ TYPE="INDIVIDUAL">


  <METS:name>Sandy Payette </METS:name>
  <METS:note>Digital Object based on Sakia image and created as the
official Fedora sample object</METS:note>  
</METS:agent>

<METS:agent ID="A2" ROLE="CUSTODIAN“ TYPE="ORGANIZATION">


<METS:name>University of Virginia Library</METS:name>
  <METS:note>Object owned by UVA</METS:note>  
</METS:agent>

</METS:metsHdr>
Esempio di metadati descrittivi esterni

<dmdSec ID="dmd001">
    <mdRef LOCTYPE="URN" MIMETYPE="application/xml"
MDTYPE="EAD"
    LABEL="Berol Collection Finding Aid">urn:x-nyu:fales1735</mdRef>
</dmdSec>
Metadati descrittivi
Sezioni MD descrittivi
dmdSec
mdRef
mdWrap
MD descrittivi
dmdSec
esterni
mdWrap
dmdSec
mdRef
dmdSec
mdWrap
Esempio di metadati descrittivi interni

<dmdSec ID="dmd002">
    <mdWrap MIMETYPE="text/xml" MDTYPE="DC" LABEL="Dublin
Core Metadata">
        <dc:title>Alice's Adventures in Wonderland</dc:title>
        <dc:creator>Lewis Carroll</dc:creator>
        <dc:date>between 1872 and 1890</dc:date>
        <dc:publisher>McCloughlin Brothers</dc:publisher>
        <dc:type>text</dc:type>
    </mdWrap>
</dmdSec>
Esempio di metadati descrittivi interni
(dati binari)

<dmdSec ID="dmd003">
    <mdWrap MIMETYPE="application/marc" MDTYPE="MARC"
LABEL="OPAC Record">
         <binData>MDI0ODdjam0gIDIyMDA1ODkgYSA0NU0wMDAxMDA...
(etc.)
        </binData>
    </mdWrap>
</dmdSec>
Metadati amministrativi

amdSec
techMD MD ammin
mdRef esterni
mdWrap

sourceMD

digiprovMD

rightsMD

Md Amministrativi
Esempio di metadati amministrativi

<amdSec ID="AMD001">
    <mdWrap MIMETYPE="text/xml" MDTYPE="NISOIMG"
LABEL="NISO Img. Data">
        <niso:MIMEtype>image/tiff</niso:MIMEtype>
        <niso:Compression>LZW</niso:Compression>
        <niso:PhotometricInterpretation>8</niso:PhotometricInterpretation>
        <niso:Orientation>1</niso:Orientation>
        <niso:ScanningAgency>NYU Press</niso:ScanningAgency>
   </mdWrap>
</amdSec>
Sezione dei File

fileSec
fileGrp
file
Flocat
FContent Contenuto
Esterno
file
file
<fileGrp>
    <fileGrp ID="VERS1">
        <file ID="FILE001" MIMETYPE="application/xml" SIZE="257537"
        CREATED="2001-06-10">
            <FLocat LOCTYPE="URL"> http://dlib.nyu.edu/tamwag/beame.xml </FLocat>
        </file>
    </fileGrp>
   
<fileGrp ID="VERS2">
        <file ID="FILE002" MIMETYPE="audio/wav" SIZE="64232836"
        CREATED="2001-05-17" GROUPID="AUDIO1">
            <FLocat LOCTYPE="URL"> http://dlib.nyu.edu/tamwag/beame.wav </FLocat>
        </file>
    </fileGrp>
   
<fileGrp ID="VERS3" VERSDATE="2001-05-18">
        <file ID="FILE003" MIMETYPE="audio/mpeg" SIZE="8238866"
        CREATED="2001-05-18" GROUPID="AUDIO1">
            <FLocat LOCTYPE="URL"> http://dlib.nyu.edu/tamwag/beame.mp3 </FLocat>
        </file>
    </fileGrp>
</fileGrp>
Collegamenti File-Metadati
Amministrativi

fileSec amdSec
fileGrp techMD Md ammin.
mdRef Esterni
file mdWrap

sourceMD
Sezione file
digiprovMD

rightsMD

Md Amministrativi
<structMap TYPE="logical">
   <div ID="div1" LABEL="Oral History: Mayor Abraham Beame" TYPE="oral history">
      
<div ID="div1.1" LABEL="Interviewer Introduction" ORDER="1">
           <fptr FILEID="FILE001">
               <area FILEID="FILE001" BEGIN="INTVWBG" END="INTVWND"
BETYPE="IDREF" />
           </fptr>
           <fptr FILEID="FILE002">
               <area FILEID="FILE002" BEGIN="00:00:00" END="00:01:47"
BETYPE="TIME" />
           </fptr>
           <fptr FILEID="FILE003">
               <area FILEID="FILE003" BEGIN="00:00:00" END="00:01:47"
BETYPE="TIME" />
           </fptr>
       </div>
<div ID="div1.2" LABEL="Family History" ORDER="2">
           <fptr FILEID="FILE001">
                <area FILEID="FILE001" BEGIN="FHBG" END="FHND" BETYPE="IDREF" />
           </fptr>
           <fptr FILEID="FILE002">
                <area FILEID="FILE002" BEGIN="00:01:48" END="00:06:17" BETYPE="TIME" />
           </fptr>
           <fptr FILEID="FILE003">
                <area  FILEID="FILE003" BEGIN="00:01:48" END="00:06:17" BETYPE="TIME" />
           </fptr>
       </div>
       <div ID="div1.3" LABEL="Introduction to Teachers' Union" ORDER="3">
           <fptr FILEID="FILE001">
                <area FILEID="FILE001" BEGIN="TUBG" END="TUND" BETYPE="IDREF" />
           </fptr>
           <fptr FILEID="FILE002">
                <area FILEID="FILE002" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" />
           </fptr>
           <fptr FILEID="FILE003">
                <area  FILEID="FILE003" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" />
           </fptr>
       </div>
   </div>
</structMap> 
Collegamento Struttura-Contenuto
Mappa Strutturale
Sezione File
structMap
fileSec
div
fptr fileGrp
area file
seq Contenuto
Flocat
area Esterno
area FContent
par file
area
area file
file
mptr
Collegamento Struttura-Metadati
descrittivi

Md Descrittivi
Mappa Strutturale
dmdSec
structMap
mdRef
div MD Descrittivi
dmdSec
div Esterni
mdWrap
div
dmdSec
mdRef
dmdSec
mdWrap
Struttura e contenuto collegati
a Metadati amministrativi
Sezione File
fileSec amdSec
fileGrp techMD
mdRef MDAdmin
file mdWrap Esterni

sourceMD
structMap
digiprovMD
div
rightsMD

Mappa Strutturale Md Amministrativi


Esempio
<METS:behaviorSec ID="DISS1.0" STRUCTID="S1“
BTYPE="uva-bdef-image-w:101" CREATED="2002-05-25T08:32:00"
LABEL="Watermark Behaviors" GROUPID="DISS1"
ADMID="AUDREC1" STATUS="A">

<METS:interfaceDef LABEL="Photo Watermark Behavior Definition"


LOCTYPE="URN" xlink:href="uva-bdef-image-w:101"/>
<METS:mechanism LABEL="Watermarking Behavior Mechanism for
Images" LOCTYPE="URN" xlink:href="uva-bmech-image-w:112"/>

</METS:behaviorSec>
Comitato  Metadati Amministrativi
Gestionali (MAG)
Nell’ambito  delle attività del Comitato Guida della Biblioteca Digitale Italiana, è
nata l’esigenza di avere un gruppo di riferimento di esperti per la definizione e
implementazione di schemi di metadati nei progetti di digitalizzazione avviati
nell’ambito delle biblioteche ed altre istituzioni culturali a livello nazionale.
Sulla base del lavoro svolto in questi anni dal Gruppo di studio sugli standard e le
applicazioni di metadati nei beni culturali e delle esperienze acquisite
nell’ambito dei programmi di digitalizzazione avviati dalla Direzione Generale
per i Beni Librarisi è ritenuto che tale Gruppo fosse il riferimento qualificato per
espletare l’attività di promozione e sviluppo di modelli e standard di metadati.
L’ICCU, quale responsabile della diffusione delle normative e degli standard
bibliografici, ha pertanto formalmente costituito nel mese di luglio 2003 un
Gruppo di lavoro permamente, il Comitato MAG, quale struttura di riferimento
per le attività connesse alla promozione, supporto, gestione ed evoluzione
dello standard di Metadati Amministrativi Gestionali, nonché all’assistenza e
consulenza alla comunità bibliotecaria, archivistica e museale per la gestione e
l’accesso alle informazioni sull’oggetto digitale. Tale Comitato pertanto
prosegue le attività del precedente Gruppo di studio sugli standard e le
applicazioni di metadati nei beni culturali, riprendendone i principali obiettivi ma
dando la priorità ad attività connesse alla diffusione ed evoluzione del set di
Metadati Amministrativi Gestionali
Membri del Comitato MAG
 Matilde Amaturo, Marco Lattanzi (Istituto Centrale per il Catalogo e la
Documentazione)
 Francesco Baldi (Discoteca di Stato)
 Giovanni Bergamin, Maria Grazia Pepe (Biblioteca Nazionale Centrale
di Firenze)
 Gianfranco Crupi (Università degli Studi La Sapienza di Roma)
 Gloria Cirocchi, Simona Gatta (Biblioteca della Camera dei Deputati)
 Claudio Leombroni (Rete Bibliotecaria di Romagna - Provincia di
Ravenna)
 Cristina Magliano, Patrizia Martini (ICCU)
 Maurizio Messina (Biblioteca Marciana di Venezia)
 Antonella Mulè (Direzione Generale per gli archivi)
 Antonio Scolari (Centro Servizio Bibliotecario della Facoltà di Ingegneria
- Università degli Studi di Genova)
 Marco Veneziani (CNR Roma)
 Paul Gabriele Weston (Università degli Studi di Pavia)
Obiettivi del Comitato MAG
 Diffusione dello schema MAG
 Completamento dello schema per le fasi AIP (Archival
information package) e DIP (Dissemination information package)
dello schema MAG
 Mantenimento ed evoluzione dello schema
 Produzione di manuali e linee guida
 Assistenza agli implementatori
 Formazione e promozione
 Rapporti con altri progetti e agenzie (Progetti europei, Dublin
Core, etc.)
 Sviluppo di schemi e profili di applicazione di metadati descrittivi
nei diversi settori della cultura
Attività avviate del Comitato
MAG
 Elaborazione del Manuale per l’utilizzo dello
Schema MAG
 Produzione di documentazione di supporto
sia a carattere generale che specifico per le
diverse tipologie di materiale sottoforma di
Raccomandazioni e Linee guida
 Produzione di un registro di link a schemi,
modelli e reference tecnici di riferimento.
Schema MAG
 Lo schema (vers. 2.0 – 10/02/2005) è stato
elaborato sulla base delle indicazioni
("Appunti per la definizione di un set di
metadati gestionali-amministrativi e strutturali
per le risorse digitali" del 30/01/2001 e vers.
1.0 - 03/05/2002) del Gruppo di studio sugli
standard e le applicazioni di metadati nei beni
culturali
Descrizione dello schema
Lo schema generale è composto dalle sezioni: 
 <gen> informazioni generali sul progetto e sul tipo di
digitalizzazione
 <bib> metadati descrittivi sull'oggetto analogico
 <stru> metadati strutturali
 <img> metadati specifici relativi alle immagini fisse
 <ocr> metadati specifici relativi al riconoscimento ottico del testo
 <doc> sezione utilizzata per descrivere ad esempio un file in
formato pdf o rtf
 <audio> metadati specifici per file audio
 <video> metadati specifici per file video
 <dis> metadati specifici per la distribuzione di oggetti bibliografici 
Metadati per la BDI
Metadati descrittivi
Si fa l'ipotesi che gli oggetti digitalizzati abbiano metadati descrittivi già presenti
in un archivio bibliografico standard. La presenza di tali metadati nello
schema è garanzia del corretto collegamento con tale archivio. La sintassi
definita fa riferimento alle specifiche del set di elementi Dublin Core.
Metadati strutturali
Il rapporto tra l'insieme dei file trasmessi ed il record bibliografico è descritto dai
tag <piece>, <completeness> e <sequence_number> associato ad ogni
immagine.
I casi presi in considerazione sono: 
 unità bibliografica e unità fisica coincidono (es monografia in un volume).
 pezzo fisico di un set (es. fascicolo di un periodico) 
 parte componente che non coincide con una unità fisica (es. capitolo di un libro) 
La sezione <stru> completa i metadati strutturali con un indice delle sezioni
dell'oggetto digitalizzato. A tali metadati è possibile associare informazioni di
rappresentazione.
Metadati amministrativi
Per la definizione dei metadati relativi alle immagini fisse è stato preso in
considerazione lo standard NISO.
Siti di riferimento
METS: http://www.loc.gov/standards/mets
OAIS: http://www.rlg.org/longterm/oais.html
MAG: http://www.bncf.firenze.sbn.it/progetti/mag/
Dublin Core: http://dublincore.org/