Sei sulla pagina 1di 139

Corso digitalizzazione

Dalla pagina al file digitale

Corso digitalizzazione del libro antico


dalla pagina al file digitale. Creazione di un prodotto editoriale finito

Riassunto delle lezioni e degli esercizi


docente: Paolo Tentori

Novantiqua Multimedia
http://www.novantiqua.it

Per navigare tra le pagine del pdf


Associazione Bibliotecari usare i pulsanti di menu di acrobat
Ecclesiastici Italiani che trovate in alto o in basso al documento
http://www.abei.it in base alla versione del reader utilizzato.
Corso digitalizzazione
Dalla pagina al file digitale

OBIETTIVI DEL CORSO


Una risorsa elettronica è il risultato della produzione del documento digitale in
base a svariate tecnologie e standard.
Sul versante della produzione del documento digitale questo corso si prefigge
di:

- fornire le basi teoriche e pratiche per creare un file digitale in formato


Acrobat pdf (Portable Document Format) partendo dall’acquisizione della foto
fino alla creazione di un documento interattivo navigabile in modo ipertestuale;

- fornire le basi teoriche e pratiche per una gestione automatizzata dei


metadati xml tramite la piattaforma xmp (eXtendible Markup Platform) di
Adobe;

- comprendere lo stato dell’arte di standard e best practices per la gestio-


ne delle risorse elettroniche nella prospettiva di creare una biblioteca digi-
tale (comprendere la differenza sostanziale tra biblioteca elettronica e bibliote-
ca digitale).
Corso digitalizzazione
Dalla pagina al file digitale

digitalizzazione
Produzione del documento digitale in base a svariate tecnologie e standard.

Nell’ambito della definizione si parla di:

elettroriproduzione (electrocoping)
quando ci si riferisce all’acquisizione di immagini bitmap di un documento (es.
una foto digitale in tif da macchina fotografica elettronica);

digitalizzazione
quando un testo è reso leggibile da una macchina (es. tramite OCR).

In questo documento, per semplicità, si userà digitalizzazione in senso lato sia


in riferimento alle immagini che al testo.

La digitalizzazione riferita al libro antico è materia privilegiata dell’Informatica Umanistica


(Humanities Computing) che nasce in conseguenza di nuove tecnologie e dell’aprirsi di nuove
prospettive ed applicazioni di strumenti informatici e telematici alle varie materie umanistiche
creando figure professionali in grado di gestire il patrimonio culturale tramite gli strumenti
teorici e metodologici tipici dell’informatica.

Per approfondire: digita in Google


Cristofori, informatica umanistica e obiettivi didattici.
Corso digitalizzazione
Dalla pagina al file digitale

digitalizzazione
Un progetto di digitalizzazione ha buone prospettive di riuscita (cioé di diffon-
dersi a livello globale secondo i nuovi modelli di distribuzione del sapere) quan-
do alla base c’è una forte identità culturale e consapevolezza del proprio
patrimonio. Ad una crescita esponenziale di risorse digitali in internet (milioni
e milioni di files) non sempre corrisponde una corretta identificazione delle
risorse. Un file non descritto internamente una volta staccato dalla rete è come
un pesce fuori dall’acqua.
Il digitale ha bisogno sempre di essere progettato.

Progettare il digitale conoscendo il patrimonio reale...


Corso Abei 2005 a Trieste.
Corso digitalizzazione
Dalla pagina al file digitale

Progetti di digitalizzazione
La digitalizzazione è, di norma, lo stadio finale di un processo di catalogazio-
ne e conservazione di un patrimonio documentario.

Le soluzioni adottabili sia da un punto di vista delle tecniche che delle best
practices sono diverse anche se si tende ormai a seguire linee guida di riferi-
mento (ad es. documenti dei gruppi di lavoro di BDI - Biblioteca Digitale
Italiana; progetti comunitari quali MINERVA e MICHAEL) che definiscono
standard di descrizione, indicizzazione, tecniche di digitalizzazione, diritto
d’autore ed accessibilità. Linee guida di questo genere sono facilmente repe-
ribili in internet (alcune tra le principali sono allegate a questo CD-ROM in
formato PDF nella cartella BESTPRACTICES).
Allo stato presente dell’arte (2006) gli aspetti pratici di creazione di files
digitali, sia da un punto di vista tecnico che di costi, sono in una situazione
ottimale (strumenti potenti, semplici da usare, a costi sempre più bassi). La
strategia vincente di un progetto di digitalizzazione sta nell’accessibilità che
passa soprattutto attraverso un uso ottimale dei metadati (XML), vera e
propria carta d’identità dei documenti, che ne consente il facile reperimento
in internet e nei cataloghi on line. Sono i metadati che definiscono il succes-
so e la reperibilità di una collana digitale. I metadati possono essere inseriti
sia nei files fotografici, che nei documenti Acrobat, che nelle pagine internet.
Corso digitalizzazione
Dalla pagina al file digitale

PROGETTARE IL DIGITALE
Le operazioni in batch (automatiche dopo programmazione) sono numerose
nella creazione del file. Conoscere bene la tecnica fa risparmiare tempo e
denaro...

La sezione “File info” per l’inserimento dei metadati in Photoshop CS2.


Corso digitalizzazione
Dalla pagina al file digitale

PROGETTARE IL DIGITALE
Sono i metadati che caratterizzano la reperibilità di un file digitale...

Esempio di inserimento di metadati descrittivi (standard Dublin Core) nel pdf di un libro d’ore della Biblioteca
del Seminario arc. di Milano.
Corso digitalizzazione
Dalla pagina al file digitale

PROGETTARE IL DIGITALE
“Dimmi come documenti e ti dirò chi sei”.
Elisa Marchetti, Progetto Pr.I.Mul.E

Per approfondire: G.Lunati G.Bergamin, Progettare il digitale, SB R.Toscana 2004

Una delle strade “possibili” seguita oggi dai metadati di un documento tipo on line.
La digitalizzazione è solo il primo tassello della comunicazione elettronica
MCF Meta Content Schema usando XML
Ref. bibliografica: www.w3.org/TR/NOTE-MCF-XML/MCF-tutorial.xml
Corso digitalizzazione
Dalla pagina al file digitale

PROGETTARE IL DIGITALE
“Un progetto di digitalizzazione presenta oggi molti rischi. Uno di questi è
sicuramente la confusione tra strumenti (soluzioni tecnologiche) e finalità
(servizi da offrire)”. G.Lunati, G.Bergamin.

P. Ayris, Guida alla selezione del materiale da digitalizzare, RLG 1999.


Ref. bibliografica: G.Lunati G.Bergamin, Progettare il digitale, SB R.Toscana 2004
Corso digitalizzazione
Dalla pagina al file digitale

PROGETTARE IL DIGITALE
definizione di risorsa elettronica

La risorsa elettronica è il cuore tecnologico del sistema di publishing


digitale. E’ il risultato della produzione di un documento digitale in base
all’uso di svariate tecnologie e standard (.txt, .doc, .pdf, .mov, .tif, .aif).
La risorsa elettronica è il primo passo perché la biblioteca diventi “content
provider”. Le caratteristiche di una buona r.e. si basano sull’ipertestualità, la
capacità migratoria del contenuto, la pluriaccessibilità della risorsa. Per otte-
nere tutto ciò bisogna seguire il più possibile standard d’uso e best
practices approvati dalla comunità scientifica internazionale.
STANDARD = massimo accesso e diffusione; permanenza temporale.

Esercizio di scansione su manoscritto del sec. XV.


© 2000 Biblioteca del Capitolo Metropolitano di Milano.
Corso digitalizzazione
Dalla pagina al file digitale

METADATI
istruzioni per l’uso
Gabriele Lunati nel suo prezioso manuale virtuale per la progettazione
digitale dice: “Negli ultimi dieci anni abbiamo avuto una produzione davvero
rilevante di standard relativi ai metadati (con convegni, discussioni su riviste
professionali, ecc.). Nello stesso periodo l’uso di metadati per la creazione di
strumenti di accesso e di gestione dell’informazione non è stato invece molto
significativo: un metaparadosso?”.
Scopo del nostro corso è quello di parlare di metadati realmente usati nella
gestione del digitale e impareremo come usare i tools di Adobe (XML gestito
nello schema XMP).
Faremo una carrellata (anche ripetitiva in alcuni casi) sui concetti di base dei
metadati ma alla fine applicheremo i nostri strumenti a criticità reali riscontra-
te in biblioteche digitali on line, per vedere se gli strumenti sono veramente
utili e se i nostri interventi sono efficaci.
Corso digitalizzazione
Dalla pagina al file digitale

META...PROBLEMI
formati proprietari e risorse libere nel mondo dei metadati

Queste prime pagine si propongono di fornire una panoramica (e una riflessio-


ne) nel dedalo dei concetti, delle raccomandazioni ed iniziative in riferimento
all’argomento dei metadati. Nello svolgersi del corso presenteremo diverse
tecniche fondamentali relative ai metadati (Dublin Core, RDF, XMP) concen-
trandoci in modo particolare su quelle applicate alle immagini (IPTC e IPTC
Core, EXIF) ma prima è importante chiarire la differenza tra standard e formati
proprietari in un campo, quello di xml che avrà forti sviluppi in futuro. La scelta
di strumenti di lavoro (quali e perché) deve essere ponderata e valutata per
bene. Nella pagina seguente
portiamo un esempio di come
anche grandi aziende produt-
trici di software possano incor-
rere in problemi gestionali
nell’uso di metadati che non
rispettano specifiche precise.
Non importa se non capirete
tutte le sigle (le spiegheremo
in seguito durante il corso),
l’importante è aprire gli occhi
sul valore degli standard.

Sito internet di IPTC (The Internationa Federation of Library Associations). IPTC è un’associazione di riferimen-
to internazionale per gli standard dei metadati nelle immagini fotografiche .
Corso digitalizzazione
Dalla pagina al file digitale

Le proprietà delle immagini secondo Microsoft


Ref. Webbibliografica: Patrick Peccatte, Métadonnées: une initiation, 2006

Microsoft con Windows 2000 ha introdotto la possibilità di associare proprietà


Titolo, Autore, ecc. a una scheda qualsiasi; basta cliccare col bottone di destra
sul nome della scheda, attivare il menu contestuale “Proprietà”, spuntare “Rias-
sunto” e prendere le info dai campi disponibili. E’ una generalizzazione delle
proprietà associate al pacchetto Office (Word, Excell, ecc.). Il problema è che
queste utili proprietà si perdono quando:
lo schedario è copiato su un’altra piattaforma; è trasmesso per posta elettroni-
ca; è copiato su un volume non NFTS; in alcuni casi di compressione.
Con Windows XP viene introdotta una nuova tecnica di stoccaggio delle pro-
prietà immagine (specifiche per JPEG/TIFF) basandosi su una descrizione di
tipo EXIF in UNICODE. Questa non è compatibile con Windows 2000 cre-
ando la situazione che una stessa immagine elaborata su due pacchetti Windows
diversi si trova ad avere due set di metadati totalmente incompatibili. La
storia (ufficiosa ma plausibile) racconta che Microsoft ha sviluppato la tecnica
per rendere “portabili” le info associate alle immagini senza tener conto, nel
corso dello sviluppo, che la descrizione EXIF non supporta l’UNICODE e
non contempla campi “Categoria”. Problemi quindi con le specifiche EXIF e
IPTC e tra versioni della stessa piattaforma WIN: un bel grattacapo!
Morale della favola: per associare metadati ad immagini JPEG/TIFF uti-
lizzare campi IPTC o meglio IPTC Core...
Corso digitalizzazione
Dalla pagina al file digitale

Glossario
della pagina precedente

EXIF: abbreviazione di EXchangeable Image File. I dati EXIF sono dei


metadati incapsulati nello schedario immagine al momento dello scatto e sono
quindi dei dati tecnici di tipo interno. EXIF è stato sviluppato nel 1995 dal
JEIDA, Japan Electronic Industry Development Association. Una descrizione
tecnica di questi metadati è disponibile sul sito PIMA (Photographic and Imaging
Manufacturers Association).

La videata dei metadati sulla piattaforma XMP di Adobe . Le proprietà EXIF inerenti sono visibili al settore
“Advanced”.
Corso digitalizzazione
Dalla pagina al file digitale

Glossario
continuazione...

IPTC: acronimo di International Press and Telecommunications Council,


organizzazione internazionale che ha sviluppato e promosso standard di scam-
bio per la stampa. In associazione con NAA (Newspaper Association of Ameri-
ca) l’IPTC ha definito un modello globale di scambio chiamato IPTC-NAA
Information Interchange Model (la versione 4 è conosciuta come IIMV4). Il
sottoinsieme “Application record n.2” di questo modello è quello usato da
Adobe per definire in XMP le info associate ad un immagine. Le info IPTC/IIM
standard sono progressivamente rimpiazzate dal nuovo schema di metadati
IPTC Core basato
su XMP. I vantaggi
sono notevoli:
nessuna limitazione
di campi; nessun
problema di accenti;
estensibilità e
personalizzazione
dei metadati.
XMP rimane
comunque una
piattaforma
proprietaria di
Adobe.

La videata dei metadati sulla piattaforma XMP di Adobe . Le proprietà IPCT hanno quattro ambiti: contatti;
contenuti; immagine; status.
Corso digitalizzazione
Dalla pagina al file digitale In seguito versione più approfondita su xml

Glossario
cos’è XMP?

XMP: acronimo di eXtensible Metadata Platform è un formato di gestione


di XML (eXtensible Markup Language) nei software Adobe. E’ un linguaggio
basato su RDF (Resource Description Framework) che aggiunge
metainformazioni alle immagini secondo una sintassi RDF/XML. RDF è un lin-
guaggio per la rappresentazione di informazioni su risorse di qualsiasi tipo. Le
specifiche di RDF sono mantenute dal W3C e presenti tra la documentazione
ufficiale su XML.

La videata di un elemento RDF in un listato xml. xmlns:rdf è lo schema che ci definisce il “namespace” da cui
provengono i dati per la definizione di RDF. Webbibliografia: Patrick Peccatte, Métadonnées, cit.
Corso digitalizzazione
Dalla pagina al file digitale

XML (eXtensible Markup Language)


cos’è?
XML è un metalinguaggio di marcatura, cioé un linguaggio che permette
di definire altri linguaggi di markup.

XML è un insieme di standard e regole sintattiche per modellare la


struttura di documenti e di dati.

Questo insieme di regole dette specifiche definisce le modalità secondo cui


è possibile crearsi un proprio linguaggio di markup.

Le specifiche ufficiali sono state definite dal W3C (World Wide Web Consor-
tium).

In XML il documento è un contenitore di informazioni strutturato secondo


regole gerarchiche
RADICE elemento
radice

ELEMENTI elemento elemento elemento

AT T R I B U T I testo immagine testo codice testo testo


Corso digitalizzazione
Dalla pagina al file digitale

XML (eXtensible Markup Language)


cos’è?
XML permette di definire documenti con struttura arbitraria attraverso
la specifica di una Document Type Definition (DTD). La DTD, un insieme
di dichiarazioni che forma la grammatica dei documenti, può essere
interna o esterna al documento (riferita tramite un URI = Universal Resource
Identifier).

Un altro metodo per qualificare i nomi degli elementi e degli attributi usati
nei documenti xml passa attraverso xmlns (xml Namespaces). Uno spazio
di nomi (namespace) è una collezione di nomi identificata da un URI.

XML si occupa esclusivamente della struttura del testo e del significato


delle entità che lo compongono.

RADICE elemento
radice

ELEMENTI elemento elemento elemento

AT T R I B U T I testo immagine testo codice testo testo


Corso digitalizzazione
Dalla pagina al file digitale

ESEMPIO DI STANDARD NEI METADATI


METS: Metadata Encoding and Trasmission Standard

METS è un’iniziativa della Digital Library Federation per la realizzazione di uno


standard xml gestionale. E’ stato un punto di riferimento per la creazione
dello standard MAG dell’ICCU.
Un documento METS può essere usato come:

SIP (Submission Information Package)

AIP (Archival Information Package)

DIP (Dissemination Information Package)

Un documento METS ha sette sezioni:


1 - Intestazione Mets: info meta quali autore, editore...
2 - Metadati descrittivi: interni o puntati sull’esterno.
3 - Metadati amministrativi: info sui file creati e sull’oggetto originale.
4 - Sezione file (FileGrp): lista di tutti i file contenenti le versioni elettroniche
dell’oggetto digitale.
5 - Mappa strutturale: collega gli elementi dell’oggetto digitale alla struttura
ai file di contenuto e ai metadati appartenenti ad ogni elemento.
6 - Link strutturali: evidenzia gli yperlink tra i nodi della mappa strutturale.
Servono per l’archiviazione di siti web.
7 - Comportamento: associazione di comportamenti con il contenuto dell’og-
getto METS (esecuzione di codici).
Corso digitalizzazione
Dalla pagina al file digitale

ESEMPIO DI STANDARD NEI METADATI


METS: Metadata Encoding and Trasmission Standard

Come potete vedere dalla fotocopia tutte le sezioni seguono una “grammatica”
precisa nel listato xml:
Ci sono ELEMENTI (definiti dal tag di apertura e chiusura); ATTRIBUTI, ENTITA’,
VALORI.

ELEMENTI (costituiscono la base dello xml e sono rappresentati mediante tag


di marcatura).

ATTRIBUTI (info aggiuntive per un elemento)

ENTITA’ (alias per la definizione delle parti di un documento xml e


sottostruttura)
VALORI:
PCdata ( testo analizzato da un parser xml)
Cdata (testo non analizzato da un parser xml).

MAG (acronimo di Metadati Amministrativi e Gestionali) è un’application profile


che ha l’obiettivo di fornire le specifiche formali per la fase di raccolta, di tra-
sferimento, disseminazione dei dati.
Le sezioni dello schema MAG (che si rifà in parte a METS) sono:
GEN, BIB, STRU, IMG, OCR, DOC, AUDIO, VIDEO, DIS.
Lo schema MAG importa il set di elementi Dublin Cpre e tramite il namespace
convenzionale dc: li utilizza per la descrizione.
Corso digitalizzazione
Dalla pagina al file digitale

METADATI
glossario

niso: namespace convenzionale che punta sul set di metadati del comitato per
gli standard delle immagini digitali (National Information Standards
Organitation).

SINTASSI DI XML Schema


xs:schema = radice di ogni dichiarazione di schema
xmlns:xs = namespace da cui provengono gli oggetti necessari per la defini-
zione di un particolare schema (element, type, targetNameSpace, ecc.).
xsi:... .xsd = elemento da uno schema diverso (meccanismo di estensione di
uno schema diverso).
xsd: è un prefisso convenzionale per denotare gli schemi W3C.
RDF: Resource Description Framework = è un linguaggio per la rappresenta-
zione di info su risorse di qualsiasi tipo. Le specifiche di RDF sono mantenute
dal W3C e presenti tra la documentazione ufficiale su XML.
XPointer, XLink = prefisso convenzionale per dewscrivere metadati che pun-
tano su altri metadati.
XSLTrasformation = è la parte di XSL (eXtensible Stylesheet Language) che
ha il compito di trasformare un documento XML in un altro documento. Sono
simili XPath, XSL-FO.
Corso digitalizzazione
Dalla pagina al file digitale

risorsa elettronica
perchè usare Acrobat pdf?
Acrobat pdf è uno standard pluriapplicativo e multipiattaforma sul mer-
cato da oltre dieci anni (è una risorsa “proprietaria” di Adobe, con un pacchetto
di produzione a pagamento e un reader di visualizzazione gratuito).
E’ implementabile nel tempo (è possibile inserire oggi i metadati secondo le
best practices più recenti su files relizzati in versioni precedenti dell’applicazio-
ne).
E’ un prodotto “finito” a risorsa chiusa o aperta in base alle esigenze (ad es.
si può inserire una specifica di copyright direttamente nel file di visualizzazione
o nei metadati ed impedire la modifica del documento tramite password).
I metadati possono essere conglobati nel file (identificabili anche una volta
che il documento migra da internet off-line).
Il PDF è una risorsa gestibile nelle biblioteche digitali on line (i metadati
possono “puntare” sui singoli documenti).
Lo sforzo di apprendimento per la creazione e l’uso è ridotto e gestibile
anche da personale scarsamente uso all’informatica.
I costi del pacchetto commerciale sono accettabili.
Il prodotto finale è compatibile con gli standard e le best practices più mo-
derne ed approvate dal mondo scientifico e accademico internazionale.

Acrobat pdf è comunque solo uno dei modi di creare e gestire una risorsa
elettronica...
Corso digitalizzazione
Dalla pagina al file digitale

PDF SI CREA DA STAMPANTE


La creazione del pdf segue le stesse procedure della stampa reale con la sola
differenza che si esce su file.

Nella videata uscita stampa da Adobe Indesign CS.


Corso digitalizzazione
Dalla pagina al file digitale

IL COMANDO ESPORTA
La creazione del pdf può essere effettuata tramite stampa, creazione di PostScript
(in seguito elaborato in Distiller) o dal comando esporta.

Creazione del PDF tramite il comando esporta di Indesign CS (versione WIN).


Corso digitalizzazione
Dalla pagina al file digitale

IL COMANDO ESPORTA
La creazione del pdf può essere effettuata tramite stampa, creazione di PostScript
(in seguito elaborato in Distiller) o dal comando esporta.

Creazione del PDF tramite il comando esporta di Indesign CS (versione MAC).


Corso digitalizzazione
Dalla pagina al file digitale

IL COMANDO STAMPA
La creazione del pdf può essere effettuata tramite stampa, creazione di
PostScript (in seguito elaborato in Distiller) o dal comando esporta.

Creazione del PDF tramite il comando stampa di Indesign CS (versione WIN).


Corso digitalizzazione
Dalla pagina al file digitale

IL COMANDO STAMPA DI DISTILLER


La creazione del pdf può essere effettuata tramite stampa di PostScript cre-
ato da un programma di impaginazione ed in seguito elaborato da distiller.

Creazione del PDF tramite elaborazione di PostScript in Distiller.


Corso digitalizzazione
Dalla pagina al file digitale

PROGETTARE IL DIGITALE
istruzioni per l’uso

Privilegiare la qualità sulla quantità (il pubblico che utilizza il web valuta le
risorse elettroniche in base alla qualità).
Elaborare un progetto sostenibile (nelle tecniche, nei costi, nei tempi).
Individuare sempre lo stato legale dei materiali legati alla scansione.
Confrontarsi coi successi e gli insuccessi di altri progetti.
Domande tipo da porsi:
- qual’è il punto finale del mio progetto?
- qual’è il bisogno a cui voglio rispondere?
- chi è l’utente a cui mi rivolgo?
- qual’è il vantaggio della mia collana digitale sul patrimonio reale?

Planimetria per ciclisti in una guida di fine ottocento del TCI. Esercizio di collage su tre scansioni.
© 2001 Comunità Montana del Lario Orientale
Corso digitalizzazione
Dalla pagina al file digitale

PROGETTARE IL DIGITALE
Valutazione dei costi

I file digitali sono significativamente più costosi da gestire nel tempo rispetto
al materiale cartaceo e in un progetto il momento della digitalizzazione in sé
interessa solo una minima parte dei
costi (grosso modo il 10% del totale).
Preventivare costi per la produzione
di metadati, indicizzazione, cataloga-
zione, controllo qualità e manteni-
mento nel tempo della collezione
(per es. migrazione dei dati per evo-
luzione delle tecnologie).
I costi del progetto non vengono a
cessare quando questo appare sul
web.
Per farvi un’idea delle specifiche
chieste da un ente pubblico date
un’occhiata al capitolato tecnico per
la digitalizzazione dei codici della
Biblioteca Medicea Laurenziana
allegato a questo CD
(RISORSEDOC/ Capitolato_tecnico.pdf)
e valutate la base d’asta.

Pergamena digitalizzata a scanner piano, corso ABEI 2005.


© 2005 Biblioteca Seminario arc. di Trieste
Corso digitalizzazione
Dalla pagina al file digitale

Breve analisi dei settori di costo


Tratto da
RLG Diginews, (III),5, 1999.

Nella pianificazione e stesura di un budget per un progetto di scansione digi-


tale molti sono gli aspetti da considerare, tra cui:
- selezione e preparazione del materiale;
- Creazione dei metadati di catalogazione, descrizione, indicizzazione;
- Conservazione e tutela dell’oggetto fisico;
- Realizzazione di prodotti intermedi;
- Digitalizzazione vera e propria;
- Controllo qualità su immagini e metadati prodotti;
- Infrastrutture tecnologiche (ad es. stoccaggio dati);
- manutenzione nel tempo del materiale digitale.

(Scansione a fini conservativi ). Corso Abei Venegono Inf. 2003.


© 2003 Biblioteca Seminario arc. di Milano, segnatura 3XK-I-14.
Corso digitalizzazione
Dalla pagina al file digitale

BIBLIOTECA ELETTRONICA
definizione
Una collezione digitale di opere letterarie in formato testo o in immagini. E’
stato il primo sistema distributivo di documenti digitali seriali (per lo più off
line). A differenza di una biblioteca digitale, non è centrata sull’informazione
dei contenuti digitali ma sul semplice travaso anastatico di una risorsa reale.

Marca tipografica e nota manoscritta da un “Ovidio” di Bibliotheca electronica.


© 1998 Biblioteca Seminario arc. di Milano
Ref. bibliografica: P.Tentori, Bibliotheca electronica, Archivi di Lecco (XII) 4, 1999.
Corso digitalizzazione
Dalla pagina al file digitale

BIBLIOTECA ELETTRONICA
Una biblioteca elettronica può evolvere in biblioteca digitale con opportuni
interventi di rebulding data. Sono molti gli istituti e le ditte specializzate in
questo settore.

A sin. sito di amanuense.it, una ditta di servizi per la digitalizzazione e di costruzione di biblioteche digitali.
A dx. pagina dal sito on line del CILEA, un punto di riferimento italiano per la cultura tecnica del digitale in biblioteca.
Corso digitalizzazione
Dalla pagina al file digitale

BIBLIOTECA DIGITALE
Si basa sempre su documenti digitali seriali ma diverge dalla biblioteca elet-
tronica, per esempio, per la cooperazione in ambiente digitale (standard
comuni, interscambio di informazioni). Una buona definizione è quella della
Digital Library Federation: “La biblioteca digitale è un’organizzazione che
fornisce risorse, compreso il personale specializzato, per selezionare, orga-
nizzare, dare l’accesso intellettuale, interpretare, distribuire, preservare
l’integrità e assicurare la persistenza nel tempo delle collezioni digitali così
che queste possano essere accessibili prontamente ed economicamente per
una comunità definita o per un insieme di comunità”

Immagini dalla biblioteca digitale del Project Runeberg.


Ref.webbibliografica:http://www.runeberg.org
Corso digitalizzazione
Dalla pagina al file digitale

BIBLIOTECA DIGITALE
In modo molto schematico la biblioteca digitale ha alla sua base un’architet-
tura informatica di questo genere che garantisce appunto organizzazione e
accesso alle risorse.

Molti attori,
un linguaggio flessibile
multipiattaforma per de-
scrivere i dati (XML),
risorse standardizzate già
disponibili su cui “puntare”
per le proprie esigenze.

I file digitali sono i mattoni


basali del progetto.
I metadati il cemento che
tiene insieme l’edificio.

Architettura di un Service provider.


Ref. webibliografica: Basilio Buttà, Metadati negli open archive.
Corso digitalizzazione
Dalla pagina al file digitale

Sistema di biblioteca digitale


Sottoinsiemi:

- sistema di archiviazione documenti;

- sistema di attribuzione, gestione e ricerca di metadati;

- sistema di distribuzione remota dei documenti;

- sistema di consultazione on line dei documenti;

- sistema di ricerca avanzata su contenuti on line di documenti.

Esercizio di scansione su un fondo archivistico (sez. 7-1-11 ABFMB). Corso Abei Bologna 2002.
© 2002 Biblioteca dei Frati Minori di Bologna
Corso digitalizzazione
Dalla pagina al file digitale

Digitalizzazione conservativa e divulgativa


Vediamo di seguito alcuni esempi di raccolte digitali messe a disposizione in
internet o su CD-ROM.
Le scelte strategiche che vedrete in questi esempi sono molto diverse ma
tutti i progetti analizzati sono funzionali e ben strutturati. Alcuni sono nati da
oltre un decennio e hanno trovato soluzioni funzionali per un riaggiornamen-
to dei metadati, oggi fondamentali nelle raccolte on line.

Esempi riportati:
- Mirabilia Vicomercati della Biblioteca di Vimercate (mi) per la
valorizzazione del patrimonio fotografico di privati cittadini.
- Catalogo delle Cinquecentine della Biblioteca Comunale di Empoli (fi)
per la valorizzazione di un fondo antico.
- Progetto Mateo dell’Università di Mannheim per la divulgazione del patri-
monio librario antico della biblioteca universitaria.
- Catalogo cinquecentine Bibl. Civica e Statale di Gorizia. Un e-book
semplice ed efficace di catalogo iconografico.
- Bibliotheca electronica. Un progetto di CD-ROM sul libro antico di biblio-
teche consorziate.
- Sito internet del Museo virtuale del Romanico a Civate. Un esempio
pratico di valorizzazione iconografica e bibliografica del patrimonio fotografi-
co di enti pubblici e privati collaboranti sullo stesso tema.
Corso digitalizzazione
Dalla pagina al file digitale

Mirabilia Vicomercati
- Mirabilia Vicomercati è un progetto della Biblioteca di Vimercate (mi) per
la valorizzazione del patrimonio fotografico di privati cittadini.
Home page: http://www.mirabiliavicomercati.org/
Corso digitalizzazione
Dalla pagina al file digitale

Mirabilia Vicomercati

Spiegazione nel sito dei software utilizzati per la creazione dello stesso
e link alle risorse http://www.greenstone.org/cgi-bin/library
Corso digitalizzazione
Dalla pagina al file digitale

Mirabilia Vicomercati

Schermata di accesso per soggetti


Corso digitalizzazione
Dalla pagina al file digitale

Mirabilia Vicomercati

Esempio di una scheda con riferimento alle regole Dublin Core.


http://www.mirabiliavicomercati.org/schede/Foto/67/scheda.html
Corso digitalizzazione
Dalla pagina al file digitale

Mirabilia Vicomercati

Accesso alle risorse tramite box di interrogazione e database collegato.


Corso digitalizzazione
Dalla pagina al file digitale

Mirabilia Vicomercati

Accesso alle risorse tramite elenco alfabetico dei soggetti.


Corso digitalizzazione
Dalla pagina al file digitale

Mirabilia Vicomercati

Schermata di spiegazione ai cittadini che intendono contribuire alla collana.


http://www.mirabiliavicomercati.org/sezioni/902/index.html
Corso digitalizzazione
Dalla pagina al file digitale

Mirabilia Vicomercati

Schermata dei contatti.


http://www.mirabiliavicomercati.org/sezioni/903/
Corso digitalizzazione
Dalla pagina al file digitale

Mirabilia Vicomercati
http://www.mirabiliavicomercati.org

- Mirabilia Vicomercati è un buon esempio di trasparenza nell’impiego di


risorse pubbliche finalizzate alla creazione di un progetto.

Punti di forza: (biblioteca digitale standardizzata)

- il progetto è spiegato all’utenza in ogni suo passo tecnico e finanziario;

- l’esperienza è condivisa e condivisibile (link ai software usati; indirizzo


delle figure giuridiche e tecniche coinvolte nel progetto contattabili);

- il sito è chiaro, dinamico e funzionale anche se difficilmente una biblioteca


riuscirebbe a replicare un sito analogo senza riferimento esterno a tecnici
informatici;

- l’utenza è coinvolta nell’implementazione delle risorse.


Corso digitalizzazione
Dalla pagina al file digitale

Catalogo cinquecentine Biblioteca di Empoli


- Catalogo edizioni del Cinquecento è un progetto della Biblioteca Comu-
nale “Renato Fucini” di Empoli. E' una risorsa digitale in internet.
Home page: http://www.comune.empoli.fi.it/biblioteca/biblioteca.htm
Corso digitalizzazione
Dalla pagina al file digitale

Catalogo cinquecentine Biblioteca di Empoli

Schermata della home page dell’indice:


http://www.comune.empoli.fi.it/biblioteca/CATALOGO/indici/indici.html
Corso digitalizzazione
Dalla pagina al file digitale

Catalogo cinquecentine Biblioteca di Empoli

Schermata delle soluzioni tecniche adottate:


http://www.comune.empoli.fi.it/biblioteca/CATALOGO/documenti/html.html
Corso digitalizzazione
Dalla pagina al file digitale

Catalogo cinquecentine Biblioteca di Empoli

Schermata di una scheda generale:


http://www.comune.empoli.fi.it/biblioteca/CATALOGO/schede/sch422.html
Corso digitalizzazione
Dalla pagina al file digitale

Catalogo cinquecentine Biblioteca di Empoli


http://www.comune.empoli.fi.it/biblioteca/biblioteca.htm

- Il catalogo cinquecentine della Biblioteca di Empoli è un buon esempio


di versatilità delle risorse tecniche applicate contemporaneamente alla
distibuzione on line (internet) che off line (CD-ROM).

Punti di forza: (risorsa catalografica digitale)

- il progetto (del 1999!) è spiegato all’utenza in ogni suo passo tecnico;

- è mantenuta la struttura catalografica già in possesso della biblioteca che


risulta arricchita da un punto di vista iconografico;

- il sito è chiaro, dinamico e funzionale. Le capacità tecniche necessarie pos-


sono essere acquisite anche da un bibliotecario;

- concepito prima del 2000, il sito mantiene un valore di risorsa d’uso funzio-
nale.
Corso digitalizzazione
Dalla pagina al file digitale

Progetto Mateo
- Progetto Mateo (MAnnheimer TExte Online) è un progetto della Biblioteca
Universitaria della città di Mannheim, iniziato fin dal 1996 con diversi settori
(Marabu, Camena, Discotheca Rara).
Home page: http://www.uni-mannheim.de/mateo/epo.html
Corso digitalizzazione
Dalla pagina al file digitale

Progetto Mateo

Pagine indice dei libri disponibili di Jonston, Jan (1603-1675).


Corso digitalizzazione
Dalla pagina al file digitale

Progetto Mateo

Pagine strutturata a indice iconografico del Liber II. De Piscibus di Jonston,


Jan(1603-1675).
Corso digitalizzazione
Dalla pagina al file digitale

Progetto Mateo

Particolare dal Liber II. De Piscibus di Jonston, Jan(1603-1675).


Corso digitalizzazione
Dalla pagina al file digitale

Progetto Mateo
http://www.uni-mannheim.de/mateo/epo.html

- Il progetto Mateo della Biblioteca Universitaria di Mannheim è un esem-


pio di biblioteca strutturata professionale e ottimale nei servizi.

Punti di forza: (biblioteca digitale standardizzata)

- il progetto (iniziato nel 1996!) è spiegato all’utenza in ogni suo passo tecni-
co ed è stato implementato nel tempo;

- il sito è ben curato sia nella definizione e presentazione dei progetti che
nell’accesso alle singole opere;

- la struttura informatica è complessa ma ben fruibile dall’utente finale.


Corso digitalizzazione
Dalla pagina al file digitale

Bibliotheca electronica
http://www.novantiqua.it

- Bibliotheca electronica è un database di libri antichi in PDF frutto del


lavoro di biblioteche italiane consorziate.
Viene citato in questo corso come esempio di aggiornamento sui metadati. I
file PDF (i più vecchi sono del 1995!) vengono riaggiornati nei metadati tra-
mite la piattaforma XMP di Adobe. Questo rende aggiornato e fruibile secon-
do i canoni più moderni lavori attuati un decennio fa e pensati per una distri-
buzione su CD-ROM. Prima di essere messi a disposizione in internet i file
PDF creati nelle versioni da3.0 a 6.0 di ACROBAT vengono aperti in ACROBAT
7.0 dove è possibile riempire una schermata XML coerente con le regole
Dublin Core. In questo modo il lavoro di digitalizzazione precedente viene
facilmente reindicizzato dai motori internet on line.
Esempi più approfonditi verranno mostrati durante le esercitazioni pratiche.
Corso digitalizzazione
Dalla pagina al file digitale

Catalogo cinquecentine Gorizia

- Il catalogo delle Cinquecentine Statale e Civica di Gorizia è uno dei


primi tentativi di valorizzazione dell’aspetto iconografico a bassi costi in un
catalogo bibliotecario. Esiste solo una versione su CD-ROM (di circa 500 Mb
di “peso”). Ricalcando il modello catalografico dei fondi bibliotecari fornisce
indici interattivi funzionali (editore, città di stampa, alfabetico, autore, titoli).
Il lavoro, che presenta frontespizi, antiporte, marche tipografiche è
implementabile fino alla digitalizzazione di tutto il fondo.
L’implementazione dei metadati avviene tramite la piattaforma XMP di
Adobe. Si tratta di una risorsa catalografica off line.
Viene presentato un esempio di navigazione nel file al videoproiettore.
Il file PDF è presente nel CD alla cartella ESEMPI/CIVICA/CIVICA.PDF.
Corso digitalizzazione
Dalla pagina al file digitale

Museo del Romanico a Civate


http://museovirtuale.comune.civate.lc.it/

- Il Museo del Romanico a Civate è uno spazio-laboratorio dove le scuole


prendono confidenza col libro antico tramite facsimili, puzzle didattici ed
opere su computer. E’ uno dei primi esempi di applicazione ‘ad hoc’ delle
nuove tecnologie informatiche sul libro antico in riferimento alla didattica. I
quindici facsimili presenti nel museo sono pezzi unici realizzati con una spe-
sa/stampa di circa un euro a pagina. La parte di ricerca e didattica è disponi-
bile anche in internet e nella cartella ESEMPI/MUSEO di questo CD.
Alcuni dei fac simili cartacei sono consultabili in aula durante il corso.
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Greenstone è un sistema di gestione di biblioteche digitali sviluppato
presso la New Zealand Digital Library Project - University di Waitako.
Home page: http://www.greenstone.org
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Greenstone è usato in ambito di molti progetti di gestione bibliotecaria ed
è uno standard anche per le biblioteche ABEI. Un’ottima introduzione alla
gestione del software è a disposizione in internet da parte del prof. Savino,
che insegna ai corsi di informatica umanistica. Gli esempi che seguono sono
tratti dal suo sito: http://www.nmis.isti.cnr.it/savino/
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Greenstone usa un interfaccia utente estremamente “amichevole sia per
la ricerca che per l’inserimento dati.
Rif. bibliografico: http://www.nmis.isti.cnr.it/savino/
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Greenstone: anche l’inserimento dei metadati è logico e funzionale.
Rif. bibliografico: http://www.nmis.isti.cnr.it/savino/
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Greenstone: esempio di estrazione dei metadati.
Rif. bibliografico: http://www.nmis.isti.cnr.it/savino/
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Greenstone: esempio di assegnazione manuale dei metadati.
Rif. bibliografico: http://www.nmis.isti.cnr.it/savino/
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Michael è un consorzio della Comunità Europea orientato all’ottimizzazione
delle risorse digitali.
Home page: http://www.michael-culture.org
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Michael in Italia
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati


- Michael: la piattaforma tecnologica
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati


- Michael: la piattaforma tecnologica
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati


- Michael: la piattaforma tecnologica
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati


- Michael: la piattaforma tecnologica
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati


- Michael: per iniziare
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati


- Michael: per iniziare
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati


- Michael: per iniziare
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati


- Michael: interfaccia dati
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati


- Michael: creare un record
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Sepiades è un progetto della Comunità Europea orientato alla creazione e
gestione on line di archivi fotografici.
Home page: http://www.knaw.nl/ecpa/sepia
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Sepiades: la gerarchia del software di catalogazione.
Corso digitalizzazione
Dalla pagina al file digitale

Biblioteche digitali e metadati: qualche esempio


- Sepiades: il modello di catalogazione.
Corso digitalizzazione
Dalla pagina al file digitale

Progetto di digitalizzazione
Benchmarking:

determinazione dei requisiti di qualità basati sugli attributi dei documenti

Management:

definizione di tempi e budget

Presentazione:

individuazione delle necessità degli utenti

Conservazione:

valutazione dei piani a lungo termine


Corso digitalizzazione
Dalla pagina al file digitale

Conoscere il materiale che si intende digitalizzare, per cui:

Descrizione dei documenti e creazione dei punti di accesso.


Standardizzazione della descrizione (ISAD(G))
ISAD(G) International Standard for Archival Description

Standard descrittivi:

ISBD(M) se moderno
International Standard Bibliographic Description for Monographic Publication

ISBD(A) se antico
International Standard Bibliographic Description for Antiquaria

RICA
Regole Italiane di Catalogazione per Autori

ISBD(NBM) ...Non Book Material

Questo dovreste farlo già nella vostra biblioteca tramite i tools


di catalogazione...
Per approfondire: cerca in google
Maria Cristina Bassi
Formati marc - xml e servizi derivati
Corso digitalizzazione
Dalla pagina al file digitale

Le 4 funzioni fondamentali dei record bibliografici

Trovare

Identificare

Selezionare

Ottenere

Le stesse funzioni sono alla base dei metadati, cioé di quei dati indicizzati
sulla forma ed il contenuto di una risorsa.

I metadati standard per le biblioteche dovrebbero seguire il Dublin Core o DC


metadata schema che è uno standard riconosciuto a livello internazionale.

Per approfondire:
http://www.picturesaustralia.org/metadata.html
Corso digitalizzazione
Dalla pagina al file digitale

Standard nei metadati

Comunità archivistica
Si basano su standard ISAD(G) e ISAAR(CPF)
Più in particolare
Standard EAD (Encoded Archival Description): è un DTD XML.
Standard EAC (Encoded Archival Context): è sempre un DTD XML. Si applica
a liste d’autorità di soggetti produttori d’archivio.

Comunità bibliotecaria
Usa gli standard descrittivi ISBD, i formati di scambio bibliografico della fa-
miglia MARC e lo standard del Dublin Core per i metadati DCMI (Dublin Core
Metadata Iniziative): è un DTD XML sviluppato dal consorzio W3C.

MAG (Metadati Amministrativi Gestionali): applicazione di metadati nei pro-


getti di digitalizzazione.
Corso digitalizzazione
Dalla pagina al file digitale

Oggetto digitale

“Un oggetto digitale è definito [...] come un qualcosa (es. un’immagine, una
registrazione audio, un documento testuale) che è stato codificato in modo
digitale e integrato con metadati tali da supportarne l’individuazione,
l’uso e l’immagazzinamento”.
California Digital Library. Digital Object Standard: Metadata, Content and Encoding, May 18, 2001

I metadati rivestono un’importanza crescente, tanto da venire considerati


parte costituente della definizione stessa di oggetto digitale: una risorsa
digitale è inseparabilmente composta dal contenuto informativo (una se-
quenza di bit) e da una serie di informazioni (metadati) tali da rendere
quella sequenza di bit significante, individuabile, e accessibile per la fruizione,
l’archiviazione, la conservazione, la disseminazione e le altre operazioni
gestionali.
Nell’ambito dei progetti di digitalizzazione un’accurata definizione dei metadati
associati agli oggetti che compongono una collezione digitale costituisce il
discrimine fra i progetti orientati alla mera produzione di dati e quelli orientati
all’erogazione di servizi.
Elena Pierazzo, Mag. Manuale utente, ICCU 2006

Per approfondire:
Manuale.pdf nella cartella BESTPRACTICES
Corso digitalizzazione
Dalla pagina al file digitale

metadati: dati strutturali su altri dati.

I metadati vengono utilizzati per descrivere le risorse digitali o fisiche, in


maniera strutturata e standardizzata per consentire la scoperta, il recupero e
l’uso di tali risorse.
Non vi è un unico formato di metadati che vada bene per tutte le necessità.

Il collegamento tra il metadato e la risorsa da esso descritta può essere se-


parato dalla risorsa o incorporato nella stessa.
Anche le grandi case produttrici di software si orientano a costruire program-
mi di uso comune (ad es. il pacchetto OFFICE) in xml.
Si veda come esempio cosa fa Adobe InDesign CS2 per mezzo di xml.

(per approfondire: cartella BESTPRACTICES


InDesign_User_Guide_#15FBC1.pdf).
Corso digitalizzazione
Dalla pagina al file digitale

Nel caso delle risorse in rete i metadati descrittivi migliorano le capacità di


scoperta delle risorse mediante:

- ricerche basate su un determinato campo informativo (autore, titolo,


data, ecc.);
- possibilità di capire, senza dover accedere alla risorsa, se essa soddi-
sfa le necessità dell’utente basando la ricerca su elementi maggiormente
descrittivi: formato, durata, tipo...
- indicizzazione di oggetti non testuali;
- possibilità di accedere ad un contenuto sostitutivo distinto dall’accesso
al contenuto della risorsa.

Vantaggio: possibilità di restringere il campo di ricerca nella grande quantità


di dati digitali disponibili on line.
Corso digitalizzazione
Dalla pagina al file digitale

Uso di metadati: dati strutturali su altri dati.

Possiedono tre categorie funzionali:

a) Descrittiva (descrizione dei campi informativi per l’identificazione ed


il recupero degli oggetti)

b) Amministrativa-gestionale (ad es. registrazione della locazione, posi-


zione, diritti di proprietà)

c) Strutturale (per descrivere la struttura interna dei documenti e ge-


stirne le relazioni interne)

Formati standard per il mondo bibliotecario

- Dublin Core: ha 15 elementi descrittivi di base, integrabili. E’ una “lingua


franca” che garantisce una soglia minima di interoperabilità. Per approfondire:
http://www.dublincore.org
- Marc 21: utilizzato principalmente nell’ambito della catalogazione
bibliografica. Formato di rappresentazione interna dei metadati e come for-
mato di scambio. Per approfondire:
http://www.ifla.org
- Mag: metadati amministrativi e gestionali.
Per approfondire:
Manuale.pdf nella cartella BESTPRACTICES
Corso digitalizzazione
Dalla pagina al file digitale

STANDARD METADATI

Dublin Core:
sviluppato dallo DCMI (Dublin Core Metadate Initiative), il set di marcatori
Dublin Core è forse il più diffuso standard di metadati a livello internazionale.
Il Dublin Core (DC) deve il suo successo da un lato alla sua semplicità (è
costituito di solo quindici elementi), dall’altro alla sua estrema flessibilità.

Il sito web dell’organizzazione ( http://dublincore.org/ ) è ricco di informazioni


e di suggerimenti per l’applicazione dello standard. Da parte sua l’ICCU ha
curato la traduzione italiana delle specifiche descrittive dello standard
( http://www.iccu.sbn.it/dublinco.html ).

Nella scelta dei software orientati all’xml tener presente se viene rispettato lo
standard DC, in caso contrario stiamo facendo un cattivo investimento per la
biblioteca.
Corso digitalizzazione
Dalla pagina al file digitale

STANDARD METADATI

MAG:
più che per particolari tipologie di documenti fonte (es. periodici, musica a
stampa o manoscritta, carte geografiche, fotografie etc.), il set di metadati
MAG viene definito per tipologie di oggetti digitali (es. immagini statiche, testi
prodotti con tecnologia OCR, suono, audiovisivi etc.);
- i MAG sono espressi nella sintassi XML;
- i MAG si presentano come uno standard aperto, documentato, liberamente
disponibile e del tutto indipendente da specifiche piattaforme hardware e
software, al fine di favorirne un impiego generalizzato;
- di norma i MAG vanno associati alla risorsa digitale nel suo complesso, e
comprendono informazioni generali sul progetto e sul metodo di digitaliz-
zazione ed altre informazioni relative all’unità elementare dell’archivio digita-
le, cioè al singolo oggetto digitale;
- i MAG comprendono una quantità limitata di metadati descrittivi, ereditati
dagli applicativi di catalogazione ed espressi in formato Dublin Core. Di nor-
ma tali metadati descrittivi sono funzionali a operazioni gestionali interne
all’archivio degli oggetti digitali;
- di norma, con poche eccezioni, i MAG vanno raccolti o prodotti con proce-
dure automatizzate nel corso del processo di digitalizzazione o trattamento
(post-processing) dell’oggetto digitale.
Per approfondire:
Manuale.pdf nella cartella BESTPRACTICES
Corso digitalizzazione
Dalla pagina al file digitale

Detto in un altro modo... Per approfondire: cerca in google


“Famiglie” di metadati e loro sostenitori Antonella De Robbio xml

Comunità archivistica
Si basano su standard ISAD(G) e ISAAR(CPF)
Più in particolare
Standard EAD (Encoded Archival Description): è un DTD (Document Type
Definition) XML.
Standard EAC (Encoded Archival Context): è sempre un DTD XML. Si applica
a liste d’autorità di soggetti produttori d’archivio.

Comunità bibliotecaria
Usa gli standard descrittivi ISBD, i formati di scambio bibliografico della fa-
miglia MARC e lo standard del Dublin Core per i metadati DCMI (Dublin Core
Metadata Iniziative): è un DTD XML sviluppato dal consorzio W3C.

MAG (Metadati Amministrativi Gestionali): applicazione di metadati gestionali


nei progetti di digitalizzazione.

Come potete notare xml senza uno specifico DTD è come una macchina
senza manuale di istruzioni... La DTD consiste di un insieme di dichiarazioni
che formano la grammatica dei documenti, cioé ne definiscono la struttura.
Dichiarazioni = istruzioni = risultati ottimizzati da parte del computer.
Corso digitalizzazione
Dalla pagina al file digitale

Per approfondire: cerca in google


XML (eXtensible Markup Language) Giuseppe Zito xml

Se l'html è stato uno dei fondamenti del successo del Web , l'xml è la base di
questa nuova fase di Internet. L'xml non è un programma né un database.
Non dice niente su come vanno processati i dati relativi alle cose.E' solo una
serie di specifiche che dicono come i dati vanno resi disponibili online. La
forma assomiglia all'html: formato testo con comandi di marcatura (tag)
racchiusi da parentesi angolari.La grande novita' è che ora i comandi potete
inventarli voi (o, se non siete informatici, aiutati da qualcuno che lo sa fare).
In definitiva l'xml è uno standard che ci permette di definire nuovi linguag-
gi di marcatura. Questi linguaggi di marcatura permettono di rappresentare
informazione strutturata in un formato testo che si descrive da sé e che è
adatto allo scambio della stessa tra computer e programmi e quindi tra orga-
nizzazioni. Il set di caratteri usato, detto Unicode, permette di rappresentare
testi nei principali alfabeti mondiali.
Elementi di marcatura a attributi sono definiti attraverso la specifica di un
DTD (Document Type Definition) e sempre più spesso da XML-schema.
Questo dà il grande vantaggio di lasciar interpretare i dati all’applicazione
che li legge in base al contesto, per cui se vedi <p> in un file XML, non è
detto che sia un paragrafo. A seconda del contesto può essere un prezzo, un
parametro, una persona, un libro...
Corso digitalizzazione
Dalla pagina al file digitale

Per approfondire: cerca in google


XML (eXtensible Markup Language) Savino xml

Il vecchio Web era facile da definire


Web=HTML+URL+HTTP.

Il nuovo Web si presenta invece con una sequenza incredibile di nuove tec-
nologie tra le quali è difficile raccapezzarsi:
Web semantico = XML + DOM + XML Schema + XSLT + XPath + XQuery +
SOAP + WSDL + UDDI + ...

E' possibile progettare un'applicazione ad oggetti descrivendo i dati diretta-


mente in xml.
Possiamo pensare all'xml come una maniera "light" di serializzare i nostri
oggetti assicurandone la persistenza.
Insomma l'xml diventa una rappresentazione degli oggetti sia su una memo-
ria di massa che nelle specifiche di disegno dell'applicazione. L'idea base è di
usare la descrizione dell'xml fatta ad esempio in XML-Schema, per generare
direttamente le definizioni degli oggetti e il codice per trattarli inclusa la
possibilità di salvare gli stessi oggetti in xml. Vediamo gli standard e i tools
evolversi in modo da permettere di fare con xml cose che si fanno coi
database tradizionali. Ad esempio avere linguaggi di query compatibili con
SQL. Lo sviluppo di servizi Web comincia a fare concorrenza alle applicazioni
desktop. Non spaventatevi, probabilmente esiste già il programma di cui
avete bisogno, non dovete per forza crearvelo...
Corso digitalizzazione
Dalla pagina al file digitale

Per approfondire: cerca in google


XML (eXtensible Markup Language) Savino xml

Di fatto, per le biblioteche, XML sta diventando lo standard per la rappre-


sentazione dei dati ed esistono due categorie principali di applicazione:
- markup semantico di documenti e pagine web, unitamente all’uso degli
stili (XSL) per la visualizzazione;
- formato uniforme per l’interoperabilità tra applicazioni e per la
serializzazione di strutture dati complesse trattabili come oggetti.
In biblioteca XML si applica:
- nella gestione delle collezioni digitali;
- organizzazione dei legami fra vari oggetti delle biblioteche digitali (testi,
immagini, sequenze audio e video);
- assicurazione dell’interoperabilità tra applicazioni di rete (interscambio
dati e protocolli applicativi).
L'enorme successo del Web ha portato a un ripensamento di tutta l'informa-
zione online con lo scopo preciso di trasformarla in un'unico database. E' il
sogno del Web semantico di Tim Berners Lee, per la cui realizzazione il
primo passo è la codifica in xml dei documenti online e la realizzazione di
servizi web.
Un rapido esame dello stato attuale del Web e di Internet mostra alcune
stupefacenti caratteristiche.Solo circa 1/1000 dell'informazione online era
classificata da un motore di ricerca come Google (nel 2004) perché il resto
dell'informazione non era in un formato accessibile. Nel 2006 le cose sono
già molto diverse...
Corso digitalizzazione
Dalla pagina al file digitale

XML SCHEMA
Abbiamo già visto che XML è l’acronimo di eXtensible Markup Language, un
linguaggio di contrassegno (mark up) progettato per la descrizione di dati.
La validazione del linguaggio avviene tramite DTD (Document Type
Definition) o per mezzo di XML Schema.
Uno schema XML è un metodo per descrivere la struttura, cioé i blocchi
legali, di un documento xml permettendo la validazione del documento
stesso. L’insieme di attributi dell’elemento schema costituisce la dichiarazio-
ne di schema. Gli schemi di riferimento possono essere conservati su server
sparsi per la rete (repository) su cui xml “punta”. Anche il formato di risposta
xml deve seguire un protocollo di validazione (ad es. il protocollo OAI-PMH).

richiesta OAI
DATI SERVICE
metadati (xml) codificati

OAIS (Open Archival Information System): un’organizzazione di soggetti e


sistemi che hanno accettato la responsabilità della conservazione dell’infor-
mazione e del materiale disponibile per una comunità determinata.
OAIS propone un modello logico di riferimento per gli oggetti digitali e i metadati
loro associati.
Corso digitalizzazione
Dalla pagina al file digitale

DUBLIN CORE SET ELEMENT


Nel mondo digitale l’esistenza stessa di una risorsa dipende dai metadati.
Il set di metadati descrittivi DC (Dublin Core) è quello di riferimento per
l’interoperabilità tra domini (musei, archivi e biblioteche, ma non solo).
Il set di elementi base è così costituito:
1. Title: nome della risorsa (r.).
2. Subject: l’argomento della r.
3. Description: spiegazione
del contenuto (c.) della r.
4. Type: natura e genere del c. di r.
5. Source: riferimento alla risorsa.
6. Relation: rifer. alla r. correlata.
7. Coverage: scopo, luogo della r.
8. Creator: entità responsabile nella
creazione contenuto della risorsa.
9. Publisher: responsabile produzione.
10. Contributor: persona, organizzazione,
servizio.
11. Right: diritti sulla risorsa.
12. Date: data di creazione.
13. Format: specifica sul formato.
14. Identifier: identificatore.
15: Lingua.
Corso digitalizzazione
Dalla pagina al file digitale

XML: ISTRUZIONI PER L’USO

XML si presenta come un listato testuale facilmente analizzabile dopo un po’


di allenamento. Naturalmente all’utente bibliotecario interessa relativamen-
te come sia costruita un’interfaccia tecnica tipo server (deve solo accertarsi
che vengano rispettati gli standard DC, MARC21 e MAG citati precedente-
mente in modo da usare strumenti validati ed espandibili nel tempo). Un
altro discorso è conoscere l’interfaccia client, cioé i tools pratici per la crea-
zione, inserimento e gestione dei metadati nei propri archivi di lavoro. Soli-
tamente, i programmi normalmente in uso presso le biblioteche (tipo
SEBINA) hanno già pensato ad un’implementazione dell’xml. Per i progetti ex
novo conviene comunque orientarsi su pacchetti software approvati a livello
della Comunità Europea (tra l’altro, di solito, sono pure gratuiti).

Esempi pratici:
- visione di un semplice listato text.xml
- validazione della risorsa in Jaxe, cambiamento dei dati, esportazione.
- panoramica sul software di archiviazione fotografica SEPIADES: standard,
funzioni di base.
- esempio di riempimento campi metadati, esportazione, importazione dati
xml in Adobe Photoshop e Acrobat

Per approfondire: Per approfondire: documenti nella cartella XMPSTANDARD


http://www.knaw.nl/ecpa/sepia xmp_creativepros.pdf XMPspecification.pdf
Corso digitalizzazione
Dalla pagina al file digitale

METADATI
Servono per:

- l’identificazione del documento;


- le informazioni relative all’acquisizione tecnica;
- la provenienza;
- la navigazione verso la fonte d’informazione e al suo interno (per es. punti
di accesso multiplo, indicizzazione, ricerca full-text, struttura del documento).

<?xml version="1.0" encoding="UTF-8" ?>


- <!-- Created from PDF via Acrobat SaveAsXML -->
- <!-- Mapping Table version: 28-February-2003 -->
- <TaggedPDF-doc>
<?xpacket begin='?' id='W5M0MpCehiHzreSzNTczkc9d'?>
<?xpacket begin="?" id="W5M0MpCehiHzreSzNTczkc9d"?>
- <x:xmpmeta xmlns:x="adobe:ns:meta/" x:xmptk="Adobe XMP Core 4.0-c316 44.253921, Sun Oct 01
2006 17:14:39">
- <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
- <rdf:Description rdf:about="" xmlns:pdf="http://ns.adobe.com/pdf/1.3/">
<pdf:Producer>Acrobat Distiller 5.0.5 (Macintosh)</pdf:Producer>
<pdf:Keywords>libro antico; didattica; biblioteca digitale; biblioteche digitali; old book;
bibliotheca electronica; virtual libraries; virtual library; manoscritti; codici; cinquecentine;
secentine; abei; novantiqua; corso digitalizzazione libro antico</pdf:Keywords>
</rdf:Description>

Il listato iniziale dei metadati di questo documento. Le prime stringhe sono state realizzate da Acrobat in automati-
co. La parte finale è il risultato del riempimento campi (produttore, parole chiave) dell’interfaccia XMP da parte
dell’autore.
Corso digitalizzazione
Dalla pagina al file digitale

SOFTWARE DI VALIDAZIONE PER XML


Anche se questo corso non è orientato ad un uso sofisticato di xml, può essere
utile imparare qualche metodo di controllo dei blocchi strutturali, anche se
generati in automatico dai nostri programmi d’uso comune. Sono molti gli ap-
plicativi scaricabili da internet allo scopo.

Jaxe è un programma Java xml editor. Può essere utile per mettere in evidenza le parti di marcatura del sorgente
xml.
Corso digitalizzazione
Dalla pagina al file digitale

SOFTWARE DI VALIDAZIONE PER XML


Il sito internet del W3C mette a disposizione un servizio efficace e veloce per
controllare la validazione dei documenti xml all’URL:
http://validator.w3.org/check.

Videata di validazione che appare sul sito del W3C.


Corso digitalizzazione
Dalla pagina al file digitale

SOFTWARE DI VALIDAZIONE PER XML


Attraverso il pulsante “local file” puntiamo sul documento che intendiamo far
validare on line. Nel nostro caso facciamo leggere l’xml che abbiamo generato
tramite l’esportazione da acrobat 8.0 per win del libro d’ore fiammingo in for-
mato pdf.

Nella videata scegliamo un documento xml da far validare.


Corso digitalizzazione
Dalla pagina al file digitale

SOFTWARE DI VALIDAZIONE PER XML


La risposta del programma ci dà la presenza di un errore a livello dell’elemento
DOCTYPE (no DOCTYPE found). Il nostro listato xml non è valido.

Nella videata scegliamo un documento xml da far validare.


Corso digitalizzazione
Dalla pagina al file digitale

SOFTWARE DI VALIDAZIONE PER XML


Apriamo con qualsiasi applicazione di lettura il file nativo e correggiamo l’ele-
mento DOCTYPE. Ripetiamo la validazione e questa volta il file viene ritenuto
corretto.

Risposta positiva dopo la correzione sul file.


Corso digitalizzazione
Dalla pagina al file digitale

SOFTWARE DI VALIDAZIONE PER XML


Fate adesso un esercizio di validazione di un file XMP (la gestione proprietaria
Adobe di XML). Che risposta dà il validator? Come mai?
Il file XMP secondo voi è ben formato e valido?

Prova di validazione di un file xml dalla piattaforma Adobe XMP.


Corso digitalizzazione
Dalla pagina al file digitale

INSERIRE XML IN FILE MULTIPLI


Per rendersi conto della potenza di xml in Photoshop CS si entri nel browse
(viene attivato un programma che si chiama Bridge). Per ogni foto archiviata in
cartelline specifiche è possibile vedere in basso a sinistra l’interfaccia dei metadati
(qualora presenti).

La videata di Bridge attivata da Photoshop CS2.


Corso digitalizzazione
Dalla pagina al file digitale

INSERIRE XML IN FILE MULTIPLI


E’ possibile selezionare un numero a scelta dei file ed inserire metadati comuni
su tutti i file con un semplice comando di inserimento che va ad acquisire i
metadati in un template preparato precedentemente.

La videata di Bridge attivata da Photoshop CS2.


Corso digitalizzazione
Dalla pagina al file digitale

INSERIRE XML IN FILE MULTIPLI


Una volta confermato il comando i metadati saranno presenti in ciascun file in
base ai campi scelti nel template. Questo comando è molto comodo quando si
lavora su risorse singole (tipo le pergamene). Campi come copyright, indirizzo
della biblioteca, parole chiave sono standardizzate per tutti i file. Interverremo
solo per i campi identificativi dei singoli documenti. Il risparmio di tempo nel-
l’inserimento dei metadati è assicurato.

La videata di Bridge attivata da Photoshop CS2.


Corso digitalizzazione
Dalla pagina al file digitale

Nella digitalizzazione abbiamo l’entità oggetto che può essere:

Singola unità documentaria: bandi, manifesti, fogli volanti, pergamene

Multipla unità documentaria: libri

Una risorsa viene digitalizzata in quanto facente parte di una collezione e


come tale ricercabile dall’utente.

Per collezione si intende un’aggregazione di documenti analogici o


elettronici.

Abbiamo già visto che ad una collezione si possono (devono) applicare i


metadati.

La funzione normalizzatrice dei contenuti digitali svolta dai metadati è


condizione necessaria per l’industrializzazione dei processi di digitalizzazione,
e contribuisce a creare un mercato di prodotti e servizi uniformi ed efficienti in
questo settore.

Per approfondire: Per approfondire: digitare su google


http://www.minerva.org R. Wendler. LDI Update: Metadata in the Library
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ADOBE PHOTOSHOP
- ADOBE PHOTOSHOP ha sempre avuto una gestione dei dati file fin dalle
versioni più vecchie. Nella videata “info file” è possibile vedere dalla versione
7.0 in poi tutta una serie di metadati in parte inseriti in automatico durante
il processo di digitalizzazione (scanner o macchina foto elettronica), in parte
inseriti o importati dall’operatore. Questi metaname sono in formato xml.

Nell’esempio a
fianco videata dei
metadati inseriti
in una pergamena
medievale duran-
te il processo di
digitalizzazione.
La videata si apre
alla voce “info su
file” di
Photoshop 7.0.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ADOBE PHOTOSHOP
- ADOBE PHOTOSHOP 7.0
I dati possono essere importati da file xml esterni.

Nell’esempio a
fianco videata dei
metadati inseribili
in una pergamena
medievale duran-
te il processo di
elaborazione
immagini. Alcuni
dati standard
come copyright o
indirizzo archivio
possono essere
inseriti in questo
modo.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ADOBE PHOTOSHOP
- ADOBE PHOTOSHOP 7.0
Nella videata EXIF possiamo trovare oltre ai dati inseriti quelli importati au-
tomaticamente da Photoshop nel processo elaborazione immagini come la
risoluzione o la grandezza del file.

Nell’esempio a
fianco videata dei
dati EXIF.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ADOBE PHOTOSHOP
- ADOBE PHOTOSHOP 7.0
Nella videata origine vediamo i metadati base inseribili in un file Photoshop.

Nell’esempio a
fianco videata dei
dati origine in
Photoshop.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
XML è gestito in Photoshop CS da XMP (extensible Markup Platform).

ADOBE PHOTOSHOP CS
La piattaforma CS di Adobe
ha portato
cambiamenti radicali
nella gestione
dei metadati.
Nell’esempio a
fianco videata di
apertura di CS
in MAC OSX.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
- ADOBE PHOTOSHOP CS
Aprire la stringa info file per entrare nella videata XMP .
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
- ADOBE PHOTOSHOP CS
La gestione dei metadati nella piattaforma CS di Adobe avviene tramite la
specifica XMP. Questa piattaforma, di tipo proprietario, è un compromesso
tra le esigenze commerciali di Adobe e xml che è un sorgente di dominio
pubblico.

Nell’esempio a
fianco videata di
apertura di
metadati sulla
specifica XMP di
Adobe.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
- ADOBE PHOTOSHOP CS
Qualora i dati tecnici non siano disponibili (in questo caso vediamo la sezione
dei metadati da una sorgente tramite macchina fotografica digitale)
non vengono importati in automatico. L’immagine del file è stata digitalizzata
da scanner piano.

Nell’esempio a
fianco videata di
dati da macchina
fotografica digita-
le in Photoshop
CS.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
- ADOBE PHOTOSHOP CS
XMP rispetta lo standard Dublin Core.

Nell’esempio a
fianco videata
riassuntiva delle
proprietà dei dati
inseriti nel file.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
NEL PACCHETTO ADOBE ACROBAT
- Acrobat dalla versione 8.0 dà la possibilità di uscire in formato xml diret-
tamente dal pdf con un semplice comando di esportazione.

Nell’esempio a
fianco il tasto di
esportazione xml
da acrobat 8.0.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
NEL PACCHETTO ADOBE ACROBAT
- Acrobat dalla versione 8.0 dà la possibilità di uscire in formato xml diret-
tamente dal pdf con un semplice comando di esportazione. Anche se al mo-
mento l’utilità pratica di un simile comando può sembrare superflua, bisogna
tener presente che lo sviluppo dei software in un futuro prossimo tenderà a
basarsi sull’implementazione di xml come base sorgente per la gestione delle
applicazioni. In ogni caso è possibile estrarre listati xml ben formati da inse-
rire con semplice copia e incolla.

Nell’esempio a
fianco il sorgente
xml di questo
documento pdf.
Le immagini
vengono
archiviate in
formato jpg in
una cartellina
“images” allegata
al file.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ACROBAT 8.0
- La visione e l’inserimento dei dati xml in Acrobat 8.0 avviene dal pulsante
“proprietà”.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ACROBAT 8.0
La prima schermata “descrizione” ci dà campi generali quali titolo, autore,
parole chiave, ecc.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ACROBAT 8.0
E’ possibile integrare, sostituire i metadati con una semplice importazione di
file xml.
Corso digitalizzazione
Dalla pagina al file digitale

LA GESTIONE DI XML
IN ACROBAT 8.0
In questo caso tutti i campi compilati presenti nel nuovo listato vanno a
sostituire quelli precedenti. In caso di integrazione di metadati verranno
riportati dati in aggiunta ai campi validati (ad es. nel campo autore trovere-
mo più di un autore). La DTD di XMP elimina in modo automatico tutto ciò
che non ritiene coerente con le sue specifiche. Allo scopo si provi ad impor-
tare il listato xml integrale del libro d’ore che trovate in ESERCIZI/PDFXML/
FILESXML/HEURESXML in qualsiasi file pdf. Verranno riempiti solo i campi
ritenuti validi.
Corso digitalizzazione
Dalla pagina al file digitale

COPYRIGHT
“L’idea che scaturisce dal pensiero umano non può essere oggetto di pro-
prietà intellettuale in quanto patrimonio dell’intera umanità: ciò che è ogget-
to di diritto d’autore è la forma espressiva della manifestazione di un concet-
to, di un’idea”.
Antonella De Robbio, Copyright elettronico:stato dell’arte, Firenze 2003

Nota di proprietà intellettuale in un CD-ROM di Bibliotheca electronica.


Ref. bibliografica: Bibliotheca electronica, Fondo Valentini Elettronico, FVE22.
Corso digitalizzazione
Dalla pagina al file digitale Per saperne di più:
Digita su Google: Antonella de Robbio copyright

COPYRIGHT
normativa di riferimento
Legge 22 aprile 1941 n.633,
“protezione del diritto d’autore e di altri diritti connessi al suo esercizio”

Legge 18 agosto 2000 n.248,


“nuove norme di tutela del diritto d’autore”

Codice Civile,
artt. da 2575 a 2583

Istruzioni per l’uso:


nel redigere un contratto di distribuzione delle proprie opere con un editore
la biblioteca tenga presente i seguenti punti fissi.
NON si vende MAI il diritto, ma si trasferisce, per un tempo determinato,
il diritto di distribuzione di copie di un MASTER DIGITALE che resta di pro-
prietà della biblioteca.
OPERA ORIGINALE = proprietà della biblioteca
MASTER DIGITALE = proprietà della biblioteca
COPIA DEL MASTER DIGITALE = diritto di distribuzione temporaneo ad un
editore (off line o on line).
La cessione di un bene (anche in formato digitale) implica la perdita d’autori-
tà sullo stesso (es. vendesi appartamento...).
La cessione di un diritto temporaneo su un bene non implica l’alienazione del
bene stesso (es. affittasi appartamento...).
Corso digitalizzazione
Dalla pagina al file digitale

COPYRIGHT
istruzioni per l’uso
“Il modo di far cultura è il modo di fare società”

L’atteggiamento delle biblioteche di fronte all’avanzata delle tecnologie distri-


butive è cambiato molto negli ultimi anni. Dal “panico” di fine anni ‘90 per la
paura di perdere in identità si vedono oggi atteggiamenti opposti (collane di
centinaia di libri on line scaricabili senza riferimento interni alla fonte e “orfani”
una volta usciti da internet). Al di là del fattore di tutela economico, causa
principale dell’uso del copyright, tramite risorse elettroniche identificate ed
identificabili le biblioteche devono diventare “players” attivi nel nuovo sistema
di produzione della cultura. Capacità migratoria dei contenuti e pluriaccessibilità
alla risorsa devono andare di pari passo con un ruolo consapevole di
infomediazione e intermediazione culturale su un bene specifico.
Alle problematiche di:
- sovraccarico informativo;
- progressiva perdita di valore del concetto di autorità e di autore
si risponde con nuovi ruoli dei possessori del “bene cultura”. L’accesso è oggi
preponderante sul possesso. E’ giusto che sia così: il potere della biblioteca
moderna sta nell’essere un luogo privilegiato per l’accesso alle fonti, ma il
bene libro è quello che caratterizza la storia di una biblioteca e la sua essenza.
Corso digitalizzazione
Dalla pagina al file digitale

COPYRIGHT
istruzioni per l’uso
codici
Un buon esempio di biblioteca aperta per l’accesso alle fonti è il sito dell’ab-
bazia di S.Gallo. Nel sito del CESG (Codices Electronici SanGallenses) sono
disponibili oltre cento codici ad una risoluzione ottimizzata (file di circa 50
Mb una volta decompressi).

Videate del sito internet della Biblioteca di San Gallo


Ref. webbibliografica: http://www.cesg.unifr.ch/it/index.htm
Corso digitalizzazione
Dalla pagina al file digitale

COPYRIGHT
istruzioni per l’uso
codici
Per l’accesso si chiede semplicemente di accettare una nota sul copyright il
cui punto centrale è il divieto per un uso commerciale del materiale librario.
Trattandosi di codici (pezzi unici non replicati, al contrario di incunaboli e
cinquecentine) qualsiasi vertenza sull’uso sarebbe facilmente districabile a
favore della biblioteca.

Videate del sito internet della Biblioteca di San Gallo


Ref. webbibliografica: http://www.cesg.unifr.ch/it/index.htm
Corso digitalizzazione
Dalla pagina al file digitale

COPYRIGHT
istruzioni per l’uso
codici
L’unico punto debole del sito ritengo sia la mancanza di metadati nelle pagi-
ne (che vengono scaricate singolarmente). L’identità del file è inscindibile dal
contenuto digitale. Un file, una volta scaricato da internet può avere le vi-
cende più svariate. Risalire alla fonte è un diritto dell’utenza ed un dovere di
infomediazione del proprietario del bene. La disintermediazione non deve
essere fonte di disaggregazione dei contenuti. Un file digitale senza metadati
è come un viaggiatore senza passaporto. Esercizio: calcolando di voler inse-
rire i metadati in batch (solo per i campi standard di proprietà) ipotizzare
tempi e costi per tutti i codici presenti in internet.

Ricerca di metadati tramite la piattaforma XMP di Adobe nel file csg-0051_079.jpg del sito CESG.
Ref. webbibliografica: http://www.cesg.unifr.ch/it/index.htm
Corso digitalizzazione
Dalla pagina al file digitale

COPYRIGHT
istruzioni per l’uso
libri a stampa
I libri a stampa antichi (dagli incunaboli in su) sono esemplari a copie multi-
ple quindi più problematici da tutelare rispetto ai codici in caso di vertenze
legali. In uno dei corsi precedenti avevo preparato files con timbri estrapolati
da cinquecentine inseriti successivamente in file di altre biblioteche. Gli allie-
vi non se ne sono, giustamente, minimamente accorti e hanno compilato le
schede di possesso in base al timbro sul frontespizio. Una perizia legale pro-
fessionale troverebbe comunque tracce inconfutabili di corrispondenza tra un
file digitale ed un originale (le macchie sono un ottimo DNA...).

Xilografia della città di Marsiglia in una cinquecentina famosa, la Chronica Universalis dello Schedel.
© 1997 Biblioteca Seminario arc. di Milano.
Corso digitalizzazione
Dalla pagina al file digitale

COPYRIGHT
istruzioni per l’uso
libri a stampa
Non bisogna quindi preoccuparsi molto di eventuali contraffazioni digitali che
hanno la coda di paglia (anche se è notevole cosa può fare l’elaborazione
elettronica ad es. per il restauro digitale su beni artistici, come si vede dal-
l’esempio sotto).

Angelo dei venti nella navata inferiore del ciborio romanico di S.Pietro al Monte di Civate (lc). Prova di restauro
digitale. Ref. webbibliografica: http://museovirtuale.comune.civate.lc.it
Corso digitalizzazione
Dalla pagina al file digitale

COPYRIGHT
istruzioni per l’uso
libri a stampa
Un altro caso in cui il problema è poter risalire alla fonte. Abbiamo preso
come esempio l’OPAL di libri antichi della Biblioteca dell’Università di Torino.
Le 1432 (!) opere in formato pdf rappresentano una collana molto ricca. Il
sito è un buon esempio di biblioteca digitale. Una volta scaricati però i pdf
non contengono alcun riferimento alla biblioteca di origine. Probabilmente
nessuno userà a scopo commerciale fraudolento questo patrimonio notevole,
è però un peccato che nessuno possa risalire off line a chi ha impegnato
forze finanziarie e tecniche per la valorizzazione di un fondo unico. Esercizio:
calcolare i tempi per il rebulding meta di tutti i pdf.

A dx. videata dell’index dell’OPAL libri antichi, Biblioteca Università di Torino. A sin. il file pdf ispezionato per la ricerca di metadati off
line. Ref. webbibliografica: http://hal9000.cisi.unito.it/wf/BIBLIOTECH/Umanistica/Biblioteca2/Libri-anti1/
Corso digitalizzazione
Dalla pagina al file digitale

COPYRIGHT
istruzioni per l’uso

Il PDF ha degli accorgimenti standard per la chiusura del file tramite password
in modo da consentire o non consentire azioni sul file (le principali sono: modi-
fica, estrazione di parti, stampa). Per le biblioteche ABEI una best practice
interna è sempre stata, nei casi di libri (cioé beni ad unità multiple), quella di
offrire un layout il più possibile vicino all’originale (libro elettronico da sfoglia-
re) con una semplice informativa di proprietà del file in riferimento alla
biblioteca in possesso dell’originale. Crediamo sia un modo corretto di salva-
guardare l’identità della risorsa nel processo migratorio dei files. La politi-
ca di distribuzione dei files è poi un’altra questione (accesso gratuito o a paga-
mento della risorsa) che va definita prima che il materiale finisca on line.
Per la gestione protetta di contenuti in formato digitale esistono anche servizi
basati su DRM (Digital Right Management) che si basano sulla criptazione
dei formati (compreso il pdf) o sull’attivazione dei reader. In questo modo i
documenti possono essere acquisiti tramite azioni di “pay per use” o “pay per
view”.
Corso digitalizzazione
Dalla pagina al file digitale

PERGAMENE DI GRANDE FORMATO


esercizio di assemblaggio di pezzi multipli
Nell’esperienza di digitalizzazione dell’ABEI ci siamo trovati spesso a dover
intervenire su fondi con materiale di grandi dimensioni. Le specifiche di riso-
luzioni richieste erano tali che nessun planetario o dorso digitale era in grado
di raggiungere il risultato voluto. La soluzione più economica è stata quella di
realizzare un assemblaggio su pezzi multipli digitalizzati singolarmente su
scanner piano A3. Per alcune pergamene medievali, custodite a Nonantola
l’assemblaggio ha visto fino a sei pezzi da “cucire”. In questo esercizio si
mostrano le fasi di realizzazione di un assemblaggio a 4 pezzi per una perga-
mena di grandezza reale di 76x48 cm. La risoluzione a stampa richiesta (400
dpi) ha creato un file di 263 Mb.
Corso digitalizzazione
Dalla pagina al file digitale

PERGAMENE DI GRANDE FORMATO


esercizio di assemblaggio di pezzi multipli
Un assemblaggio del genere riesce solo se lo scanner mantiene un
bilanciamento colori uniforme sulle varie scansioni. Questo non è prerogativa
di tutti gli scanner. Il miglior software di gestione che ha fatto al caso nostro
è quello legato allo scanner Mustek Paragon A3. Il bilanciamento del colore,
qualora non avvenga in automatico, crea troppi problemi di gestione colore e
rende improponibile realizzare un assemblaggio con qualità accettabile a
prezzi economici. Il Museo Nonantolano si è munito di questo tipo di scanner
e non ha problemi di gestione colore.

Nell’esempio a A dx le due
fianco il risultato scansioni iniziali
finale da cui è partito
dell’assemblaggio l’assemblaggio.
di una pergamena
a rotolo.
Corso digitalizzazione
Dalla pagina al file digitale

PERGAMENE DI GRANDE FORMATO


esercizio di assemblaggio di pezzi multipli
I passi da seguire per assemblare una foto digitale scansionata in più tempi.
Aprire i due files da unire, guardare in “dimensione immagine” l’altezza in
cm. del file più piccolo. Rendere attivo l’altro file ed aprire la videata “dimen-
sione quadro” (come da esempio sotto a sin.). Allargare il quadro ancoran-
dosi sulla base opposta alla direzione di una grandezza adeguata al file da
inserire (vedere il risultato nell’esempio a dx.).
Corso digitalizzazione
Dalla pagina al file digitale

PERGAMENE DI GRANDE FORMATO


esercizio di assemblaggio di pezzi multipli
Trascinare il file piccolo nel file allargato (come da esempio sotto a sin.). In
questo modo abbiamo le foto su due livelli. Opacizzare il livello in modo da
vedere i particolari di entrambi i livelli (vedere il risultato nell’esempio a dx.).
Corso digitalizzazione
Dalla pagina al file digitale

PERGAMENE DI GRANDE FORMATO


esercizio di assemblaggio di pezzi multipli
Sovrapporre i due file (come da esempio sotto a sin.) e scegliere lo strumen-
to selezione o seleziona tutto per il livello del file più piccolo. Selezionare
livello - trasformazione libera, dopo aver agganciato i due file in un punto
sovrapposto che farà da perno per raddrizzare l’immagine tramite rotazione.
E’ utile centrare il punto aiutandosi con le guide. Spostare il crocino che
appare al centro dell’immagine sul punto di perno (vedere il risultato nel-
l’esempio a dx.).
Corso digitalizzazione
Dalla pagina al file digitale

PERGAMENE DI GRANDE FORMATO


esercizio di assemblaggio di pezzi multipli
Ruotare manualmente o tramite inserzione numerica dei gradi in modo da
far combaciare i due file in modo perfetto così da ottenere il risultato di de-
stra.
Corso digitalizzazione
Dalla pagina al file digitale

PERGAMENE DI GRANDE FORMATO


esercizio di assemblaggio di pezzi multipli
A questo punto ristabilire l'opacità del livello al 100%, unire i livelli e la per-
gamena è un file unico. Inserire i metadati (se richiesto a questo livello dal
vostro progetto) e salvare il file nel formato richiesto.
Corso digitalizzazione
Dalla pagina al file digitale

Fasi di un progetto di digitalizzazione


Progetto generale

Obiettivi

Servizi da offrire

Comunità di utenti

Valutazione delle risorse Valutazione delle caratteristiche


economiche fisiche dei documenti
umane
tecnologiche

Per approfondire:
http://www.minerva.org

Potrebbero piacerti anche