Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Novantiqua Multimedia
http://www.novantiqua.it
digitalizzazione
Produzione del documento digitale in base a svariate tecnologie e standard.
elettroriproduzione (electrocoping)
quando ci si riferisce all’acquisizione di immagini bitmap di un documento (es.
una foto digitale in tif da macchina fotografica elettronica);
digitalizzazione
quando un testo è reso leggibile da una macchina (es. tramite OCR).
digitalizzazione
Un progetto di digitalizzazione ha buone prospettive di riuscita (cioé di diffon-
dersi a livello globale secondo i nuovi modelli di distribuzione del sapere) quan-
do alla base c’è una forte identità culturale e consapevolezza del proprio
patrimonio. Ad una crescita esponenziale di risorse digitali in internet (milioni
e milioni di files) non sempre corrisponde una corretta identificazione delle
risorse. Un file non descritto internamente una volta staccato dalla rete è come
un pesce fuori dall’acqua.
Il digitale ha bisogno sempre di essere progettato.
Progetti di digitalizzazione
La digitalizzazione è, di norma, lo stadio finale di un processo di catalogazio-
ne e conservazione di un patrimonio documentario.
Le soluzioni adottabili sia da un punto di vista delle tecniche che delle best
practices sono diverse anche se si tende ormai a seguire linee guida di riferi-
mento (ad es. documenti dei gruppi di lavoro di BDI - Biblioteca Digitale
Italiana; progetti comunitari quali MINERVA e MICHAEL) che definiscono
standard di descrizione, indicizzazione, tecniche di digitalizzazione, diritto
d’autore ed accessibilità. Linee guida di questo genere sono facilmente repe-
ribili in internet (alcune tra le principali sono allegate a questo CD-ROM in
formato PDF nella cartella BESTPRACTICES).
Allo stato presente dell’arte (2006) gli aspetti pratici di creazione di files
digitali, sia da un punto di vista tecnico che di costi, sono in una situazione
ottimale (strumenti potenti, semplici da usare, a costi sempre più bassi). La
strategia vincente di un progetto di digitalizzazione sta nell’accessibilità che
passa soprattutto attraverso un uso ottimale dei metadati (XML), vera e
propria carta d’identità dei documenti, che ne consente il facile reperimento
in internet e nei cataloghi on line. Sono i metadati che definiscono il succes-
so e la reperibilità di una collana digitale. I metadati possono essere inseriti
sia nei files fotografici, che nei documenti Acrobat, che nelle pagine internet.
Corso digitalizzazione
Dalla pagina al file digitale
PROGETTARE IL DIGITALE
Le operazioni in batch (automatiche dopo programmazione) sono numerose
nella creazione del file. Conoscere bene la tecnica fa risparmiare tempo e
denaro...
PROGETTARE IL DIGITALE
Sono i metadati che caratterizzano la reperibilità di un file digitale...
Esempio di inserimento di metadati descrittivi (standard Dublin Core) nel pdf di un libro d’ore della Biblioteca
del Seminario arc. di Milano.
Corso digitalizzazione
Dalla pagina al file digitale
PROGETTARE IL DIGITALE
“Dimmi come documenti e ti dirò chi sei”.
Elisa Marchetti, Progetto Pr.I.Mul.E
Una delle strade “possibili” seguita oggi dai metadati di un documento tipo on line.
La digitalizzazione è solo il primo tassello della comunicazione elettronica
MCF Meta Content Schema usando XML
Ref. bibliografica: www.w3.org/TR/NOTE-MCF-XML/MCF-tutorial.xml
Corso digitalizzazione
Dalla pagina al file digitale
PROGETTARE IL DIGITALE
“Un progetto di digitalizzazione presenta oggi molti rischi. Uno di questi è
sicuramente la confusione tra strumenti (soluzioni tecnologiche) e finalità
(servizi da offrire)”. G.Lunati, G.Bergamin.
PROGETTARE IL DIGITALE
definizione di risorsa elettronica
METADATI
istruzioni per l’uso
Gabriele Lunati nel suo prezioso manuale virtuale per la progettazione
digitale dice: “Negli ultimi dieci anni abbiamo avuto una produzione davvero
rilevante di standard relativi ai metadati (con convegni, discussioni su riviste
professionali, ecc.). Nello stesso periodo l’uso di metadati per la creazione di
strumenti di accesso e di gestione dell’informazione non è stato invece molto
significativo: un metaparadosso?”.
Scopo del nostro corso è quello di parlare di metadati realmente usati nella
gestione del digitale e impareremo come usare i tools di Adobe (XML gestito
nello schema XMP).
Faremo una carrellata (anche ripetitiva in alcuni casi) sui concetti di base dei
metadati ma alla fine applicheremo i nostri strumenti a criticità reali riscontra-
te in biblioteche digitali on line, per vedere se gli strumenti sono veramente
utili e se i nostri interventi sono efficaci.
Corso digitalizzazione
Dalla pagina al file digitale
META...PROBLEMI
formati proprietari e risorse libere nel mondo dei metadati
Sito internet di IPTC (The Internationa Federation of Library Associations). IPTC è un’associazione di riferimen-
to internazionale per gli standard dei metadati nelle immagini fotografiche .
Corso digitalizzazione
Dalla pagina al file digitale
Glossario
della pagina precedente
La videata dei metadati sulla piattaforma XMP di Adobe . Le proprietà EXIF inerenti sono visibili al settore
“Advanced”.
Corso digitalizzazione
Dalla pagina al file digitale
Glossario
continuazione...
La videata dei metadati sulla piattaforma XMP di Adobe . Le proprietà IPCT hanno quattro ambiti: contatti;
contenuti; immagine; status.
Corso digitalizzazione
Dalla pagina al file digitale In seguito versione più approfondita su xml
Glossario
cos’è XMP?
La videata di un elemento RDF in un listato xml. xmlns:rdf è lo schema che ci definisce il “namespace” da cui
provengono i dati per la definizione di RDF. Webbibliografia: Patrick Peccatte, Métadonnées, cit.
Corso digitalizzazione
Dalla pagina al file digitale
Le specifiche ufficiali sono state definite dal W3C (World Wide Web Consor-
tium).
Un altro metodo per qualificare i nomi degli elementi e degli attributi usati
nei documenti xml passa attraverso xmlns (xml Namespaces). Uno spazio
di nomi (namespace) è una collezione di nomi identificata da un URI.
RADICE elemento
radice
Come potete vedere dalla fotocopia tutte le sezioni seguono una “grammatica”
precisa nel listato xml:
Ci sono ELEMENTI (definiti dal tag di apertura e chiusura); ATTRIBUTI, ENTITA’,
VALORI.
METADATI
glossario
niso: namespace convenzionale che punta sul set di metadati del comitato per
gli standard delle immagini digitali (National Information Standards
Organitation).
risorsa elettronica
perchè usare Acrobat pdf?
Acrobat pdf è uno standard pluriapplicativo e multipiattaforma sul mer-
cato da oltre dieci anni (è una risorsa “proprietaria” di Adobe, con un pacchetto
di produzione a pagamento e un reader di visualizzazione gratuito).
E’ implementabile nel tempo (è possibile inserire oggi i metadati secondo le
best practices più recenti su files relizzati in versioni precedenti dell’applicazio-
ne).
E’ un prodotto “finito” a risorsa chiusa o aperta in base alle esigenze (ad es.
si può inserire una specifica di copyright direttamente nel file di visualizzazione
o nei metadati ed impedire la modifica del documento tramite password).
I metadati possono essere conglobati nel file (identificabili anche una volta
che il documento migra da internet off-line).
Il PDF è una risorsa gestibile nelle biblioteche digitali on line (i metadati
possono “puntare” sui singoli documenti).
Lo sforzo di apprendimento per la creazione e l’uso è ridotto e gestibile
anche da personale scarsamente uso all’informatica.
I costi del pacchetto commerciale sono accettabili.
Il prodotto finale è compatibile con gli standard e le best practices più mo-
derne ed approvate dal mondo scientifico e accademico internazionale.
Acrobat pdf è comunque solo uno dei modi di creare e gestire una risorsa
elettronica...
Corso digitalizzazione
Dalla pagina al file digitale
IL COMANDO ESPORTA
La creazione del pdf può essere effettuata tramite stampa, creazione di PostScript
(in seguito elaborato in Distiller) o dal comando esporta.
IL COMANDO ESPORTA
La creazione del pdf può essere effettuata tramite stampa, creazione di PostScript
(in seguito elaborato in Distiller) o dal comando esporta.
IL COMANDO STAMPA
La creazione del pdf può essere effettuata tramite stampa, creazione di
PostScript (in seguito elaborato in Distiller) o dal comando esporta.
PROGETTARE IL DIGITALE
istruzioni per l’uso
Privilegiare la qualità sulla quantità (il pubblico che utilizza il web valuta le
risorse elettroniche in base alla qualità).
Elaborare un progetto sostenibile (nelle tecniche, nei costi, nei tempi).
Individuare sempre lo stato legale dei materiali legati alla scansione.
Confrontarsi coi successi e gli insuccessi di altri progetti.
Domande tipo da porsi:
- qual’è il punto finale del mio progetto?
- qual’è il bisogno a cui voglio rispondere?
- chi è l’utente a cui mi rivolgo?
- qual’è il vantaggio della mia collana digitale sul patrimonio reale?
Planimetria per ciclisti in una guida di fine ottocento del TCI. Esercizio di collage su tre scansioni.
© 2001 Comunità Montana del Lario Orientale
Corso digitalizzazione
Dalla pagina al file digitale
PROGETTARE IL DIGITALE
Valutazione dei costi
I file digitali sono significativamente più costosi da gestire nel tempo rispetto
al materiale cartaceo e in un progetto il momento della digitalizzazione in sé
interessa solo una minima parte dei
costi (grosso modo il 10% del totale).
Preventivare costi per la produzione
di metadati, indicizzazione, cataloga-
zione, controllo qualità e manteni-
mento nel tempo della collezione
(per es. migrazione dei dati per evo-
luzione delle tecnologie).
I costi del progetto non vengono a
cessare quando questo appare sul
web.
Per farvi un’idea delle specifiche
chieste da un ente pubblico date
un’occhiata al capitolato tecnico per
la digitalizzazione dei codici della
Biblioteca Medicea Laurenziana
allegato a questo CD
(RISORSEDOC/ Capitolato_tecnico.pdf)
e valutate la base d’asta.
BIBLIOTECA ELETTRONICA
definizione
Una collezione digitale di opere letterarie in formato testo o in immagini. E’
stato il primo sistema distributivo di documenti digitali seriali (per lo più off
line). A differenza di una biblioteca digitale, non è centrata sull’informazione
dei contenuti digitali ma sul semplice travaso anastatico di una risorsa reale.
BIBLIOTECA ELETTRONICA
Una biblioteca elettronica può evolvere in biblioteca digitale con opportuni
interventi di rebulding data. Sono molti gli istituti e le ditte specializzate in
questo settore.
A sin. sito di amanuense.it, una ditta di servizi per la digitalizzazione e di costruzione di biblioteche digitali.
A dx. pagina dal sito on line del CILEA, un punto di riferimento italiano per la cultura tecnica del digitale in biblioteca.
Corso digitalizzazione
Dalla pagina al file digitale
BIBLIOTECA DIGITALE
Si basa sempre su documenti digitali seriali ma diverge dalla biblioteca elet-
tronica, per esempio, per la cooperazione in ambiente digitale (standard
comuni, interscambio di informazioni). Una buona definizione è quella della
Digital Library Federation: “La biblioteca digitale è un’organizzazione che
fornisce risorse, compreso il personale specializzato, per selezionare, orga-
nizzare, dare l’accesso intellettuale, interpretare, distribuire, preservare
l’integrità e assicurare la persistenza nel tempo delle collezioni digitali così
che queste possano essere accessibili prontamente ed economicamente per
una comunità definita o per un insieme di comunità”
BIBLIOTECA DIGITALE
In modo molto schematico la biblioteca digitale ha alla sua base un’architet-
tura informatica di questo genere che garantisce appunto organizzazione e
accesso alle risorse.
Molti attori,
un linguaggio flessibile
multipiattaforma per de-
scrivere i dati (XML),
risorse standardizzate già
disponibili su cui “puntare”
per le proprie esigenze.
Esercizio di scansione su un fondo archivistico (sez. 7-1-11 ABFMB). Corso Abei Bologna 2002.
© 2002 Biblioteca dei Frati Minori di Bologna
Corso digitalizzazione
Dalla pagina al file digitale
Esempi riportati:
- Mirabilia Vicomercati della Biblioteca di Vimercate (mi) per la
valorizzazione del patrimonio fotografico di privati cittadini.
- Catalogo delle Cinquecentine della Biblioteca Comunale di Empoli (fi)
per la valorizzazione di un fondo antico.
- Progetto Mateo dell’Università di Mannheim per la divulgazione del patri-
monio librario antico della biblioteca universitaria.
- Catalogo cinquecentine Bibl. Civica e Statale di Gorizia. Un e-book
semplice ed efficace di catalogo iconografico.
- Bibliotheca electronica. Un progetto di CD-ROM sul libro antico di biblio-
teche consorziate.
- Sito internet del Museo virtuale del Romanico a Civate. Un esempio
pratico di valorizzazione iconografica e bibliografica del patrimonio fotografi-
co di enti pubblici e privati collaboranti sullo stesso tema.
Corso digitalizzazione
Dalla pagina al file digitale
Mirabilia Vicomercati
- Mirabilia Vicomercati è un progetto della Biblioteca di Vimercate (mi) per
la valorizzazione del patrimonio fotografico di privati cittadini.
Home page: http://www.mirabiliavicomercati.org/
Corso digitalizzazione
Dalla pagina al file digitale
Mirabilia Vicomercati
Spiegazione nel sito dei software utilizzati per la creazione dello stesso
e link alle risorse http://www.greenstone.org/cgi-bin/library
Corso digitalizzazione
Dalla pagina al file digitale
Mirabilia Vicomercati
Mirabilia Vicomercati
Mirabilia Vicomercati
Mirabilia Vicomercati
Mirabilia Vicomercati
Mirabilia Vicomercati
Mirabilia Vicomercati
http://www.mirabiliavicomercati.org
- concepito prima del 2000, il sito mantiene un valore di risorsa d’uso funzio-
nale.
Corso digitalizzazione
Dalla pagina al file digitale
Progetto Mateo
- Progetto Mateo (MAnnheimer TExte Online) è un progetto della Biblioteca
Universitaria della città di Mannheim, iniziato fin dal 1996 con diversi settori
(Marabu, Camena, Discotheca Rara).
Home page: http://www.uni-mannheim.de/mateo/epo.html
Corso digitalizzazione
Dalla pagina al file digitale
Progetto Mateo
Progetto Mateo
Progetto Mateo
Progetto Mateo
http://www.uni-mannheim.de/mateo/epo.html
- il progetto (iniziato nel 1996!) è spiegato all’utenza in ogni suo passo tecni-
co ed è stato implementato nel tempo;
- il sito è ben curato sia nella definizione e presentazione dei progetti che
nell’accesso alle singole opere;
Bibliotheca electronica
http://www.novantiqua.it
Progetto di digitalizzazione
Benchmarking:
Management:
Presentazione:
Conservazione:
Standard descrittivi:
ISBD(M) se moderno
International Standard Bibliographic Description for Monographic Publication
ISBD(A) se antico
International Standard Bibliographic Description for Antiquaria
RICA
Regole Italiane di Catalogazione per Autori
Trovare
Identificare
Selezionare
Ottenere
Le stesse funzioni sono alla base dei metadati, cioé di quei dati indicizzati
sulla forma ed il contenuto di una risorsa.
Per approfondire:
http://www.picturesaustralia.org/metadata.html
Corso digitalizzazione
Dalla pagina al file digitale
Comunità archivistica
Si basano su standard ISAD(G) e ISAAR(CPF)
Più in particolare
Standard EAD (Encoded Archival Description): è un DTD XML.
Standard EAC (Encoded Archival Context): è sempre un DTD XML. Si applica
a liste d’autorità di soggetti produttori d’archivio.
Comunità bibliotecaria
Usa gli standard descrittivi ISBD, i formati di scambio bibliografico della fa-
miglia MARC e lo standard del Dublin Core per i metadati DCMI (Dublin Core
Metadata Iniziative): è un DTD XML sviluppato dal consorzio W3C.
Oggetto digitale
“Un oggetto digitale è definito [...] come un qualcosa (es. un’immagine, una
registrazione audio, un documento testuale) che è stato codificato in modo
digitale e integrato con metadati tali da supportarne l’individuazione,
l’uso e l’immagazzinamento”.
California Digital Library. Digital Object Standard: Metadata, Content and Encoding, May 18, 2001
Per approfondire:
Manuale.pdf nella cartella BESTPRACTICES
Corso digitalizzazione
Dalla pagina al file digitale
STANDARD METADATI
Dublin Core:
sviluppato dallo DCMI (Dublin Core Metadate Initiative), il set di marcatori
Dublin Core è forse il più diffuso standard di metadati a livello internazionale.
Il Dublin Core (DC) deve il suo successo da un lato alla sua semplicità (è
costituito di solo quindici elementi), dall’altro alla sua estrema flessibilità.
Nella scelta dei software orientati all’xml tener presente se viene rispettato lo
standard DC, in caso contrario stiamo facendo un cattivo investimento per la
biblioteca.
Corso digitalizzazione
Dalla pagina al file digitale
STANDARD METADATI
MAG:
più che per particolari tipologie di documenti fonte (es. periodici, musica a
stampa o manoscritta, carte geografiche, fotografie etc.), il set di metadati
MAG viene definito per tipologie di oggetti digitali (es. immagini statiche, testi
prodotti con tecnologia OCR, suono, audiovisivi etc.);
- i MAG sono espressi nella sintassi XML;
- i MAG si presentano come uno standard aperto, documentato, liberamente
disponibile e del tutto indipendente da specifiche piattaforme hardware e
software, al fine di favorirne un impiego generalizzato;
- di norma i MAG vanno associati alla risorsa digitale nel suo complesso, e
comprendono informazioni generali sul progetto e sul metodo di digitaliz-
zazione ed altre informazioni relative all’unità elementare dell’archivio digita-
le, cioè al singolo oggetto digitale;
- i MAG comprendono una quantità limitata di metadati descrittivi, ereditati
dagli applicativi di catalogazione ed espressi in formato Dublin Core. Di nor-
ma tali metadati descrittivi sono funzionali a operazioni gestionali interne
all’archivio degli oggetti digitali;
- di norma, con poche eccezioni, i MAG vanno raccolti o prodotti con proce-
dure automatizzate nel corso del processo di digitalizzazione o trattamento
(post-processing) dell’oggetto digitale.
Per approfondire:
Manuale.pdf nella cartella BESTPRACTICES
Corso digitalizzazione
Dalla pagina al file digitale
Comunità archivistica
Si basano su standard ISAD(G) e ISAAR(CPF)
Più in particolare
Standard EAD (Encoded Archival Description): è un DTD (Document Type
Definition) XML.
Standard EAC (Encoded Archival Context): è sempre un DTD XML. Si applica
a liste d’autorità di soggetti produttori d’archivio.
Comunità bibliotecaria
Usa gli standard descrittivi ISBD, i formati di scambio bibliografico della fa-
miglia MARC e lo standard del Dublin Core per i metadati DCMI (Dublin Core
Metadata Iniziative): è un DTD XML sviluppato dal consorzio W3C.
Come potete notare xml senza uno specifico DTD è come una macchina
senza manuale di istruzioni... La DTD consiste di un insieme di dichiarazioni
che formano la grammatica dei documenti, cioé ne definiscono la struttura.
Dichiarazioni = istruzioni = risultati ottimizzati da parte del computer.
Corso digitalizzazione
Dalla pagina al file digitale
Se l'html è stato uno dei fondamenti del successo del Web , l'xml è la base di
questa nuova fase di Internet. L'xml non è un programma né un database.
Non dice niente su come vanno processati i dati relativi alle cose.E' solo una
serie di specifiche che dicono come i dati vanno resi disponibili online. La
forma assomiglia all'html: formato testo con comandi di marcatura (tag)
racchiusi da parentesi angolari.La grande novita' è che ora i comandi potete
inventarli voi (o, se non siete informatici, aiutati da qualcuno che lo sa fare).
In definitiva l'xml è uno standard che ci permette di definire nuovi linguag-
gi di marcatura. Questi linguaggi di marcatura permettono di rappresentare
informazione strutturata in un formato testo che si descrive da sé e che è
adatto allo scambio della stessa tra computer e programmi e quindi tra orga-
nizzazioni. Il set di caratteri usato, detto Unicode, permette di rappresentare
testi nei principali alfabeti mondiali.
Elementi di marcatura a attributi sono definiti attraverso la specifica di un
DTD (Document Type Definition) e sempre più spesso da XML-schema.
Questo dà il grande vantaggio di lasciar interpretare i dati all’applicazione
che li legge in base al contesto, per cui se vedi <p> in un file XML, non è
detto che sia un paragrafo. A seconda del contesto può essere un prezzo, un
parametro, una persona, un libro...
Corso digitalizzazione
Dalla pagina al file digitale
Il nuovo Web si presenta invece con una sequenza incredibile di nuove tec-
nologie tra le quali è difficile raccapezzarsi:
Web semantico = XML + DOM + XML Schema + XSLT + XPath + XQuery +
SOAP + WSDL + UDDI + ...
XML SCHEMA
Abbiamo già visto che XML è l’acronimo di eXtensible Markup Language, un
linguaggio di contrassegno (mark up) progettato per la descrizione di dati.
La validazione del linguaggio avviene tramite DTD (Document Type
Definition) o per mezzo di XML Schema.
Uno schema XML è un metodo per descrivere la struttura, cioé i blocchi
legali, di un documento xml permettendo la validazione del documento
stesso. L’insieme di attributi dell’elemento schema costituisce la dichiarazio-
ne di schema. Gli schemi di riferimento possono essere conservati su server
sparsi per la rete (repository) su cui xml “punta”. Anche il formato di risposta
xml deve seguire un protocollo di validazione (ad es. il protocollo OAI-PMH).
richiesta OAI
DATI SERVICE
metadati (xml) codificati
Esempi pratici:
- visione di un semplice listato text.xml
- validazione della risorsa in Jaxe, cambiamento dei dati, esportazione.
- panoramica sul software di archiviazione fotografica SEPIADES: standard,
funzioni di base.
- esempio di riempimento campi metadati, esportazione, importazione dati
xml in Adobe Photoshop e Acrobat
METADATI
Servono per:
Il listato iniziale dei metadati di questo documento. Le prime stringhe sono state realizzate da Acrobat in automati-
co. La parte finale è il risultato del riempimento campi (produttore, parole chiave) dell’interfaccia XMP da parte
dell’autore.
Corso digitalizzazione
Dalla pagina al file digitale
Jaxe è un programma Java xml editor. Può essere utile per mettere in evidenza le parti di marcatura del sorgente
xml.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ADOBE PHOTOSHOP
- ADOBE PHOTOSHOP ha sempre avuto una gestione dei dati file fin dalle
versioni più vecchie. Nella videata “info file” è possibile vedere dalla versione
7.0 in poi tutta una serie di metadati in parte inseriti in automatico durante
il processo di digitalizzazione (scanner o macchina foto elettronica), in parte
inseriti o importati dall’operatore. Questi metaname sono in formato xml.
Nell’esempio a
fianco videata dei
metadati inseriti
in una pergamena
medievale duran-
te il processo di
digitalizzazione.
La videata si apre
alla voce “info su
file” di
Photoshop 7.0.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ADOBE PHOTOSHOP
- ADOBE PHOTOSHOP 7.0
I dati possono essere importati da file xml esterni.
Nell’esempio a
fianco videata dei
metadati inseribili
in una pergamena
medievale duran-
te il processo di
elaborazione
immagini. Alcuni
dati standard
come copyright o
indirizzo archivio
possono essere
inseriti in questo
modo.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ADOBE PHOTOSHOP
- ADOBE PHOTOSHOP 7.0
Nella videata EXIF possiamo trovare oltre ai dati inseriti quelli importati au-
tomaticamente da Photoshop nel processo elaborazione immagini come la
risoluzione o la grandezza del file.
Nell’esempio a
fianco videata dei
dati EXIF.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ADOBE PHOTOSHOP
- ADOBE PHOTOSHOP 7.0
Nella videata origine vediamo i metadati base inseribili in un file Photoshop.
Nell’esempio a
fianco videata dei
dati origine in
Photoshop.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
XML è gestito in Photoshop CS da XMP (extensible Markup Platform).
ADOBE PHOTOSHOP CS
La piattaforma CS di Adobe
ha portato
cambiamenti radicali
nella gestione
dei metadati.
Nell’esempio a
fianco videata di
apertura di CS
in MAC OSX.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
- ADOBE PHOTOSHOP CS
Aprire la stringa info file per entrare nella videata XMP .
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
- ADOBE PHOTOSHOP CS
La gestione dei metadati nella piattaforma CS di Adobe avviene tramite la
specifica XMP. Questa piattaforma, di tipo proprietario, è un compromesso
tra le esigenze commerciali di Adobe e xml che è un sorgente di dominio
pubblico.
Nell’esempio a
fianco videata di
apertura di
metadati sulla
specifica XMP di
Adobe.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
- ADOBE PHOTOSHOP CS
Qualora i dati tecnici non siano disponibili (in questo caso vediamo la sezione
dei metadati da una sorgente tramite macchina fotografica digitale)
non vengono importati in automatico. L’immagine del file è stata digitalizzata
da scanner piano.
Nell’esempio a
fianco videata di
dati da macchina
fotografica digita-
le in Photoshop
CS.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ADOBE PHOTOSHOP CS
- ADOBE PHOTOSHOP CS
XMP rispetta lo standard Dublin Core.
Nell’esempio a
fianco videata
riassuntiva delle
proprietà dei dati
inseriti nel file.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
NEL PACCHETTO ADOBE ACROBAT
- Acrobat dalla versione 8.0 dà la possibilità di uscire in formato xml diret-
tamente dal pdf con un semplice comando di esportazione.
Nell’esempio a
fianco il tasto di
esportazione xml
da acrobat 8.0.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
NEL PACCHETTO ADOBE ACROBAT
- Acrobat dalla versione 8.0 dà la possibilità di uscire in formato xml diret-
tamente dal pdf con un semplice comando di esportazione. Anche se al mo-
mento l’utilità pratica di un simile comando può sembrare superflua, bisogna
tener presente che lo sviluppo dei software in un futuro prossimo tenderà a
basarsi sull’implementazione di xml come base sorgente per la gestione delle
applicazioni. In ogni caso è possibile estrarre listati xml ben formati da inse-
rire con semplice copia e incolla.
Nell’esempio a
fianco il sorgente
xml di questo
documento pdf.
Le immagini
vengono
archiviate in
formato jpg in
una cartellina
“images” allegata
al file.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ACROBAT 8.0
- La visione e l’inserimento dei dati xml in Acrobat 8.0 avviene dal pulsante
“proprietà”.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ACROBAT 8.0
La prima schermata “descrizione” ci dà campi generali quali titolo, autore,
parole chiave, ecc.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ACROBAT 8.0
E’ possibile integrare, sostituire i metadati con una semplice importazione di
file xml.
Corso digitalizzazione
Dalla pagina al file digitale
LA GESTIONE DI XML
IN ACROBAT 8.0
In questo caso tutti i campi compilati presenti nel nuovo listato vanno a
sostituire quelli precedenti. In caso di integrazione di metadati verranno
riportati dati in aggiunta ai campi validati (ad es. nel campo autore trovere-
mo più di un autore). La DTD di XMP elimina in modo automatico tutto ciò
che non ritiene coerente con le sue specifiche. Allo scopo si provi ad impor-
tare il listato xml integrale del libro d’ore che trovate in ESERCIZI/PDFXML/
FILESXML/HEURESXML in qualsiasi file pdf. Verranno riempiti solo i campi
ritenuti validi.
Corso digitalizzazione
Dalla pagina al file digitale
COPYRIGHT
“L’idea che scaturisce dal pensiero umano non può essere oggetto di pro-
prietà intellettuale in quanto patrimonio dell’intera umanità: ciò che è ogget-
to di diritto d’autore è la forma espressiva della manifestazione di un concet-
to, di un’idea”.
Antonella De Robbio, Copyright elettronico:stato dell’arte, Firenze 2003
COPYRIGHT
normativa di riferimento
Legge 22 aprile 1941 n.633,
“protezione del diritto d’autore e di altri diritti connessi al suo esercizio”
Codice Civile,
artt. da 2575 a 2583
COPYRIGHT
istruzioni per l’uso
“Il modo di far cultura è il modo di fare società”
COPYRIGHT
istruzioni per l’uso
codici
Un buon esempio di biblioteca aperta per l’accesso alle fonti è il sito dell’ab-
bazia di S.Gallo. Nel sito del CESG (Codices Electronici SanGallenses) sono
disponibili oltre cento codici ad una risoluzione ottimizzata (file di circa 50
Mb una volta decompressi).
COPYRIGHT
istruzioni per l’uso
codici
Per l’accesso si chiede semplicemente di accettare una nota sul copyright il
cui punto centrale è il divieto per un uso commerciale del materiale librario.
Trattandosi di codici (pezzi unici non replicati, al contrario di incunaboli e
cinquecentine) qualsiasi vertenza sull’uso sarebbe facilmente districabile a
favore della biblioteca.
COPYRIGHT
istruzioni per l’uso
codici
L’unico punto debole del sito ritengo sia la mancanza di metadati nelle pagi-
ne (che vengono scaricate singolarmente). L’identità del file è inscindibile dal
contenuto digitale. Un file, una volta scaricato da internet può avere le vi-
cende più svariate. Risalire alla fonte è un diritto dell’utenza ed un dovere di
infomediazione del proprietario del bene. La disintermediazione non deve
essere fonte di disaggregazione dei contenuti. Un file digitale senza metadati
è come un viaggiatore senza passaporto. Esercizio: calcolando di voler inse-
rire i metadati in batch (solo per i campi standard di proprietà) ipotizzare
tempi e costi per tutti i codici presenti in internet.
Ricerca di metadati tramite la piattaforma XMP di Adobe nel file csg-0051_079.jpg del sito CESG.
Ref. webbibliografica: http://www.cesg.unifr.ch/it/index.htm
Corso digitalizzazione
Dalla pagina al file digitale
COPYRIGHT
istruzioni per l’uso
libri a stampa
I libri a stampa antichi (dagli incunaboli in su) sono esemplari a copie multi-
ple quindi più problematici da tutelare rispetto ai codici in caso di vertenze
legali. In uno dei corsi precedenti avevo preparato files con timbri estrapolati
da cinquecentine inseriti successivamente in file di altre biblioteche. Gli allie-
vi non se ne sono, giustamente, minimamente accorti e hanno compilato le
schede di possesso in base al timbro sul frontespizio. Una perizia legale pro-
fessionale troverebbe comunque tracce inconfutabili di corrispondenza tra un
file digitale ed un originale (le macchie sono un ottimo DNA...).
Xilografia della città di Marsiglia in una cinquecentina famosa, la Chronica Universalis dello Schedel.
© 1997 Biblioteca Seminario arc. di Milano.
Corso digitalizzazione
Dalla pagina al file digitale
COPYRIGHT
istruzioni per l’uso
libri a stampa
Non bisogna quindi preoccuparsi molto di eventuali contraffazioni digitali che
hanno la coda di paglia (anche se è notevole cosa può fare l’elaborazione
elettronica ad es. per il restauro digitale su beni artistici, come si vede dal-
l’esempio sotto).
Angelo dei venti nella navata inferiore del ciborio romanico di S.Pietro al Monte di Civate (lc). Prova di restauro
digitale. Ref. webbibliografica: http://museovirtuale.comune.civate.lc.it
Corso digitalizzazione
Dalla pagina al file digitale
COPYRIGHT
istruzioni per l’uso
libri a stampa
Un altro caso in cui il problema è poter risalire alla fonte. Abbiamo preso
come esempio l’OPAL di libri antichi della Biblioteca dell’Università di Torino.
Le 1432 (!) opere in formato pdf rappresentano una collana molto ricca. Il
sito è un buon esempio di biblioteca digitale. Una volta scaricati però i pdf
non contengono alcun riferimento alla biblioteca di origine. Probabilmente
nessuno userà a scopo commerciale fraudolento questo patrimonio notevole,
è però un peccato che nessuno possa risalire off line a chi ha impegnato
forze finanziarie e tecniche per la valorizzazione di un fondo unico. Esercizio:
calcolare i tempi per il rebulding meta di tutti i pdf.
A dx. videata dell’index dell’OPAL libri antichi, Biblioteca Università di Torino. A sin. il file pdf ispezionato per la ricerca di metadati off
line. Ref. webbibliografica: http://hal9000.cisi.unito.it/wf/BIBLIOTECH/Umanistica/Biblioteca2/Libri-anti1/
Corso digitalizzazione
Dalla pagina al file digitale
COPYRIGHT
istruzioni per l’uso
Il PDF ha degli accorgimenti standard per la chiusura del file tramite password
in modo da consentire o non consentire azioni sul file (le principali sono: modi-
fica, estrazione di parti, stampa). Per le biblioteche ABEI una best practice
interna è sempre stata, nei casi di libri (cioé beni ad unità multiple), quella di
offrire un layout il più possibile vicino all’originale (libro elettronico da sfoglia-
re) con una semplice informativa di proprietà del file in riferimento alla
biblioteca in possesso dell’originale. Crediamo sia un modo corretto di salva-
guardare l’identità della risorsa nel processo migratorio dei files. La politi-
ca di distribuzione dei files è poi un’altra questione (accesso gratuito o a paga-
mento della risorsa) che va definita prima che il materiale finisca on line.
Per la gestione protetta di contenuti in formato digitale esistono anche servizi
basati su DRM (Digital Right Management) che si basano sulla criptazione
dei formati (compreso il pdf) o sull’attivazione dei reader. In questo modo i
documenti possono essere acquisiti tramite azioni di “pay per use” o “pay per
view”.
Corso digitalizzazione
Dalla pagina al file digitale
Nell’esempio a A dx le due
fianco il risultato scansioni iniziali
finale da cui è partito
dell’assemblaggio l’assemblaggio.
di una pergamena
a rotolo.
Corso digitalizzazione
Dalla pagina al file digitale
Obiettivi
Servizi da offrire
Comunità di utenti
Per approfondire:
http://www.minerva.org