Sei sulla pagina 1di 27

Digitalizzazione e

conservazione dei
documenti nelle
biblioteche

Progettazione e realizzazione
Direzione Didattica
Prof. C. A. Prete
Coordinamento tecnico
Alice Carminati
Sviluppo contenuti
Giovanni Bergamin
2007 PER LE IMMAGINI:
COREL. All rights reserved.
Digital Vision. All rights reserved.
MACROMEDIA FLASH Player software by Macromedia, Inc.,
1995-2007 Macromedia, Inc.

INDICE
Lezione 01: La digitalizzazione

Introduzione

Dall'analogico al digitale

La digitalizzazione: prospettive e problemi

Riepilogo

Lezione 02: La conservazione del digitale

Introduzione

La conservazione del digitale: problemi e definizioni

Strategie di conservazione del digitale

Riepilogo

Lezione 03: La digitalizzazione: aspetti


tecnici e operativi

Introduzione

La programmazione delle attivit e i costi

La digitalizzazione: l'immagine digitale

Riepilogo

Lezione 04: I formati e gli scanner

Introduzione

I formati

L'attrezzatura

Riepilogo

LEZIONE 1: DallANALOGICO al DIGITALE


Al giorno d'oggi le biblioteche si trovano di fronte a un aumento esponenziale delle fonti d'informazione:
difatti, accanto ai materiali esistenti nella tradizionale veste cartacea, sono presenti una quantit di
documenti "multimediali", formati cio da testi, immagini statiche e in movimento, suoni, ecc. Tali
documenti possono essere sia di tipo "analogico" (cio registrazioni audio e video), sia di tipo "digitale"
(banche dati, periodici elettronici, risorse di Internet, ecc.). Siamo di fronte, in altre parole, a una vera e
propria compresenza di supporti, che spinge le biblioteche a organizzare le proprie raccolte secondo criteri
innovativi, per offrire servizi sempre pi
vantaggiosi agli utenti.
Fra le tipogie di documenti che le biblioteche
devono acquisire, trattare e conservare, quelle in
formato
digitale
assumono
un'importanza
crescente. Il concetto di digitale implica la
presenza, all'interno di un determinato sistema, di
una serie di stati "discreti", cio discontinui,
senza possibilit intermedie: si dice infatti che un
meccanismo digitale "salta" da un valore a un
altro senza passare per tutti i valori in esso
presenti; in un meccanismo analogico invece la
variazione
avviene
in
maniera
continua,
mostrando di volta in volta le diverse grandezze
presenti nel sistema.
Un esempio pu venire dagli orologi: quelli
analogici mostrano il passare del tempo
attraverso il movimento continuo delle lancette,
quelli digitali attraverso il "salto" da un numero
all'altro su uno schermo. Analogamente i
termometri analogici mostrano la temperatura
attraverso l'altezza della colonnina di mercurio,
che varia in modo continuo con il variare della
temperatura; in quelli digitali invece la
temperatura viene visualizzata attraverso una
serie di numeri su uno schermo, con variazioni di
tipo discontinuo.

Nel passaggio dall'analogico al digitale, insomma, si ha una suddivisione in unit discrete di qualcosa che
nella realt spesso continuo. Ci avviene attraverso la conversione delle informazioni analogiche (continue)
in informazioni "numeriche", cio digitali (discontinue); ricordiamo infatti che digit in inglese vuol dire
numero,
cifra.
I numeri in cui traduciamo le informazioni di tipo continuo sono soltanto due, 0 e 1. Si parla quindi di
"codifica binaria": qualsiasi elemento viene tradotto in una sequenza di otto cifre, cio otto bit, che sono
sempre e soltanto combinazioni di 0 e di 1 (otto bit costituiscono un byte). Ad esempio, quando sulla
tastiera di un computer digitiamo il carattere A, questo corrisponde a 00000001; il carattere B corrisponde
a 00000010, e cos via.

I materiali digitali quindi sono sempre formati da sequenze di bit e di byte. Come vedrai, essi possono
costituire il prodotto della conversione in forma digitale di un originale analogico, ad esempio un documento
cartaceo (e in questo caso si parla appunto di "digitalizzazione" ovvero conversione di un segnale o codice
analogico in un segnale o codice digitale.), oppure possono nascere direttamente in forma numerica, come
accade per i milioni di siti web presenti sulla rete.

SURROGATI DIGITALI = creati dalla conversione in forma digitale di materiali analogici


NATI DIGITALI = i nati digitali sono materiali che non hanno origine analogica, ma sono prodotti unicamente
in veste numerica.

I vantaggi dei materiali digitali sono ben noti, e consistono:

nella
nella
nella
nella

loro flessibilit e semplicit d'uso;


capacit di assumere forma ipertestuale e multimediale;
possibilit per l'utente di effettuare ricerche sul testo pieno;
possibilit di utilizzare in maniera amichevole grandi quantit di dati, e cos via.

Per "digitalizzazione" s'intende quindi la conversione di un segnale o codice analogico in un segnale o


codice digitale; ci avviene attraverso la traduzione di meccanismi analogici in valori "numerici", cio
costituiti da una sequenza di bit (0 e 1).
I termini "conversione", "retroconversione" e "cattura" sono spesso usati come sinonimi di
digitalizzazione: si dice cio che un segnale analogico viene "convertito" in un segnale digitale, o
"catturato" in forma digitale.
In sintesi, la digitalizzazione la conversione di documenti dal formato analogico (e in primo luogo
cartaceo) a quello numerico.

Le attivit di digitalizzazione costituiscono una realt di dimensioni tali da non poter essere in alcun
modo sottovalutate. Proprio per questo opportuno chiedersi se queste attivit siano in grado di
aumentare il valore del patrimonio documentario di una biblioteca o di accrescere il numero dei
suoi utenti; la risposta che la digitalizzazione uno strumento e non un fine in s, per cui il suo impiego
deve essere legato alla soddisfazione di una serie di obiettivi e di bisogni informativi.
Una volta precisato ci, occorre rilevare che le principali ragioni per cui si digitalizza sono, da un lato, la
necessit di conservare una serie di documenti potenzialmente a rischio; dall'altro la possibilit di migliorare
l'accesso a una serie di risorse che, diversamente, sarebbero difficili da utilizzare

In molti casi, infatti, la digitalizzazione considerata un valido criterio di conservazione, capace di portare a
un'indefinita salvaguardia del patrimonio documentario.
Tuttavia, come ha scritto una studiosa americana, "digitalizzare non significa conservare, o per lo meno non
completamente; le risorse digitali ottengono i risultati migliori nel facilitare l'accesso all'informazione, ma
sono assai deboli quando a esse assegnata la tradizionale responsabilit bibliotecaria della conservazione"
(Abby Smith).
necessario effettuare di volta in volta un'attenta valutazione dei materiali che si vogliono digitalizzare,
per stabilire se questa procedura pu dar vita a un'idonea salvaguardia di documenti in precarie
condizioni di conservazione o quelli che, per una serie di motivi, sono a rischio di scomparsa.
Assai importante poi il ruolo della digitalizzazione come "accesso": difatti moltissimi documenti rari o
unici sono presenti spesso in luoghi remoti o difficili da raggiungere, e questo limita molto la possibilit di
utilizzarli efficacemente. Attraverso la digitalizzazione invece si creano surrogati dell'originale analogico, che
possono essere messi su un cd-rom o collocati su Internet, e diventare cos accessibili a milioni di utenti.

Il secondo, importante vantaggio legato alla conservazione, dal momento che la digitalizzazione rende
possibile la salvaguardia di grandi insiemi documentari che vanno incontro a un rapido degrado.
Un esempio viene dai numerosi quotidiani che, fra Otto e Novecento, sono stati stampati su carta acida, e
che oggi sono a forte rischio di scomparsa: difatti la conversione di questi documenti in formato digitale ne
accresce la capacit di sopravvivenza, compromessa dall'azione di degrado delle componenti chimicofisiche, oltre che dai problemi derivanti da un loro mantenimento in ambienti non idonei.
Alle attivit di digitalizzazione poi si accompagnano una serie di tecniche in grado di accrescere le capacit
di analisi dei materiali a rischio, consentendo cos gli interventi pi idonei per la loro conservazione. Fra
queste tecniche, assai interessante appare il "digital imaging" (Tecnica che permette di aumentare il grado
di risoluzione delle immagini digitali, offrendo una maggiore precisione nei dettagli al fine di individuare
specifiche particolarit.), perch consente di ottenere informazioni che la consultazione diretta dell'originale
non in grado di fornire: questa procedura infatti permette non solo di aumentare il grado di risoluzione
(cio del numero di pixel impiegati per definire un'immagine digitale Un'immagine digitale la
rappresentazione di un'immagine bi-dimensionale tramite una serie di valori numerici, che la descrivono a
seconda della tecnica utilizzata.) delle immagini digitali, offrendo una maggiore precisione nei dettagli al fine
di individuare specifiche particolarit, ma anche di aumentare il contrasto fra una stampa o un manoscritto
sbiaditi e uno sfondo scuro, rendendo assai pi leggibili i testo di documenti antichi o deteriorati.
Decisamente innovativo infine il cosiddetto "restauro virtuale" (Tecnica di restauro che non modifica le
condizioni fisiche dell'originale, come avviene con il restauro tradizionale, perch agisce solo sulle immagini
digitalizzate.), una tecnica cio che non modifica le condizioni fisiche dell'originale come avviene con il

restauro tradizionale, perch agisce solo sulle immagini digitalizzate, su cui vengono effettuate tutte le
operazioni di miglioramento e di restauro. La Biblioteca Nazionale Centrale di Firenze, ad esempio, ha
realizzato importanti iniziative in questo campo, dando vita a un archivio digitale in grado di consentire
un'agevole consultazione di questi materiali; l'archivio infatti comprende immagini ad alta definizione di
pagine tratte da codici membranacei, restaurate virtualmente e messe a confronto con le opere nel loro
stato reale.
A fronte di questi vantaggi, la digitalizzazione presenta anche numerosi limiti, dovuti in primo luogo alla
necessit di attribuire autenticit e autorevolezza
al surrogato rispetto all'originale analogico; difatti
praticamente impossibile accertare la rispondenza
all'originale di una copia digitale: non potendo ricorrere
all'originale per una verifica, si dovr contare
sull'autorevolezza e sull'affidabilit dell'istituzione che
ha curato la digitalizzazione.
Il secondo, rilevante problema deriva dal fatto che la
digitalizzazione
implica
la
scomparsa
della
componente
materiale
del
documento, con
differenze anche notevoli tra la maniera di presentarsi
della copia digitalizzata e quella dell'originale; ci di
conseguenza pu dar vita a non pochi problemi tanto
nella ricezione quanto nell'utilizzo dei dati da parte degli
utenti.
Infine, bisogna considerare i problemi di conservazione
tipici dei formati digitali; difatti, a causa del
deterioramento fisico dei supporti e della continua
"obsolescenza tecnologica" (Processo per cui hardware,
software e altri strumenti tecnologici vengono
progressivamente sostituiti da nuovi prodotti in
commercio.) dei prodotti digitali, l'informazione in veste
numerica va soggetta a un forte rischio di perdita: come
vedremo, i formati digitali hanno cicli di vita assai brevi,
per cui occorre provvedere a una loro adeguata
conservazione attraverso le tecniche e le strategie elaborate a livello internazionale.

LEZIONE2: La conservazione dei documenti digitali

Le attivit di digitalizzazione sono strettamente


legate a quelle relative alla conservazione del digitale
(In inglese digital preservation) Insieme delle attivit
realizzate per assicurare l'accesso continuo ai materiali
digitali (o alle informazioni in essi contenute) per il
tempo considerato necessario., dal momento che gli
oggetti che derivano dalla retroconversione dei
documenti
analogici
presentano
le
stesse
caratteristiche - e quindi gli stessi problemi - di tutti gli
altri formati digitali.
Rispetto ai corrispondenti analogici, i materiali digitali
mostrano infatti una fragilit assai maggiore, e quindi
un'alta probabilit di diventare fisicamente e
logicamente inaccessibili; essi inoltre manifestano un
grado di obsolescenza tecnologica decisamente
elevato, e ci contribuisce a rendere il loro ciclo di vita
decisamente breve.

Queste problematiche hanno spinto molte organizzazioni a porre in atto


una serie di politiche e strategie volte alla conservazione di un
patrimonio che, al giorno d'oggi, sempre pi importante e diffuso.
Un primo punto di partenza si avuto con il rapporto, pubblicato nel
1995, della Task Force on Archiving Digital Information, nel quale
sono stati messi in luce non solo gli aspetti di debolezza e di instabilit
dei formati digitali, ma anche i problemi legati all'obsolescenza
tecnologica degli strumenti che ne rendono possibile la fruizione.
La conservazione del digitale (digital preservation) linsieme
delle attivit realizzate per assicurare laccesso continuo ai materiali
digitali per il tempo considerato necessario. Vengono individuate tre
tipologie di conservazione:
CONSERVAZIONE A LUNGO TERMINE Implica un accesso costante ai
materiali (e/o alle informazioni in essi contenuti) per una quantit di
tempo indeterminato;
CONSERVAZIONE DI MEDIO TERMINE La conservazione di medio termine valida se laccesso ai
documenti e alle informazioni avviene per un periodo di tempo determinato.
CONSERVAZIONE DI BREVE TERMINE La conservazione di breve termine risulta possibile quando
laccesso possibile con le tecnologie esistenti.

Come si detto, i tempi di vita dei


formati digitali risultano di gran lunga
inferiori a quelli dei supporti analogici:
alcuni test sperimentali infatti dimostrano
che la vita media di un cd-rom va dai
cinque ai venticinque anni, mentre
hardware, software e sistemi operativi
hanno cicli di vita che oscillano dai due ai
cinque anni.
Ma i tempi in assoluto pi brevi sono quelli
dei documenti di rete: la vita media di
una pagina web infatti stata stimata in
settanta giorni, anche se di recente questo
limite stato ridotto a soli quarantaquattro
giorni.
Un altro problema quello dell'obsolescenza tecnologica, dal momento che il mercato produce una
quantit di supporti sempre pi raffinati e potenti e sempre meno costosi. Non un caso se in questi anni
abbiamo assistito alla scomparsa pressoch totale di supporti molto usati quali i floppy disk, oltre che alla
mancata produzione delle componenti necessari per il loro utilizzo (come alcuni drive di computer), oltre che
all'abbandono di numerosi tipi di hardware e software: la conseguenza che il rischio di perdere le
informazioni contenute in questi strumenti aumenta in modo costante.
I problemi di conservazione del digitale dunque possono derivare dalle cause pi diverse, per cui
necessario disporre di una gamma ben precisa di strategie che consentano di individuare le soluzioni pi
adeguate ai problemi che di volta in volta si manifestano.
Alcune di queste strategie hanno sollevato non poche perplessit fra gli esperti del settore, come la proposta
di trasferire su hard copies una serie di materiali in formato numerico, ad esempio effettuando una
stampa su carta o realizzando un microfilm a partire da un originale su supporto digitale. Sappiamo infatti
che la carta ha tempi di obsolescenza assai lunghi, e si stima che il microfilm possa durare centinaia di anni:
ci nonostante, essa appare una proposta paradossale, in primo luogo perch si va verso la digitalizzazione
di gran parte del patrimonio analogico e non viceversa; in secondo luogo perch un'idea praticamente
irrealizzabile, a causa dell'immensa quantit di documenti esistenti in formato digitale; infine, perch
un'idea svantaggiosa, in quanto sulla hard copy non possibile replicare le caratteristiche di flessibilit e di
maneggevolezza, n le capacit ipertestuali e multimediali proprie di questi formati.
Un'altra idea che talvolta affiora quella di mantenere "come in un museo" una quantit di hardware e
software obsoleti, al fine di poterli utilizzare in caso di necessit, ad esempio per la lettura di documenti
contenuti su dischi o nastri attualmente fuori commercio; anche in questo caso siamo di fronte a un'ipotesi
difficilmente realizzabile, sia perch richiede costi elevati, sia perch non offre garanzie che tali prodotti
possano mantenersi integri e funzionanti nel tempo.
Vi sono DUE METODI utilizzati per la conservazione digitale:
REFRESHING = metodo volto a mantenere i bit in buona salute e consiste nel copiare, a distanze di tempo
brevi, le informazioni su supporti pi recenti, come ad esempio da Floppy Disc a CD-Rom o da Hard Drive a
DVD.
MIGRAZIONE = prevede il trasferimento sistematico die documenti su nuovi hardware e software prima che
quelli precedenti diventi obsoleti. A differenza del refreshing richiede una decodifica periodica die dati
affinch possano essere leggibili dalle nuove generazioni di hardware e software.

Una strategia del tutto diversa l'emulazione (Strategia di conservazione del digitale che permette, grazie
a software di emulazione di piattaforme hardware obsolete, di utilizzare software e documenti originali anche
se questi sono ormai obsoleti), ossia "un approccio che permette l'emulazione di sistemi obsoleti su sistemi
futuri e non ancora noti, in modo che un software originale possa essere usato in futuro bench sia ormai
obsoleto" (Jeff Rothenberg).
In altre parole, questa strategia propone di evitare le migrazioni periodiche di dati da un
supporto a un altro, dal momento che assai pi semplice e meno costoso utilizzare il software
di un documento originale anche se questo, cos come l'hardware, diventato obsoleto.

Per evitare le migrazioni periodiche di dati occorre inserire in una "capsula virtuale" tutti gli oggetti necessari
per un futuro utilizzo di questo documento, e cio da un lato il documento digitale, insieme al software e al
sistema operativo impiegati per la sua creazione, dall'altro un "emulatore" dell'originaria piattaforma
hardware, che sia in grado appunto di emulare tale piattaforma su qualsiasi computer si costruir in futuro,
prescindendo dunque dalle sue caratteristiche tecniche, che ovviamente non sono note nel momento in cui
si prepara la capsula.
Essenziali perch la strategia abbia successo sono poi i metadati, ossia le notizie sui dati relativi a hardware,
software e sistemi operativi, che vanno anch'essi inclusi nella capsula e che permetteranno di decodificare le
informazioni in essa presenti.
L'emulazione ha suscitato notevoli consensi, ma ha sollevato anche vivaci critiche: alcuni studiosi hanno
infatti rilevato che hardware, software e sistemi operativi hanno di norma dei proprietari, e quindi risultano
difficilmente "incapsulabili" a causa dei diritti posseduti dai rispettivi titolari; un altro problema poi dato
dalla difficolt di lettura dei metadati su piattaforme future e non ancora conosciute.

In ogni caso, il dibattito a livello internazionale ha evidenziato che


la migrazione e l'emulazione costituiscono le tecniche pi
efficaci di salvaguardia dei record digitali.

VANTAGGI E SVANTAGGI DELLA MIGRAZIONE


I principali vantaggi della migrazione consistono indubbiamente
nella sua diffusione, in quanto la modalit pi usata nella
conversione della maggior parte degli archivi digitali; le sue
procedure poi non soltanto sono stabili e ben definite, ma in grado
di diventare sempre pi semplici man mano che avanza la
tecnologia. Assai importante infine l'esistenza di precisi criteri
di valutazione dei rischi, che permettono di agevolare le
decisioni e le scelte tecniche.
Gli svantaggi della migrazione riguardano in primo luogo i
costi, se vero che per migrazioni complesse necessario
prevedere specifici programmi di finanziamento; e in secondo
luogo i tempi, che possono risultare assai lunghi e richiedere
procedimenti piuttosto elaborati.
Il limite principale tuttavia risiede nell'elevata probabilit di perdita di funzionalit, di accuratezza, d'integrit
e di utilizzabilit dei record "migrati" rispetto a quelli originali.

VANTAGGI E SVANTAGGI DELLEMULAZIONE

Tra gli svantaggi dell'emulazione invece bisogna annoverare:


-

La sua dimensione ancora sperimentale, e dunque l'esigenza di ulteriori approfondimenti affinch


possa dimostrare a pieno la propria affidabilit;
Riproduzione parziale del "look and feel" dell'originale, risultandone cos attenuato uno dei
requisiti che la caratterizzano maggiormente;
Aspetti riguardanit il copyright di hardware e software ancora da chiarire e definire che potrebbero
recare problematicit;
Costi elevati, specie in assenza di precise economie di scala.

LEZIONE3: La digitalizzazione: aspetti tecnici e operativi


Nel momento in cui si decide di realizzare
un'attivit di digitalizzazione, opportuno
prevedere un'idonea programmazione di tali
attivit, individuando una serie di linee guida
che utile seguire nella creazione dei surrogati
digitali.
Queste linee guida, in sintesi, dovrebbero:

precisare gli scopi dell'iniziativa e le

relative responsabilit gestionali;


definire le strategie e le procedure

operative da sviluppare nelle diverse


fasi del processo;
stabilire
i
criteri
per
una
conservazione di lungo termine dei
prodotti che derivano dall'attivit di
digitalizzazione.

Tali indicazioni potranno poi essere inserite in


una tabella, per rendere pi esplicito il flusso
delle operazioni.

Assai importante, nella programmazione delle attivit, il discorso legato ai costi. Secondo studi recenti, la
ripartizione dei costi di un processo di digitalizzazione si articola di norma in:

1/3 per l'acquisizione delle immagini digitali;


1/3 per la creazione di metadati (ossia le informazioni descrittive e gestionali legate alla

digitalizzazione);
1/3 per la gestione amministrativa e il controllo di qualit; a ci vanno inoltre aggiunti i
costi di conservazione degli archivi digitali.

Nella stima dei costi bisogna prevedere anche altre variabili, legate alla diversit dei formati del documento
d'origine e alle specifiche usate per la conversione: infatti evidente che, pi alta la qualit dell'immagine,
pi alto il costo.
Occorre inoltre tener conto di aspetti quali l'assemblaggio dei materiali d'origine, gli eventuali costi del
copyright, la fase di post-produzione (successiva cio all'attivit di digitalizzazione), tutti elementi che che
fanno aumentare i costi di almeno1/3.
Una digitalizzazione pu avvenire:
ALLINTERNO DI UNA ISTITUZIONE = richiede il calcolo dei costi legato ad attrezzature hardware e
software, al personale impiegato, ai locali con annessi e connessi in cui si svolge lattivit etc
ALLESTERNO DI UNA ISTITUZIONE = si basa su di un contratto basato sul costo unitario per immagine
(solitamente): i costi potranno risultare da una prima stima dellintero progetto.

I principali fattori che influenzano i costi sono:

la natura del documento d'origine;


la preparazione dei materiali;
i requisiti tecnici necessari per dar corso all'attivit.

Per quanto riguarda il primo punto, bisogna precisare che i costi variano in rapporto non solo al formato e
alla dimensione del documento da digitalizzare, ma anche all'attenzione che si deve prestare nel
maneggiare questi documenti: per fare un esempio, la conversione di documenti non particolarmente rari in
formato A4 avr un costo pi basso rispetto alla conversione di documenti di formato speciale e di notevole
rarit.
I costi inoltre variano a seconda del livello di preparazione dei materiali da digitalizzare; tali costi includono
fra l'altro:

il trasporto dei documenti di origine da un ambiente a un altro;


l'assemblaggio dell'intera raccolta e la verifica della presenza di tutti i documenti;
la "sfascicolatura";
la rimozione delle cuciture, ecc.

La variabile principale data dai requisiti tecnici richiesti per ottenere determinati risultati: un'immagine ad
alta risoluzione infatti coster di pi di una a bassa risoluzione, sia perch richiede attrezzature pi costose,
sia perch d vita a file di dimensioni pi grandi, che quindi occupano uno spazio maggiore nel supporto di
destinazione.
A causa di queste variabili, alcuni osservatori ritengono che sia praticamente impossibile prevedere in
maniera realistica i costi di un progetto di digitalizzazione; pervenire a una stima dei costi invece
assai importante, perch " del tutto assurdo intraprendere un progetto di digitalizzazione senza avere idea
dei
costi
che
questo
comporta"
(Stuart
Lee).
La maniera pi semplice ed efficace per ottenere tale stima esaminare altri progetti di
digitalizzazione, e ricavare una serie di informazioni che possono costituire una ragionevole base di
partenza. Poich i costi sono molto variabili, sar necessario stabilire una media; una volta che queste cifre
saranno state rilevate e possibilmente disposte in una tabella, si potranno vantaggiosamente applicare al
progetto di digitalizzazione.
Oggi si pu stimare che il costo di digitalizzazione di un'immagine in bianco e nero in formato A4 di
circa 0,50 euro; se invece si tratta di un manoscritto miniato, il costo per immagine di circa 2 euro, ma
se si tiene conto delle numerose variabili coinvolte, questo costo pu andare dai 22 ai 30 euro.

La digitalizzazione: LIMMAGINE DIGITALE


Parliamo dunque dell'immagine digitale, partendo da un oggetto che ci familiare: lo schermo del computer.
Se avviciniamo lo sguardo fin quasi a toccarlo, possiamo notare che esso costituito da una serie di
piccolissime celle: uno schermo di buon livello, ad esempio, ha 1024 celle che lo attraversano
orizzontalmente e 768 verticalmente.
Queste celle prendono il nome di "picture elements", di solito abbreviato in pixel. Ogni cella in grado di
mostrare il nero, il bianco, il grigio o un colore.
Ciascun colore (o gamma di colori) dato da un determinato "codice" che, come tutte le informazioni
digitali, memorizzato in modalit binaria, ossia attraverso una serie di 0 e di 1. Al livello pi semplice,
questo codice dato da un codice a una cifra; ad esempio:
0 = nero / 1 = bianco

Pertanto, se al computer viene detto che un certo pixel ha il codice 0


associato a esso, il computer riempie quel pixel con il nero; viceversa, se
a un certo pixel associato il codice 1, il computer riempie quel pixel con
il
bianco.
L'immagine che ne risulta dunque un'immagine a un bit (soltanto un
singolo bit, ossia uno 0 o un 1, richiesto per ciascun pixel); per questo si
dice che ogni pixel ha una "profondit" di due, ci sono cio soltanto due
possibili valori con cui esso pu essere riempito, 0 e 1.
Cos un'immagine in bianco e nero che ricopre l'intero schermo a 1024 x
768 pixel costituita da 786.432 pixel, ciascuno con un valore di 0 e di 1
per mostrare il bianco o il nero. Il computer converte questi codici negli
appropriati colori (in questo caso il bianco e il nero) e li proietta sullo
schermo del computer, cosicch da una certa distanza essi possono
sembrare un'immagine normale (come si vede dall'immagine a lato).
Ma ciascun pixel pu contenere molte pi informazioni rispetto al solo
bianco o al solo nero: tecnicamente si parla infatti di "gradazione" (shade), che consiste appunto nella
possibilit di accrescere il numero delle varianti dell'immagine, non limitate al solo bianco o al solo nero.
Come si misura il numero delle diverse gradazioni di una immagine? La risposta che dipende tutto dalla
"profondit", ossia dal numero dei possibili valori con cui ciascun pixel pu
essere riempito.
Cos, se invece di un'immagine a un bit prendiamo un'immagine a quattro
bit, questa avr quattro "solchi", cio quattro codici da riempire con una
serie di 1 e/o di 0; pertanto, se l'immagine a 1 bit ha il valore di 1 o 0,
l'immagine a quattro bit avr 16 valori possibili.
In altre parole, ci sono 16 possibili valori per ciascuna cella; si tratta quindi
di un'immagine a quattro bit, perch sono usate quattro cifre binarie per
rappresentare ciascun pixel.
Se l'immagine appena vista fosse un'immagine su una scala di grigi, ogni
cella potrebbe essere riempita da una delle possibili gradazioni di grigio,
con "0000" che rappresenta il nero, e "1111" che rappresenta il bianco.
Allo stesso modo un'immagine a 8 bit implica 256 diverse combinazioni, cio 28 ("00000000"; "11111111",
ed ogni possibile combinazione di otto costituita da 0 e 1); un'immagine a 16 bit data da 216, cio 65.536
possibili combinazioni; un'immagine a 24 bit da oltre 16 milioni di diverse combinazioni, e cos via.
Pertanto, se si vuole digitalizzare un'immagine su una scala di grigi a otto bit, ciascuna cella o pixel
dovr contenere una delle 256 combinazioni di grigi; allo stesso modo, se si vuole digitalizzare a colori a
24 bit, ciascun pixel sar riempito da uno degli oltre 16 milioni di colori.
Questo specifico controllo di gradazione da cella a cella produce le immagini ad alta qualit che si
trovano nei progetti di digitalizzazione: difatti la variazione della profondit dei bit permette un controllo
molto maggiore su ci che contiene ciascun pixel sullo schermo.
L'altro fondamentale elemento che definisce la qualit dell'immagine la risoluzione; essa si riferisce al
numero di pixel usati per convogliare l'immagine stessa, ed espressa in dpi (dots per inch, ossia punti per
pollice), in cui il pollice si riferisce a un pollice del documento originale.
Ad esempio, nella scansione di un'immagine lunga 10 pollici e larga 5, lo scanner o la macchina
fotografica digitale possono essere programmati per digitalizzare a 100 punti per pollice (100 dpi), il che
significa che ciascun pollice quadrato del documento originale pu essere catturato a una risoluzione di 100

pixel
per
100
pixel.
In sostanza, pi punti per pollice vengono digitalizzati, pi alta la qualit dell'immagine, in quanto vengono
catturate pi informazioni relative a ciascun pollice quadrato del documento originale.
Se ora torniamo al nostro progetto di digitalizzazione, dobbiamo chiederci se conviene digitalizzare
sempre al massimo livello possibile di profondit e risoluzione.
La risposta ovviamente che non sempre utile farlo, sia per la dimensione dei file che ne risultano, sia per
i tempi pi lunghi di scansione, sia per gli scopi e le destinazioni dei file digitalizzati.
Per concludere questa lezione proponiamo la seguente tabella, tratta dal libro di Lee Stuart, che mette a
confronto i possibili costi della digitalizzazione con i requisiti di profondit e risoluzione richiesti di volta
in volta.

LEZIONE4: I formati e gli scanner

La digitalizzazione di un documento - ad esempio di un libro - pu dar vita


a un'immagine digitale delle diverse pagine (e si ha cos un "formato
immagine" - Modalit di rappresentazione di un'immagine su file, in grado di
dar luogo a formati diversi (TIFF, JPEG, GIF, DjVu, ecc.), o a un vero e proprio
testo, elaborabile cio da un normale computer (si parla allora di "formato
testo").
Nel primo caso si ottiene una vera e propria fotografia digitale delle
pagine, mentre nel secondo si produce un file che pu essere manipolabile
dall'utente, analogamente a quanto accade con un sistema di videoscrittura.
Una differenza sostanziale tra il formato testo e il formato immagine consiste
nella dimensione dei file, che per il formato testo da 15 a 20 volte
superiore rispetto al formato immagine.
Un'altra differenza data dalle modalit con cui si ottengono questi formati:
oggi infatti un file di immagine pu essere realizzato in tempi brevi e con costi contenuti; un file di testo
invece non pu essere creato solo attraverso processi automatici, ma richiede un intervento umano di
digitazione su tastiera, e questo fa aumentare notevolmente i tempi e i costi.
La tecnologia richiesta per il formato testo prende il nome di Optical Character Recognition - (Optical
Character Recognition = riconoscimento ottico dei caratteri). Tecnologia necessaria per interpretare le varie
forme con cui i punti di nero si distribuiscono su una superficie bianca, e riconoscere ciascuna forma come
corrispondente a un carattere (riconoscimento ottico dei caratteri, in sigla OCR); essa ha lo scopo di

interpretare le varie forme con cui i punti di nero si


distribuiscono su una superficie bianca, e riconoscere
ciascuna forma come corrispondente a un carattere.
L'OCR dunque consente di estrarre il testo da
un'immagine
digitale,
riconoscerlo
in
modo
appropriato e convertirlo affinch sia elaborabile dal
computer. In seguito a questa modalit quindi si
ottiene lo stesso risultato di una digitazione diretta da
tastiera, ma con tempi e costi decisamente
inferiori; l'OCR infatti appare la soluzione pi
vantaggiosa in tutti i casi in cui occorre recuperare
grandi quantit di testo.
Tuttavia, non sempre le prestazioni dei software di
OCR danno risultati di assoluta precisione: per
raggiungere un livello considerato perfetto al 99,995
% (ossia con un errore ogni 20.000 caratteri) sono
infatti necessari software molto sofisticati e costosi.
Per quanto riguarda invece i formati di immagine,
ricordiamo che la dimensione e le caratteristiche
di questi file incidono notevolmente sulle possibilit
di essere utilizzati vantaggiosamente dagli utenti;
pertanto essenziale che, nel pianificare le attivit di
digitalizzazione, si preveda quale formato di
immagine pu risultare pi opportuno, sia per la
retroconversione, sia per la conservazione, e quale pi utile per l'utilizzo che ne faranno gli utenti.

TIFF (Tagged Image File Format): forse il pi importante formato di immagine, ed ampiamente usato
nei processi di digitalizzazione, perch consente che immagini di alta qualit (anche superiori a 24 bit a
colori) possano essere salvate senza alcuna perdita. La conversione dal TIFF ad altri formati
particolarmente agevole, e molti software sono in grado di effettuarla senza difficolt; esso inoltre
diventato uno standard di fatto per creare immagini master (da adibire cio alla conservazione) di alta
qualit.
Il formato TIFF d vita a file molto voluminosi, per cui in certi casi (ad es. se le immagini devono essere
collocate su Internet), opportuno creare delle versioni pi ridotte, sia in TIFF, sia in formati pi agevoli
come il JPEG o il GIF; a scopi di conservazione invece opportuno archiviare le immagini master
direttamente in formato TIFF.

JPEG (Joint Photographic Experts Group): insieme al formato GIF, il file di immagine pi utilizzato per il
web, e di norma visualizzabile da qualsiasi browser. Di solito i file JPEG sono usati per le immagini a
colori; essi supportano una profondit di 24 bit a colori, ma permettono anche la compressione (rendendo
cio il file pi piccolo), anche se questo ne riduce la qualit.
L'impiego sul web di questo formato comporta una velocit di visualizzazione relativamente pi bassa
rispetto al GIF, in quanto viene impiegato uno speciale algoritmo di compressione e decompressione;
inoltre i cosiddetti "JPEG progressivi" permettono una visualizzazione pi veloce, perch dapprima viene
caricata un'immagine a bassa qualit, poi intorno a questa si costruisce la grafica, che aumenta
gradualmente in qualit e chiarezza.

GIF (Graphical Interchange Format): anch'esso ampiamente usato sul web, soprattutto per immagini
artistiche o scale di grigi, dando vita a immagini a 8 bit. Esistono due versioni di questo formato, 87a e
89a (il pi recente), ed entrambe permettono di visualizzare un'immagine a bassa risoluzione e poi di
riempirla
gradualmente
nel
dettaglio.
DjVu: un formato molto interessante, sia perch d vita a tassi di compressione maggiori di 1000:1, sia
perch molto indicato per la fornitura di immagini a colori. molto leggero (ogni immagine di circa 70
Kb), ed ha potenzialit elevate, in quanto consente di:

ingrandire moltissimo l'immagine senza perdite nella definizione;

potersi "muovere" al suo interno;

selezionare e tagliare le parti che interessano;

eliminare lo sfondo e lasciare soltanto il testo, su cui effettuare tutte le operazioni.

Affinch la digitalizzazione possa essere realizzata, dovr essere disponibile un'adeguata attrezzatura
tecnica, che di norma costituita da strumenti per la cattura dei dati (scanner, fotocamere digitali,
hardware audio e video), collegati a piattaforme informatiche dotate di adeguate risorse per la
conservazione di lungo termine. L'attrezzatura va installata prima che inizi la digitalizzazione: difatti, finch
l'ambiente hardware e software non sar stato predisposto e testato, preferibile non introdurre alcun
originale. La scelta dello scanner dovr essere legata a una serie di variabili:

il tipo di materiale da digitalizzare;


il budget previsto per il progetto;
la durata e le finalit del progetto stesso.

Prima di iniziare la scansione opportuno testare lo scanner con materiali di prova; ci si pu effettuare
anche in fase di formazione degli operatori.

Tra i diversi tipi di scanner attualmente disponibili, lo


scanner "piatto" andrebbe utilizzato solo con
materiali gi piatti di per s, che dunque non
vengono danneggiati se disposti su una superficie
rigida e piatta; uno scanner piatto inoltre dovrebbe
essere di dimensioni non inferiori a quelle
dell'esemplare da scandire.
importante che il vetro di scansione sia sempre
pulito, sia per garantire la qualit delle immagini, sia
per evitare che i materiali da digitalizzare possano
sporcarsi. Inoltre, opportuno scandire solo
esemplari che si adattano interamente allo scanner
piatto, ma se proprio non si pu evitare di scandire un
esemplare in pi parti, bene assicurarsi che vi sia
un adeguato margine di sovrapposizione tra di esse.
Oggi esistono scanner molto sofisticati, che
consentono la digitalizzazione di opere antiche e
rare o di formato anomalo senza alcun rischio per
gli originali: i documenti, infatti, vengono illuminati
con luce fredda (5.400 Kelvin di temperatura colore),
e sono sottoposti ad adeguate condizioni di
temperatura
e
di
umidit.
In particolare, gli scanner "basculanti" permettono
di digitalizzare documenti quali manoscritti e opere
a stampa antiche e moderne, in fogli e in volumi, fino a uno spessore di 12 cm.
I documenti sono posizionati a faccia in su, evitando di essere danneggati come invece pu avvenire con i
normali scanner piatti: tramite la superficie basculante, il piano di ripresa viene infatti mantenuto alla
distanza ottimale per una corretta messa a fuoco dell'obiettivo per entrambe le facciate del volume. Inoltre,
la curvatura delle pagine, che rappresenta un serio problema per i volumi rilegati, viene corretta
automaticamente da uno speciale dispositivo di rilevamento.
Nella digitalizzazione con scanner basculanti, appositi software gestiscono le operazioni di scansione e
l'impostazione dei vari parametri di controllo, effettuando le elaborazioni digitali delle immagini e la
registrazione di queste su disco rigido, cd-rom o dvd; i documenti di norma vengono convertiti in immagini in
formato TIFF, con una risoluzione che varia da 200 a 600 dpi.
Nei progetti di digitalizzazione sta diventando sempre pi comune l'uso di macchine fotografiche digitali, a
causa della loro versatilit nel digitalizzare oggetti non piatti, come libri rilegati, manoscritti piegati o
raggrinziti, oggetti tridimensionali, e cos via. In questo caso, il piano fotografico e il piano del materiale che
viene fotografato dovranno essere perfettamente paralleli, al fine di evitare che le immagini appaiano
distorte. L'ambiente fotografico poi non potr dirsi pronto senza un'adeguata illuminazione: infatti difficile
che la luce ambientale sia sufficiente allo scopo, quindi per compensare eventuali distorsioni si potranno
usare idonei filtri.
Va ricordato che la capacit di memorizzazione degli strumenti di digitalizzazione limitata, per cui
utile disporre di un computer dotato di adeguate capacit di memoria, mentre dovrebbero essere
effettuate di frequente copie di sicurezza delle immagini digitalizzate.
quindi necessario scegliere i supporti di memorizzazione pi adeguati, specie se si vogliono
mantenere le collezioni digitali integre e accessibili nel lungo periodo. Di norma, i materiali digitalizzati

sono collocati su server, specie se sono destinati alla diffusione su Internet; poi essenziale effettuare
copie di sicurezza di tali materiali archiviando i dati su supporti rimovibili, e dunque separandoli da quelli
conservati sui server, per accrescere la loro capacit di conservazione.
Oggi si assiste a un utilizzo sempre maggiore del dvd come supporto per le copie di sicurezza, in quanto
offre ampie capacit di archiviazione, oltre a una notevole duttilit e semplicit d'uso. Ma poich ogni
supporto diventa obsoleto in tempi relativamenti brevi, opportuno far migrare periodicamente i prodotti
delle attivit di digitalizzazione: difatti, la possibilit di archiviare i dati sia su Internet (grazie a server di
dimensioni via via crescenti), sia sui dischi rimovibili, rende pi facile l'attivit di migrazione, e dunque la
conservazione di questi file nel lungo periodo.

BIBLIOGRAFIA

A. Abid, Conservare il patrimonio digitale: la prospettiva UNESCO, in


Futuro delle memorie digitali e patrimonio culturale, Atti del convegno
internazionale, Firenze, 16-17 ottobre 2003, a cura di Vittoria Tola e
Cecilia Castellani, Roma, ICCU, 2004.
G. Blasi (edited by), The future of the memory, Brepols, Turnhout, 2002.
V. Cappellini, Le memorie digitali per il patrimonio culturale: la
protezione del copyright nella fruizione telematica, in Futuro delle
memorie digitali e patrimonio culturale, Atti del convegno internazionale,
Firenze, 16-17 ottobre 2003, a cura di Vittoria Tola e Cecilia Castellani,
Roma, ICCU, 2004.
G. Cirocchi, Conservazione di risorse digitali: quali sfide?, "Bollettino
AIB", 39, 3, p. 289, 1999.
G. Cirocchi, Nuove frontiere per la conservazione: vantaggi, svantaggi e
modalit della digitalizzazione, in Obiettivo Conservazione. Atti del

seminario La conservazione dei beni librari nelle biblioteche


dell'Universit, Bologna, dicembre 2000, a cura di Maria Pia Torricelli,
Bologna, TDM, 2002, p. 69-99.
A. De Robbio, Progetti di digitalizzazione: vademecum on-the-fly, in
"Proceedings 14. Seminario Angela Vinay: Biblioteconomia, La frontiera
digitale, 4-5 aprile 2003, http://eprints.rclis.org/archive/00000137/.
F. Di Giammarco, Conservare il futuro. Modelli e progetti di web
archiving, "Biblioteche oggi", 23 (2005), 2, p. 31-33, 2005.
P. Falchetta, Guida breve alla digitalizzazione in biblioteca, "Biblioteche
oggi", 18 (2000), 9, p. 52-67, 2000.
A. Farsetti, Digitising journals, Conference on future strategies for
European Libraries, Copenhagen, 13-14 March 2000,
http://www.burioni.it/forum/fars-cop.htm.
J. Feather (edited by), Managing preservation for libraries and archives.
Current practice and future developments, Aldershot, Asgate, 2004, p. 159173, 2004.
R. C. Gonzalez, R. E. Woods, Digital image processing, 2. ed., Upper
Saddle River, Prentice Hall, 2002.
S. Granger, Emulation as a digital preservation strategy, "D-Lib
Magazine", 6 (2000), 10,
www.dlib.org/dlib/october00/granger/10granger.html.
G. S. Hunter, Preserving digital information, New York, Neal-Schuman,
2000. Istituto Centrale per il Catalogo Unico delle Biblioteche Italiane e le
Informazioni Bibliografiche, Conservazione delle memorie digitali: rischi
ed emergenze. Sei casi di studio, a cura di Alessandra Ruggiero, prefazione
di Luciano Scala, documento presentato al convegno internazionale
"Futuro delle memorie digitali e patrimonio culturale", Firenze, 16-17
ottobre 2003.
M. Jones, N. Beagrie, Preservation management of digital materials: a
handbook, Digital preservation Coalition,
www.dpconline.org/graphics/handbook.
S. D. Lee, Digital imaging: a practical handbook, London, Library
Association Publishing, 2001.
M. Malinconico, Tecnologie di conservazione del digitale e biblioteche
ibride, in La biblioteca ibrida. Verso un sistema informativo integrato, a

cura di Ornella Foglieni, Milano, Editrice Bibliografica, 2003, p. 165-194,


2003.
C. Paolini, Links: il Restauro Virtuale. Una esperienza della Biblioteca
Nazionale Centrale di Firenze, 21/02/1999,
www.argosproject.org/links/restvir.html.
D. Pearson, Digitisation: do we have a strategy?, "Ariadne", 30 (2001),
www.ariadne.ac.uk/issue30/digilib/.
S. Ross, Changing trains at Wigan: digital preservation and the future of
scholarship, National Preservation Office, NPO Guidance Occasional
Papers, November 2000, www.bl.uk/services/npo/pdf/wigan.pdf.
J. Rothenberg, Avoiding technological quicksand: finding a viable
technical foundation for digital preservation, A report to the Council on
Library and Information Resouces, Commission on Preservation and
Access, Washington, CLIR, 1999,
www.clir.org/pubs/reports/rothenberg/contents.html
M. Santoro, Dall'analogico al digitale: la conservazione dei supporti non
cartacei, "Biblioteche oggi", 19 (2001) 2, p. 52-64,
www.bibliotecheoggi.it/2001/20010208801.pdf.
M. Santoro, Conservare/digitalizzare: l'esperienza dei periodici, in
Conservare il Novecento: la stampa periodica, II Convegno nazionale,
Ferrara, 29-30 marzo 2001, a cura di Maurizio Messina e Giuliana Zagra.
Roma, Associazione Italiana Biblioteche, 2002, p. 160-174.
M. Santoro, Futuro delle memorie digitali e patrimonio culturale,
"Bibliotime", 6 (2003), 3, www.spbo.unibo.it/bibliotime/num-vi3/santoro.htm.
M. Santoro, La conservazione dell'informazione, in Biblioteche e
innovazione. Le sfide del nuovo millennio, Milano, Editrice Bibliografica,
2006, p. 395-498.
M. K. Sitts (edited by), Handbook for digital projects; a management tool
for preservation and access Andover, Massachusetts, 2000,
http://nedcc.org/oldnedccsite/digital/dighome.htm.
A. Smith, Why digitize? Council for Library and Information Resources,
Commission on Preservation and Access, February 1999,
http://www.clir.org/pubs/abstract/pub80.html.
S. Vitali, Una memoria fragile: il web e la sua conservazione, in Dario

Ragazzini - Serge Noiret - Monica Gallai - Luigi Tomassini - Stefano


Vitali, La storiografia digitale, a cura di Dario Ragazzini, Torino, Utet
Libreria, 2004, p. 101-127.

WEBLIOGRAFIA

www.cilea.it/index.php?id=digitalizzazione
Servizio del CILEA che si propone di fornire supporto a progetti di
digitalizzazione di opere cartacee.
ftp://ftp.cordis.lu/pub/ist/docs/digicult/lund_principles-it.pdf
Contenuti europei sulle reti globali. Meccanismi di coordinamento dei
programmi di digitalizzazione, I principi stabiliti a Lund. Conclusioni della
riunione tra esperti, Lund, Svezia, 4 aprile 2001.
ftp://ftp.cordis.lu/pub/ist/docs/digicult/lund_action_plan-it.pdf
Contenuti europei sulle reti globali. Meccanismi di coordinamento dei
programmi di digitalizzazione, Piano d'azione per il coordinamento dei
programmi e delle politiche di digitalizzazione. Seguito della riunione di
esperti, Lund, Svezia, 31 luglio 2001.
www.epi-centre.com/basics/basics1.html
Electronic Photo Imaging at EPIcentre, The art and science of digital
imaging. The analysis of detail. L'arte e la scienza dell'immagine digitale.
www.getty.edu/research/conducting_research/standards/introimages/
Howard Besser, Introduction to imaging, second edition, edited by Sally
Hubbard with Deborah Lenert. Pubblicazione on line che introduce la
tecnologia dell'immagine digitale e la creazione di una libreria d'immagini.
www.griseldaonline.it/informatica/manuale.htm
Sito dove consultabile il seguente testo: Francesca Tomasi, Manuale di
informatica umanistica. Per l'applicazione delle pratiche computazionali ai
testi letterari.
www.ifnet.it/lunati/toscana/manuale/0-INDICE.html
Sito della Regione Toscana per il Servizio biblioteche, musei e attivit
culturali. Qui consultabile il seguente testo: Manuale virtuale per la
progettazione digitale, a cura di Gabriele Lunati e Giovanni Bergamin.
http://it.wikipedia.org/wiki/Digitalizzazione
Sito dell'enciclopedia libera Wikipedia, dove si trova la definizione di
digitalizzazione.
www.manuali.net/corsigratis/intro_corso.asp?ID=99
Sito dove possibile frequentare il seguente corso on line: Metodologie per
la digitalizzazione delle immagini.

www.minervaeurope.org/
Minerva Knowledge Base. Digitising Content Together. Ministerial Network
for Valorising Activities in Digitisation.
www.minervaeurope.org/structure/nrg/documents/charterparma031119finali.htm
Carta di Parma, versione finale, 19 novembre 2003; documento che
riprende e rinforza i principi di Lund, che ne sono il fondamento.
2. Conservazione del digitale
www.archive.org
The Internet Archive. Universal access to human knowledge.
www.digitalpreservation.gov/
The Library of Congress, Digital preservation.
www.dpconline.org/graphics/
Digital Preservation Coalition.
http://en.wikipedia.org/wiki/Digital_preservation
Digital preservation. From Wikipedia, the free encyclopedia.
www.library.cornell.edu/iris/tutorial/dpm/eng_index.html
Digital Preservation Management. Implementing short-term strategies for
long-term problems.
www.netpreserve.org/about/index.php
NetPreserve.org. International Internet Preservation Consortium.
www.oclc.org/programs/ourwork/past/digpresstudy/default.htm
Task Force on Archiving of Digital Information, Preserving digital
information: final report and recommendations.