Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
FRANCO GUADAGNI
Linvito alla riflessione sulla volatilit delle informazioni archiviate in formato digitale stato un gradito stimolo sia da un punto di vista professionale che personale. La questione ha infatti grande rilevanza a livelli diversi, poich lera digitale ha ormai superato la fase iniziale in cui le tecnologie basate sulla logica binaria erano appannaggio dellindustria dei computer e della produzione commerciale di informazioni, per atterrare pesantemente nella vita quotidiana di ognuno di noi. La vendita di fotocamere digitali ha superato quella delle vecchie macchine fotografiche analogiche, e gran parte di coloro che amano videoregistrare vacanze o occasioni importanti hanno la possibilit di masterizzare i ricordi audiovideo nello stesso formato professionale, MPEG2/DVD, in cui vengono commercializzati i film dautore. Il problema della conservazione dellinformazione binaria perci ormai condiviso dalle grandi istituzioni del sapere (Universit, archivi pubblici e privati, Enti di ricerca), dalle multinazionali dellinformazione (editoria, musica, cinema) e da ogni settore del mondo professionale, ma anche dai privati che sempre di pi affidano ai bit impressi su supporti quali CD, DVD ed hard disk le proprie memorie private e i ricordi personali. Come spesso capita quando si fanno confronti tra il mondo professionale ed il mondo dei consumatori, la dimensione quantitativa del problema nel secondo caso (come vedremo nel seguito) di qualche ordine di grandezza superiore al primo, motivo per cui ha almeno altrettanta dignit ed importanza. Per questo, nella necessit di focalizzare il problema per una breve trattazione, ed anche in considerazione della formazione e delle competenze personali, ho deciso di affrontare la tematica dal punto di vista delle esigenze ed aspettative delluomo comune.
sintesi riportato nelle figure seguenti d una dimensione (se non altro relativa) dellimportanza dellinformazione digitale prodotta dal mondo privato rispetto a quella prodotta in ambiti professionali. Le dimensioni assolute sono quasi vertiginose: lunit di misura il Terabyte (1012 byte), che possiamo in maniera semplicistica rappresentare come il contenuto informativo di unipotetica biblioteca in cui siano custoditi un milione di volumi, ognuno di mille pagine ed in cui ogni pagina contiene mille caratteri. Il Terabyte diviene comunque presto una
1. Introduzione
La quantit di informazione generata nel mondo da qualche tempo oggetto di studio in vari ambiti, ed in particolare i dati qui riportati prov e n g o n o d a u n p ro g e t t o d e l l a S c h o o l o f Information Management and Systems dellUniversit della California a Berkeley (www.sims.berkeley.edu/research/projects/howmuch-info-2003/), che ha dato una panoramica dellinformazione originata nel 2002. Il tentativo di
32
unit di misura troppo minuTerabytes scola per tenere conto di Fonte: Berkeley University 3500 tutta linformazione generata How much information Project nel mondo, e si parla perci 3000 anche di Petabyte (equivalente a mille Terabyte) o di 2500 Exabyte (equivalente a mille Petabyte). Uno sguardo ai 2000 grafici delle figure 1 e 2 ci dice in quali categorie 1500 ricade linformazione, e quali sono i settori che ne produ1000 cono in maggiore quantit. Gi il primo grafico ci 500 dice che linformazione privata prodotta sotto forma di 0 messaggi testuali (SMS, utilizzati pi frequentemente in Europa, ed Instant Messages Internet, pi usati negli Stati Uniti) circa dieci volte superiore a quella di tutti i FIGURA 1 Informazione prodotta nel mondo nel 2002. libri stampati nel mondo n e l l o ste sso peri o d o . L o stesso grafico ci dice che, della conservazione della memoria uno dei vangrossomodo, linformazione dei messaggi testuali taggi principali dellinformazione numerica, la sua privati (SMS+IM) equivalente alla somma di non deteriorabilit (intesa come degrado della sua quella contenuta in libri, giornali, DVD e CD audio pu bbl i c a ti n el l o stesso periodo! Il grafico mostra un Terabytes primo salto passando alle Fonte: Berkeley University 1400000 How much information Project trasmissioni radiofoniche, che generano una quantit 1200000 di informazioni circa dieci volte superiore a quella delle 1000000 precedenti categorie sommate tra loro. Il cambio di 800000 scala che porta al secondo grafico impressionante. 600000 Qui lordine di grandezza di ve n ta ol tre cen to vo l te 400000 quello di prima. Abbozzando una somma globale, si pu 200000 osservare come la somma di h ome vi de o e fo to g rafi a 0 generi una quantit di informazione circa 20 volte superiore alla somma di tutte le fonti professionali di informa zi on e , te levi si o n e e cinema compresi. La conservazione affida- FIGURA 2 Informazione prodotta nel mondo nel 2002. bile di questa enorme quantit di dati un problema di qualit in qualche modo lineare nel tempo) rischia una dimensione consona ai numeri a diciotto cifre di tradursi in un altrettanto grave difetto. La che essa sottende. stampa di una fotografia invecchia ingiallendo, sgualcendosi, sporcandosi, ed una volta che il 2. La conservazione analogica e quella digitale degrado analogico ha agito, ben poco si potr fare per riportarla al suo aspetto originario. Non obiettivo di questo articolo ricordare i Una foto digitale una sequenza di bit che una vantaggi che la produzione e memorizzazione digivolta archiviata si mantiene costante nel tempo, tale dellinformazione comporta. Dal punto di vista finch i bit siano leggibili. Ma proprio per la natura
SMS + IM CD Audio Giornali Radiografie Fotografia Cinema Internet Radio DVD Libri Televisione Video privati
33
fisica dei supporti digitali e degli strumenti che li sanno leggere, il pericolo che la foto dun tratto scompaia Other Magnetic Tape CD perch i bit non si riescono 10 - 30 years 5 - 100 years piu a leggere, per motivi che indagheremo tra breve. E, Newspaper Microfilm cosa ancora peggiore, vista 10 - 20 years 10 - 500 years la sorprendente capacit (nel senso quantitativo del termine) dei supporti digitali, Data-grade Photographic slides VHS video VHS video il rischio che pi frequente10 - 30 years 100 years mente si corre quello della perdita non di una sola foto Digital linear tape Archival-grade acid-free paper o di una sola canzone, ma 10 - 300 years 100 - 500 years di centinaia di esse in un colpo solo, con la semplice Fonte: Egyptian Stone Tablet Michael Gilbert, perdita di un CD-ROM o di Univ. of Massachusset 2.200 years parte di esso. A scanso di equivoci bene comunque ricordare che per quanto si usi spesso il termine virtuale per indicare linformazione digitale, FIGURA 3 Una rappresentazione grafica della durata dei supporti fisici. la sua memorizzazione si traduce comunque in fatti f i si c i c h e m odi fi can o u n di essi. La figura 3 riporta una sintesi tratta proprio qualche supporto materiale (es. la superficie rifletdallarticolo di Gilbert, che nello stesso suggerisce tente di un disco ottico), pertanto il degrado del anche alcuni espedienti per far s che la durata dei mezzo fisico non di per s troppo differente da supporti fisici dei bit sia la pi lunga possibile. quello cui destinata la pellicola di un film. Ma la La longevit delle incisioni su pietra evidentedensit di impacchettamento dellinformazione in mente difficilmente eguagliabile, ma anche se ci un mezzo digitale trasforma quello che su una foto accontentassimo di un periodo minore (alcune un graffio o uno strappo in una irrimediabile perdecine di anni potrebbe considerarsi gi una buona dita di milioni di bytes, traducendosi in un evento durata per i supporti digitali), purtroppo il degrado molto pi traumatico dal punto di vista del recufisico dei supporti solo uno dei pericoli che pero dellinformazione, proprio perch linformaminano la conservazione digitale della memoria. zione nascosta sotto un graffio sulla superficie di un CD enormemente superiore a quella che esso nasconde sulla superficie di una fotografia .
34
zare archivi dellordine di qualche centinaio di Megabyte. Daltronde i miei venticinque anni di vita professionale mi consentono di ricordare i floppy disk da otto pollici (contenevano ben 200 Kbyte di informazione!); sicuramente per trovare oggi un lettore in grado di recuperare i bit da quegli aggeggi dallaspetto antidiluviano bisognerebbe andare in un museo dellinformatica. E stiamo parlando di soli trentanni orsono .
nici, la Adobe, proprietaria del formato PDF (Portable Document Format) ha attivato una collaborazione con lorganizzazione internazionale di standardizzazione ISO per la pubblicazione di uno standard di derivazione del formato PDF, per consentire la sua decifrabilit svincolandola dalluso di un software specifico di propriet dellazienda.
35
7. Che fare?
Lutilizzatore non professionale di tecnologie informatiche ha, come abbiamo visto in precedenza, la stessa esigenza di conservazione dellinformazione e si scontra con problemi simili a quelli, ad esempio, di una istituzione accademica che deve memorizzare il patrimonio culturale rinchiuso in documenti cartacei vecchi di secoli. Naturalmente i mezzi economici a disposizione sono diversi, come lo sono le dimensioni dei problemi da affrontare, ma la larga diffusione di tecnologie di memorizzazione a basso costo (es. masterizzazione di CD e DVD) pu in alcuni casi creare un vantaggio per lutilizzo in entrambi i contesti. Apparecchiature molto complesse che sono state proposte nel recente passato per larchiviazione industriale dei dati (ad esempio costosi jukebox di dischi ottici particolari) rischiano di essere meno sicure rispetto a mezzi pi popolari ed economici: vendute in pochi esemplari esse sono infatti soggette a rapida obsolescenza, con conseguente perdita in maniera quasi definitiva di grandi moli di dati. Tutti i pericoli elencati possono essere affrontati seguendo semplici norme di comportamento: una buona manipolazione ed una idonea archiviazione sono le regole indicate da Michael Gilbert (nel suo articolo gi citato) contro il deterioramento fisico dei supporti; luso di tecnologie di storage non di nicchia ma invece ad ampia diffusione (es i CD/DVD) alleviano il rischio di non disporre di lettori con esse compatibili; luso di formati il pi possibile standard per conservare documenti, immagini e filmati - rifuggendo da formati proprietari magari molto pi di moda - protegge la leggibilit futura dei bit immagazzinati; infine luso ragionato e praticato solo in caso di effettiva necessit di tecniche di protezione basate su cifratura dei dati scongiura il rischio di dimenticare il PIN (incubo di tutti i possessori di bancomat ...). Ma c di pi .
nale digitale, ogni sua copia, anche dopo mille riproduzioni, gli sar fedele bit per bit1. naturalmente possibile, ed anzi consigliato, trar profitto da questa caratteristica per scongiurare la perdita soprattutto dei ricordi digitali che si hanno pi cari, conservandone pi copie. In questa pratica le leggi di Moore, che si applicano ancora perfettamente allandamento dei costi e delle prestazioni delle attrezzature informatiche, ci danno una buona mano. Nella figura 4 rappresentato lo stato dellarte della memorizzazione digitale al momento della stesura di questo articolo (sicuramente chi lo legger trover questa informazione gi sorpassata e ci che oggi sembra quasi miracoloso pensando a ieri, domani sar roba vecchia). Recentemente stata sfondata la barriera del Terabyte per hard disk da Personal Computer di classe media, quelli usati dagli utenti privati pi tecnologicamente avanzati.
La miniaturizzazione consente di immagazzinare 40 Gigabyte in un HD delle dimensioni di una moneta da un euro, e persino tecnologie pi sofisticate come quelle delle memorie a stato solido (es. flash memory) hanno capacit dellordine dei Gigabyte, come si pu vedere nella figura 4. I costi naturalmente dipendono dal tipo di supporto, ed oggi si va dai circa 70 euro per Gigabyte per le tecnologie a stato solido (Flash, SD e similari), ai 10 centesimi di euro per quelle ottiche (DVD) passando per i circa 40 centesimi di euro al Gigabyte per gli hard disk magnetici. Prezzi che potremmo definire popolari, visto che la memorizzazione di due ore di video amato(1)
Questo a patto che nel processo di copia non si modifichi loriginale, ad esempio comprimendolo con tecniche a perdita dinformazione (JPEG una di esse). Il processo di editing, salvataggio, compressione dellinformazione (es. foto o musica) d luogo a cambiamenti spesso irreversibili. sempre buona norma perci mantenere almeno una copia delloriginale, che contiene tutta linformazione catturata al momento della registrazione.
36
riale alla massima qualit pu essere effettuata su un singolo DVD del costo di meno di un Euro. E ancora la ricerca non si ferma: tecnlogie ottiche basate su laser che operano nella zona del blu/indaco sono gi sulla rampa di lancio commerciale (previsto inizialmente per il 2005, ed ormai in ritardo di circa un anno) promettendo dischi che nelle dimensioni di un CD/DVD attuale potranno immagazzinare da 15 a 50 Gbyte a seconda dello standard utilizzato. Il miglioramento destinato a continuare, come si desume esaminando nella figura 5 le linea di tendenza di capacit e costi delle memorie. Il grafico a destra (fonte:IBM Computers), pur essendo vecchio di oltre cinque anni, predice con sufficiente precisione la situazione attuale (addirittura approssimando per difetto le capacit disponibili), mentre quello di destra ci fa vedere quale sar la probabile situazione di qui a dieci anni per quanto riguarda il costo unitario delle memorie di massa.
Le previsioni IBM di 5 anni fa sono state rispettate ... Costo di 1 Terabyte di memoria (dollari) 100.000.000 10.000.000 1.000.000 100.000 10.000 1.000 100 10 1 1985 1995 2005 2015 Andamento del costo unitario della memoria di massa, con previsioni fino al 2015
9. Aumentano le esigenze
Se tanta abbondanza pi che sufficiente per gli scopi prevedibili a breve, gli scrutatori (e i costruttori) del futuro stanno immaginando scenari in cui anche una moltiplicazione per mille delle capacit attuali (o una corrispondente riduzione dei costi) avranno un senso per soddisfare bisogni scaturiti da nuove mode e comportamenti. Il dilagare dei diari in rete, i cosidetti Blog, con le loro pi recenti versioni multimediali, fanno intravedere la possibilit, nel prossimo futuro, di avere a disposizione una registrazione quasi totale delle proprie esperienze di vita.
(2) FIGURA 5 Linee di tendenza e costi delle memorie.
Sensecam un progetto Microsoft in cui una macchina fotografica (o, in futuro, una videocamera) indossata come accessorio di abbigliamento riprende ci che succede intorno al portatore e lo scarica tramite rete su un archivio. Lifeblog un progetto Nokia similare, che ha per protagonista naturalmente un telefonino in grado di effettuare riprese video che vengono scaricate in tempo quasi reale su un sito Web via collegamento di telefonia mobile UMTS.
Sembra fantascienza, ma se aziende del calibro di Microsoft e Nokia 2 hanno dato vita a progetti di ricerca in queste direzioni, c da aspettarsi che prima o poi qualcosa del genere accada. C comunque un limite alla quantit di informazioni che ognuno di noi pu generare (e verosimilmente voler archiviare), e memorie di qualche Terabyte3 costituiscono probabilmente un ordine di grandezza accettabile per la conservazione di tutto ci che vorremo trattenere. Se le tendenze previste saranno confermate, i problemi di quantit e costi saranno presto risolti in maniera positiva, consentendoci di duplicare a basso costo gli archivi digitali cui siamo pi affezionati, rendendo pi improbabile una loro prematura scomparsa.
(3)
Per avere un termine di riferimento, si consideri che la completa archiviazione in formato DVD a buona qualit di tutta la produzione cinematografica italiana, dalle origini ad oggi (circa 4000 titoli) richiederebbe meno di 20 Terabyte.
37
Computer del mondo possa essere disponibile e ricercabile in rete. Questa sarebbe di gran lunga la pi grande biblioteca che lumanit abbia mai concepito, una biblioteca in perenne rapida evoluzione, in cui in ogni momento nuova informazione sarebbe disponibile ma anche vecchia informazione verrebbe persa, tutte le volte che una persona cancellasse un file dai suoi archivi. Lultima riflessione che vorrei proporre riguarda la somiglianza della situazione descritta sopra con quella di una memoria biologica, che continuamente apprende e che dimentica le cose meno importanti: anche in questo enorme archivio dinamico le cose pi interessanti sarebbero replicate migliaia di volte, in tutte le memorie locali di coloro che, per un motivo o per laltro, avessero copiato localmente linformazione. Informazione destinata a morire quando, dimenticata da tutti, fosse cancellata anche dallultimo hard disk in cui era stata scritta. Cos, sarebbe interessante sapere se la sorte di questa memoria (si perdoni il calembour ) sar quella di durare di pi sulla carta su cui verr stampata o nella forma digitale in cui stata prodotta, e se un pronipote avr maggiori probabilit di ritrovare questa mia piccola eredit ricercandola tra i vecchi libri in soffitta, o nel suo computer, oppure nella rete .
ABBREVIAZIONI
American Standard Code for Information Interchange Digital Right Management Digital Video Disk Instant Messaging Joint Photographic Expert Group Motion Pictures Experts Group Portable Document Format Portable Network Graphics Short Message Service Tagged Image File Format
Sto pensando qui ai cosidetti Media Center, computer che collegandosi al televisore agiscono da intermediari tra il mondo dellinformazione digitale e quello del broadcasting, che sta anchesso digitalizzandosi (Televisione Digitale Terrestre, canali digitali satellitari, TV via Internet, ...).
F r a n c o G u a d a g n i si laureato in Ingegneria Elettronica all'Universit di Pisa e l a v o r a d al 1 9 8 1 i n Te l e c o m Italia. Professionalmente si occupato dapprima di reti dati, collaborando alla introduzione in Italia della prima rete dati a pacchetto focalizzandosi in seguito sul settore applicativo delle reti di computer (posta elettronica, file transfer). Dal 1990 il suo interesse professionale si spostato sulla rete Internet, concentrandosi soprattutto sugli aspetti di applicazioni e servizi. Dal 1995 al 2000 ha rappresentato Telecom Italia allinterno del World W ide Web Consortium, ha avuto partecipazione attiva a diversi organi di gestione/amministrazione di Internet in Italia. Oggi responsabile dellingegneria dei sistemi di Messaggistica Telecom. Nel corso della sua carriera ha pubblicato numerosi articoli su riviste di settore ed ha contribuito con presentazioni ed interventi a convegni di rilevanza nazionale ed internazionale.
38