Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Informatica gestionale
DOCUMENTAZIONE
DIGITALE APPUNTI
LEZIONE
ARCHIVI DIGITALI
Catalogazione definizione ICCD
(Istituto Centrale per il Catalogo e
la Documentazione) : Attività di
registrazione,
descrizione e classificazione di tutte
le tipologie di beni culturali,
individuare e conoscere i beni,
documentarli in
modo opportuno, archiviare le
informazioni raccolte secondo i
criteri.
Formato digitale, ci sono opere nate
in digitale: Film e Fotografia,
ebook. Altre vengono convertite in
quello che si
chiama “equivalente digitale”,
processo di cui vie e una cattura dei
dati reali, una foto digitale, una
scansione di un
libro, Processo di
DIGITALIZZAZIONE che
permette la conversione da opera
fisica a opera digitale. Viene
imposto
uno standard per la digitalizzazione
che assicurano la qualità e
l’interoperabilità del risultato.
Data Deluge: diluvio di dati, dovuto
sempre di più ad un ammassamento
ad onda di dati reali che diventano
digitali,
con musei virtuali, consultazione di
testi in formato digitali, la scienza
con le pubblicazioni, grandi
quantità di dati
(dataset)
Modo in cui gli archivi digitali si
manifestano si articola in alcune
aree generali:
Biblioteche digitali (Digital
libraries) dove le risorse sono
conservate in forma digitale
(PERSEUS digital
library)
Archivi digitali (Digital
archives) dove il materiale più
eterogeneo in archivi – formati
diversi, spesso legato
all’attività di un’istruzione (archivi
di film, musica, immagini, teatro,
ecc..)
Digital repository: un
“deposito” scarsamente strutturato
di documenti
Scopi della conservazione:
Conservazione; conservazione a
lungo termine del bene/risorsa, la
conservazione delle risorse digitali
ha
problematiche specifiche
Fruizione: ricerca e accesso alle
risorse da parte del pubblico che
può essere generico o specialistico
Studio: lo studio da parte di
specialisti della risorsa
Digital rights management:
Gestione dei diritti nel contesto
digitale
CATALOGO/METADATI/ARCHI
VIO
Archivio: raccolta di beni culturali.
Opere o documenti (risorse) sono
descritti in un catalogo
Catalogo: insieme di schede, che
descrivono le opere (titolo,
dimensioni, argomenti, autore,
ecc…) forma strutturata
che contengono i Metadati,
Metadati: sono la descrizione dei
dati, contengono informazioni
diverse: Metadati Amministrativo-
Generali, MAG
che corrispondono alla gestione e
alla amministrazione, come
responsabilità, provenienza e
proprietà; relative al
contento come ad esempio autore,
formato, ecc… (ES. di scheda
metadati DUBLIN CORE)
Schede di catalogo hanno le schede
gemelle con la stessa struttura con
le stesse proprietà, situazione di
grandissima
confusione se la condizione non è
corretta, bisogno di omogeneità
Schede di metadati: Dublin (Non
Dublino, nome nasce da Dublin in
Ohio, USA) core, si trova ovunque,
schema di
metadati, schema descrittivo per
rappresentare dati di una
determinata risorsa, Nata per il
WEB, è lo schema di
metadati più semplice (ISO 15836),
nato per essere una base per tutta la
documentazione. Ha lo scopo
esplicito di
permettere il reperimento di risorse
(Web risorse). Con Dublin Core si
può descrivere qualsiasi cosa,
descrive le
risorse, risorsa per essere tale deve
avere un’identità, identità è un
indirizzo internet, secondo lo
standard RFC2396 (lo
standard che si riferisce all’URI),
risorsa può essere informazione o
indirizzo in senso più ampio. DCMI
(Dublicn
Core Metadate Initiative) ha una
typelist: collection, dataset, ecent,
image (still or moving), interactive,
resourse,
service, software, sound, text,
physical object.
Elementi fondamentali del Dublin
Core (DC-MES Metadate element
set): Title, Creator,
Subject, Descripion, Publisher,
Contributor, Date, Type, Format,
Identifier, Source,
Language, Relation(relazione con
altre opere), Coverage e Rights.
1
Si può identificare qualsiasi cosa
come la canzone in esempio o una
immagine, anche una gif, anche una
statua. I vari
elementi possono essere ripetuti
seguendo sempre la massima
descrizione di una risorsa. Bisogna
attingere dallo
standard Dublin Core.
Bisogna digitalizzare ovviamente lo
schema fatto (in questo caso a
matita, o su slide), il processo
permette al contenuto logico dello
schema di metadati (nozione
astratta) di essere in un formato
machine-readble (XML, RDF e
JSON) si chiama
SERIALIZZAZIONE.
In esempio è la serializzazione per
un file audio chiamato “A Guide
to Growing Roses” di “Rose Bush”,
esempio fittizio, in scrittura
XML (leggibile), tag html che
corrispondono al Dublin Core
<dc:title>A Guide to Growing
Roses</dc:title> segnalano alla
macchina che gli elementi tra i tag
fanno parte del Dublin Core, in
modo comprensibile è leggibile sia
per noi sia per la macchina.
Formato JSON è un formato meno
comprensibile, formato adatto allo
scambio di dati improntato sugli
array Javascript, annidati uno negli
altri,
primo livello contengono key words
precedute dalla @ ( in esempio
laterale
@type appartiene al tipo Library
che contiene all’interno ciò che è
racchiuso
nelle parentesi graffe dopo la riga
“contains” contiene un @subject ,
un
“@type”=”ex:Book” (un libro)
“dc:creator”: “Plato”, “dc:title:
“The
Republic” ( il libro è la Repubblica
di Platone che a sua volta contiente
Capitoli ecc…) permesso da JSON
è il forte annidamento dei dati.
Tra gli esempi di possibilità da
remoto di indagine delle
documentazioni
digitali vi sono: Europeana, MET
Galleries, British Museum, ecc…
MODELLO OAIS
Modello OAIS descrive un modello
astratto di archivio, non è
architettura concreta, è un modello
di funzionamento
dell’archivio, orientato alla
conservazione di dati, il modello è
funzionale, perché si concentra sulle
funzioni principali
dell’archivio: inserimento,
consultazione e conservazione dei
dati. Descrive un insieme di
funzioni che si interfacciano
ad uno schema predefinito (modello
funzionale), i dati immensi
nell’archivio vengono resi
accessibili al fruitore
attraverso l’intervento del gestore
dei dati. Da notare che è definita
rispetto al concetto di comunità
designata,
riconoscendo il fatto che l’archivio
ha la finalità di consultazione di una
singola comunità che poi utilizzerà i
dati.
Per quanto riguarda le funzioni di
base (Entità funzionali)
OAIS (dispensa) riconosce 4
funzioni base: Ingest, ha il
compito di ricevere i dati del
produttore e predisporli per la
memorizzazione; Archival Storage,
gestisce la
memorizzazione dei dati; Data
Management gestisce il
database; Access supporta l’accesso
ai dati da parte
dell’utente. In figura vengono
evidenziatii flussi interni
dell’archivio Producer inoltra i dati
(pacchetto informativo
SIP) alla funzione Ingest che
conterrà il dato e la descrizione
(metadati), dato inoltrato poi alla
funzione Archival Storage,
verrà rappresentato in un luogo
(cartella, ecc…) invece
l’indirizzo dove è stata messa la
risorsa e i metadati della
risorsa vengono inviati da Ingest
(NO da Archival Storage) a
Data Management che viene assolto
tipicamente dall’utilizzo di un
Database, nel momento in cui
avviene l’accesso e
si interfaccia (da sito, es.
Europeana) digita una keyword o
usa una risorsa, l’archivio viene
interrogato e viene
inoltrato la funzione di accesso che
recupera dati.
2
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!
SCARICA
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!
SCARICA
Dublic Core) i loro metadati
secondo i protocolli OAI-PMH.
Service Providers richiedono di
poter raccogliere i
metadati che vengono esposti dai
Data providers. Funziona via HTTP
seguendo il protocollo ipertestuale,
permette ai
providers di comunicare tra loro.
OAI-PMH permette in
comunicazione HTTP una serie di
sei servizi (in esempio solo
uno). L’operazione di Harvesting è
una richiesta da parte di un Service
providers di accedere ai dati
contenuti in una
serie di repository, in sé è
un’applicazione client che effettua
una richiesta OAI-PMH, il mezzo
con cui il Service
Provider raccoglie i metadati da un
repository si chiama harvester.
Repository (Definizione) è un
server accessibile in
rete che può rispondere alle
richieste OAI-PMH come descritto
dallo standard. Questa è gestita da
una Data Provider
per esporre i metadata agli
harvester. Risorsa (resource) è
oggetto di cui il metadato parla (con
about). Item è un
contenitore contiene i metadati
(statici o generati automaticamente)
su una singola risorsa, in formati
multipli che
possono essere raccolti via OAI-
PMH, ogni item ha un identificativo
che è unico nel repository in cui fa
parte. Record
è un insieme di metadati in un certo
formato, normalmente restituito in
formato XML, normalmente è
identificato da
un prefisso (Prefix) che delinea il
formato dei metadati, da un
identificativo unico che permette
l’accoppiamento con
l’item a cui appartengono, inoltre
viene identificato anche da un
datestamp che ci dice quando sono
stati generati quei
dati. GetRecord (comando
all’interno del protoccolo OAI-
PMH) recupera un singolo record di
metadati (una scheda)
da un repository, il funzionamento è
in figura. (si chiede arXiv.org il
record con l’item che ha come
identificativo
0112017, formato in formato
Dublin core)
RICHIESTA:
RISPOSTA:
La risposta avviene in xml e
descrive l’item con tag in HTML,
che
portano informazione, il record ha
un header che contiene le
informazioni generali della risorsa,
con l’identificativo, con il
datestamp
e il tag setSpec che precisa l’ambito
di appartenenza dell’articolo in
questo caso matematica e computer
science, dopo l’header abbiamo i
metadati in formato Dublin Core,
che ci inoltrano il titolo, il creato e
il
soggetto (argomento).
SISTEMI PER LA GESTIONE DI
BASI DI DATI (DBMS)
Database management system: vi è
differenza fra dati manipolati in un
formato che risponde ad un modello
concettuale e lo strumento per
creare e gestire i documenti in tale
formato.
Dati e Metadati sono diversi, i primi
hanno entità e proprietà mentre i
metadati sono i nomi delle entità e
delle
proprietà e il tipo dei valori delle
proprietà, nel DB sono
rappresentate entrambi, i metadati
sono parte dei dati. Un
esempio è Donald Duck. I dati
sono: Donald Duck, 0101111, Via
Principale 15, Paperopoli. I
metadati sono che
Donald Duck è una stringa di
caratteri e rappresenta un nome
proprio, 0101111 è un numero e
rappresenta un numero
di telefono e Via Principale 15,
Paperopoli è una stringa di caratteri
e rappresenta un indirizzo.
ATTENZIONE: i
metadati delle risorse nel mondo
degli archivi nel DB sono i dati veri
e propri che a loro volta devono
essere descritti,
nel DB i dati veri e propri sono
separati dalla loro descrizione.
Relazioni tra i dati nel database. Nei
DB i dati sono strutturati secondo le
relazioni logiche tra di essi,
esempio Donald
Duck abita a Paperopoli, perciò
tendono a essere autodescrittive, i
dati non sono duplicati, utenti
diversi possono
condividere gli stesi dati e tutti
agiscono sulla stessa
rappresentazione, tutti accedono
agli stessi dati, se lavorano su
stesso DB, un senso contrario
all’uso quotidiano dell’informatica
(esempio i file docx sul mio
computer li posso
5