Sei sulla pagina 1di 5

Gli archivi

Archivi insieme di informazioni che hanno delle determinate caratteristiche

Queste informazioni sono organizzate in modo tale da essere reperibili in qualsiasi momento e sono
memorizzate con una struttura, un formato ben preciso (es, in una rubrica telefonica la struttura che si
ripete è nome, cognome e telefono).
L’insieme di queste informazioni prende il nome di record, quindi un archivio è un insieme di record.

Record informazioni di un singolo soggetto.


Tutte le informazioni presenti in un record si chiamano campi.

Istanza termine spesso utilizzato come sinonimo di record.


File è una collezione di record.

Quando vengono cambiati alcuni dati in un record, si parla di manipolazione dei dati.
Tutte le informazioni vengono solitamente caricate nelle memorie di massa che ci permettono di
conservarle per sempre. Le memorie di massa vengono chiamate anche memorie ausiliari perché sono
un’estensione della memoria centrale (es. chiavetta USB).

Ultimamente solo molto utilizzati anche i cloud (es. google drive, dropbox) per conservare queste
informazioni.
Le memorie di massa sono caratterizzate da alcuni parametri fondamentali:

• Tipo di accesso: sequenziale (legge le informazioni nell’ordine in cui sono state inserite senza
possibilità di saltarle es. nastro) o diretto (permette di saltare le informazioni e andare
direttamente a quella che ci interessa es. CD);
• Capacità: quantità di informazioni che possono essere inserite in un supporto;
• Tempo medio di accesso: tempo impiegato per visualizzare i dati (misurato in millisecondi: ms);

• Velocità di trasferimento: velocità con la quale i dati vengono trasferiti dalla memoria di massa
alla memoria centrale (in Kb/sec).
Le unità periferiche sono gestite da apparecchiature dette drive, che sono collegate al computer tramite
opportune schede di controllo (controller)e consentono la registrazione o l’accesso ai dati già registrati.

Il codice binario più usato nei computer moderni è il codice ASCII (8 bit). I 256 caratteri rappresentabili
con il codice ASCII sono diventati insufficienti, per questo viene utilizzata la codifica Unicode.
Oltre ai bit che compongono le informazioni, sui supporti di memoria di massa vengono registrati anche i
bit di controllo, detti bit di parità.

Bit di parità bit che viene aggiunto alle sequenze di bit che rappresentano i dati.
La parità può essere pari (aggiunto un bit 1 o un bit 0per rendere pari il numero di bit con valore 1) o
dispari (rendere dispari il numero dei bit a 1). In fase di lettura, questo viene controllato tramite il
controllo di parità.
Quando i record vengono memorizzati all’interno della memoria essa viene divisa in blocchi che possono
essere adiacenti.
Record logico nome, cognome, paese

Record fisico blocco dove vengono salvati i dati. Se questo blocco è grande, su di esso vengono salvati più
record logici.
Il fattore di blocco dice quanti record logici sono contenuti in un record fisico. Se in un record fisico è
presente solo un record logico, il fattore di blocco è pari a uno e si dice “a record sbloccati”.

Il modulo che svolge le funzioni di gestione dei file viene chiamato file system. Funzioni:
• Tiene traccia dei file usando particolari strutture dette file directory;

• Decide secondo le richieste a quale programma assegnare un file o una parte di esso;
• Assegna un file al programma che lo ha richiesto;
• Toglie l’uso di un file a un programma rendendolo disponibile ad altri programmi.

Le copie di sicurezza e la fault tolerance

Copie di sicurezza backup

Il backup è l’azione di copiare periodicamente i dati per evitare di perderli.


È sempre necessario tenere più copie degli stessi file su diversi dispositivi e in ambienti diversi.

L’azione inversa al backup è il restore, il recupero dei dati da una copia precedente.
Altri modi per non perdere i dati:

• UPS (Uninterroptible Power Supply) è un gruppo di continuità, che serve a proteggere il


computer da inconvenienti sulla rete elettronica (cadute di tensione, interruzioni temporanee
della fornitura di energia elettrica)

• Fault tolerance:
La fault tolerance è la tolleranza dei guasti e può essere realizzata in diversi livelli:

• Mirroring: consente di avere nelle unità di memoria di massa due copie dello stesso disco. Le
operazioni di scrittura vengono effettuate su tutte e due le copie, garantendo un backup
continuamente aggiornato.
• Duplexing: consiste nella duplicazione dell’unità di controllo dei dischi (controller) oltre che dei
dischi.
• Duplicazione dell’intero sistema: viene garantita la continuità del lavoro a fronte di un guasto a
una qualsiasi delle parti del sistema.

Le basi di dati
Il database è una collezione di archivi organizzati. Per gestire un database si utilizzano dei software: le
DBMS (DataBase Management System).
I database vengono utilizzati da utenti diversi con programmi diversi. Cioè, tutti devono poter accedere ai
dati anche con applicazioni diverse.

Gli archivi devono essere efficienti, quindi facilmente consultabili. Deve essere garantita la consistenza,
cioè i dati in essere significativi.
Altra caratteristica è la sicurezza dei dati, significa impedire che i dati vengano danneggiati.

Infine l’integrità, significa impedire che i dati vengano persi.


Database distribuiti sono dei database che sono utilizzabili anche da un altro computer.

Organizzazione degli archivi mediante basi di dati


Un DBMS deve essere in grado di:

• Permettere la creazione di una nuova base di dati. La creazione della base di dati avviene
mediante un apposito linguaggio che prende il nome di linguaggio di definizione dei dati, ovvero
DDL (Data Definition Language).
• Facilitare l’utente nell’inserimento, nella cancellazione e nella variazione di dati, tramite la
manipolazione dei dati, DML (Data Manipulation Language).

• Rendere possibile l’estrazione di informazioni tramite un linguaggio di interrogazione, QL (Query


Language).
• Effettuare le precedenti operazioni con un linguaggio semplice.

Caratteristiche fondamentali di un DBMS:


• Facilità di accesso;

• Indipendenza dalla struttura logica dei dati;


• Indipendenza dalla struttura fisica dei dati;

• Eliminazione della ridondanza;


• Eliminazione della inconsistenza;

• Integrità dei dati;


• Utilizzo da parte di più utenti;
• Controllo della concorrenza;
• Sicurezza dei dati.

La descrizione dei dati è formata dai metadati, cioè dati che descrivono i dati, e prende il nome di
dizionario dei dati o anche catalogo dei dati (in inglese, data dictionary).

I modelli per il database


Il database è un modello della realtà considerata. Per descrivere i dati si fa uso di modelli di dati. Il più
generale è noto come modello concettuale, seguito dal modello logico dei dati e infine si trova il modello
fisico che si occupa della registrazione dei dati sulle memorie di massa.
Modello concettuale (modello a livello di oggetti)
Tra i numerosi modelli proposti per la progettazione concettuale, i più noti sono il modello orientato agli
oggetti e il modello Entità/Associazioni (E/R, dall’inglese Entity/Relationship).
Nella costruzione del modello E/R di una realtà si individuano gli oggetti che la compongono dette entità,
gli attributi, che rappresentano le caratteristiche dell’entità, e infine le associazioni che individuano le
correlazioni logiche tra entità.

Modello logico (modello a livello di record)


Il modello logico comprende le strutture di dati che organizzano i dati, in modo da consentire le
operazioni di manipolazione e di interrogazione.

Nello sviluppo della teoria dei database, sono emersi tre diversi tipi di modelli a livello di record per le
basi di dati: il modello gerarchico (1960), il modello reticolare e il modello relazionare (usato ai giorni
d’oggi). Tra i modelli citati è diventato predominante l’uso del modello relazionale.
Il modello relazionale rappresenta il database come un insieme di tabelle. Viene considerato attualmente
il modello più semplice ed efficace, perché è più vicino al modo consueto di pensare i dati e si adatta in
modo naturale alla classificazione e alla strutturazione di essi.

Il modello relazionale nasce nel 1970, proposto da Edgar F. Codd. Si basa su alcuni concetti
fondamentali:
• Utilizzare il linguaggio matematico, perché conosciuto a livello universale dove ogni simbolo ha
un solo significato;

• Eliminare i problemi di ambiguità nella terminologia e nella simbologia.


La diffusione del modello relazionale è cresciuta nel tempo in coincidenza con la crescita della capacità
delle memorie centrali e della potenza di calcolo dei processori, che hanno permesso di manipolare le
tabelle con sempre maggior rapidità. Invece i database costruiti sul modello gerarchico e relazionale,
meno esigenti in termini di prestazioni dell’hardware, erano più adeguate alle limitate prestazioni delle
macchine degli anni ’70.

Le operazioni sui database gerarchici e reticolari, agiscono sui singoli record che vengono identificati
specificando i percorsi per ritrovarli. Si dice in tale caso che l’approccio adottato nell’elaborazione dei
dati e di tipo procedurale, ovvero bisogna indicare al computer come deve fare per trovare i dati. I
sistemi relazionali adottano invece un approccio di tipo dichiarativo nell’elaborazione delle informazioni,
in quanto viene specificato cosa si vuole trovare, mentre i percorsi per trovare i dati sono a carico del
sistema.
Modello fisico
Il modello fisico dei dati ha la funzione di descrivere il modo con il quale un dato modello logico è
mappato sulle memorie di massa del computer.

Potrebbero piacerti anche