Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2. Strumenti a disposizione: Hw e Sw
2.1. il calcolatore elettronico, reti di calcolatori e software distribuiti
5. Linguaggio XML (eXtensible Markup Language) per definire e controllare il significato degli elementi contenuti in un documento
5.1. il concetto di metadata e Document Type Definition
5.2. strumenti tecnologici per lo sviluppo di metadati: il linguaggio xml e casi d’uso: il turismo e i beni culturali, gestione di
biblioteche, elementi multimediali (immagini e file audio)
5.3. cenni al web semantico ed e-learning
RAPPRESENTAZIONE DIGITALE
DELL’INFORMAZIONE
PARTE 1:INTRODUZIONE
IL CONCETTO DI INFORMAZIONE
Ogni messaggio utilizza un codice che deve essere comune a chi lo trasmette e a chi lo riceve,
e sulla cui base il messaggio stesso deve essere interpretato.
I codici utilizzano un certo numero di simboli di base e costruiscono messaggi complessi
combinando fra loro i simboli di base sulla base di apposite regole di combinazione.
Stabilire esattamente quali siano i simboli semplici e quali siano le combinazioni ammesse può
essere assai difficile, soprattutto nel caso delle lingue storico-naturali (i simboli di base saranno
le singole lettere, le parole che troviamo in un dizionario, o qualcos'altro ancora?)
Sembra naturale pensare che chi codifica un messaggio lo faccia attraverso una successione di
scelte, scelte effettuate fra i simboli semplici e le combinazioni di simboli semplici messe a sua
disposizione dal codice che sta utilizzando
4
IL CONCETTO DI INFORMAZIONE
$
o
W i ca c o l Vent
us Via
m
la o
rtit le
a
P i ca
s
Mu
la donna è immobile @
qual piuma al vento ∞
f(x)dx
0
5
LIVELLI DI INFORMAZIONE E CODICI
Pragmatica
7 Mondo7de M o n do 7de llo 7
o n do lla7
M ar9e musica spe;acolo
dell'
Livello dei contesti
Semantica
$
Do Casa
Re Dollaro Guernica, Pablo Picasso
Livello dei significati
Macchie di inchiostro
Sintattica C o le g i n i Caratteri
β A par
suoni imma Parole
α $
B Nomi
Livello dei simboli
7
SUA MAESTÀ IL… BIT
• Se l’informazione è scelta, la più piccola quantità di Codifica Binaria
informazione è quella associabile a una scelta binaria
si può sempre ricondurre una scelta tra molte
• Questa informazione elementare viene detta bit
possibilità a una sequenza di scelte binarie
(dall’inglese binary digit = numero binario)
Voglio scegliere lun nell’insieme
• Occorreranno due soli simboli da associare alle due
[ lun, mar, mer, gio, ven, sab, dom]
possibilità offerte dalla scelta binaria: “0” e “1”
ripeto il procedimento
8
QUANTI BIT?
Alcune semplici leggi combinatorie ci consentono di capire quanti bit sono necessari per rappresentare un certo numero di oggetti
• 1 bit 2 combinazioni (0, 1) 2 oggetti bit solo due stati, “0” oppure “1”
9
RAPPRESENTAZIONE DIGITALE DEI NUMERI
I numeri vengono rappresentati con la notazione posizionale pesata:
123 = 1 x 100 + 2 x 10 + 3 x 1
Ogni cifra assume un peso diverso in base alla sua posizione
Il peso è una potenza intera della base di numerazione
Occorre un numero di cifre (simboli) diverse tra di loro pari esattamente alla base
BASE 2
b = 2, cifre = { 0, 1}
rappresentazione di quindici:
1111 Infatti: 1*23+1*22+1*21+1*20 = 8 + 4 + 2 + 1 = 15
rappresentazione di duecentododici:
11010100 Infatti: 1*27 +1*26 +0*25 +1*24 +0*23+1*22+0*21+0*20 = 128 + 64 + 16 + 4 = 212
11
CONVERSIONE - DA BASE 2 A BASE 10
11010100[2]
0 x 20 + 0 x 21 + 1 x 22 + 0 x 23 + 1 x 24 + 0 x 25 + 1 x 26 + 1 x 27 = 212[10]
• A questi vanno aggiunti diversi altri simboli come lo spazio, i segni di interpunzione, i simboli per indicare il passaggio
alla riga o alla pagina successiva, ecc.
• Può essere facilmente rappresentato attribuendo in maniera univoca a ciascuno dei suoi elementi un numero intero - codice.
• Es. numero delle lettere dell'alfabeto inglese sono 26 (per un totale di 52 considerando anche quelle maiuscole).
• Se ad esse aggiungiamo 10 cifre numeriche, 40 simboli extra, arriviamo ad un totale di 100 di simboli da rappresentare.
E' necessario che la rappresentazione dei simboli sia la stessa in tutto il mondo (pena
la totale incomunicabilità) Necessaria adozione di una comune rappresentazione.
13
CODIFICA ALFANUMERICA: CODIFICA ASCII
La codifica ASCII (che si pronuncia ASKI), prende il nome da American Standard Code for Information Interchange.
• Tale codifica si basa sull'utilizzo di 7 bit per un totale di 128 simboli rappresentabili.
• Tra le più utilizzate codifiche ASCII (entro i primi 128 simboli) vi sono:
• { codice 123
• } codice 125
• | codice 124
Come si vede:
• Tali estensioni derivano dalla necessità di codificare simboli legati a particolari lingue, e dal fatto che operando su 8 bit, la codifica ASCII
consente l'utilizzo dell'ottavo bit, lasciando gli altri 7 inalterati.
• Tutte le estensioni della codifica ASCII non modificano tale codifica ma aggiungono semplicemente altri 128 simboli.
• Tra le estensioni STANDARD più diffuse vi è la ISO Latin1 (caratteri per linguaggi europa occidentale)
• La codifica Unicode supera i limiti della codifica ASCII e relativi derivati, in quanto estende il numero di simboli codificabili.
• E’ stata estesa fino a 32 bit e attualmente sono più di 100.000 simboli codificati con lo standard Unicode. Essi sono divisi in:
• Segni Speciali
15
..PROSSIMA PUNTATA
I segnali in un calcolatore
16