Sei sulla pagina 1di 16

UNIVERSITÀ DEGLI STUDI DI SALERNO

CORSO DI STUDI: CORSO DI STUDI:


FILOLOGIA MODERNA LINGUE E CULTURE STRANIERE

INFORMATICA UMANISTICA INFORMATICA APPLICATA

ANNO ACCADEMICO 2021-2022

ING. FABIO CLARIZIA


INDICE
1. Rappresentazione digitale dell’informazione
1.1.rappresentazione digitale dei segnali audio, video ed immagini;

2. Strumenti a disposizione: Hw e Sw
2.1. il calcolatore elettronico, reti di calcolatori e software distribuiti

3. Elaborazione di testo a supporto di contenuti artistici


3.1.definizione del processo di sottotitolatura e sopratitolatura con introduzione dei rispettivi applicativi

4. Elaborazione delle immagini e dei segnali audio


4.1.principi teorici ed applicativi per la manipolazione delle immagini e dei segnali audio;

5. Linguaggio XML (eXtensible Markup Language) per definire e controllare il significato degli elementi contenuti in un documento
5.1. il concetto di metadata e Document Type Definition
5.2. strumenti tecnologici per lo sviluppo di metadati: il linguaggio xml e casi d’uso: il turismo e i beni culturali, gestione di
biblioteche, elementi multimediali (immagini e file audio)
5.3. cenni al web semantico ed e-learning
RAPPRESENTAZIONE DIGITALE
DELL’INFORMAZIONE

RAPPRESENTAZIONE DIGITALE DEI SEGNALI AUDIO, VIDEO ED IMMAGINI

PARTE 1:INTRODUZIONE
IL CONCETTO DI INFORMAZIONE

Esistono molte definizioni del (difficile/facile?) concetto di informazione

L’informazione è uno scambio di conoscenza

Ogni messaggio utilizza un codice che deve essere comune a chi lo trasmette e a chi lo riceve,
e sulla cui base il messaggio stesso deve essere interpretato.
I codici utilizzano un certo numero di simboli di base e costruiscono messaggi complessi
combinando fra loro i simboli di base sulla base di apposite regole di combinazione.
Stabilire esattamente quali siano i simboli semplici e quali siano le combinazioni ammesse può
essere assai difficile, soprattutto nel caso delle lingue storico-naturali (i simboli di base saranno
le singole lettere, le parole che troviamo in un dizionario, o qualcos'altro ancora?)
Sembra naturale pensare che chi codifica un messaggio lo faccia attraverso una successione di
scelte, scelte effettuate fra i simboli semplici e le combinazioni di simboli semplici messe a sua
disposizione dal codice che sta utilizzando
4
IL CONCETTO DI INFORMAZIONE

Noi assumeremo quella che vede l’informazione


come scelta tra diverse alternative, situata in un contesto che ne consente l’interpretazione

esempio di testo esempio di immagine esempio di numeri

$
o
W i ca c o l Vent
us Via
m
la o
rtit le
a
P i ca
s
Mu

la donna è immobile @
qual piuma al vento ∞
f(x)dx
0

I simboli hanno una forma ben precisa


• Associazione tra informazione e simboli
Rappresentare • I simboli sono associabili ad un
che ci consente di distinguerli l’uno
dall’altro ovvero ciascun simbolo deve
supporto fisico
l’Informazione - Disegni, caratteri, note, ecc.
essere univocamente identificabile.

- Pareti rupestri, carta, legno, ecc.

5
LIVELLI DI INFORMAZIONE E CODICI

Pragmatica
7 Mondo7de M o n do 7de llo 7
o n do lla7
M ar9e musica spe;acolo
dell'
Livello dei contesti

Semantica
$
Do Casa
Re Dollaro Guernica, Pablo Picasso
Livello dei significati
Macchie di inchiostro
Sintattica C o le g i n i Caratteri
β A par
suoni imma Parole
α $
B Nomi
Livello dei simboli

Il contesto (essere in un museo) completa


l’informazione e i nomi diventano il titolo e
l’autore di un quadro famoso
6
CODICI E CODIFICHE

• L’associazione tra un insieme di simboli e un insieme


di significati si chiama CODIFICA
• La codifica realizza una corrispondenza tra i simboli e
il significato.
• In base a questa associazione, il simbolo porta
l’informazione (anche se non è l’informazione in se)
• Ad esempio, il simbolo “3” è associato al numero
tre
• L’insieme dei simboli utilizzati viene detto alfabeto e Nota importante:
la regola di associazione viene detta codice
• Al concetto di “numero tre” possono
corrispondere diverse rappresentazioni
simboliche: “3”, “III”, “tre”, “three”, “trois”

• È possibile passare da una codifica a un’altra,


operazione che viene chiamata transcodifica

7
SUA MAESTÀ IL… BIT
• Se l’informazione è scelta, la più piccola quantità di Codifica Binaria
informazione è quella associabile a una scelta binaria
si può sempre ricondurre una scelta tra molte
• Questa informazione elementare viene detta bit
possibilità a una sequenza di scelte binarie
(dall’inglese binary digit = numero binario)
Voglio scegliere lun nell’insieme
• Occorreranno due soli simboli da associare alle due
[ lun, mar, mer, gio, ven, sab, dom]
possibilità offerte dalla scelta binaria: “0” e “1”

divido l’insieme di partenza in due


sottoinsiemi e ne scelgo uno

ripeto il procedimento

ancora una volta

un bit può essere importante..


La scelta di lun equivale alle tre scelte
ma con molti bit… si può fare tutto! binarie indicate dalla sequenza 000

8
QUANTI BIT?

Alcune semplici leggi combinatorie ci consentono di capire quanti bit sono necessari per rappresentare un certo numero di oggetti

Quanti bit mi servono per codificare N oggetti?

Il più famoso multiplo del bit è il byte


N ≤ 2k k ≥ log2 N k= log2 N (intero superiore) costituito da 8 bit.
Su questa base possiamo introdurre i
Quanti oggetti posso codificare con k bit? multipli successivi:

• 1 bit 2 combinazioni (0, 1) 2 oggetti bit solo due stati, “0” oppure “1”

Byte 8 bit, quindi 28 = 256 stati


• 2 bit 4 combinazioni (00, 01, 10, 11) 4 oggetti
KiloByte [KB] 210 Byte = 1024 Byte ~ 103 Byte
• 3 bit 8 combinazioni (000, 001, …, 111) 8 oggetti MegaByte [MB] 220 Byte = 1'048'576 Byte ~ 106 Byte

• … GigaByte [GB] 230 Byte ~ 109 Byte

• k bit 2k combinazioni 2k oggetti TeraByte [TB] 240 Byte ~ 1012 Byte

PetaByte [PB] 250 Byte ~ 1015 Byte

ExaByte [EB] 260 Byte ~ 1018 Byte

9
RAPPRESENTAZIONE DIGITALE DEI NUMERI
I numeri vengono rappresentati con la notazione posizionale pesata:
123 = 1 x 100 + 2 x 10 + 3 x 1
Ogni cifra assume un peso diverso in base alla sua posizione
Il peso è una potenza intera della base di numerazione
Occorre un numero di cifre (simboli) diverse tra di loro pari esattamente alla base

• Base di rappresentazione (b)

• Si usano b cifre (simboli associati ai numeri da 0 a b -1)


Rappresentazione posizionale
• Se ad esempio voglio rappresentare il numero
n = am X bm + am-1 X bm -1 + … + a1 X b1 + a0 X b0 = ∑i ai X bi

• Userò la rappresentazione: amam -1 …. a1a0

• In queste ipotesi la rappresentazione è unica


10
BASE 10
b = 10, cifre = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 }
rappresentazione di sedici:
16 Infatti: 16 = 1 x 101 + 6 x 100= 10 + 6
rappresentazione di duecentododici:
212 Infatti: 212 = 2 x 102 + 1 x 101 + 2 x 100 = 200 + 10 + 2

BASE 2
b = 2, cifre = { 0, 1}
rappresentazione di quindici:
1111 Infatti: 1*23+1*22+1*21+1*20 = 8 + 4 + 2 + 1 = 15
rappresentazione di duecentododici:
11010100 Infatti: 1*27 +1*26 +0*25 +1*24 +0*23+1*22+0*21+0*20 = 128 + 64 + 16 + 4 = 212
11
CONVERSIONE - DA BASE 2 A BASE 10
11010100[2]

0 x 20 + 0 x 21 + 1 x 22 + 0 x 23 + 1 x 24 + 0 x 25 + 1 x 26 + 1 x 27 = 212[10]

CONVERSIONE - DA BASE 10 A BASE 2


212 2
0 106 2
0 53 2 divisioni successive per 2 fino a un quoto uguale a 0
1 26 2 i resti (dall’ultimo al primo) danno la sequenza di cifre
0 13 2
1 6 2
0 32
1 12
1 0
12
ESEMPIO DI CODIFICA: ALFANUMERICA
L’insieme dei caratteri alfanumerici: lettere dell'alfabeto e dalle cifre decimali.

• A questi vanno aggiunti diversi altri simboli come lo spazio, i segni di interpunzione, i simboli per indicare il passaggio
alla riga o alla pagina successiva, ecc.

• Può essere facilmente rappresentato attribuendo in maniera univoca a ciascuno dei suoi elementi un numero intero - codice.

• Es. numero delle lettere dell'alfabeto inglese sono 26 (per un totale di 52 considerando anche quelle maiuscole).

• Se ad esse aggiungiamo 10 cifre numeriche, 40 simboli extra, arriviamo ad un totale di 100 di simboli da rappresentare.

• 100 simboli da rappresentare: soli 7 bit (128 simboli diversi) sono


sufficienti per rappresentare l'insieme dei caratteri alfanumerici

E' necessario che la rappresentazione dei simboli sia la stessa in tutto il mondo (pena
la totale incomunicabilità) Necessaria adozione di una comune rappresentazione.
13
CODIFICA ALFANUMERICA: CODIFICA ASCII
La codifica ASCII (che si pronuncia ASKI), prende il nome da American Standard Code for Information Interchange.

• Tale codifica si basa sull'utilizzo di 7 bit per un totale di 128 simboli rappresentabili.

• Da notare che i caratteri dell'alfabeto e le cifre numeriche successive


hanno codice anch'esso successivo:

• ad esempio a ha codice 97, b codice 98, c codice 99, il numero 0


ha codice 48, il numero 1 codice 49….

• Tra le più utilizzate codifiche ASCII (entro i primi 128 simboli) vi sono:

•   ~ (tilde) codice 126

• { codice 123

• } codice 125

• | codice 124

Come si vede:

• I caratteri di controllo (non riproducibili) hanno i codici più bassi.

• Il blank (Spazio) è il primo dei caratteri riproducibili.

• Le maiuscole/minuscole sono ordinate (codice Progressivo).


14
CODIFICHE ALFANUMERICHE DERIVATE DALLA CODIFICA ASCII
Esistono numerose estensioni della codifica ASCII.

• Tali estensioni derivano dalla necessità di codificare simboli legati a particolari lingue, e dal fatto che operando su 8 bit, la codifica ASCII
consente l'utilizzo dell'ottavo bit, lasciando gli altri 7 inalterati.

• Tutte le estensioni della codifica ASCII non modificano tale codifica ma aggiungono semplicemente altri 128 simboli.

• Tra le estensioni STANDARD più diffuse vi è la ISO Latin1 (caratteri per linguaggi europa occidentale)

• La codifica Unicode supera i limiti della codifica ASCII e relativi derivati, in quanto estende il numero di simboli codificabili.

• Operava inizialmente su 16 bit/2 byte (65.536 codifiche)

• E’ stata estesa fino a 32 bit e attualmente sono più di 100.000 simboli codificati con lo standard Unicode. Essi sono divisi in:

• Script Moderni: Latino, Greco, Giapponese, Cinese, Koreano, etc.

• Script Antichi: Sumero, Egiziano, etc.

• Segni Speciali

• La codifica Unicode ingloba la codifica ISO Latin1.

15
..PROSSIMA PUNTATA

I segnali in un calcolatore

16

Potrebbero piacerti anche