Sei sulla pagina 1di 7

BIENNIO SPECIALISTICO DI II LIVELLO

INFORMATICA MUSICALE
Prof. Giuseppe SPEDICATI



ANALOGICO/DIGITLE

La comunicazione analogica si basa sulla somiglianza (analogia) tra la grandezza comunicata e il dato
da comunicare, mentre la comunicazione digitale trasmette l’informazione dopo averla codificata in
una stringa di cifre di un sistema numerico opportunamente scelto; nel mondo dell’informatica nel
sistema binario.
I segnali analogici, dunque, consistono in una tensione elettrica che segue nel tempo l'andamento
del segnale originale. Nei segnali audio la tensione elettrica è molto simile all'andamento dell'onda
sonora originale (molto simile, non identica, perché vi è sempre l'introduzione di una quota di
distorsione e di rumore, non presenti nel segnale originale).
Nel caso dei segnali digitali invece, il segnale viene rappresentato da una serie di numeri, ciascuno dei
quali rappresenta il valore della pressione istantanea in un dato istante.
I dispositivi basati sul sistema di comunicazione digitale rappresentano, per mezzo di un codice in
cifre, i valori delle grandezze da trasmettere, anche se queste variano con continuità. Utilizzano quindi
la campionatura di tali grandezze a successivi intervalli di tempo, molto ravvicinati, e la codifica dei
valori campionati in un sistema numerico prefissato.
Ad esempio, sono dispositivi basati sulla comunicazione digitale il contachilometri di
un’autovettura o l’orologio munito di display a cristalli liquidi, che convertono in cifre,
rispettivamente, una distanza o lo scorrere del tempo. Questi dispositivi aggiornano l’informazione
mostrata a tempi discreti, effettuando comunque un’approssimazione rispetto alla reale variazione
della grandezza in questione.

FREQUENZA DI CAMPIONAMENTO
Il processo di conversione da analogico a digitale inizia con l’ingresso di segnali audio analogici
(Campionamento). L’intensità del segnale è misurata a intervalli di tempo discreti, ma abbastanza
ravvicinati da permettere la ricostruzione fedele del segnale: il numero di volte in cui un segnale audio
in ingresso è misurato in un determinato periodo di tempo è definito frequenza di campionamento
(in inglese, sample rate o sample frequency).
Questi intervalli devono essere sufficientemente brevi da distinguere le frequenze del suono udibili.
Un importante aspetto è che si tratta di numeri interi, cioè che non hanno una parte decimale. Questi
numeri costituiscono quindi un insieme discreto: non è possibile rappresentare tutti i valori, ma
1
solo quelli che corrispondono a un intero. Invece i segnali analogici non sono discreti, ma
continui. Allora al momento di misurare l'ampiezza di ogni gradino questa dovrà essere
approssimata ad un intero, commettendo così un errore più o meno grande.
In base al teorema di Shannon-Nyquist, la frequenza di campionamento deve essere almeno il
doppio della frequenza più elevata del segnale audio da digitalizzare.
Campionare un segnale ad una frequenza minore del doppio della sua banda significherebbe estrarre
un numero di campioni insufficiente perché troppo “veloci affinchè il dispositivo di campionamento
possa intercettarne almeno due campio per ogni ciclo. Ciò implica che frequenze molto alte non
avrebbero abbastanza campioni a descriverle; ciò porterà all'incapacità dell'elaboratore di stabilire
quale sia la frequenza originale, la quale sarà sostituita da frequenze più basse. Queste frequenze
vengono definite aliasing ed essendo al di sotto dei 20 kHz rientrerebbe nella banda dell'udibile e
dunque avremo aggiunto al segnale iniziale una frequenza che prima dell'operazione di
campionamento non esisteva mentre avremo perso la frequenza alta originale.
Nella figura vediamo come si presenta una frequenza di aliasing sovrapposta ad una sinusoide
sottocampionata:

Nel campo del campionamento dell’immagine in movimento, un classico esempio di aliasing e


quando vediamo girare le ruote al contrario del senso giusto di rotazione questo perché il numero di
immagini al secondo è inferiore al n. di frame giusto. Per evitare questo problema i dispositivi di

campionamento sia software che hardware sono dotati del cosiddetto filtro antialising, ciò impedirà
l'introduzione di frequenze superiori alla metà di quella di campionamento. In pratica i moderni
sistemi di campionamento applicano il filtro antialising automaticamente durante la ripresa.
Negli anni ‘70, quando Philips e Sony iniziarono a cercare un modo di migliorare la qualità audio
della musica registrata, si rivolsero al campionamento digitale. Fu scelto un sample rate di 44.100
campioni per secondo (44.1 kHz) sia perché era superiore all’obiettivo fissato e cioè superiore ai
40 kHz (che rappresenta il doppio della massima frequenza, 20 kHz, percepibile dall’orecchio

2
umano), sia perché rappresentava il massimo di informazioni che potevano essere immagazzinate su
nastro (che è stato il mezzo di archivio di scelta fino a che non furono perfezionati quei piccoli
dischi argentati che oggi conosciamo come CD. Per la cronaca, il primo CD è apparso nel 1981,
riscuotendo un immediato e largo successo).


Riproduzione digitale di un suono analogico a diverse frequenze di campionamento

QUANTIZZAZIONE
Abbiamo chiarito, brevemente, alcune questioni legate alla frequenza di campionamento: possiamo
dire, in un linguaggio appena un po’ più tecnico che abbiamo analizzato la questione nel dominio
del tempo – ossia sull’asse orizzontale del grafico del segnale audio.
Proviamo a cambiare punto di vista, e analizziamo in generale la questione dal punto di vista dell’asse
verticale: ossia dal punto di vista dell’ampiezza dove il parametro da impostare correttamente per
ottenere una buona digitalizzazione è la quantizzazione ossia la risoluzione di campionamento.
Quali sono i valori possibili per la quantizzazione?
3
Un campionamento a 16 bit e 44,1 kHz è sufficiente per offrire una buona fedeltà del suono
come avviene, ad esempio, negli usuali cd audio.
Tale campionamento audio digitale è noto con l’acronimo PCM che sta per Pulse Code
Modulation.
Il PCM audio digitale produce un ritratto accurato del suono reale e solamente ascoltatori dotati di
orecchio molto sensibile ed allenato e di buon equipaggiamento stereo possono distinguere tra esso e
l'originale.
Volendo schematizzare i concetti sopra esposti, possiamo dire che, per ottenere un suono digitale
fedele, bisogna essenzialmente considerare due variabili: la frequenza di campionamento e la
profondità di bit.

Tabella riassuntiva
FREQUENZA DI CAMPIONAMENTO PROFONDITA' DI BIT


Numero di volte che un segnale audio in ingresso è misurato oAccuratezza con quale è effettuata ciascuna misurazione o campione. Si
"campionato" in un dato periodo di tempo. E' tipicamente indicata inriferisce alla lunghezza delle parole binarie (cioè sequenze di 0 e 1) usate
kilohertz (kHz, migliaia di cicli per secondo). per descrivere ciascun campione del segnale d'ingresso. Parole più lunghe
Per registrare in "CD-quality" audio è richiesta una frequenza di permettono misurazioni più accurate e riproduzioni più fedeli di un
campionamento di 44.1kHz. segnale (maggior dinamica e minor distorsione). In un sistema a 16 bit,
ciascun campione è rappresentato come una parola binaria lunga 16 cifre.
Poiché ciascuna di queste 16 cifre può essere uno 0 o un 1, sono possibili


65.536 (216) valori per ciascun campione.

IL FORMATO WAVE e AIF


Il Waveform Audio File Format, noto anche come “WAVE” è lo standard per gli utenti Windows il
formato AIFF è lo standard per gli utenti Apple. Sono i due formati audio che consentono di
impostare diversi tipi di frequenze di campionamento e Bit ossia permettono di campionare seconso lo
standard PCM.

LA COMPRESSIONE AUDIO
Si è visto che lo standard PCM utilizzato per i CD audio è in grado di offrire un’elevata qualità, ma
di contro produce file molto pesanti per essere usati sui lettori portatili o trasferiti via Internet.
Cercheremo ora di vedere come questo problema è stato risolto mediante le tecniche di
compressione.
Le tipologie di compressione più utilizzate sono due: LOSSLESS e LOSSY. Nel primo
caso la compressione avviene senza perdita di informazioni e quindi si otterra un file finale di qualità
pari a quella dell’originale; nel secondo invece si ha una perdita di informazioni e una volta
4
decompresso il file avrà una qualità inferiore.
A questo scopo e, soprattutto, per aumentare di conseguenza la velocità di trasferimento di un file
audio, sono stati messi a punto diversi codec, ovvero algoritmi per la compressione e la
decompressione dell’audio. I codec attualmente disponibili sono tanti e lo sviluppo dei nuovi è in
continua evoluzione:il settore è in effetti molto vivace anche perché software di questo tipo
vengono utilizzati in tantissime apparecchiature digitali che in qualche maniera hanno a che fare
con un segnale audio; compresi, giusto per fare un esempio, i telefonini cellulari.
Indipendentemente dall’utilizzo per cui è stato sviluppato, qualsiasi codec deve comunque fare i conti
con almeno tre fattori principali:

• Il bitrate, ovvero il numero di bit necessari per trasmettere un secondo di informazioni audio
(bit/sec) e si indica con la sigla Kbps; minore è questo valore rispetto all’originale non compresso,
maggiore è il tasso di compressione. Il calcolo del bitrate per un brano digitalizzato in qualità Cd
Audio è presto fatto: 44.100 Hz x 16 bit x 2 canali stereo =1411,2 Kbps (circa 1,4 Mbit/sec) un
Mp3 di qualità Cd ha un bitrate di soli 128 Kbps.
• codificando il segnale a 64 kbps si eliminerà oltre alle informazioni meno udibili anche quelle
udibili ma meno importanti, con una qualità che risulterà mediocre;
• codificando il segnale a 112 kbps si otterrà un suono sufficientemente buono;
• codificando il segnale a 128 kbps si è molto vicini all'originale;
• codificando il segnale a 160 e 192 kbps non è possibile percepire differenze con l'originale;
• codificando il segnale a 256 kbps anche i più fanatici ascoltatori saranno soddisfatti;

• Il ritardo di processamento, che è in sostanza la somma dei tempi di compressione e
decompressione necessari alla codifica del segnale; qualsiasi algoritmo richiede infatti un processo
di calcolo che può essere in tempo reale o meno.

• La qualità del segnale, un parametro che misura l’eventuale degrado dell’audio dopo il processo di
compressione e decompressione; questo fattore è misurato sia con criteri soggettivi - ovvero con
l’ascolto – sia con criteri di tipo oggettivo basati sul confronto fra le forme d ’onda.
I codec più complessi possono richiedere lunghi tempi di processamento (quindi la codifica e la
decodifica non avviene in tempo reale) ma arrivano a garantire un alto tasso di compressione e una
buona qualità del segnale.
Algoritmi più semplici hanno invece un’esecuzione immediata ma, di contro,una buona qualità del
segnale può essere assicurata solo da alti valori di bitrate.

5
COMPRESSIONE LOSSLESS
I formati di compressione senza perdita di informazioni funzionano un po’ come quelli delle
applicazioni che abitualmente impieghiamo per comprimere i nostri file: ad esempio WinZip o
WinRar su Windows, oppure StuffIt su Mac OS. Con queste utility sappiamo bene che è possibile
ridurre le dimensioni di un file, ad esempio un documento di Word, anche del 90%senza che al
momento della successiva decompressione vi sia alcuna perdita di informazioni.
Per la natura ben diversa di un suono digitalizzato rispetto a un banale file di testo, queste applicazioni
non hanno invece praticamente alcun effetto sui file audio. Per la compressione dei file audio senza
perdita di dati esistono quindi dei codec ad hoc che risultano molto utili per fare copie meno
ingombranti dei propri Cd Audio e sono l’unica alternativa per chi, sulla qualità dell’audio, non è di
sposto a scendere a compromessi .
I formati Lossless, quindi, non sono standard come altri formati audio.
Se utilizzate un determinato codec per comprimere una vostra registrazione e desiderate passarla a
qualcun altro, assicuratevi che anche il computer del destinatario abbia la stessa applicazione che
avete utilizzato per la compressione.
Alcuni player software sono in grado di riprodurre determinati file Lossless (per esempio Winamp o
iTunes); in altri casi, prima di procedere al l’ascolto, è necessari o decomprimere il file per
riportarlo nel suo formato originale..

Alcuni esempi di formati LOSLESS


WMA
FLAC
MONKEY’S AUDIO (riconoscibile dall’ estensione “,APE”)

COMPRESSIONE LOSSY
A differenza dei codec che abbiamo analizzato fin qui, i metodi di compressione lossy, quindi con
perdita di dati, tagliano definitivamente una buona parte delle informazioni contenute in un file. Le
informazioni eliminate - e in termini quantitativi sono davvero tante se si pensa che un file audio da
40 MB può diventare tranquillamente da 4 MB - vengono perse per sempre e non sono più
recuperabili in alcuna maniera.
Tutti i codec lossy intervengono in modo “distruttivo” e anche ritrasformando un file in un formato
non compresso non si tornerà mai ad avere la stessa quantità di informazioni del file originale.
I codec lossy per l’audio si basano invece sui principi di acustica e psicoacustica. Come abbiamo
visto, infatti, una fondamentale caratteristica dell’orecchio umano è la sua incapacità di percepire
stimoli al di fuori del range di frequenze che va da 20 a 20.000 Hz. Questi sono valori medi che,

6
oltre tutto, variano anche in funzione dell’età: se avete più di 35 anni, rassegnatevi… il vostro udito
è destinato inesorabilmente a peggiorare soprattutto per le frequenze alte.
La maggior parte degli esseri umani, tuttavia, dimostra una certa difficoltà a percepire i suoni già
con frequenze intorno ai 15.000 Hz, soprattutto se a tali suoni acuti sono sovrapposti suoni di
tonalità più grave; cosa che accade normalmente nei brani musicali.
Da questa semplice riflessione sulle caratteristiche del nostro apparato uditivo si può già intuire
quali possono essere le informazioni da eliminare in una compressione lossy: proprio le
informazioni relative alle frequenze al di sopra dei 15.000 Hz, in particolare se esse si sovrappongono
a frequenze più basse. Già così è una bella fetta di informazioni, ma si può fare di più: si possono
scartare anche altri dati e quindi ridurre ulteriormente le dimensioni di un file.

Alcuni esempi di formati lossy più diffusi.

MP3
Fraunhofer IIS
MP3 PRO
AAC
WMA
OGG VORBIS
REAL AUDIO