Sei sulla pagina 1di 14

Il suono digitale capitolo 1 ___________________________________________________________________________

Il Suono Digitale
Capitolo 1 - Dal segnale analogico al segnale digitale
Introduzione Vantaggi del segnale digitale Svantaggi della rappresentazione digitale Schema della catena audio che utilizza tecnologie digitali Il segnale analogico Il segnale digitale Il teorema del campionamento Il fenomeno dellaliasing Sample rate e percezione sonora Ricostruzione del segnale analogico a partire da quello originale
pag 1 pag 2 pag 2 pag 3 pag 3 pag 5 pag 7 pag10 pag13 pag13

Introduzione
Avrete senzaltro visto, nella sezione riguardante il segnale analogico che la rappresentazione analogica del suono lavora per analogia ovvero la curva continua nel tempo costituita dalle variazioni di ampiezza dellonda di pressione acustica, viene rappresentata da unanaloga curva continua nel tempo i cui punti sono le variazioni di tensione elettrica. Questa seconda curva pu essere memorizzata allinterno dei solchi di un disco in vinile o nel campo magnetico di un nastro e riproduce fedelmente le variazioni di ampiezza del suono acustico. La rappresentazione digitale del suono invece non riproduce la curva continua di ampiezza con una curva analoga ad essa, ma una successione finita di numeri (discreta) che rappresentano di volta in volta il valore dellampiezza in istanti successivi di tempo. Pertanto, in ambito analogico si ha un curva continua che approssima una curva continua mentre in ambito digitale si ha una successione di numeri che approssima una curva continua. I numer costituenti la successione digitale vengono rappresentati in ambito binario e sono chiamati campioni (sample). I loro valori si riferiscono alla tensione elettrica del segnale analogico.

Silvio Relandini 1

Il suono digitale capitolo 1 ___________________________________________________________________________

Vantaggi del segnale digitale


Perch importante poter trasformare il suono dal segnale analogico a quello digitale? I vantaggi del codice digitale, costituito da una sequenza finita di dati, sono innumerevoli: 1) essendo un numero determinato, cosentono di dimensionare opportunamente i supporti di memorizzazione (hard disk, nastri) 2) non inducono fenomeni di degradazione del segnale durante le operazioni di copia del segnale stesso: infatti copiando ripetutamente lo stesso segnale analogico si ottiene una degradazione sempre maggiore della qualit del segnale in quanto loperazione di copia deve nuovamente approssimare con una curva continua la curva che era stata memorizzata in precedenza e questo introduce sempre pi errori. Invece, fare una copia di numeri non comporta alcun errore: la curva memorizzata in precedenza rimane sempre la stessa, non subisce alterazioni nella copia. 3) le operazioni di manipolazione (termine tecnico tradotto in inglese con le parole processing, editing) del segnale digitale sono operazioni aritmetiche che comporteranno il cambiamento di alcuni numeri. Se si vuole incrementare lintensit di un suono basta moltiplicare i suoi numeri per il fattore desiderato di amplificazione. Invece, nel corrispondente caso analogico, bisogna utilizzare un dispositivo elettronico per accrescere lampiezza della curva in questione. 4) il segnale digitale pu avere algoritmi in grado di correggere gli errori introdotti dai supporti per la memorizzazione (compact disc, dvd, dat, ecc.) e dai dispositivi di trasmissione (via cavo, via satellite). Gli errori digitali consistono nel leggere alcuni numeri, rappresentanti il segnale, in maniera differente rispetto a come erano stati memorizzati. Un sistema digitale, grazie alla finitezza del codice, conosce quali sono le rappresentazioni possibili, e quindi in grado di rilevare e correggere alcuni errori mediante lintroduzione di informazioni aggiuntive rispetto al segnale vero e proprio.

Svantaggi della rappresentazione digitale


La rappresentazione digitale del segnale audio porta anche degli svantaggi: 1) necessaria la realizzazione di uninterfaccia di comunicazione tra linterno e lesterno dellelaboratore, costituita tipicamente da una scheda audio che ospita i convertitori AD (analogico-digitale) e DA (digitale-analogico) 2) i processi di conversione inducono approssimazioni del segnale.

Silvio Relandini 2

Il suono digitale capitolo 1 ___________________________________________________________________________

3) per avere una qualit del segnale comparabile con i migliori sistemi analogici occorrono grandi capacit di memoria, di calcolo e di velocit di trasmissione per la memorizzazione, la manipolazione e il trasferimento del segnale, comportando ovviamente costi maggiori. Per fortuna la tecnologia in rapida evoluzione e nel corso degli anni ha consentito di adottare numerose soluzioni per mitigare questi svantaggi. La tecnolgia digitale applicata allaudio piuttosto recente e risale dallinizio degli anni 80.

Schema della catena audio che utilizza tecnologia digitale


Quando si considera la catena audio di un processo di registrazione e riproduzione che utilizza un computer per lacquisizione, lediting e la memorizzazione dei segnali dobbiamo pensare al seguente schema:

Suono acustico

microfono

Suono analogico

Convertitore A/D

Suono digitale

Convertitore D/A Suono acustico

Suono analogico

monitor

Come possiamo osservare, il suono subisce una serie di modificazioni dette trasduzioni ovvero dei processi che trasformano il segnale da una forma energetica in unaltra: la trasduzione che opera la trasformazione acustica-analogica effettuata tramite il microfono, quella analogica-digitale e viceversa dai convertitori AD e DA, quella analogica-acustica da un diffusore (monitor, speaker).

Il segnale analogico
In un processo puramente analogico, il microfono cattura le variazioni di pressione dellaria e le trasduce in un segnale elettrico, ovvero, i valori della pressione x del segnale in ingresso vengono convertiti nei valori di tensione y del segnale in uscita, in modo che le variazioni di y rappresentino ancora le variazioni di x.

Silvio Relandini 3

Il suono digitale capitolo 1 ___________________________________________________________________________

Viceversa, il diffusore un trasduttore elettroacustico ha in ingresso un segnale i cui valori esprimono una variazione di tensione y che trasduce in un segnale duscita i cui valori x rappresentano una variazione di pressione x. Anche lorecchio un trasduttore elettroacustico: come il microfono, trasduce lenergia acustica in impulsi nervosi di tipo elettrico. Le variazioni di tensione descrivono esattamente il segnale acustico. Il debole segnale elettrico in uscita da un microfono risulta essere molto debole e pertanto deve passare attraverso un preamplificatore e un amplificatore prima di essere registrato tipicamente su un nastro magnetico; qui una testina elettromagnetica produce un campo magnetico sulla pellicola di polvere o ossido di ferro o ancora ferro-cromo che presente sul nastro. Il campo magnetico, fatto variare nel tempo dalla corrente elettrica della corrente sulla testina, orienta in modo ordinato le particelle di polvere di ferro. Dai supporti di memorizzazione analogici il segnale pu essere prelevato mediante un lettore adeguato (ad esempio un giradischi, in cui la testina trasduce landamento dei microsolchi in un segnale elettrico), amplificato e mandato ai diffusori acustici, che trasducono il segnale elettrico in un segnale sonoro acustico. Se un sistema di alta fedelt (e di conseguenza abbastanza costoso), le curve di ampiezza sonora iniziale e finale sono piuttosto simili. Comunque sia, gli elementi della catena introducono del rumore e della distorsione pi o meno accentuata a seconda della qualit delle macchine e dei cavi. Il rumore un segnale indesiderato ad ampio spettro che si aggiunge al segnale analogico. Quando presenta un livello di segnale piuttosto omogeneo in tutte le frequenze detto rumore bianco ( il tipo rumore, fruscio, che si percepisce passando manualmente da un canale radio FM ad un altro). Per la riduzione del rumore (noise reduction) dai supporti analogici sono stati sviluppati vari sistemi il cui pi noto quello della Dolby. Per stimare lammontare di rumore introdotto da un sistema analogico, si utilizza una grandezza chiamata rapporto segnale-rumore (Signal-to-Noise-Ratio - SNR) che definita come il rapporto tra la massima ampiezza utile del segnale e lampiezza del rumore presente SNR = max ampiezza segnale/ampiezza rumore

Silvio Relandini 4

Il suono digitale capitolo 1 ___________________________________________________________________________

chiaro che maggiore il rapporto SNR, migliore sar la qualit del segnale. Si usa esprimerlo in decibel: SNR (in dB) = 20 log (max ampiezza segnale/ampiezza rumore) Un altro parametro utilizzato per esprimere la qualit del dispositivo audio analogico la gamma dinamica (dynamic range) ovvero il rapporto tra lampiezza massima e quella minima presenti nel segnale. misurata in decibel e pertanto esprime la differenza tra lampiezza massima e lampiezza minima presenti nel segnale in che significa che un segnale audio che passa da un pianissimo a un fortissimo o viceversa presenta unestesa gamma dinamica. Ovviamente un sistema analogico migliore un sistema che approssima meglio la gamma dinamica del segnale in ingresso. La presenza di un rumore nel segnale analogica limita la gamma dinamica riducendola. La distorsione una modifica non voluta della forma donda (e quindi dello spettro) di un segnale audio. Nei componenti elettronici, la distorsione aumenta con lampiezza. Per ampiezza utile si intende quella massima alla quale non si presentano effetti di distorsione, ovvero quella alla quale la distorsione mantenuta al di sotto di una certa soglia di tolleranza prefissata. Se osserviamo i parametri di unonda, la distorsione pu essere in frequenza, ampiezza e fase. Un tipico caso di distorsione in frequenza presente nella nostra percezione uditiva perch lorecchio risponde in modo differente alle diverse frequenze e quindi la forma donda percepita differente dalla quella in ingresso.

Il segnale digitale
Il segnale digitale (numerico, discreto) una successione di numeri che

rappresentano lampiezza del segnale in precisi e ravvicinati istanti di tempo. Lo strumento che effettua la trasduzione analogica-digitale il convertitore AD mentre il procedimento detto campionamento del suono. Cosa vuol dire campionare un segnale? Vuol dire trovare una rappresentazione discreta per qualcosa che in origine una variazione continua. Ad un tempo fissato e ripetuto da un circuito di clock, interno al convertitore, lo strumento effettua una lettura di ampiezza del segnale in ingresso che associa ad un campione (sample). Passato un tempo pari al precedente, viene effettuata una nuova lettura e creato un

Silvio Relandini 5

Il suono digitale capitolo 1 ___________________________________________________________________________

nuovo campione. Il tempo che trascorre tra un campione e il successivo detto tempo di campionamento. Nella figura seguente mostrato un segnale analogico che viene campionato. I sample sono indicati con dei pallini rossi.

Se diminuiamo il tempo che trascorre tra un campione e il successivo otteniamo un maggior numero di letture, ovvero di campioni, nellunit di tempo. Limmagine successiva mostra lo stesso segnale campionato con un tempo di campionamento par alla met di quello dellimmagine precedente.

Il numero dei campioni che vengono creati al secondo stabilisce il tasso o frequenza di campionamento (sample rate - SR), espresso in hertz. Si preferisce parlare di

Silvio Relandini 6

Il suono digitale capitolo 1 ___________________________________________________________________________

frequenza soltanto quando si parla di cicli al secondo per un segnale, impiegando il nome tasso o velocit quando si parla di campioni al secondo. In inglese, la confusione viene evitata usando il termine frequency per la frequenza vera e propria, e il termine rate per i campioni. Se ad esempio utilizziamo una SR di 10 Hz significa che in un secondo avremo 10 campioni e pertanto il tempo di campionamento sar pari a 0,1 secondi (1/10). Se invece SR = 100 Hz, allora avremo 100 campioni e il tempo di campionamento sar pari a 0,01 secondi (1/100). Ovviamente pi alta la sample Rate e maggiore sar la risoluzione, ovvero la qualit con cui approssimiamo la curva analogica.

Il teorema del campionamento (Nyquist)


Se ho un segnale da campionare la cui frequenza F, qual la sample rate minima che posso utilizzare per il campionamento di quel segnale, senza incappare in una serie di fenomeni tali da distorcere il segnale? Consideriamo un semplice segnale periodico puro (un suono sinusoidale). Ogni ciclo di oscillazione si compone di una fase positiva e di una negativa e pertanto per campionare questa alternanza mi occorrono almeno due campioni.

Il teorema di H. Nyquist (detto del campionamento), formulato nel 1928, afferma che considerato un segnale di frequenza F, lo si pu campionare a patto che si utilizzi una sample rate che sia almeno il doppio di F.

Silvio Relandini 7

Il suono digitale capitolo 1 ___________________________________________________________________________

S R 2F
Nel caso per che il segnale da campionare sia periodico complesso, ovvero costituito da numerose componenti sinusoidali (parziali armoniche e non armoniche), come nella figura seguente che riproduce lo spettro acustico di un simile segnale, occorre stabilire quale sia la F del segnale da prendere in considerazione.

In questo caso bisogna considerare la parziale con frequenza maggiore in quanto quella che pi velocemente alterna loscillazione sinusoidale tra la fase positiva e quella negativa. Nella figura la parziale in questione stata colorata di rosso e pertanto F = 440 Hz: ci significa che per campionare questo segnale dovr utilizzare una sample rate almeno pari a 880 Hz. In tal caso la formulazione del teorema di Nyquist la seguente: considerato un segnale audio, lo si pu campionare a patto che si utilizzi una sample rate che sia almeno il doppio della frequenza F relativa alla componente sinusoidale pi elevata presente nello spettro acustico.

Silvio Relandini 8

Il suono digitale capitolo 1 ___________________________________________________________________________

S R 2FMax
Questo per significa che il segnale da campionare deve avere una componente pi acuta nello spettro individuabile ovvero che deve essere limitato nella banda acustica. Tutte le componenti di frequenza superiore devono essere eliminate dallo spettro. Siamo ora in grado di formulare pienamente il teorema del campionamento: preso un segnale audio limitato in banda, per campionarlo occorre utilizzare una sample rate che sia almeno il doppio della frequenza F relativa alla componente sinusoidale pi acuta presente nello spettro acustico del segnale. Soffermiamoci un attimo: la banda del segnale deve essere limitata ossia deve esserci una frequenza massima all'interno del segnale, che non deve mai essere superata. Poi, misurata questa frequenza massima, il teorema afferma che la sample rate da utilizzare deve essere almeno doppia di questa frequenza massima perch il campionamento possa essere realizzato con successo. Ad esempio: se vogliamo campionare un segnale audio la cui frequenza massima sia, per ipotesi, 300Hz (ovvero l'onda sonora pi "veloce" compie 300 cicli al secondo), la sample rate dovr essere come minimo di 600Hz, ossia dovranno essere presi almeno 600 campioni in un secondo. Se per dobbiamo campionare un segnale che arrivi, ad esempio, fino a 15.000 Hz, sar necessaria una frequenza di campionamento di almeno 30.000Hz, ossia si dovranno prendere almeno 30.000 misurazioni al secondo. Nella pratica, in ragione del fatto che lo spettro udibile compreso tra i 20 e i 20.000Hz, sarebbe sufficiente prendere una sample rate di 40.000Hz per campionare ogni possibile suono udibile dall'uomo. Ci che avviene nella digitalizzazione rispetta il teorema del campionamento procedendo in senso inverso. Stabilito un tasso di campionamento SR, occorre eliminare dal segnale tutte quelle frequenze che sono oltre la met di SR; quindi, se SR = 11.000 campioni al secondo, occorre eliminare dal segnale tutte le frequenze superiori a 5500 Hz. Per far ci si utilizza un filtro passabasso che elimina (o meglio attenua) tutte le frequenze sopra quella di riferimento (detta frequenza di taglio o di cutoff). Ovviamente tale filtro detto passabasso (LP, lowpass filter) in quanto fa passare solamente le frequenze sotto la frequenza di taglio, ed detto di antialiasing in quanto evita il fenomeno dellaliasing, noto anche come foldover.

Silvio Relandini 9

Il suono digitale capitolo 1 ___________________________________________________________________________

Quindi, prima di campionare il segnale occorre filtrarlo in modo da eliminare una parte del suo spettro che potrebbe causare il problema dellaliasing.

Il fenomeno dellaliasing
Abbiamo visto che se si utilizza una SR superiore al doppio della frequenza di una componente sinusoidale, questa verr campionata bene. Vediamo il caso in cui SR = 2F In tal caso, per campionare bene il segnale dovremmo avere una buona dose di fortuna in quanto per prendere i campioni sui picchi dovrebbe esserci uno sfasamento di un quarto di periodo (90) tra il segnale sinusoidale e linizio del campionamento.

Se per siamo altrettanto sfortunati da effettuare loperazione in fase con il segnale allora i campioni saranno presi quando il segnale passer per lo zero e come risultato avremo un segnale campionato le cui ampiezze sono nulle.

Silvio Relandini 10

Il suono digitale capitolo 1 ___________________________________________________________________________

Per questo motivo il campionamento detto critico. Vediamo cosa succede se la SR inferiore a 2F ovvero: SR < 2F In questo caso il numero dei campioni preso per ogni ciclo di oscillazione inferiore a due e ci vuol dire che il signale risultante ricostruito di frequenza pi bassa rispetto alloriginale.

Questa frequenza chiamata spuria in quanto non era presente nel segnale analogico in ingresso. Questo fenomeno chiamato aliasing. Qual la frequenza FS del segnale spurio? Si calcola in base alla seguente formula:

FS = F - SR
Se ad esempio il segnale da campionare ha una frequenza pari a 1000 Hz e utilizziamo una SR pari a 1500 Hz, allora si avr una frequenza spuria pari a FS = 1000 1500 = -500 Hz Un valore della frequenza negativa non ha senso, equivale solamente a dire che il segnale campionato presenta una controfase e lorecchio la percepir quindi come una 500 Hz. Per comprendere meglio il fenomeno consideriamo limmagine seguente.

Silvio Relandini 11

Il suono digitale capitolo 1 ___________________________________________________________________________

Supponiamo di utilizzare una SR = 800 Hz, tale cio da indurre un campionamento critico sulla componente (rossa) con frequenza 4F (400 Hz) e un fenomeno di aliasing sulla componente ultima (4,4 F, ovvero 440 Hz) che dar come risultato una componente spuria con frequenza pari a 40 Hz e in controfase.

Silvio Relandini 12

Il suono digitale capitolo 1 ___________________________________________________________________________

Le conseguenze dellaliasing possono essere molto nefaste e dipendono dai rapporti che le frequenze spurie hanno con le altre frequenze presenti nel segnale. Ad esempio, nel caso in cui la frequenza spuria sia molto vicina a una frequenza gi presente nel segnale, si potrebbe verificare un fenomeno di battimenti. Riassumento: per una parziale del segnale da campionare sono necessari almeno due campioni per ciascun periodo del segnale: nel periodo di una sinusoide, infatti, il segnale cambia direzione due volte. Inoltre, poich in un segnale complesso sono presenti pi parziali, occorre che il campionamento prelevi almeno due campioni per la parziale di frequenza massima presente nel segnale quindi la SR deve essere almeno il doppio della frequenza massima presente nel segnale di ingresso per evitare il fenomeno dellaliasing.

Sample Rate e percezione sonora


Poich luomo percepisce segnali di frequenza massima pari a 20.000 Hz, sufficiente scegliere una SR vi valore oltre 40.000 campioni al secondo, per non avere perdite significative nella qualit del segnale ricostruito e il fenomeno dellaliasing. La SR relativa al compact disc pari a 44.100 campioni al secondo ed quindi sufficiente a rappresentare correttamente il segnale audio di partenza. Per eliminare le frequenze dal segnale in ingresso, occorre filtrare il segnale in modo da far passare solo le frequenze al di sotto della met del tasso di campionamento. Il dispositivo che permette di fare questa operazione un filtro passabasso che abbiamo visto essere detto di antialiasing. Leliminazione delle frequenze pi elevate in realt una semplificazione in quanto il filtro riesce solo ad attenuare le frequenze indesiderate. La frequenza che fissa la soglia oltre la quale le frequenze vengono attenuate detta frequenza di taglio o di cutoff.

Ricostruzione del segnale analogico a partire da quello digitale


Le stesse tematiche che riguardano il filtro passabasso riappaiono nella ricostruzione del segnale analogico, quando il filtro deve eliminare i cambi repentini di intensit dovuti alla successione di tensioni generate dal convertitore DAC in corrispondenza della lettura dei singoli campioni dal segnale digitalizzato. Questi cambi sono rapidissimi perch la tensione rimane costante fino alla conversione del campione successivo risultando in un segnale a scalini. Nei casi reali lintervallo di tempo tra

Silvio Relandini 13

Il suono digitale capitolo 1 ___________________________________________________________________________

due conversioni successive di decimillesimi di secondo (ad esempio, a 44.100 campioni al secondo lintervallo di 0,023 millisecondi). Ma il segnale analogico di partenza non pu avere questi cambi di intensit cos veloci perch stato utilizzato un flitro passa basso per eliminare le componenti superiori alla met del tasso di campionamento. Per la ricostruzione corretta del segnale pertanto occorre filtrare nuovamente il segnale digitale mediante un filtro passabasso tarato come il filtro usato nella fase di campionamento. Il segnale che arriver ai diffusori sar molto simile a quello originale catturato dal microfono. La conversione inversa, da digitale ad analogico compiuta dal Convertitore DigitaleAnalogico (DAC - Digital-to-Analogue Converter). Il DAC genera delle tensioni elettriche che sono proporzionali ai campioni del segnale digitale, in corrispondenza degli istanti di tempo stabiliti dallorologio interno. Un interpolatore si occupa di smussare i gradini dovuti al salto da un valore di tensione al valore vicino. Il segnale viene amplificato e mandato ai diffusori per la trasduzione in segnale acustico.

Silvio Relandini 14