Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
4. AUDIO DIGITALE
Con dei valori cos bassi non riusciamo a rappresentare correttamente la forma donda
analogica (colore blu) nel dominio digitale (punti e linee rosse).
sistemi digitali home, otterremo una rappresentazione tutto sommato molto vicina a quella
analogica.
Attualmente nei sistemi audio professional si preferiscono frequenze di 96Khz o addirittura
192Khz, con risoluzioni di 24bit, le quali permettono una qualit del suono ottima con un
rapporto segnale/rumore molto elevato (24bit = 144dB).
Foldover e Frequenza di Nyquist
Secondo il teorema di Nyquist la frequenza di campionamento deve essere almeno due volte la
massima frequenza registrata oppure, invertendo i termini, la massima frequenza
rappresentabile in un sistema digitale la met della frequenza di campionamento.
Con il termine di Frequenza di Nyquist si intende esattamente la met della Frequenza di
campionamento.
Un segnale audio con una banda passante di 20 kHz richiede una frequenza di campionamento
di 40 kHz: se prendiamo ad esempio la nostra frequenza di campionamento tipica di 44.100Hz,
la massima frequenza rappresentabile sar di 22.050Hz (Frequenza di Nyquist).
Se esisteranno delle frequenze superiori queste produrranno il cosiddetto fenomeno del
foldover, cio ripiegamento: il termine deriva dal fatto che le frequenze superiori alla
Frequenza di Nyquist verranno riflesse (ripiegate) intorno a questultima.
Per eliminare questo fenomeno bisogna filtrare il segnale con un filtro passa-basso prima della
conversione per assicurare che la sua banda passante sia corretta.
Facciamo nuovamente un esempio (sempre con valori irreali nel campo audio digitale ma che
ci consentono di rappresentare meglio il problema):
Nella figura precedente, il primo suono a 2Hz viene rappresentato correttamente; il suono a
4Hz anche, ma come si vede arriva alla soglia massima di rappresentabilit. Il suono a 6Hz
invece non viene campionato con sufficiente frequenza per essere rappresentato
correttamente, generando cos il fenomeno del foldover.
La frequenza di foldover risultante viene data da:
Freq. di campionamento Freq. troppo alta (superiore a Freq. di Nyquist)
(Nellesempio precedente otteniamo una frequenza di 2Hz data da 8Hz 6Hz)
CONVERTITORI IDEALI
CONVERTITORI REALI:
Nel mondo digitale reale si usano delle particolari tecniche per migliorare ulteriormente il
rapporto S/R:
Nel processo di conversione digitale/analogica dobbiamo sempre tenere presente che il segnale
digitale convertito in analogico non un segnale continuo, ma a gradini, e perci contiene pi
immagini dello spettro fondamentale, dette alias. Queste sono essenzialmente delle ripetizioni
dello spettro a frequenze pi alte (che superano la frequenza di Nyquist) e sono dovute alla
distorsione armonica introdotta dai gradini stessi. Queste frequenze, riflettendosi al di sotto
della freq. di Nyquist generano del rumore aggiuntivo.
Per evitare i disturbi necessario rimuovere queste immagini con un filtro analogico, che viene
perci detto filtro anti-aliasing. Si tratta di un filtro passabasso con frequenza di taglio pari
alla massima frequenza audio che interessa, quindi, in genere
ft = Freq. campionamento / 2 (ovvero Freq. di Nyquist)
(dove ft la frequenza di taglio).
Poich un filtro analogico non pu avere una curva di taglio ideale, e cio lasciar passare
immutate le frequenze desiderate e cancellare completamente le altre1, si preferisce oggi
aumentare la frequenza di campionamento nel processo di conversione D/A (Digital to Analog),
tipicamente da 4 a 128 volte (oversampling o sovracampionamento), in modo tale da
spostare a frequenze pi alte le immagini degli spettri indesiderati (oltre la soglia di udibilit).
Nelloversampling dunque si aggiungono campioni (per interpolazione) fra un un campione
originale e laltro migliorando cos il rapporto S/R a parit di bit di quantizzazione.
Dithering
Il risultato (in alto nella figura precedente) una forma d'onda che non affatto sinusoidale,
ma assomiglia pi a un'onda quadra, uno spettro complesso con armoniche dispari: si tratta
quindi di distorsione armonica. Per mascherare queste armoniche che costituiscono il
cosiddetto rumore di quantizzazione, si aggiunge al segnale una piccola quantit di rumore
bianco (dithering = tremore, in basso nella figura precedente).
Sintesi additiva
La sintesi additiva un tipo di sintesi con la quale si pu creare una forma donda complessa a
partire dalla somma di forme donda semplici (come ad esempio una somma di sinusoidi).
Modificando le ampiezze delle componenti armoniche (parziali) possibile ottenere una grande
variet di timbri (vedi in proposito il Teorema di Fourier).
Pu essere a spettro fisso (ovvero lampiezza delle parziali non cambia nel tempo) oppure a
spettro variabile (lampiezza di ciascuna parziale varia nel tempo in modo tale che anche il
timbro del suono cambi nel tempo).
Abbiamo gi visto parlando di Fisica del Suono, come anche le forme donda quadra,
triangolare o a dente di sega, derivino dalla sovrapposizione di suoni sinusoidali semplici.
Sintesi sottrattiva
La sintesi sottrattiva nasce dellidea di poter creare un suono sottraendo ampiezza ad alcune
componenti di un suono pi complesso di quello da ottenere attraverso luso di filtri. Il filtro
un dispositivo che lascia passare certe frequenze mentre blocca (o riduce) delle altre.
Generalmente si parte da un rumore bianco (che nasce dalla compresenza di tutte le frequenze
udibili) e attraverso un banco di filtri si genera il suono voluto.
I filtri che vengono utilizzati sono:
Filtro passa-basso: un filtro che attenua tutte le frequenze al di sopra della cosiddetta
frequenza di taglio ovvero lascia passare solo le frequenze che si trovano sotto tale
frequenza;
Filtro passa-alto: un filtro che lascia passare tutte le frequenze sopra la frequenza di
taglio e quindi blocca quelle poste al di sotto di tale frequenza;
Filtro passa-banda: un filtro che consente di attenuare le frequenze al di sopra e al di
sotto di una certa banda di frequenze. Ad esempio se gli estremi del filtro sono 1600 e
2000Hz, il filtro attenuer le frequenze al di sotto di 1600Hz e quelle al di sopra di
2000Hz, lasciando passare una banda sonora di 400Hz (detta banda passante o
larghezza di banda).
P
1000
P+M
1200
997 (P 1M)
994 (P 2M)
991 (P 3M)
988 (P 4M)
985 (P 5M)
1003 (P + 1M)
1006 (P + 2M)
1009 (P + 3M)
1012 (P + 4M)
1015 (P + 5M)
10
11
EQUALIZZATORI
Un equalizzatore un circuito in grado di amplificare o attenuare una certa banda di frequenze
e di lasciarne altre inalterate: agisce dunque sul timbro del suono effettuando delle correzioni
sullampiezza delle frequenze.
Gli equalizzatori possono essere Attivi o Passivi:
Passivi: Sono dei filtri che limitano il passaggio della frequenza sulla quale sono
impostati. Questi, a differenza di quelli attivi, non amplificano nulla, il loro compito
quello di opporsi al passaggio di determinate frequenze: quando il guadagno viene
posto al massimo, il segnale non viene alterato mentre viene attenuato quando il
guadagno abbassato (tramite un potenziometro o un cursore).
Tipi di equalizzatore:
Equalizzatore a campana
12
Equalizzatori parametrici
Si distinguono in:
2.
3.
13
Equalizzatore grafico
composto da una serie di singoli equalizzatori a campana. La larghezza della campana
varia a seconda del contesto operativo per il quale l'equalizzatore viene disegnato.
L'equalizzatore grafico quello pi comune, presente in molti apparecchi audio, con un
certo numero di bande prefissate di frequenza e relativi controlli che ne regolano
l'enfatizzazione ed il taglio. Le bande di frequenza regolabili possono essere 2 o 3 nei
modelli minimi (bassi, indicativamente sotto i 300 Hz; medi, sotto i 3 KHz; alti, sopra i 3
KHz) oppure anche diverse decine (modelli a 32 bande etc.), con una regolazione precisa e
mirata su una vasta gamma di frequenze. La posizione dei controlli disegna una curva
caratteristica a seconda del tipo di intervento sull'audio e naturalmente pi bande si
utilizzeranno, pi sar preciso il disegno della curva.
FILTRI
I filtri vengono utilizzati per attenuare o eliminare delle bande di frequenza dal segnale
originario.
Pendenza del filtro: La pendenza di un filtro stabilisce quanto rapidamente l'ampiezza decada.
Abbiamo visto in precedenza come in varie situazioni si renda necessaria una pendenza quasi
verticale: nella realt dei filtri ci non realizzabile ma ci si pu solo avvicinare a tale risultato.
14
EFFETTI
Riverbero
Il riverbero il suono che permane in un ambiente quando il segnale diretto si esaurito.
Ne abbiamo gi parlato in Fisica del suono descrivendo il fenomeno della Riflessione, ma
comunque per immaginarlo facciamo un altro esempio: un battito delle mani in una cattedrale.
Dopo aver percosso le mani il suono riverbera per diversi secondi estinguendosi lentamente.
Questo riverbero deriva dalle riflessioni del suono originario sulle superfici che incontra. Nel
fenomeno della riflessione, una parte dell'energia associata all'onda sonora viene assorbita e
un'altra parte viene riflessa e dunque ad ogni riflessione l'onda sonora perde una parte di
energia fino a che questa non si estingue.
La figura precedente mostra l'ampiezza delle varie riflessioni e gli istanti di tempo in cui si
verificano. Il primo suono che raggiunge l'ascoltatore sempre il segnale diretto (Direct
Signal); dopo una breve pausa denominata ritardo iniziale (pre-delay) arrivano le prime
riflessioni (early reflections) che sono quelle che hanno incontrato una sola superficie prima
di arrivare all'ascoltatore. Infine arrivano le ultime riflessioni (late reflections) che sono quelle
che hanno incontrato pi di una superficie: queste arrivano sovrapponendosi le une con le altre
generando un suono mediamente continuo. Le ultime riflessioni, per il loro carattere
ravvicinato nel tempo, prendono anche il nome di grappolo di riverberazione, in inglese RC:
reverb cluster.
Le unit di riverbero dell'ultima generazione praticamente sono tutte digitali e impiegano
algoritmi di simulazione molto sofisticati, la cui relizzazione resa possibile grazie al continuo
aumento della potenza di calcolo disponibile.
Di seguito viene riportata una lista dei controlli fondamentali:
15
Delay
Aggiunge repliche del segnale distanziate nel tempo generando un effetto eco.
Inizialmente veniva prodotto utilizzando un registratore analogico sfruttando la distanza tra
due testina di lettura. La tecnica digitale ha semplificato molto la realizzazione di questo effetto
consentendo inoltre di introdurre innovazioni interessanti come il ping pong delay (le repliche
sono alternate sui canali destro e sinistro) ed il multi-tap (le repliche si susseguono con tempi
diversi creando effetti di dissolvenza).
Phaser
Questo effetto combina il segnale originario e una sua versione ritardata in cui il ritardo viene
modulato: ci significa che varia continuamente e l'andamento della variazione definito da
una funzione generalmente sinusoidale generata da un LFO (Low Frequency Oscillator).
Vediamo che il segnale in ingresso viene diviso in due parti: la prima raggiunge l'uscita senza
essere manipolata mentre la seconda viene fatta passare attraverso un delay e poi ri-miscelata
al segnale di ingresso. Il tempo di delay controllato come gi detto da un circuito LFO (Low
Frequency Oscillator - Oscillatore a bassa frequenza). Tali oscillatori vengono di solito
impiegati per controllare i parametri di altri effetti come nel presente caso in cui il LFO modula
il tempo di ritardo tra i due segnali.
Possiamo notare che una parte del segnale destinato all'uscita viene prelevata e rispedita in
ingresso (feedback). Questo artificio viene impiegato in tanti altri tipi di effetti e ha il risultato
di amplificare ulteriormente l'effetto applicato.
I controlli tipici di cui viene dotato un effetto phaser sono i seguenti:
Rate: la velocit di variazione del tempo di delay ( la frequenza del modulatore LFO).
Mix: miscela il segnale originario e quello manipolato.
Feedback: controlla la quantit di ritorno del segnale (in pratica il phasing applicato).
Flanger
Estende l'effetto phasing aggiungendo anche un pitch shifter, ossia un circuito in grado di
modificare la frequenza (altezza) del segnale.
16
Chorus
Presenta un'ulteriore estensione rispetto al Phaser e al Flanger aggiungendo un modulo che
introduce variazioni di ampiezza sul segnale manipolato:
Leffetto che ne deriva quello di avere pi voci che cantano lo stesso segnale.
Pitch Shifter
Questo effetto in grado modificare la frequenza (altezza) del segnale in ingresso.
Tremolo
Applica sul segnale di ingresso delle modulazioni di ampiezza. La frequenza del LFO controlla la
rapidit della modulazione dell'ampiezza del segnale audio (deve essere sotto i 20Hz,
altrimenti viene percepito come AM: vedi prima Modulazione di Ampiezza).
Vibrato
Applica sul segnale di ingresso delle modulazioni di frequenza. In questo caso un LFO modula
la frequenza del segnale (deve essere sotto i 20Hz: vedi prima Modulazione di Frequenza).
Distorsore
La nascita del Rock deve molto all'invenzione di questo effetto scoperto per caso come risultato
di un'errata amplificazione. Il principio di funzionamento del distorsore molto semplice:
quando l'ampiezza di un segnale supera la soglia massima consentita all'ingresso di un
amplificatore, si incorre nel fenomeno chiamato saturazione. Questo significa che quando il
segnale di ingresso minore della soglia, l'amplificatore funziona correttamente e riproduce in
uscita la forma d'onda amplificata. Quando per il segnale di ingresso supera la soglia,
17
18
PROCESSORI DI SEGNALE
Compressore
Il compressore agisce sulla dinamica del segnale di ingresso riducendone l'ampiezza quando
questa supera una certa soglia; la riduzione viene espressa con un rapporto, per esempio 3:1.
Ci significa che quando il segnale supera la soglia, la parte di segnale al di sopra di questa
viene ridotta di 1/3:
Nella figura precedente abbiamo sulla sinistra il segnale che si presenta all'ingresso del
compressore. Sulla sinistra vediamo le ampiezze di riferimento misurate in dB e possiamo
notare che il segnale ha una dinamica di 50 dB. La figura mostra anche la soglia scelta per
l'azione del compressore: -20 dB. Nella figura di destra vediamo il risultato di una
compressione 3:1. La parte di segnale al di sotto della soglia rimasta invariata mentre la
parte superiore stata ridotta a 1/3 e dunque la parte di dinamica superiore alla soglia che era
di 30 dB si ridotta a 10 dB. La dinamica complessiva passa cos da 50 dB a 30 dB.
Controlli del compressore:
19
sceso al di sotto della soglia. Serve a conferire un'azione pi dolce all'azione del
compressore.
Nella figura seguente viene mostrata la curva di compressione di un compressore per diversi
valori del rapporto di compressione (Ratio):
La figura mostra l'ampiezza del segnale di uscita in funzione di quello di ingresso. Si vede che
fino al valore di soglia l'ampiezza del segnale di uscita la stessa di quella del segnale di
ingresso. Oltre interviene la compressione secondo il rapporto impostato.
De-esser
Il termine de-essing indica l'operazione di eliminazione di quel fastidioso fruscio che si ha in
certe registrazioni vocali in corrispondenza delle lettere con maggiore contenuto di alte
frequenze come la 's'. Il fruscio dipende dal fatto che il segnale in quel momento satura alla
frequenza della lettera 's' generando una distorsione.
Per realizzare il de-essing si ricorre all'uso di un compressore abbinato ad un equalizzatore: il
20
segnale originario viene fatto passare in un equalizzatore in cui le 's' vengono evidenziate
ancora di pi mentre tutte le altre frequenze vengono attenuate al massimo.
Il segnale che esce dall'equalizzatore ha un'ampiezza rilevante solo in presenza delle 's'.
Questo segnale viene spedito nell'ingresso del compressore con l'effetto di metterlo in azione
solo in corrispondenza delle 's'. Dunque ogni volta che la 's' si presenta, il segnale uscito
dall'equalizzatore supera la soglia fissata sul compressore che dunque entra in azione
abbassando il volume della voce ed evitando la saturazione. Finita la 's' il volume della voce
torna quello originario.
Limiter
Quando in un compressore il rapporto di compressione viene portato ad un valore superiore a
10:1, questo assume il comportamento di un limiter:
Con riferimento alla figura precedente, il segnale che ha superato il valore di soglia viene
riportato al valore di soglia stesso. Ci significa che il segnale non supera mai la soglia.
Nonostante questa soluzione introduca forti distorsioni, in quanto ha un comportamento
equivalente alla saturazione, viene a volte impiegata per proteggere le apparecchiature da
picchi inaspettati che potrebbero danneggiarli.
21
Gate
Si tratta di un circuito in grado di far passare il segnale di ingresso verso l'uscita solo se
l'ampiezza di questo maggiore di una prefissata soglia.
Controlli:
Threshold (Soglia): Al di sopra della soglia il segnale passa e arriva all'uscita. Al di sotto
della soglia il segnale viene fermato (o meglio attenuato).
Attack time (Tempo di attacco): Tempo di apertura del gate quando il segnale supera la
soglia.
Hold time (Tempo di tenuta): Il tempo per il quale il gate viene tenuto aperto anche
quando il segnale ridisceso al di sotto della soglia.
Es. Pulizia dei suoni di una batteria: Immaginiamo i segnali provenienti dal microfonaggio di
una batteria. Ogni microfono fornir il suono dell'elemento verso cui puntato ma risentir
anche del rumore che tutti gli altri elementi producono (leaking). Per evitare ci ogni segnale
viene fatto passare attraverso un gate che ne impedisce il passaggio quando l'elemento in
questione non viene percosso. Naturalmente, nel momento della percussione, il segnale passa
e permette il passaggio anche a tutti i suoni di sottofondo: tuttavia poich il suono
dell'elemento predominante, tender a coprire il sottofondo.
Expander
E praticamente il processo contrario del compressore. Al di sotto della soglia il segnale viene
amplificato secondo il valore del rapporto di espansione; sopra la soglia il segnale di ingresso si
presenta invariato alluscita.
22
MICROFONI
I microfoni sono dei trasduttori in grado di trasformare energia acustica (meccanica) in energia
elettrica: in particolare le variazioni della pressione atmosferica vengono convertite in
variazioni di tensione e dunque in corrente. In base alla tipologia costruttiva utilizzata
possiamo distinguere 3 tipi di microfono:
1. Microfono elettrodinamico
Un avvolgimento fatto di un materiale conduttore fissato sul diaframma che viene investito
dall'onda sonora e che vibra in conseguenza di questa. L'avvolgimento si trova all'interno di un
campo magnetico generato da un apposito magnete posto al suo interno: quando il diaframma
vibra, fa muovere con s anche l'avvolgimento che rompe le linee del campo magnetico e
dunque nell'avvolgimento viene indotta una corrente. In questo modo il segnale elettrico
generato ha lo stesso andamento dell'onda acustica che ha investito il diaframma.
Sono molto resistenti e per questo vengono comunemente impiegati in situazioni live
(senza rischiare dunque di essere danneggiati).
Sono generalmente adatti per la riproduzione della voce e delle chitarre.
in grado di sopportate pressioni sonore anche molto elevate.
2. Microfono a nastro
In questo caso si usa un diaframma composto da un nastro di alluminio molto sottile che viene
sospeso allinterno di un campo magnetico molto forte. Quando viene messo in vibrazione a
causa dellonda sonora, induce una corrente di intensit ed ampiezza proporzionale allonda
sonora stessa, riproducendo lo stesso fenomeno presente nei microfoni elettrodinamici.
Caratteristiche principali dei microfoni a nastro:
Il diaframma molto sottile permette uneccellente risposta alle alte frequenze anche se
lo rende estremamente delicato e inadatto ad elevate pressioni sonore.
Viene impiegato nella registrazione di voci delicate e di chitarre acustiche.
23
3. Microfono a condensatore
Questo tipo di microfono si basa su un principio elettrostatico piuttosto che elettromagnetico,
come succede invece nel caso dei microfoni dinamici. La testa o capsula del microfono a
condensatore consiste di due lamine molto sottili, una fissa ed una mobile, dette armature o
piastre.
Queste due lamine formano un capacitore (ossia un condensatore, da cui il nome), che un
dispositivo elettrico in grado di immagazzinare una carica elettrica.
La piastra mobile il diaframma del microfono e vibra in accordo con l'onda acustica da cui
viene investito: la vibrazione della piastra produce una variazione della distanza tra le due
piastre variando cos il valore della capacit. Questo implica una variazione della tensione ai
capi delle piastre con un conseguente passaggio di corrente. Il diaframma viene realizzato in
mylar (un tipo di plastica) rivestito di uno strato d'oro (che un eccellente conduttore). Si
rende necessaria l'applicazione di un voltaggio per polarizzare inizialmente il condensatore.
Questo prende il nome di phantom power e viene fornito generalmente dal mixer al quale
il microfono viene collegato: in particolare ogni canale di un mixer possiede un bottone
dedicato alla phantom power che applica sul canale una tensione continua di 48V.
La tensione phantom ha il duplice scopo di polarizzare il condensatore all'interno del microfono
e di amplificare la corrente proveniente dallo stesso. I microfoni a condensatore sono molto pi
accurati dei microfoni elettrodinamici in quanto il diaframma pu essere realizzato con
materiali molto leggeri e di dimensioni ridotte e dunque pu risultare molto sensibile, anche
alle frequenze pi alte.
Caratteristiche principali dei microfoni a condensatore:
Diaframma molto sottile che permette una buona riproduzione anche delle frequenze
pi alte.
Si pu danneggiare se sottoposto a pressioni sonore molto elevate.
Molto delicato e dunque poco adatto a situazioni live: viene generalmente impiegato
negli studi di registrazione.
24
25
davanti (o da dietro) non vengono captati. Questi microfoni sono utili per registrazioni
stereo.
Microfoni PZM: Pressure Zone Microphones ovvero Microfoni a zona di pressione (detto
anche a pannello). Una zona di pressione uno spazio costruito con superfici altamente
riflettenti: dunque in prossimit della zona di pressione il campo sonoro viene quasi
raddoppiato essendo composto sia dall'onda incidente che dall'onda riflessa.
I microfoni PZM sono montati su apposite piastre orizzontali e vengono posizionati
all'interno della zona di pressione. Vengono utilizzati in genere per le riprese distanziate.
Il principio di funzionamento consiste nel fatto che qualsiasi suono che non proviene dalla
direzione di puntamento, penetra all'interno delle fessure e, a causa della lunghezza del
tubo, subisce innumerevoli riflessioni che mediamente si annullano le une con le altre.
I suoni provenienti dalla direzione di puntamento invece percorrono il tubo senza ostacoli.
Questo microfono viene usato per puntare una precisa sorgente sonora nello spazio, anche
a grande distanza.
26
Bibliografia:
-
27