Sei sulla pagina 1di 27

Stefano Bonetti

4. AUDIO DIGITALE

Campionamento, Frequenza di campionamento e Quantizzazione


Come definizione generale, con il termine campionamento si intende la trasformazione del
segnale audio analogico (continuo) in digitale (discreto).
Tale termine deriva dal fatto che preleviamo dei campioni, ovvero dei valori, del segnale audio
originario e li preleviamo ad intervalli di tempo regolari.
Il ritmo costante con cui si prelevano questi campioni viene identificato con una frequenza
detta frequenza di campionamento che viene misurata in Hertz (Hz).
La frequenza di campionamento viene dunque definita come l'insieme delle misurazioni del
segnale prese nel tempo di un secondo.
Con la quantizzazione il convertitore ADC (analog to digital converter) trasforma i valori
continui di tensione in valori discreti di ampiezza restituendo il numero binario corrispondente:
la precisione della scala di rappresentazione dell'ampiezza dipende dal numero di bit con cui
viene campionato il segnale (si parla di risoluzione in bit del campionamento).
Nella maggior parte dei sistemi digitali consumer, come ad esempio il CD-Audio, il segnale
viene campionato con una risoluzione di 16 bit (che pu rappresentare al massimo 65536
valori, traslati da 32768 a +32767 e dedotti dalla gi citata formula: 2^n_bit).
La quantizzazione agisce sullampiezza del segnale campionato e quindi sul suo range
dinamico (gamma dinamica).
Errore di quantizzazione:
Nella quantizzazione ogni campione viene rappresentato da un valore che ne approssima il
valore reale: un valore infinito deve essere convertito in un valore finito del sistema
binario. qui che l'operazione di conversione in digitale di un segnale analogico introduce una
degradazione, poich il segnale digitale che risulter sar solo una approssimazione del
segnale analogico.
Gli errori di approssimazione introdotti nella quantizzazione provocano del rumore, detto
rumore di quantizzazione, che pu essere quantificato in funzione del numero di bit utilizzato.
Ed proprio il numero di bit a determinare la possibile gamma dinamica, ovvero il cosiddetto
rapporto segnale/rumore (S/R o SNR, Sound to Noise Ratio). Tale rapporto si ottiene mediante
le seguenti espressioni:
S/R(dB) = 6 * n_bit
(dove n_bit il numero di bit)
ovvero, volendo essere pi precisi:
20 * Log10(A.A)
(dove A.A l'ampiezza assoluta)
Ad esempio, con 16 bit il rapporto S/R uguale a 96 dB (a titolo di esempio le registrazioni su
nastro analogico hanno un rapporto S/R di circa 65dB), ovvero 96.3295986125.
Vediamo ora attraverso i due seguenti esempi come Frequenza di campionamento e
Quantizzazione agiscano sulla qualit e sulla dinamica di un segnale:
1) In questo primo esempio cercheremo di campionare un suono ad una frequenza di 10Hz con
una risoluzione di 3bit (sono dei valori naturalmente impossibili nel campo audio, ma servono a
chiarire il concetto).

Con dei valori cos bassi non riusciamo a rappresentare correttamente la forma donda
analogica (colore blu) nel dominio digitale (punti e linee rosse).

2) Se per aumentiamo i valori di frequenza di campionamento e di risoluzione a 20Hz/4bit,


vediamo che il segnale analogico comincia a corrispondere con pi precisione al segnale
digitale (blu = analogico, rosso = digitale).

Arrivando ad una frequenza di campionamento di 44.100Hz (44.100 campioni al secondo) con


una risoluzione di 16bit (scala di rappresentazione di 65536 valori), tipiche come gi detto dei

sistemi digitali home, otterremo una rappresentazione tutto sommato molto vicina a quella
analogica.
Attualmente nei sistemi audio professional si preferiscono frequenze di 96Khz o addirittura
192Khz, con risoluzioni di 24bit, le quali permettono una qualit del suono ottima con un
rapporto segnale/rumore molto elevato (24bit = 144dB).
Foldover e Frequenza di Nyquist
Secondo il teorema di Nyquist la frequenza di campionamento deve essere almeno due volte la
massima frequenza registrata oppure, invertendo i termini, la massima frequenza
rappresentabile in un sistema digitale la met della frequenza di campionamento.
Con il termine di Frequenza di Nyquist si intende esattamente la met della Frequenza di
campionamento.
Un segnale audio con una banda passante di 20 kHz richiede una frequenza di campionamento
di 40 kHz: se prendiamo ad esempio la nostra frequenza di campionamento tipica di 44.100Hz,
la massima frequenza rappresentabile sar di 22.050Hz (Frequenza di Nyquist).
Se esisteranno delle frequenze superiori queste produrranno il cosiddetto fenomeno del
foldover, cio ripiegamento: il termine deriva dal fatto che le frequenze superiori alla
Frequenza di Nyquist verranno riflesse (ripiegate) intorno a questultima.
Per eliminare questo fenomeno bisogna filtrare il segnale con un filtro passa-basso prima della
conversione per assicurare che la sua banda passante sia corretta.
Facciamo nuovamente un esempio (sempre con valori irreali nel campo audio digitale ma che
ci consentono di rappresentare meglio il problema):

Nella figura precedente, il primo suono a 2Hz viene rappresentato correttamente; il suono a
4Hz anche, ma come si vede arriva alla soglia massima di rappresentabilit. Il suono a 6Hz
invece non viene campionato con sufficiente frequenza per essere rappresentato
correttamente, generando cos il fenomeno del foldover.
La frequenza di foldover risultante viene data da:
Freq. di campionamento Freq. troppo alta (superiore a Freq. di Nyquist)
(Nellesempio precedente otteniamo una frequenza di 2Hz data da 8Hz 6Hz)

CONVERTITORI IDEALI

CONVERTITORI REALI:
Nel mondo digitale reale si usano delle particolari tecniche per migliorare ulteriormente il
rapporto S/R:

Aliasing e Sovracampionamento (Oversampling)

Nel processo di conversione digitale/analogica dobbiamo sempre tenere presente che il segnale
digitale convertito in analogico non un segnale continuo, ma a gradini, e perci contiene pi
immagini dello spettro fondamentale, dette alias. Queste sono essenzialmente delle ripetizioni
dello spettro a frequenze pi alte (che superano la frequenza di Nyquist) e sono dovute alla
distorsione armonica introdotta dai gradini stessi. Queste frequenze, riflettendosi al di sotto
della freq. di Nyquist generano del rumore aggiuntivo.
Per evitare i disturbi necessario rimuovere queste immagini con un filtro analogico, che viene
perci detto filtro anti-aliasing. Si tratta di un filtro passabasso con frequenza di taglio pari
alla massima frequenza audio che interessa, quindi, in genere
ft = Freq. campionamento / 2 (ovvero Freq. di Nyquist)
(dove ft la frequenza di taglio).
Poich un filtro analogico non pu avere una curva di taglio ideale, e cio lasciar passare
immutate le frequenze desiderate e cancellare completamente le altre1, si preferisce oggi
aumentare la frequenza di campionamento nel processo di conversione D/A (Digital to Analog),
tipicamente da 4 a 128 volte (oversampling o sovracampionamento), in modo tale da
spostare a frequenze pi alte le immagini degli spettri indesiderati (oltre la soglia di udibilit).
Nelloversampling dunque si aggiungono campioni (per interpolazione) fra un un campione
originale e laltro migliorando cos il rapporto S/R a parit di bit di quantizzazione.

Dithering

La quantizzazione ha alcune importanti conseguenze, particolarmente alle ampiezze pi basse.


Se vero che la gamma dinamica di un segnale di 16 bit di circa 96 dB, questo vale
solamente per i segnali di ampiezza massima.
Consideriamo infatti una sinusoide di ampiezza 18 dB (shiftati in dBfs = 18 96 = -78dBfs),
equivalente a 3 bit (18dB deriva da 3bit * 6 = 18dB; vedere quanto detto per il rapporto S/R):

Inoltre, pi ripido il filtro e pi introduce irregolarit nella risposta in frequenza e distorsioni


di fase.
1

Il risultato (in alto nella figura precedente) una forma d'onda che non affatto sinusoidale,
ma assomiglia pi a un'onda quadra, uno spettro complesso con armoniche dispari: si tratta
quindi di distorsione armonica. Per mascherare queste armoniche che costituiscono il
cosiddetto rumore di quantizzazione, si aggiunge al segnale una piccola quantit di rumore
bianco (dithering = tremore, in basso nella figura precedente).

Convertitori 1 bit (sigma/delta)

Sono i pi utilizzati per realizzare i lettori CD e sfruttano il sovracampionamento per ottenere


un rapporto S/R elevato.

... errore Jitter


Prima di passare alle tecniche di sintesi del suono, dobbiamo menzionare ancora un altro
errore che le apparecchiature digitali possono introdurre nel nostro segnale: il cosiddetto
jitter o errore di jittering.
Fino a questo momento abbiamo dato per scontato che la scheda audio registri i vari campioni
del segnale analogico ad esattamente 44.100Hz, ovvero ogni 1/44.100 secondi (0.022 ms).
Questo per non del tutto esatto perch c sempre un piccolissimo errore di timing
(temporizzazione) che fa prendere il segnale o troppo prima o troppo dopo rispetto al
momento esatto. Questo deriva da piccolissime imprecisioni del generatore di clock (il gi
citato cristallo di quarzo).
Nellaudio professional lerrore di jittering impercettibile (praticamente inesistente), mentre
su apparecchiature mediocri pu essere pi frequente. Provoca distorsioni, rumore o perdita di
informazioni (in pratica riduce il rapporto S/R).

SINTESI DEL SUONO

L'oscillatore digitale e le tecniche di sintesi


Nel caso di segnali numerici, una tecnica di sintesi una formula che consente di calcolare il
valore dei campioni che rappresentano il suono. Lunit di generazione del suono nel
campo digitale viene definita come Oscillatore Digitale.
Formula per la generazione di un suono sinusoidale:
Sn= A*sin(2*PI*F*n*T)
A = Ampiezza,
PI= PiGreco (3.141592...),
F=Frequenza desiderata,
T=Periodo di campionamento (1/Freq. di Campionamento)
In generale loscillatore digitale accetter due parametri in ingresso, ovvero lampiezza e la
frequenza:

Rappresentazione grafica dell'oscillatore

Sintesi additiva
La sintesi additiva un tipo di sintesi con la quale si pu creare una forma donda complessa a
partire dalla somma di forme donda semplici (come ad esempio una somma di sinusoidi).
Modificando le ampiezze delle componenti armoniche (parziali) possibile ottenere una grande
variet di timbri (vedi in proposito il Teorema di Fourier).
Pu essere a spettro fisso (ovvero lampiezza delle parziali non cambia nel tempo) oppure a
spettro variabile (lampiezza di ciascuna parziale varia nel tempo in modo tale che anche il
timbro del suono cambi nel tempo).
Abbiamo gi visto parlando di Fisica del Suono, come anche le forme donda quadra,
triangolare o a dente di sega, derivino dalla sovrapposizione di suoni sinusoidali semplici.

Rappresentazione grafica della sintesi additiva:

Sintesi sottrattiva
La sintesi sottrattiva nasce dellidea di poter creare un suono sottraendo ampiezza ad alcune
componenti di un suono pi complesso di quello da ottenere attraverso luso di filtri. Il filtro
un dispositivo che lascia passare certe frequenze mentre blocca (o riduce) delle altre.
Generalmente si parte da un rumore bianco (che nasce dalla compresenza di tutte le frequenze
udibili) e attraverso un banco di filtri si genera il suono voluto.
I filtri che vengono utilizzati sono:

Filtro passa-basso: un filtro che attenua tutte le frequenze al di sopra della cosiddetta
frequenza di taglio ovvero lascia passare solo le frequenze che si trovano sotto tale
frequenza;
Filtro passa-alto: un filtro che lascia passare tutte le frequenze sopra la frequenza di
taglio e quindi blocca quelle poste al di sotto di tale frequenza;
Filtro passa-banda: un filtro che consente di attenuare le frequenze al di sopra e al di
sotto di una certa banda di frequenze. Ad esempio se gli estremi del filtro sono 1600 e
2000Hz, il filtro attenuer le frequenze al di sotto di 1600Hz e quelle al di sopra di
2000Hz, lasciando passare una banda sonora di 400Hz (detta banda passante o
larghezza di banda).

Sintesi per Modulazione dampiezza (AM) e Modulazione ad anello (RM)


La modulazione dampiezza lalterazione dellampiezza di un oscillatore provocata da un
altro oscillatore. Loscillatore che viene modulato viene detto portante (carrier), mentre
loscillatore che provoca la modulazione viene detto modulante (modulator).
Pensiamo come punto di partenza il concetto del tremolo: esso indica una oscillazione di
ampiezza nel tempo. La caratteristica del tremolo per che questa oscillazione ha una
frequenza bassa (sotto i 20Hz); se per questa oscillazione supera i 20Hz in questo caso
abbiamo un fenomeno diverso, ovvero la comparsa di 2 frequenze nuove che si aggiungono
allo spettro della portante. Da qui nascono le tecniche conosciute con il termine di AM
(modulazione dampiezza) e RM (ring modulation o modulazione ad anello).
La differenza fra questi due tipi di modulazione sta nel fatto che la modulazione dampiezza
usa un segnale modulante unipolare e conterr in uscita anche la portante, mentre la
modulazione ad anello usa un segnale modulante bipolare e non conterr in uscita la portante.
I segnali unipolari sono quelli che oscillano solo nel campo positivo: per crearli c bisogno di
aggiungere una costante (un valore fisso detto Offset) ad un oscillazione bipolare.
I segnali bipolari invece sono quelli che oscillano nel campo positivo e nel negativo.
La modulazione ad anello pu essere generata anche moltiplicando due segnali audio fra di
loro.
I segnali aggiuntivi che vengono a crearsi con questa tecnica sono dati da:

Frequenza della portante + frequenza della modulante


Frequenza della portante frequenza della modulante
Ad esempio con una AM,
Portante: 1000 Hz,
Modulante: 200 Hz,
il risultato sar:
P-M
800

P
1000

P+M
1200

Schema della Modulazione dampiezza

Schema della Modulazione ad anello

Modulazione di Frequenza (FM)


La modulazione di Frequenza invece lalterazione della frequenza di un oscillatore (portante)
provocata da un altro oscillatore (modulante con frequenza superiore ai 20Hz2).
Mentre nella modulazione dampiezza avevamo un sola coppia di bande laterali (rispetto alla
portante), nella FM abbiamo una serie teoricamente infinita di coppie di bande laterali.
Le nuove frequenze che si vengono a generare saranno date dalla somma e differenza del
segnale portante con il segnale modulante (moltiplicato per il numero dordine delle nuove
parziali).
Esempio:
Portante = 1000Hz
Modulante = 3Hz
Il risultato sar: Suono portante di 1000Hz + le seguenti bande laterali:

997 (P 1M)
994 (P 2M)
991 (P 3M)
988 (P 4M)
985 (P 5M)

1003 (P + 1M)
1006 (P + 2M)
1009 (P + 3M)
1012 (P + 4M)
1015 (P + 5M)

Lampiezza delle parziali aggiuntive dipende dallindice di modulazione (cio Amp.Mod /


Freq.Mod) ed data dalla funzione di Bessel di I specie.
.
2

In caso di una frequenza inferiore ai 20Hz si produrr il fenomeno del vibrato.

10

Schema della Modulazione di Frequenza

11

EQUALIZZATORI
Un equalizzatore un circuito in grado di amplificare o attenuare una certa banda di frequenze
e di lasciarne altre inalterate: agisce dunque sul timbro del suono effettuando delle correzioni
sullampiezza delle frequenze.
Gli equalizzatori possono essere Attivi o Passivi:

Attivi: Amplificano o attenuano la frequenza selezionata. Se desideriamo sentire


maggiormente la frequenza ad esempio dei 500Hz aumenteremo sullequalizzatore il
valore corrispondente. L'equalizzatore attivo non far altro che alzare il volume intorno
ai 500Hz rispetto al bilanciamento generale. Gli equalizzatori attivi utilizzano
componenti elettronici attivi e dunque consentono un reale aumento del guadagno.

Passivi: Sono dei filtri che limitano il passaggio della frequenza sulla quale sono
impostati. Questi, a differenza di quelli attivi, non amplificano nulla, il loro compito
quello di opporsi al passaggio di determinate frequenze: quando il guadagno viene
posto al massimo, il segnale non viene alterato mentre viene attenuato quando il
guadagno abbassato (tramite un potenziometro o un cursore).

Tipi di equalizzatore:

Equalizzatore a campana

Questo tipo di equalizzatore dotato di 3 controlli:

1. - Guadagno (attenuazione/amplificazione - cut/boost)


Agisce sull'ampiezza A della campana che pu essere sia positiva (amplificazione) che
negativa (attenuazione). L'amplificazione massima un parametro che dipende dalla
qualit del circuito: arrivare a 15dB di guadagno senza introdurre distorsioni implica
l'uso di tecnologie sofisticate. Generalmente troviamo questo tipo di EQ sui canali del
mixer. Pi il mixer di fascia professionale, pi i suoi peak EQ consentono guadagni
elevati senza introdurre distorsioni. Nei mixer di fascia media generalmente i guadagni
sono dell'ordine di 12dB.

2. - Frequenza di taglio (frequenza centrale - center frequency)

la frequenza alla quale si ha il guadagno massimo (o minimo) sulla campana.


Generalmente un potenziometro ne consente la variazione permettendo di centrare la

12

campana esattamente nella zona di frequenze che vogliamo manipolare.

3. - Fattore di merito Q (Q factor)


un parametro che misura l'ampiezza (in larghezza) della campana cio l'ampiezza
della banda di frequenze che vengono amplificate o attenuate.

Equalizzatore a scaffale (Shelving EQ)


Questo tipo di equalizzatore viene utilizzato per avere un controllo sugli estremi dello
spettro delle frequenze udibili (dunque per le frequenze basse, low-shelf e le frequenze
alte, high-shelf). E praticamente lunione di un filtro passa-basso con uno passa-alto.

Equalizzatori parametrici
Si distinguono in:

1. - Completamente parametrici: possibile modificare tutte e tre le grandezze che

2.
3.

caratterizzano la campana di equalizzazione: frequenza centrale (fc), guadagno (A),


fattore di merito (Q). I mixer professionali hanno su ogni canale un equalizzatore
parametrico a 4 bande: bassi, medio bassi, medio alti, alti.
- Semi parametrici: il fattore di merito Q non variabile, cio la forma della campana
fissa.
- Di picco: sono fissi i valori di fc e Q ed possibile intervenire solo sul guadagno (sono
i pi economici e vengono installati su mixer di fascia bassa).

Sezione di equalizzazione di un mixer professionale:

13

Equalizzatore grafico
composto da una serie di singoli equalizzatori a campana. La larghezza della campana
varia a seconda del contesto operativo per il quale l'equalizzatore viene disegnato.
L'equalizzatore grafico quello pi comune, presente in molti apparecchi audio, con un
certo numero di bande prefissate di frequenza e relativi controlli che ne regolano
l'enfatizzazione ed il taglio. Le bande di frequenza regolabili possono essere 2 o 3 nei
modelli minimi (bassi, indicativamente sotto i 300 Hz; medi, sotto i 3 KHz; alti, sopra i 3
KHz) oppure anche diverse decine (modelli a 32 bande etc.), con una regolazione precisa e
mirata su una vasta gamma di frequenze. La posizione dei controlli disegna una curva
caratteristica a seconda del tipo di intervento sull'audio e naturalmente pi bande si
utilizzeranno, pi sar preciso il disegno della curva.

FILTRI
I filtri vengono utilizzati per attenuare o eliminare delle bande di frequenza dal segnale
originario.

Filtri Passa-Basso e Passa-Alto


Come gi accennato, il filtro passa-basso permette il passaggio delle sole frequenze minori
della frequenza di taglio, mentre il filtro passa-alto permette il passaggio solo di quelle
maggiori:

Tipiche utilizzazioni di filtri passa-alto sono l'eliminazione di vibrazioni a bassa frequenza


come quelle generate da musicisti che camminano su un palco su cui sono poggiati i
microfoni o come il rumore di fondo generato da un condizionatore d'aria o da altre
apparecchiature elettriche. Filtri passa-basso vengono invece usati per esempio per
eliminare fruscii o rumori ad alta frequenza.

Filtro Passa-Banda e Filtro a reiezione di banda


Il Filtro Passa-Banda consente il passaggio di una certa banda di frequenze e impedisce il
passaggio del resto del segnale, mentre il filtro a reiezione di banda il suo contrario,
cio impedisce il passaggio di una certa banda e consente il passaggio del resto delle
frequenze del segnale.

Pendenza del filtro: La pendenza di un filtro stabilisce quanto rapidamente l'ampiezza decada.
Abbiamo visto in precedenza come in varie situazioni si renda necessaria una pendenza quasi
verticale: nella realt dei filtri ci non realizzabile ma ci si pu solo avvicinare a tale risultato.

14

EFFETTI

Riverbero
Il riverbero il suono che permane in un ambiente quando il segnale diretto si esaurito.
Ne abbiamo gi parlato in Fisica del suono descrivendo il fenomeno della Riflessione, ma
comunque per immaginarlo facciamo un altro esempio: un battito delle mani in una cattedrale.
Dopo aver percosso le mani il suono riverbera per diversi secondi estinguendosi lentamente.
Questo riverbero deriva dalle riflessioni del suono originario sulle superfici che incontra. Nel
fenomeno della riflessione, una parte dell'energia associata all'onda sonora viene assorbita e
un'altra parte viene riflessa e dunque ad ogni riflessione l'onda sonora perde una parte di
energia fino a che questa non si estingue.

La figura precedente mostra l'ampiezza delle varie riflessioni e gli istanti di tempo in cui si
verificano. Il primo suono che raggiunge l'ascoltatore sempre il segnale diretto (Direct
Signal); dopo una breve pausa denominata ritardo iniziale (pre-delay) arrivano le prime
riflessioni (early reflections) che sono quelle che hanno incontrato una sola superficie prima
di arrivare all'ascoltatore. Infine arrivano le ultime riflessioni (late reflections) che sono quelle
che hanno incontrato pi di una superficie: queste arrivano sovrapponendosi le une con le altre
generando un suono mediamente continuo. Le ultime riflessioni, per il loro carattere
ravvicinato nel tempo, prendono anche il nome di grappolo di riverberazione, in inglese RC:
reverb cluster.
Le unit di riverbero dell'ultima generazione praticamente sono tutte digitali e impiegano
algoritmi di simulazione molto sofisticati, la cui relizzazione resa possibile grazie al continuo
aumento della potenza di calcolo disponibile.
Di seguito viene riportata una lista dei controlli fondamentali:

Pre Delay: Consente di modificare il tempo del Pre Delay.


Early Reflections: Durata delle prime riflessioni.
Decay: Durata del decadimento delle ultime riflessioni.
Mix: La percentuale tra segnale asciutto e riverberato.
Room Size: spesso i valori sono riferiti alle forme-dimensioni degli ambienti (hall, room,
chamber, cathedral, ecc.).
HF Ratio: le alte frequenze sono le prime ad essere attenuate durante le riflessioni.
Questo controllo permette di simulare le capacit di assorbimento delle superfici.
Stereo width: allarga o restringe l'immagine stereo del riverbero.

15

Delay
Aggiunge repliche del segnale distanziate nel tempo generando un effetto eco.
Inizialmente veniva prodotto utilizzando un registratore analogico sfruttando la distanza tra
due testina di lettura. La tecnica digitale ha semplificato molto la realizzazione di questo effetto
consentendo inoltre di introdurre innovazioni interessanti come il ping pong delay (le repliche
sono alternate sui canali destro e sinistro) ed il multi-tap (le repliche si susseguono con tempi
diversi creando effetti di dissolvenza).

Phaser
Questo effetto combina il segnale originario e una sua versione ritardata in cui il ritardo viene
modulato: ci significa che varia continuamente e l'andamento della variazione definito da
una funzione generalmente sinusoidale generata da un LFO (Low Frequency Oscillator).

Vediamo che il segnale in ingresso viene diviso in due parti: la prima raggiunge l'uscita senza
essere manipolata mentre la seconda viene fatta passare attraverso un delay e poi ri-miscelata
al segnale di ingresso. Il tempo di delay controllato come gi detto da un circuito LFO (Low
Frequency Oscillator - Oscillatore a bassa frequenza). Tali oscillatori vengono di solito
impiegati per controllare i parametri di altri effetti come nel presente caso in cui il LFO modula
il tempo di ritardo tra i due segnali.
Possiamo notare che una parte del segnale destinato all'uscita viene prelevata e rispedita in
ingresso (feedback). Questo artificio viene impiegato in tanti altri tipi di effetti e ha il risultato
di amplificare ulteriormente l'effetto applicato.
I controlli tipici di cui viene dotato un effetto phaser sono i seguenti:

Rate: la velocit di variazione del tempo di delay ( la frequenza del modulatore LFO).
Mix: miscela il segnale originario e quello manipolato.
Feedback: controlla la quantit di ritorno del segnale (in pratica il phasing applicato).

Flanger
Estende l'effetto phasing aggiungendo anche un pitch shifter, ossia un circuito in grado di
modificare la frequenza (altezza) del segnale.

16

Chorus
Presenta un'ulteriore estensione rispetto al Phaser e al Flanger aggiungendo un modulo che
introduce variazioni di ampiezza sul segnale manipolato:

Leffetto che ne deriva quello di avere pi voci che cantano lo stesso segnale.

Pitch Shifter
Questo effetto in grado modificare la frequenza (altezza) del segnale in ingresso.

Tremolo
Applica sul segnale di ingresso delle modulazioni di ampiezza. La frequenza del LFO controlla la
rapidit della modulazione dell'ampiezza del segnale audio (deve essere sotto i 20Hz,
altrimenti viene percepito come AM: vedi prima Modulazione di Ampiezza).

Vibrato
Applica sul segnale di ingresso delle modulazioni di frequenza. In questo caso un LFO modula
la frequenza del segnale (deve essere sotto i 20Hz: vedi prima Modulazione di Frequenza).

Distorsore
La nascita del Rock deve molto all'invenzione di questo effetto scoperto per caso come risultato
di un'errata amplificazione. Il principio di funzionamento del distorsore molto semplice:
quando l'ampiezza di un segnale supera la soglia massima consentita all'ingresso di un
amplificatore, si incorre nel fenomeno chiamato saturazione. Questo significa che quando il
segnale di ingresso minore della soglia, l'amplificatore funziona correttamente e riproduce in
uscita la forma d'onda amplificata. Quando per il segnale di ingresso supera la soglia,

17

l'amplificatore ha raggiunto il suo massimo e non in grado di amplificare ulteriormente la


forma d'onda. Ci si traduce in un'uscita costante pari al massimo consentito per
l'amplificazione per tutto il tempo che il segnale di ingresso rimane al di sopra della soglia.
Quando il segnale di ingresso ridiscende al di sotto della soglia l'amplificatore ricomincia a
funzionare correttamente.
Esempio:

Dunque in uscita abbiamo un segnale 'saturato': la saturazione introduce una brusca


variazione del segnale che non segue pi il suo andamento sinusoidale naturale e questo
significa che il nuovo segnale contiene nuove frequenze pi alte di quella originaria
(distorsione).

18

PROCESSORI DI SEGNALE
Compressore
Il compressore agisce sulla dinamica del segnale di ingresso riducendone l'ampiezza quando
questa supera una certa soglia; la riduzione viene espressa con un rapporto, per esempio 3:1.
Ci significa che quando il segnale supera la soglia, la parte di segnale al di sopra di questa
viene ridotta di 1/3:

Nella figura precedente abbiamo sulla sinistra il segnale che si presenta all'ingresso del
compressore. Sulla sinistra vediamo le ampiezze di riferimento misurate in dB e possiamo
notare che il segnale ha una dinamica di 50 dB. La figura mostra anche la soglia scelta per
l'azione del compressore: -20 dB. Nella figura di destra vediamo il risultato di una
compressione 3:1. La parte di segnale al di sotto della soglia rimasta invariata mentre la
parte superiore stata ridotta a 1/3 e dunque la parte di dinamica superiore alla soglia che era
di 30 dB si ridotta a 10 dB. La dinamica complessiva passa cos da 50 dB a 30 dB.
Controlli del compressore:

Threshold (Soglia): Questo valore espresso in dB e determina la soglia oltre la quale il


compressore entra in azione.
Ratio (Rapporto): Quantifica la riduzione di ampiezza del segnale al di sopra della
soglia. Alcuni rapporti tipici sono:
o 1:1 - Assenza di compressione, il segnale di uscita lo stesso del segnale di
ingresso.
o 2:1 - Il segnale al di sopra della soglia viene dimezzato. Se il segnale supera la
soglia di 10 dB il suo valore verr ridotto a 5 dB sopra la soglia.
o Altri valori sono 3:1, 4:1 ecc. Per valori superiori a 10:1 il compressore si
comporta praticamente come un limitatore (vedi pi avanti).
Attack time (Tempo di attacco): Indica il tempo impiegato dal compressore per entrare
in azione dopo che il segnale ha superato la soglia e viene indicato in millisecondi.
Lasciare un tempo di attacco lungo significa che il segnale che ha superato la soglia,
finch non passato il tempo di attacco, non viene compresso. Esaurito il tempo di
attacco, il compressore riduce l'ampiezza del segnale: questo ha la conseguenza di
evidenziare la parte iniziale dei suoni.
Release time (Tempo di rilascio): il tempo che impiega il compressore per ritornare
all'assenza di compressione ossia a un rapporto 1:1 dopo che il segnale di ingresso

19

sceso al di sotto della soglia. Serve a conferire un'azione pi dolce all'azione del
compressore.

Nella figura seguente viene mostrata la curva di compressione di un compressore per diversi
valori del rapporto di compressione (Ratio):

La figura mostra l'ampiezza del segnale di uscita in funzione di quello di ingresso. Si vede che
fino al valore di soglia l'ampiezza del segnale di uscita la stessa di quella del segnale di
ingresso. Oltre interviene la compressione secondo il rapporto impostato.

Utilizzi del compressore


Il compressore viene utilizzato in molti modi diversi. Ricordiamo ad esempio:

Compressione dell'intero mix: Applicando una compressione stereo ad un intero mix


possiamo ottenere un suono pi omogeneo in quanto le brusche variazioni di volume
vengono livellate e tutti i suoni vanno a far parte di un corpo unico. La compressione di
un intero mix ci permette anche di limitarne la dinamica e questo viene fatto sia perch
il genere musicale in questione lo richiede (per esempio la musica dance non richiede
pi di 30 dB di dinamica), sia per motivi tecnici (per esempio, la trasmissione della
musica via radio consente una dinamica al massimo di 15/20 dB dunque viene
effettuata una pesante compressione prima della diffusione).

Modifica dell'inviluppo di un segnale: In questo caso viene utilizzato per modificare il


suono di un singolo strumento. La scelta dei parametri dipende interamente dal tipo di
segnale in ingresso e dal risultato che si vuole ottenere.

De-esser
Il termine de-essing indica l'operazione di eliminazione di quel fastidioso fruscio che si ha in
certe registrazioni vocali in corrispondenza delle lettere con maggiore contenuto di alte
frequenze come la 's'. Il fruscio dipende dal fatto che il segnale in quel momento satura alla
frequenza della lettera 's' generando una distorsione.
Per realizzare il de-essing si ricorre all'uso di un compressore abbinato ad un equalizzatore: il

20

segnale originario viene fatto passare in un equalizzatore in cui le 's' vengono evidenziate
ancora di pi mentre tutte le altre frequenze vengono attenuate al massimo.

Il segnale che esce dall'equalizzatore ha un'ampiezza rilevante solo in presenza delle 's'.
Questo segnale viene spedito nell'ingresso del compressore con l'effetto di metterlo in azione
solo in corrispondenza delle 's'. Dunque ogni volta che la 's' si presenta, il segnale uscito
dall'equalizzatore supera la soglia fissata sul compressore che dunque entra in azione
abbassando il volume della voce ed evitando la saturazione. Finita la 's' il volume della voce
torna quello originario.

Limiter
Quando in un compressore il rapporto di compressione viene portato ad un valore superiore a
10:1, questo assume il comportamento di un limiter:

Con riferimento alla figura precedente, il segnale che ha superato il valore di soglia viene
riportato al valore di soglia stesso. Ci significa che il segnale non supera mai la soglia.
Nonostante questa soluzione introduca forti distorsioni, in quanto ha un comportamento
equivalente alla saturazione, viene a volte impiegata per proteggere le apparecchiature da
picchi inaspettati che potrebbero danneggiarli.

21

Gate
Si tratta di un circuito in grado di far passare il segnale di ingresso verso l'uscita solo se
l'ampiezza di questo maggiore di una prefissata soglia.
Controlli:

Threshold (Soglia): Al di sopra della soglia il segnale passa e arriva all'uscita. Al di sotto
della soglia il segnale viene fermato (o meglio attenuato).
Attack time (Tempo di attacco): Tempo di apertura del gate quando il segnale supera la
soglia.
Hold time (Tempo di tenuta): Il tempo per il quale il gate viene tenuto aperto anche
quando il segnale ridisceso al di sotto della soglia.

Es. Pulizia dei suoni di una batteria: Immaginiamo i segnali provenienti dal microfonaggio di
una batteria. Ogni microfono fornir il suono dell'elemento verso cui puntato ma risentir
anche del rumore che tutti gli altri elementi producono (leaking). Per evitare ci ogni segnale
viene fatto passare attraverso un gate che ne impedisce il passaggio quando l'elemento in
questione non viene percosso. Naturalmente, nel momento della percussione, il segnale passa
e permette il passaggio anche a tutti i suoni di sottofondo: tuttavia poich il suono
dell'elemento predominante, tender a coprire il sottofondo.
Expander
E praticamente il processo contrario del compressore. Al di sotto della soglia il segnale viene
amplificato secondo il valore del rapporto di espansione; sopra la soglia il segnale di ingresso si
presenta invariato alluscita.

22

MICROFONI
I microfoni sono dei trasduttori in grado di trasformare energia acustica (meccanica) in energia
elettrica: in particolare le variazioni della pressione atmosferica vengono convertite in
variazioni di tensione e dunque in corrente. In base alla tipologia costruttiva utilizzata
possiamo distinguere 3 tipi di microfono:
1. Microfono elettrodinamico
Un avvolgimento fatto di un materiale conduttore fissato sul diaframma che viene investito
dall'onda sonora e che vibra in conseguenza di questa. L'avvolgimento si trova all'interno di un
campo magnetico generato da un apposito magnete posto al suo interno: quando il diaframma
vibra, fa muovere con s anche l'avvolgimento che rompe le linee del campo magnetico e
dunque nell'avvolgimento viene indotta una corrente. In questo modo il segnale elettrico
generato ha lo stesso andamento dell'onda acustica che ha investito il diaframma.

Caratteristiche principali dei microfoni elettrodinamici:

Sono molto resistenti e per questo vengono comunemente impiegati in situazioni live
(senza rischiare dunque di essere danneggiati).
Sono generalmente adatti per la riproduzione della voce e delle chitarre.
in grado di sopportate pressioni sonore anche molto elevate.

2. Microfono a nastro
In questo caso si usa un diaframma composto da un nastro di alluminio molto sottile che viene
sospeso allinterno di un campo magnetico molto forte. Quando viene messo in vibrazione a
causa dellonda sonora, induce una corrente di intensit ed ampiezza proporzionale allonda
sonora stessa, riproducendo lo stesso fenomeno presente nei microfoni elettrodinamici.
Caratteristiche principali dei microfoni a nastro:

Il diaframma molto sottile permette uneccellente risposta alle alte frequenze anche se
lo rende estremamente delicato e inadatto ad elevate pressioni sonore.
Viene impiegato nella registrazione di voci delicate e di chitarre acustiche.

23

3. Microfono a condensatore
Questo tipo di microfono si basa su un principio elettrostatico piuttosto che elettromagnetico,
come succede invece nel caso dei microfoni dinamici. La testa o capsula del microfono a
condensatore consiste di due lamine molto sottili, una fissa ed una mobile, dette armature o
piastre.
Queste due lamine formano un capacitore (ossia un condensatore, da cui il nome), che un
dispositivo elettrico in grado di immagazzinare una carica elettrica.
La piastra mobile il diaframma del microfono e vibra in accordo con l'onda acustica da cui
viene investito: la vibrazione della piastra produce una variazione della distanza tra le due
piastre variando cos il valore della capacit. Questo implica una variazione della tensione ai
capi delle piastre con un conseguente passaggio di corrente. Il diaframma viene realizzato in
mylar (un tipo di plastica) rivestito di uno strato d'oro (che un eccellente conduttore). Si
rende necessaria l'applicazione di un voltaggio per polarizzare inizialmente il condensatore.
Questo prende il nome di phantom power e viene fornito generalmente dal mixer al quale
il microfono viene collegato: in particolare ogni canale di un mixer possiede un bottone
dedicato alla phantom power che applica sul canale una tensione continua di 48V.
La tensione phantom ha il duplice scopo di polarizzare il condensatore all'interno del microfono
e di amplificare la corrente proveniente dallo stesso. I microfoni a condensatore sono molto pi
accurati dei microfoni elettrodinamici in quanto il diaframma pu essere realizzato con
materiali molto leggeri e di dimensioni ridotte e dunque pu risultare molto sensibile, anche
alle frequenze pi alte.
Caratteristiche principali dei microfoni a condensatore:

Diaframma molto sottile che permette una buona riproduzione anche delle frequenze
pi alte.
Si pu danneggiare se sottoposto a pressioni sonore molto elevate.
Molto delicato e dunque poco adatto a situazioni live: viene generalmente impiegato
negli studi di registrazione.

Diagramma polare di un microfono


Finora abbiamo visto i diversi metodi con cui l'onda sonora viene convertita in un segnale
elettrico: adesso ci occuperemo dei diversi criteri di costruzione dei microfoni che possono
essere impiegati per ottenere caratteristiche direzionali diverse.
Sono infatti state messe a punto una serie di metodologie di costruzione che permettono di
focalizzare la sensibilit di un microfono verso una o pi direzioni specifiche e questo apre
l'orizzonte a tutta una serie di tecniche di microfonaggio che richiederebbero un intero libro per
essere spiegate.
L'andamento della sensibilit a seconda della direzione di provenienza del suono viene
descritto da un grafico denominato diagramma polare. Nella figura seguente vengono
riportati i diagrammi polari pi comuni con la loro denominazione, il centro rappresenta il
microfono con il suo diaframma mentre attorno a questo viene riportato il valore della
sensibilit al variare della direzione.
La direzione viene misurata in gradi: 0 gradi il punto esattamente di fronte al diaframma
mentre 180 gradi indica la posizione opposta, cio dietro al microfono. Ogni corona
concentrica, a partire dalla pi esterna, indica una perdita di 3 dB (per esempio, nella figura b
- diagramma cadioide - si pu notare una perdita di 3 dB per suoni provenienti da una
direzione con un angolo di 45 gradi rispetto alla direzione centrale):

24

Descrizione dei diagrammi polari:

Circolare: il microfono egualmente sensibile in tutte le direzioni dello spazio. Un


suono viene riprodotto con la stessa accuratezza da qualsiasi direzione provenga.
Cardioide: il nome deriva dalla linea a forma di cuore del diagramma. In questo caso i
suoni provenienti da dietro il microfono non vengono captati o meglio vengono
drasticamente attenuati.
Figura a 8: in questo caso il microfono in grado di captare al meglio i suoni
provenienti sia da dietro che da davanti ma risulta poco sensibile ai suoni provenienti
dalle direzioni laterali.
Super cardioide: come il diagramma cardioide ma con caratteristiche di direzionalit
accentuate. Tuttavia per stringere il diagramma anteriore bisogna accettare l'insorgenza
di un piccolo lobo posteriore. Ci implica un leggero aumento della sensibilit ai suoni
provenienti da dietro al microfono.
Iper cardioide: Come il super cardioide ma con caratteristiche di direzionalit ancora
pi accentuate. Da notare la presenza ancora maggiore del cardioide posteriore.
Shotgun: prende il nome dal tipo di microfono a cui questo diagramma associato e
che verr descritto tra breve.

Classificazione dei microfoni in base alle loro caratteristiche direzionali:

Microfoni omnidirezionali: Questo tipo di microfono presenta un diagramma polare di


tipo circolare.

Microfoni unidirezionali: Questo tipo di microfono presenta un diagramma polare di tipo


cardioide.

Microfoni a gradiente di pressione: Il diagramma polare in questo caso del tipo


figura di 8. Questo diagramma viene realizzato con dei microfoni a nastro. In questo caso
il microfono viene sollecitato dal suono proveniente dai lati mentre i suoni provenienti da

25

davanti (o da dietro) non vengono captati. Questi microfoni sono utili per registrazioni
stereo.

Microfoni a condensatore a doppio diaframma: Questo tipo di microfoni molto


versatile in quanto consente di modificare le caratteristiche di ogni diaframma e di
ottenere, dalla combinazione dei due, diagrammi polari con le caratteristiche ricercate. Alla
base abbiamo due diaframmi posti uno di fronte all'altro e un circuito in grado di pilotarli
tramite appositi interruttori.

Microfoni PZM: Pressure Zone Microphones ovvero Microfoni a zona di pressione (detto
anche a pannello). Una zona di pressione uno spazio costruito con superfici altamente
riflettenti: dunque in prossimit della zona di pressione il campo sonoro viene quasi
raddoppiato essendo composto sia dall'onda incidente che dall'onda riflessa.
I microfoni PZM sono montati su apposite piastre orizzontali e vengono posizionati
all'interno della zona di pressione. Vengono utilizzati in genere per le riprese distanziate.

Microfono Shotgun: Questo microfono costituito da un diaframma posto alla fine di un


tubo su cui vengono applicate delle fessure.

Il principio di funzionamento consiste nel fatto che qualsiasi suono che non proviene dalla
direzione di puntamento, penetra all'interno delle fessure e, a causa della lunghezza del
tubo, subisce innumerevoli riflessioni che mediamente si annullano le une con le altre.
I suoni provenienti dalla direzione di puntamento invece percorrono il tubo senza ostacoli.
Questo microfono viene usato per puntare una precisa sorgente sonora nello spazio, anche
a grande distanza.

Microfono Parabolico: In questo caso la parabola, costruita utilizzando materiali


altamente riflettenti, concentra in un unico punto il suono proveniente da una direzione con
una conseguente amplificazione dello stesso:

26

Bibliografia:
-

R. Bianchini, A. Cipriani, Il suono Virtuale, Ed. Contempo


C. Dodge, T.A. Jerse, Computer Music, Ed. Schirmer
Huber, Runstein, Manuale della registrazione sonora, Ed. Hoepli
M. Sacco, Corso di Ingegneria del suono, Audiosonica

27