Introduzione Audio

Arcangelo Monetti Introduzione all’Audio
Arcangelo Monetti - berto
AUDIO
Introduzione ai concetti fondamentali
Febbraio 2010
1
Sommario
Sommario.....................................................................................................................2
Sommario.....................................................................................................................2
Prefazione....................................................................................................................6
Glossario di base...........................................................................................................7
Fisica acustica.............................................................................................................14
Acustica..................................................................................................................14
Suono.....................................................................................................................15
Rumore...................................................................................................................16
Intensità: decibel.....................................................................................................17
Percezione...............................................................................................................19
RMS, valore efficace.................................................................................................22
Le onde ed il contenuto armonico.............................................................................23
inviluppo.................................................................................................................26
Timbro....................................................................................................................28
Rumore e contenuto spettrale...................................................................................29
Ottave e suddivisioni................................................................................................31
La musica ed i relativi termini...................................................................................32
Altezza ................................................................................................................32
Armonici..............................................................................................................33
Velocità................................................................................................................39
Direttività.............................................................................................................40
Dinamica.................................................................................................................41
Dinamica e spettro acustico: esempi......................................................................42
Riflessioni in ambiente.............................................................................................45
Riverbero ed Eco..................................................................................................47
Effetto Larsen..........................................................................................................49
Isolamento..............................................................................................................51
Fisiologia e psicoacustica ............................................................................................53
L’orecchio................................................................................................................53
La percezione..........................................................................................................55
Il suono...................................................................................................................57
Il rumore.................................................................................................................59
La percezione sonora...............................................................................................59
Psicoacustica...........................................................................................................62
Mascheramento....................................................................................................64
I domini, le ontologie e le interpolazioni.................................................................66
Pareidolie.............................................................................................................67
Audio analogico...........................................................................................................69
Dal realistico al finto................................................................................................69
Complessità e qualità...............................................................................................70
Elettronica di base...................................................................................................71
Tensione..............................................................................................................71
Corrente .............................................................................................................71
Impedenze ..........................................................................................................73
Circuiti.................................................................................................................74
Macchine elettriche: Trasformatori ........................................................................75
2
Componenti attivi ....................................................................................................76

Diodo...................................................................................................................76
Componenti attivi a vuoto.....................................................................................77
Componenti attivi a stato solido ............................................................................79
Componenti Analogici Complessi...............................................................................81
L’amplificazione.......................................................................................................81
Amplificatore differenziale........................................................................................82
Amplificatore operazionale ...................................................................................83
La distorsione.........................................................................................................89
Circuiti elettronici.....................................................................................................91
Filtri attivi................................................................................................................94
Pendenza di un filtro ............................................................................................96
Filtri Butterworth / Bessel / Chebyshev..................................................................97
Qualità di un filtro.................................................................................................98
Dispositivi...................................................................................................................99
I trasduttori.............................................................................................................99
I microfoni.............................................................................................................100
Tecnologie dei microfoni.........................................................................................102
Condensatore.....................................................................................................104
Dinamico ...........................................................................................................104
Alimentazione e phantom....................................................................................104
Risposta in frequenza..........................................................................................105
Forma e uso.......................................................................................................107
Direzionalità e Diagrammi polari..........................................................................110
Ripresa stereofonica...........................................................................................113
Gli altoparlanti.......................................................................................................114
Caratteristiche....................................................................................................115
Unità specializzate .............................................................................................116
Audio professionale...................................................................................................118
Gli amplificatori......................................................................................................118
Distorsione armonica..............................................................................................119
HiFi.......................................................................................................................120
Gli altoparlanti.......................................................................................................121
Unità specializzate .............................................................................................121
Unità multivia.....................................................................................................122
Cabinet e caricamento del trasduttore..................................................................124
I Crossover............................................................................................................127
L’Impedenza..........................................................................................................129
Risposta in Frequenza............................................................................................130
Sensibilità...........................................................................................................131
La tenuta in potenza...........................................................................................132
La distorsione.....................................................................................................132
La fase...............................................................................................................133
Cavi e connettori....................................................................................................134
Cavi bilanciati e sbilanciati...................................................................................135
Connessioni........................................................................................................137
Effetto Pelle (Skin Effect)....................................................................................142
I connettori fisici: i disturbi..................................................................................143
I connettori audio..................................................................................................145
3
Connettore Jack .................................................................................................145

Connettore XLR .................................................................................................147
Connettore DIN .................................................................................................150
Connettore RCA..................................................................................................153
Connettore SPEAKON..........................................................................................154
Le apparecchiature di controllo...................................................................................156
Mixer.....................................................................................................................156
Applicazioni........................................................................................................162
Live...................................................................................................................163
Registrazione......................................................................................................164
Conferenza.........................................................................................................165
PostProduzione...................................................................................................166
Mixer automatici e matrici.......................................................................................167
Matrici................................................................................................................167
Mixer automatici.................................................................................................168
Mixer intelligenti.................................................................................................169
Preamplificatori......................................................................................................170
Filtri ed equalizzatori.............................................................................................172
Equalizzatore grafico a terzi di ottava...................................................................172
Equalizzatore parametrico...................................................................................172
Compressori..........................................................................................................173
Anti-larsen ............................................................................................................177
I disturbi...............................................................................................................178
Meccanici...........................................................................................................178
Elettrici..............................................................................................................179
Elettronici...........................................................................................................179
Media ......................................................................................................................181
Disco analogico......................................................................................................181
Nastro magnetico ..................................................................................................183
Velocità del nastro..............................................................................................184
Formato del nastro.............................................................................................185
Musicassette..........................................................................................................185
Dat.......................................................................................................................186
CD........................................................................................................................187
DVD......................................................................................................................187
SA-CD...................................................................................................................188
MiniDisc.................................................................................................................189
DVD......................................................................................................................189
HD-DVD................................................................................................................190
Blue-ray Disk.........................................................................................................191
SD Secure Digital...................................................................................................192
Altri supporti digitali...............................................................................................193
Formati di media....................................................................................................194
Audio digitale............................................................................................................196
Campionamento.....................................................................................................197
Formato di un file PCM...........................................................................................199
Compressione........................................................................................................200
Codec....................................................................................................................200
Standard ..............................................................................................................202
4
MP3 ..................................................................................................................202
AAC MPEG-4.......................................................................................................203
OGG-Vorbis........................................................................................................204
WMA..................................................................................................................205
Dolby Digital AC3................................................................................................206
APE Monkey’s Audio............................................................................................207
Meridian MLP......................................................................................................207
MusePack MPC...................................................................................................207
FLAC..................................................................................................................207
RealAudio...........................................................................................................208
ATRAC...............................................................................................................208
Speex................................................................................................................208
CELP..................................................................................................................209
G.729.................................................................................................................209
Tabella riassuntiva..............................................................................................210
5
Prefazione
Questo manuale nasce dalla necessità, alcuni anni or sono, di formare alcuni colleghi sulle
tematiche dell’audio in senso generale, spaziando dalla fisica alla fisiologia all’elettronica
analogica e digitale, in modo tale da predisporre un substrato culturale minimo e comune
per la successiva preparazione sul campo nelle problematiche legate all’acquisizione ed
elaborazione analogica e digitale del segnale audio, in particolare del parlato umano.
Del corso tenuto a suo tempo mi erano rimasti solo alcuni appunti e l’indice; ho ritenuto
interessante preparare questo manuale che penso possa essere utile a chi, con minime
basi, decide di interessarsi all’argomento senza dover necessariamente conseguire una
laurea.
Parte dei testi sono ripresi da siti internet ed ho ritenuto inutile nasconderlo modificandoli
ad arte. Sicuramente questo testo contiene inoltre svariati errori ed imprecisioni e non
vuole in nessun caso sostituire i testi veri che si possono consultare sui vari argomenti.
Per approfondimento, consiglio caldamente di iniziare con it.wikipedia.org
L’approccio all’argomento è generalista e volutamente non approfondito, in maniera tale

che ciascuno possa trovare gli spunti e le informazioni che necessita, ed eventualmente
l’occasione per approfondirle.
Glossario di base
Questo glossario raccoglie definizioni minimali di fisica e di elettronica, in particolare rivol-
te agli appassionati ed agli inesperti ed in relazione alla catena di riproduzione del segnale
audio.
Alti
La gamma di frequenze acute, generalmente il limite inferiore è pari a 1000Hz.
Ampere
La carica elettrica di base che indica quanta corrente scorre in un circuito elettrico.
La quantità di corrente che scorre in un circuito se applichiamo la tensione di 1 Volt e la

resistenza di 1 Ohm.
Amplificatore
Un apparecchio che incrementa l'ampiezza del segnale applicato al suo ingresso.
Un apparecchio che genera un gran segnale in uscita avendo al suo ingresso un piccolo
segnale.
Ampiezza
La misura dell'ampiezza di un segnale; normalmente viene misurato in V o in dB.
Analizzatore di spettro in tempo reale
Un apparecchio che su un display può visualizzare l'intensità delle varie frequenze costi-
tuenti lo spettro audio, spesso sostituito da un personal computer. Per rilevare l'acustica
dell'ambiente si usa un microfono e come segnale il rumore rosa. Con esso è possibile in-
crementare notevolmente le performance di qualsiasi sistema modificando l’acustica com-
plessiva per la massima linearità.
Attivo
Qualsiasi apparecchio che richiede di un'alimentazione per funzionare.
Bassi
La gamma di frequenze gravi, generalmente il limite superiore è pari a 100Hz.
Bass Reflex
Un sistema di diffusore che utilizzando un tubo od una porta accordata, permette all'aria
all'interno della cassa di rinforzare l'emissione dell'altoparlante principale, mediante riso-
nanza (accordo). Può essere chiamata anche vented o ported.
Capacità
Un componente in cui l'impedenza scende con l'aumentare della frequenza.
E' chiamato anche condensatore. Normalmente è usato nei crossover come filtro passa-
alto. Può essere usato per immagazzinare energia.
Conduttore
Un materiale che non oppone resistenza al passaggio della corrente.
Constant Q / Q- costante
Un'equalizzatore progettato per mantenere costante la banda passante al variare dell'am-

piezza del segnale. E' usato, per esempio, su equalizzatori a terzi d'ottava in maniera da
non interferire durante le regolazioni sulle frequenze adiacenti.
Corrente alternata (AC)
Una corrente prodotta quando gli elettroni si muovono prima in una direzione e poi nell'al-
tra. Il segnale musicale di qualsiasi tipo è d'origine alternata (AC)
Corto circuito
Un punto di un circuito che è posto a massa (nella accezione normale, ma vale per ogni
tipo di connessione occasionale) in maniera anomala. Ciò, se riguarda un segnale di infor-
mazione blocca la leggibilità del segnale, se invece riguarda un’alimentazione può causare
un forte passaggio di corrente con conseguente surriscaldamento e bruciature se non si
protegge l'alimentazione con dei fusibili.
Decibel (abbreviato dB)
l'unità di misura per descrivere un'intensità di segnale o di livello audio. Lavora in scala lo-
garitmica, ed un incremento di 3 dB, significa un aumento del doppio, un aumento di 6
dB, un incremento del quadruplo, ecc. E' 1/10 di un Bel, dove il Bel è il logaritmo del rap-
porto tra due valori.
Distorsione
Qualsiasi differenza apportata alla forma del segnale originario, dopo che questo è passato
attraverso i sistemi d'amplificazione.
Dinamica
La differenza (in Decibel) tra il segnale più basso ed il più alto che un sistema può ripro-
durre o che un brano musicale contiene. Nel caso di un sistema completo è la differenze
tra il rumore di fondo e la massima potenza erogata dall'amplificatore. Nel caso di una re-
gistrazione, è la differenza tra il rumore di fondo e la massima quantità di segnale che il
supporto usato può accettare.
Efficienza
Generalmente s'intende come efficienza il rapporto tra l'energia totale applicata e l'energia
prodotta. E' espressa in percentuale. Un altoparlante normalmente ha un'efficienza molto
bassa, che va dal 1% al 3%. Significa che tra il 97% ed il 99% della potenza è dissipato in
calore. Se si aggiunge a questo l’efficienza dell’intera catena di riproduzione il valore scen-
de ancora.
Equalizzatore
E' un nome utilizzato per definire un controllo di tono multiplo, che può operare anche per
correggere (equalizzare) i difetti acustici di una catena di riproduzione.
F3 (misurata in Hz).
La frequenza in cui la potenza del sistema si dimezza, ed indica anche il limite minimo ri-
producibile; espressa anche nella forma (più corretta): f(-3dB)
Fattore di smorzamento
La capacità di un'amplificatore di gestire correttamente il carico al fermarsi del segnale. Il

fattore di smorzamento è calcolato dividendo il carico di lavoro (impedenza dell'altoparlan-
te) con l'impedenza d'uscita dell'amplificatore. Migliora, evidentemente, all’aumentare del
valore. Su un medesimo amplificatore, scende con la diminuzione dell'impedenza del cari-
co (altoparlante, es. 8, 4 e 2Ohm).
Filtro passa-banda
Un filtro (attivo o passivo) che permette il passaggio solo di determinate frequenze, atte-
nuando quelle inferiori e superiori.
Frequenza centrale
La frequenza in un segnale in cui si ha il picco di intensità, sia esso minimo o massimo.
Ground Loop
Indica quando due o più componenti elettronici sono connessi a masse con diversi poten-
ziali. Quando questo accade, la leggera differenza di potenziale tra i due apparecchi gene-
ra dei fastidiosi ronzii e rumori.
Hertz (Hz)
L' unità di misura della frequenza. Un Hertz è uguale ad un ciclo di una semionda per se-
condo
Impedenza (misurata in Ohm).
La resistenza che un componente oppone al passaggio della corrente alternata

Infrasonico
A volte detto subsonico. Sono le frequenze al di sotto dei 20Hz, sono inudibili dall'orecchio
umano, ma causano il movimento accentuato e visibile dei subwoofer.
Larghezza di banda
L'area di frequenze comprese tra i punti a —3 dB di un filtro passa-banda.
Gamma di lavoro di un componente elettronico.
L (Misurata in milliHenry, mH).
L'induttanza elettrica (p.es.: della bobina mobile dell'altoparlante).
LED Light-Emitting Diode.
Un piccolo semiconduttore capace di emettere luce istantaneamente. Non produce calore

(a meno della dissipazione per il passaggio di corrente), perciò è molto utilizzato come si-
stema di segnalazione.
Massa
Questo termine indica il potenziale zero di un circuito elettrico. Una buona massa è fonda-
mentale per le corrette prestazioni del sistema, come erogazione di potenza e assenza di
disturbi.
Microfono di misura
Uno speciale microfono progettato per rilevare la risposta in frequenza. La sua risposta è
per quanto possibile piatta. Eventuali irregolarità sono compensate da un'equalizzazione
nel sistema di misura.
Ottava
E' un metodo utilizzato per suddividere lo spettro audio, di derivazione musicale, ed indica
un intervallo di frequenze pari alla distanza (in Hz) tra una frequenza data ed il suo doppio
(es. 440Hz e 880Hz).
Parametrico
Una tipologia di equalizzatore dove si può intervenire sia come regolazione della frequenza
sia come ampiezza della stessa. E' normalmente usato su sistemi professionali, viste le
prestazioni, la versatilità e la complessità nell'uso pratico, normalmente sostituito con
equalizzatori grafici.
Passivo
Un componente che non richiede d'alimentazione. Normalmente presenta una perdita sul
segnale manipolato
Perdita di linea
La quantità di segnale persa a causa di componenti passivi sulla linea del segnale, quali
crossover passivi o resistenze d'attenuazione
Pink Noise — Rumore rosa
E' un segnale dove sono riprodotte tutte le ottave dello spettro audio con la stessa intensi-
tà, ovvero con un decadimento di 3dB per ogni ottava in livello. E un segnale fondamenta-
le per la taratura e la messa punto dei sistemi audio con l'aiuto di un analizzatore di spet-
tro in tempo reale.
Potenza (misurata in Watt RMS).
Per quanto riguarda gli amplificatori, è normalmente misurata al clipping (ovvero alla mas-
sima elongazione del segnale in uscita, quando le creste del segnale sono tosate) o ad un
distorsione nota (es. 10%) e su un carico dato (es. 8Ohm resistivi). Per gli altoparlanti è la
potenza continua che una bobina mobile immersa nel suo campo magnetico, riesce a dissi-
pare senza danneggiarsi.
Punto a -3dB
La frequenza in cui si ha un'attenuazione di 3 dB. Indica l'inizio o la fine di una risposta in

frequenza o il punto di crossover.
Fattore di qualità di un filtro. Rappresenta il rapporto tra la larghezza di banda e la fre-

quenza centrale di un filtro, ovvero il rapporto tra la reattanza e la resistenza in un circuito
in serie, ovvero il rapporto tra la resistenza e la reattanza in un circuito in parallelo.
Resistenza
Ciò che oppone resistenza al passaggio della corrente elettrica in un circuito, si misura in
Ohm Ω.
Resistenza in DC (Re) (misurata in Ohm).
La reale resistenza di un'altoparlante misurata con un normale voltmetro. Normalmente è

più bassa dell'impedenza nominale dell'altoparlante. Un altoparlante a 4 Ohm normalmen-
te ha una resistenza in DC che va da 3.2 a 3.5 Ohm.
Risonanza in aria libera (Fs o Fo) (misurata in Hz).
La frequenza in cui l'altoparlante presenta la massima efficienza senza essere inserito in

un sistema (cassa).
Semiconduttore
Un materiale che secondo i casi si può comportare sia come un conduttore, sia come un
isolante. Sono i componenti strutturali dei normali componenti elettronici attivi (transistor).
Senso convenzionale di scorrimento della corrente
Il senso che la corrente assume quando deve scorrere da un punto d'alto potenziale ad un
punto con il potenziale inferiore. E’ il contrario del flusso elettronico della corrente.
Serie
Un circuito dove i componenti sono collegati uno dopo l'altro come in una catena.
Serie-Parallelo (altoparlanti)
La connessione di componenti sia in serie sia in parallelo tra loro, allo scopo di aumentare
la tenuta in potenza rispetto al singolo componente (a parità di impedenza complessiva).
Sound Pressure Level (SPL)
La misura della pressione sonora, espressa in dB o in dBA (lineare o equalizzata secondo

la percezione umana).
SPLo (misurato in dB).
L'efficienza di riferimento di un'altoparlante o di una cassa acustica misurata ad 1kHz ad

un metro di distanza con 1 W.
Tensione effettiva
Un valore di tensione di un segnale in AC che abbia gli stessi effetti di un'equivalente ten-
sione in CC. Conosciuta anche come RMS (Root Mean Square).
Tweeter
Piccolo altoparlante adatto a riprodurre le frequenze acute.
Vas (misurato in litri o piedi cubi).
Volume Acoustic Suspension. E' il volume dell'aria che ha la stessa cedevolezza delle so-
spensioni di un'altoparlante.
Volt
L'unità di misura della tensione elettrica (V)
Watt
L'unità di misura per la potenza elettrica. 1 W, per definizione, si ha quando in un circuito
scorre una corrente di 1 A con una tensione di 1 V.
Woofer
Normalmente un altoparlante di grande diametro adatto a riprodurre le frequenze basse.

Fisica acustica
Acustica
L'acustica (dal greco ἀκούειν, "udire") è quella branca della fisica che studia il suono, le
sue cause - le onde di pressione -, la sua propagazione e la sua ricezione. In un'accezione
più generale, l'acustica comprende anche lo studio degli infrasuoni e degli ultrasuoni, che
non sono percepibili dall'uomo attraverso l'udito, ma si comportano - da un punto di vista
fisico - nello stesso modo.
Più in generale, si intende talvolta con acustica lo studio delle vibrazioni meccaniche nei
mezzi materiali.
La pressione sonora è la variazione di pressione rispetto alla condizione di quiete

causata da una perturbazione (onda sonora).
La pressione sonora può essere misurata usando un microfono (misura in aria), un

idrofono (misura in acqua) o un catodofono (in altri mezzi).
L'unità di misura del Sistema Internazionale della pressione sonora è il Pascal (simbolo
Pa). La pressione sonora istantanea è la variazione di pressione p0 causata da un'onda
sonora in un certo istante e in un certo punto dello spazio. La pressione sonora efficace è
il valore efficace, cioè la media quadratica della pressione sonora istantanea su un dato
intervallo di tempo.
1 Pa = 1N / m2
1 bar 100 000 Pa

1 millibar 100 Pa
1 atmosfera fisica 101 325 Pa
1 mm Hg 133,322 Pa
1 psi 6 895 Pa
Livelli di pressione
Pressione atmosferica su Plutone (approssimativo) 0,5 Pa

L'aumento di pressione alla profondità di 1 mm sott'acqua 10 Pa
Pressione atmosferica su Marte 1 kPa
L'aumento di pressione alla profondità di 1 m sott'acqua, o 10 kPa
la perdita di pressione quando si passa dal livello del mare a 1000 metri
di altitudine
La pressione atmosferica a livello del mare 100 kPa
Pressione delle lance ad acqua in pressione 10 MPa
Pressione in fondo alla Fossa delle Marianne, circa 11300 metri sotto 100 MPa
l'oceano
Pressione necessaria alla formazione di diamanti 10 GPa
Pressione necessaria per creare nanotubi in carbonio 100 GPa
Suono
Il suono (dal latino sonus) è la sensazione data dalla vibrazione di un corpo in oscillazio-
ne. Tale vibrazione, che si propaga nell'aria o in un altro mezzo elastico, raggiunge l'orec-
chio che, tramite un complesso meccanismo interno, è responsabile della creazione di una
sensazione "uditiva" direttamente correlata alla natura della vibrazione.
Come tutte le onde, anche quelle sonore sono caratterizzate da una frequenza (che nel
caso del suono è in diretta, ma non esclusiva, relazione con la percezione dell'altezza) e
un'intensità (che è in diretta, ma non esclusiva, relazione con il cosiddetto "volume" del
suono). Inoltre, caratteristica saliente delle onde sonore è la forma d'onda stessa, che ren-
de in gran parte ragione delle differenze cosiddette di timbro che si percepiscono tra diver-
se tipologie di suono.
Si può distinguere il concetto di suono da quello di rumore. Il suono è in generale una

sensazione che nasce nell'uomo quando una perturbazione meccanica si propaga in un
mezzo elastico facendolo vibrare. Per questa ragione molto spesso abbiamo a che fare con
suoni i cui stimoli acustici hanno le componenti in frequenza (vedi trasformata di Fourier)
multipli della frequenza fondamentale.
Il rumore è comunemente identificato come una sensazione uditiva sgradevole e fastidiosa

o intollerabile.
L'orecchio umano è più sensibile agli stimoli acustici le cui frequenze siano comprese fra i
16 Hz e i 20 kHz; nella realtà quotidiana la maggior parte degli umani occidentali, giovani
ed in buona salute, hanno una banda uditiva compresa tra 80Hz e 15KHz ed una soglia
uditiva di +20dB.
Per fenomeni periodici si può operare con il concetto di onda e quindi di lunghezza d’onda,
fase, frequenza, periodo, etc.
Rumore
Il rumore è un segnale di disturbo rispetto all'informazione trasmessa in un sistema.
Come i suoni, il rumore è costituito da onde di pressione sonora.
Il rumore è prodotto da innumerevoli fonti naturali ed artificiali. In generale le sorgenti di

rumore (o di suono) sono:
• corpi solidi oscillanti;
• colonne d'aria oscillanti;
• corpi in movimento rapido;
• gas rapidamente fuoruscenti;
• incrementi rapidi di pressione;
• la voce umana, complicata combinazione di corpi solidi oscillanti e colonne d'aria

oscillanti.
Generalmente i rumori sono suoni caratterizzati da un andamento di pressione non perio-
dico e armonicamente molto complesso, ma spesso la percezione di suono oppure di ru-
more è soggettiva.
Intensità: decibel
Il decibel (simbolo dB) è un decimo di Bel (simbolo B) : 10dB = 1B. Il Bel è ormai caduto
in disuso, ma rimane l' unità di misura fondamentale da cui il "deciBel" deriva.
Il Bel e il suo sottomultiplo decibel sono unità di misura di tipo logaritmico: le

corrispondenti misure sono numeri puri, e precisamente un determinato logaritmo del
rapporto fra due grandezze omogenee (esprimibili cioè nella stessa unità di misura, e tali,
quindi, che il loro rapporto è un numero puro adimensionale). Le unità di misura B e dB
sono anch' esse adimensionali, e quindi non specificano una grandezza fisica come il
metro o il watt: ma devono essere indicate nella misura, perché la loro conoscenza è
necessaria (e sufficiente) per risalire dalla misura al rapporto originale.
in acustica, si definisce il livello di intensità acustica (Intensity Level, IL) come rapporto in
dB fra il flusso di energia I e il flusso I0 della soglia di udibilità, pari a 20μPa = 20x10-6
Pa, ovvero 10-12 W/m2 (una zanzara a 3 metri).
IL = 10 * log10 (I/I0)
il livello di pressione sonora viene definito invece come dBSPL
SPL = 20 * log10 (P/P0)
che non è il rapporto in dB fra la pressione sonora p e la pressione sonora

corrispondente alla soglia di udibilità p0, ma fra i corrispondenti flussi di energia (calcolati
a parità di mezzo trasmissivo).
L’intensità misura l’energia convogliata dall’onda nell’unità di tempo. Inoltre è direttamente

proporzionale al quadrato dell’ampiezza e al quadrato della frequenza. In base all’energia
convogliata nell’unità di tempo sulla membrana del timpano, deriva che il suono appaia più
o meno intenso.
La tabella che segue compara ed analizza vari fenomeni acustici ed i relativi dBspl e la
pressione rappresentata in Pascal.
Si noti che la massima pressione in aria è pari a 194dB (livello di saturazione delle
molecole); livelli superiori sono possibili solo in presenza di una atmosfera modificata
(p.es.: particelle d’acqua o vulcaniche).
Il livello fissato come 0dB spl (minimo rumore percettibile) è purtroppo molto inferiore alla
normale sensibilità degli umani.
dBSPL Sorgente Pa (pressione)

300 Krakatoa (1883) [in atmosfera modificata]
250 All'interno di un tornado [in atmosfera modificata]
194 Massimo livello in aria 101325
185 Lesioni istantanee al tessuto muscolare 50000
180 Motore di un missile a 30 m 20000
Esplosione del Krakatoa a 160Km
168 Colpo di un M1 Garand a 1m 5000
150 Motore di un jet a 30 m 630
140 Colpo di fucile a 1 m 200
130 Soglia del dolore 100
120 Concerto Rock; Discoteca 20
Danneggiamento dell’udito a breve termine
110 Motosega a 1 metro 6
Jet a 100m
100 Martello pneumatico non silenziato a 2 m 2
90 Camion vecchio e pesante a 1 m 0.8
85 Danneggiamento dell’udito a lungo termine 0.6
80 Aspirapolvere industriale a 1 m 0.2
70 Traffico intenso a 5 m; radio ad alto volume
60 Ufficio rumoroso, radio 0.02
50 Ambiente domestico; teatro a 10 m
40 Quartiere abitato di notte 0.002
30 Sussurri a 5 m
20 Respiro umano a 3 m 0.0002
16 Soglia dell'udibile
0 Minimo suono udibile 0.00002
Percezione
La percezione del suono da parte dell’uomo è funzione della pressione acustica (intensità)
e della frequenza del fenomeno.
Le curve qui rappresentate sono molto indicative e, quantomeno, datate.

La normale percezione deve essere spostata, attualmente, almeno di 20dB verso l’alto, a
causa del danneggiamento dovuto al rumore ed alla disabitudine al silenzio.
In sintesi, la percezione è quell’area udibile (in termini di frequenza e intensità, tra 64 e

8000 Hz, e tra 30 e 130 dB) da un essere umano.
Al di sotto di questi margini vi sono le soglie di percezione (udibilità) ed al di sopra vi è la

soglia di dolore, dove il suono provoca direttamente una percezione dolorosa e non
uditiva.
Le forme d’onda, lo spettro acustico
Un’oscillazione del campo acustico, di tipo regolare e periodico, produce una variazione
della pressione con forma sinusoidale.
Ricordando la trigonometria, equivale alla visione del percorso di un oggetto sul bordo di
una circonferenza vista in prospettiva.
Una sinusoide è la rappresentabile come visualizzazione di un moto costante ed uniforme

in un percorso definito senza discontinuità o interruzioni, ovvero come segue:
Il contenuto di un’onda è esprimibile in:
• valore di picco
• valore efficace o RMS
• valore medio
Il rapporto tra valore di picco, efficace, RMS e medio dipendo dalla forma dell’onda
analizzata.
RMS, valore efficace
Per segnali sinusoidali, il valore efficace equivale al valore che avrebbe una corrente
continua che causasse gli stessi effetti termici del valore considerato.
Se si applica il procedimento ad un segnale continuo si può facilmente constatare che il

risultato coincide con lo stesso valore continuo.
Risolvendo analiticamente la funzione per un valore sinusoidale, si ottiene la formula:
che mette in relazione il valore efficace Ieff con il valore di picco Imax.
Le onde ed il contenuto armonico
La sovrapposizione di onde crea una risultante pari alla sommatoria dei livelli puntuali.
Un’onda sinusoidale è emessa da strumenti quali il flauto.
Onda quadra pura (con le due semionde pari al 50%): solo le armoniche dispari
Per avere la sensazione del suono, si immagini un clarino o una chitarra elettrica.
Onda triangolare regolare: tutte le armoniche, di intensità esponenzialmente
decrescente
Onda a dente di sega: armoniche pari e dispari ad intensità ognuna pari alla metà della
precedente.
Per avere un’idea del suono risultante si immagini il suono di un organo a canne.
Onda a dente di sega semplificata (fondamentale e due armoniche)
Onda arbitraria: fondamentale con seconda armonica e suono non correlato.

inviluppo
La variazione di intensità è definita come inviluppo, ovvero come insieme delle tangenti
alle curve di intensità.
I periodi dell’inviluppo sono suddivisi in:

• Attacco
• Primo Decadimento
• Stato stazionario
• Decadimento finale o Rilascio
Nella terminologia inglese:

• Attack
• Decay
• Sustain
• Release
Da cui l’acronimo ADSR, che definisce anche l’inviluppo ed I sistemi relativi.
L’inviluppo è quindi la forma esteriore del livello del suono nel corso del tempo.
Il timbro, invece, è correlato sia al contenuto spettrale:
che alla sua modificazione nell’arco del tempo.

Timbro
Il timbro, quindi, è definibile come contenuto armonico e relativa variazione di densità

spettrale nel tempo. Lo spettro di un suono, per un singolo istante, è quindi definibile
come insieme delle frequenze che costituiscono il suono.
Ampiezza
50 100 150 200 300 350 400 450 500 Frequenza
Mediante l’analisi FFT (trasformata veloce di Fourier, Fast Fourier Transform) si può avere
visione del contenuto spettrale di un suono.
La visualizzazione in terzi d’ottava permette una visione intuitiva dell’energia nel dominio
delle frequenze.
Nella figura un rumore arbitrario rilevato in ambiente.

Rumore e contenuto spettrale
Rumore bianco: livelli costanti per frequenze diverse
Rumore rosa: livelli decrescenti di -3dB per raddoppio di frequenza (ottava) = energia
costante
Rumore marrone: livelli decrescenti di -6dB per raddoppio di frequenza (ottava)
Il rumore bianco visto in un analizzatore di spettro in terzi d’ottava e con espressione

logaritmica in energia
Come si nota, cresce di 3dB per ottava
Il rumore rosa visto in un analizzatore di spettro in terzi d’ottava e con espressione

logaritmica in energia
Come si nota è costante nel dominio delle frequenze.

I rumori bianco e rosa sono molto usati per le operazioni di preparazione e taratura di
sistemi ed ambienti.
Ottave e suddivisioni
Le ottave standard sono:
32 Non udibile
64
120 Bassi
250 Medio-bassi
500 Medi
1000 Medio-alti
2000 Alti
4000
8000
16000 Non udibile
Per ottava si intende l’intervallo pari al raddoppio/dimezzamento della frequenza.

L’andamento dei livelli e delle potenze per frequenza si esprime in dB/oct.
In musica corrisponde all’intervallo tra una nota e la prima uguale (es. La3 e La4)
successiva/ precedente. Sulle tastiere temperate corrisponde all’intervallo formato da 12
note diverse (es. Do – Si: do, do#, re, re#, mi, fa, fa#, sol, sol#, la, la#, si).
In relazione ai suoni ed alla loro altezza (frequenza), sono molti i termini usati nella
terminologia corrente mutuati dalle fenomenologie luminose; si veda ad esempio, scuro /
chiaro = basso / alto (riferito a tono, frequenza) = grave / acuto = caldo / freddo, etc.
Per i paralleli tra suono e colore, tra acustica e luce, si vedano i vari scritti di diversi autori
in merito.
Tra i più noti autori, possiamo ricordare Isaac Newton, Johann Wolfgang von Goethe,
Vasilij Vasil'evič Kandinskij e Arthur Schopenhauer.
Il più noto degli scritti è Della Teoria dei Colori (in tedesco Zur Farbenlehre) che è un
saggio scritto da Johann Wolfgang von Goethe nel 1810.
La musica ed i relativi termini
La musica è l'arte della generazione e della combinazione di suoni che, secondo

determinate leggi fisiche e convenzioni formali, esprimono e suscitano uno stimolo fisico
ed emotivo attraverso l'apparato uditivo. La generazione dei suoni avviene, di norma,
mediante la voce umana (canto) o mediante mezzi artificiali (strumenti) che, sfruttando i
fenomeni dell'acustica, provocano la percezione uditiva e l'esperienza emotiva voluta
dall'artista. Musica come suono: Una delle più comuni definizioni di musica è di quella di
arte del suono organizzato, o - più specificatamente - di arte del produrre significati e
sensazioni, più o meno complessi - e comunque di natura volontaria - organizzando suoni
e silenzio. Simili definizioni - comunemente accettate - sono state ampiamente adottate
sin dal Diciannovesimo secolo, quando si iniziò a studiare scientificamente la relazione tra
il suono e la percezione.
La teoria musicale è la parte della musica che specifica il modo di descrivere suoni,
(consistenti in onde sonore di compressione di un mezzo trasmissivo - che in genere è
l'aria) e descrive le relazioni tra i suoni e la percezione degli ascoltatori (lo studio di come
gli esseri umani interpretano i suoni è chiamato invece psicoacustica).
Spesso gli aspetti fondamentali del suono e della musica sono descritte come altezza,
durata, intensità, e timbro.
Altezza, intensità, timbro e durata sono in realtà quattro parametri del suono, ai quali va
aggiunto il quinto che è la sonorità, ovvero quello che consente al suono di esistere,
mentre l'altezza gli consente di essere notato, l'intensità di essere annotato, il timbro di
essere connotato e la durata di essere denotato.
Altezza = frequenza (base)

Durata = durata, tempo
Intensità = livello acustico
Timbro = contenuto spettrale e componente di rumore, considerato nel dominio del
tempo.
Altezza
Il la è la sesta nota musicale nella scala diatonica di do, l'unica scala maggiore priva di
diesis e di bemolle.
La frequenza del la sopra il do centrale (la4) è definita per convenzione a 440 hertz, valore
stabilito dalla conferenza internazionale di Londra del 1939. In precedenza, si usavano
spesso le frequenze di 432 e 435 hertz, ma a seconda del luogo, del periodo e del tipo di
musica il la4 poteva variare tra i 415 e 445 hertz, andando a toccare quindi anche
l'odierno la bemolle.
Le frequenze di tutte le altre note sono calcolate a partire dal la4.
Il la4 è di fondamentale importanza, perché è la nota dei diapason.

Al di fuori dell'ambito musicale, numerose applicazioni tecniche usano il la3 come
"frequenza standard", come il monoscopio televisivo e il tono di libero del telefono.
Nella notazione in uso nei paesi di lingua inglese e tedesca, il la corrisponde alla nota A.
Armonici
Gli armonici naturali sono i suoni (ipertoni) emessi in genere dagli strumenti.
Un suono prodotto da un corpo vibrante non è mai puro, ma è costituito da un amalgama

in cui al suono fondamentale se ne aggiungono altri più acuti e meno intensi: questi sono
gli armonici, che hanno una importanza fondamentale nella determinazione del timbro di
uno strumento e nella determinazione degli intervalli musicali. I suoni armonici
corrispondono ai possibili modi naturali di vibrazione di un corpo sonoro (secondo un moto
armonico).
Ad esempio, se una corda di lunghezza L emette un Mi (primo armonico), la stessa corda

vibra con meno intensità anche a frequenza doppia (pari alla lunghezza L/2, secondo
armonico), emettendo un Mi all'ottava superiore, e così via, suddividendo la lunghezza
d'onda in multipli interi L/3, L/4, eccetera.. Lo stesso principio vale per le colonne d'aria
che vibrano all'interno di tubi (es. negli ottoni).
Fondamentale
Secondo 2f=L/2
Terzo 3f=L/3
Quarto 4f=L/4
Quinto 5f=L/5
Sesto 6f=L/6
Settimo 7f=L/7
Nell’esempio:
la fondamentale è un DO, seguono: DO (2) , SOL (3) , DO (4) , MI, SOL, SIb, DO, RE, MI,
FA#, SOL, LAb, SIb, SI, DO.
Si noti come le note risultanti dagli armonici siano molto ravvicinate, se poste su un’unica
ottava, fenomeno che può dare origine a fastidiose dissonanze:
Nella teoria musicale e, più specificatamente, in quella del suono, si parla di battimenti in
riferimento all'effetto per l'orecchio umano di due onde sonore, pure posizionate vicine tra
di loro, e di frequenza molto vicina, sempre tra di loro.
Entrando più in dettaglio, conviene fare qualche esempio. Prendiamo una chitarra e
suoniamo ad esempio le due corde più alte, il si e il mi. Il nostro orecchio sente le due
note distintamente, e si accorge che il suono complessivo è anche piacevole all'orecchio.
Supponiamo ora di cominciare a tendere sempre di più la corda del si, per alzarne la
frequenza e arrivare al mi.
Per un po' continueremo a sentire due suoni più o meno armonici. Quando le due corde
avranno la stessa frequenza, sentiremo naturalmente un solo suono; ma subito prima ci
sarà uno strano effetto: cominceremo a sentire un solo suono, ma il suo volume ci
sembrerà cambiare nel tempo, ora più forte e ora più piano.
L’effetto ottenuto è il battimento, ovvero la creazione di una differenza tra due suoni. In
linea generale, il battimento è la composizione di due suoni secondo la definizione:
dati due suoni A e B, puri e sinusoidali, la loro composizione genera C e D, dove C è la

somma delle frequenze di A e di B e D è la differenza in valore assoluto tra le due
frequenze di A e B.
Come esempio:
A=440Hz, B=442Hz  C=882Hz, D=2Hz
L’effetto acustico è la composizione delle singole sinusoidi formanti ovvero un’onda

composita (440 | 442 | 882 | 2) ovvero un suono che cambia di intensità, di fase e di
timbro ogni mezzo secondo (ovvero a 2Hz).
Il suono nello spazio
Il suono è una perturbazione della pressione atmosferica.
Possiamo immaginare la variazione di densità sul piano delle pressioni istantanee nello
spazio e quindi nel tempo.
La lunghezza d’onda “λ”, fissata la frequenza “f” del moto armonico della sorgente,
dipende dal valore della velocità c0 secondo la relazione:
c0
λ =
f
Nella figura sono indicate le corrispondenze tra frequenza in Hz e la lunghezza d’onda in

metri, in aria libera standard, ovvero con una velocità nel mezzo pari a 340 metri per
secondo.
Propagazione
Nell’aria libera il suono si propaga –teoricamente- uniformemente in tutte le direzioni,

e la sua intensità diminuisce all’aumentare della distanza dalla sorgente.
Nella figura osserviamo che la stessa potenza sonora passa attraverso A1, A2, A3, A4, ma
le aree aumentano proporzionalmente al quadrato del raggio.
Questo significa che la potenza del suono per unità di area (intensità sonora)
diminuisce proporzionalmente al quadrato del raggio.
La Legge dell’inverso del quadrato stabilisce che l’intensità del suono in campo libero è
inversamente proporzionale al quadrato della distanza dalla sorgente. Se la distanza
raddoppia, l’intensità si riduce a 1/4; se triplica, l’intensità si riduce a 1/9; se quadruplica,
l’intensità si riduce a 1/16.
Velocità
La radiazione elettromagnetica (luce) si propaga nel vuoto alla velocità di 299.792,458

km/sec.
Il suono si propaga nell'aria alla velocità di:

• 344 m/sec in aria secca a 20° (331.5 m/sec a 0° / 349.5 m/sec a 30°)
• 1495 m/sec in acqua (distillata a 20°)
• 5930 m/sec in ferro
La velocità è funzione della elasticità e della densità del mezzo trasmissivo.
Ovviamente se i mezzi trasmissivi sono diversi le velocità cambiano.

Cambiano inoltre in base alla temperatura ed alla densità
Velocità in materiali diversi a temperatura e pressione costante: 20°C / 1 atmosfera.
Materiali Velocità del suono [m/s]

Aria 343
Acqua 1.480
Ghiaccio 3.200
Vetro 5.300
Acciaio 5.200
Piombo 1.200
Titanio 4.950
PVC (morbido) 80
PVC (duro) 1.700
Calcestruzzo 3.100
Legno: Faggio 3.300
Pietra: Granito 6.200
Pietra: Peridotite 7.700
Sabbia 10-300 (dipende dal tipo)
Influenza della temperatura dell'aria sulla velocità del suono in aria libera
T in °C a in m/s
−10 325,4
−5 328,5
0 331,5
+5 334,5
+10 337,5
+15 340,5
+20 343,4
+25 346,3
+30 349,2
Direttività
La trasmissione del suono non ideale è funzione delle caratteristiche fisiche dell’emettitore
di suono, della sua forma e della sua interazione con il mezzo trasmissivo, ovvero esiste
sempre una forma di emissione caratteristica, cioè non sferica e non puntiforme (come il
caso ideale).
Curva di emissione di un violino.
Curva di emissione di una cassa acustica di buona qualità.

Dinamica
La dinamica rappresenta la differenza tra il massimo livello sonoro ed il livello di rumore di

fondo (ground-floor noise), ovvero il minimo livello riscontrabile.
RANGE DINAMICI TIPICI dB
Organo >75
Orchestra sinfonica 75
Pianoforte 70
Voce umana 60
Complesso rock 30
Registratore magnetico digitale a 16 bit 90
Amplificatore 75
Registratore professionale con Dolby A 75
Disco di acetato 74
Registratore professionale 60
Registratore a cassette con Dolby B 60
Trasmettitore radio FM 55
Disco stampato 50
Registratore a cassette 40
Trasmettitore radio AM 30
Nella figura si notano:

• livello del rumore di fondo
• fenomeno acustico e suo spegnimento
• coda acustica e ritorno al rumore di fondo
Nella figura successiva si vede la coda sonora di un suono in ambiente non rumoroso
dovuto alla persistenza da riverbero; il riverbero diviene quindi rumore d’ambiente a causa
dei suoni prodotti nel locale/ambiente.
Dinamica e spettro acustico: esempi
Come esempio di dinamica e distribuzione spettrale alcune visualizzazioni in Audacity.
Hard Rock: (Deep Purple)
Parlato: (voce maschile che legge un testo)
Musica classica: (F.Chopin, piano solo)
Si noti che variano sia la dinamiche che il contenuto spettrale nel tempo, rappresentato da
colori che vanno dal bianco, al rosso, all’azzurro al variare del livello di intensità nella
singola banda. Le bande sono rappresentate sulle ordinate ed il tempo sulle ascisse.
Trasmissione del suono, direttività, interferenza.
Un onda incidente su un corpo (parete) provocherà, in base alle caratteristiche del

materiale incontrato:
• una riflessione
• una trasmissione
• un assorbimento
La quantità di ciascuno dei tre valori e la relazione tra di loro dipende dalla forma e dalla
natura del corpo.
Riflessione sul piano
Un’onda incidente su un piano viene teoricamente riflessa integralmente:
quindi l’intensità I incidente è pari all’intensità R riflessa, rispetto alla Normale sul Piano.
In realtà, oltre alle ovvie conseguenze dell’interferenza con il piano, vi sono anche quelle
provocate dalle riflessioni e quindi alla interazione tra l’onda incidente e quella riflessa, che
possono dare origine a fenomeni costruttivi o distruttivi.
analizzando l’interferenza:
Riflessione su curve
Il fenomeno delle interferenze è ancora più evidente nel caso di curve, dove possono
formarsi aree di concentrazione (strutture concave) ed aree di diffusione (strutture
convesse).
Le onde sonore si comportano come tutte le onde incidenti, ovvero con i classici rimbalzi
ed angoli rispetto alla normale.
L’uso di strutture concave e convesse è noto da millenni per il rafforzamento, la

dispersione e la diffusione del suono.
Riflessioni in ambiente
Un suono prodotto in un qualunque ambiente è soggetto alle riflessioni sulle pareti ed a

tutti i fenomeni correlati ad esse.
Il suono, in ambiente chiuso appare, a causa delle riflessioni causate dalle pareti,
provenire da più direzioni e con distanze diverse.
Soffitto
dis tanza
s orgente-ricevitore
S
d
R
Pavimento
Il tempo di trasferimento del suono da S a R è pari a t1 (tempo di percezione) – t0 (tempo

di emissione). Il tempo t1 è calcolabile come d/c dove d=distanza e c=velocità del suono
nel mezzo (343 m/sec in aria). In ambiente saranno possibili riflessioni almeno sul soffitto
e sul pavimento.
Il primo suono è quindi d ed è diretto.
S2
d2
Soffitto
S
d
R
Pavimento
d1
S1
Si creeranno quindi delle percezioni di distanze temporali e fisiche (S1, d1, S2, d2),
dipendenti dalla forma dell’ambiente. In base all’assorbimento dell’ambiente avremo quindi
la creazione di una coda sonora, formata dalle riflessioni del suono.
Il secondo suono è d1 che possiede un tempo superiore a d ed una direzione dal basso.
Il terzo suono percepito è d2 che possiede un tempo superiore a d1 ed una direzione

dall’alto. Si noti come d2 appaia come distante il doppio del reale e proveniente dal di
fuori del locale.
Riverbero ed Eco
L’effetto di distanza e direzione deformata è alla base degli effetti di riverberazione e di

eco.
La riflessione del segnale all’interno di un ambiente provoca:

• riflessioni diverse, come intensità e tempo
• una coda sonora continua, provocata dalla persistenza delle riflessioni
Si parla di riverbero in presenza di riflessioni al di sotto del campo percettivo umano, di

eco al di sopra di essa.
Quindi, si definisce riverbero il suono riflesso ad una distanza T1 inferiore a 100
millisecondi (tempo della percezione media umana) e eco il suono riflesso con tempo
superiore.
Essendo la velocità del suono nell’aria pari a 340 m/s, un locale deve, per originare un
eco, avere una distanza tra le pareti non inferiore a 17 metri.
Un ambiente tende a generare una coda ambientale di riverbero che modifica la
percezione delle distanze e delle intensità sonore.
Si noti che il livello non decade in campo riverberante in maniera lineare rispetto alla
distanza –come in campo libero- ma tende ad una costante indipendente dalla distanza
dell’uditore.
Tale dato dipende dalla dimensione dell’ambiente e dall’assorbimento complessivo.
Sono definiti ed usati i parametri T20 e T60 ovvero i tempi relativi al livello -20dB e -60dB
rispetto al picco sonoro stimolante una coda di riverbero (norme ISO3382).
Come indicazione di T60 ottimale, per la percezione dell’ambiente:
• aule: 500-1000millisecondi
• cinema: 800millisecondi
• teatri: 1.3-1.5secondi
• sala di concerto: 1.7-2.3secondi
• chiesa: 8-10secondi
Effetto Larsen
Nel caso di amplificazione in ambiente reale possono avvenire fenomeni Larsen

(feedback acustico). La causa è sempre l’innesco di un’oscillazione tra una sorgente
amplificata che viene stimolata dal segnale amplificato di se stessa.
L’innesco può avvenire ad una qualunque frequenza, ma solo nel caso in cui vi sia una
possibilità di risonanza dovuta al sistema (microfono + amplificatore + altoparlante +
ambiente + oggetti + …).
La frequenza di innesco può variare, ovviamente, anche in base alla temperatura del
mezzo, ovvero dell’aria.
Per l’eliminazione del fenomeno si usano sistemi diversi.
In generale la teoria è sintetizzata dalla figura, ovvero

amplificazione con innesco, rilevazione del fenomeno,
retro-reazione e decorrelazione.
Nella figura un filtro anti-larsen automatico con filtro a pettine auto-adattativo.
Si nota la presenza di vari filtri notch (elimina banda).

Isolamento
L’isolamento è fattore del materiale, della forma e della dimensione.
Potere fonoisolante, in funzione della frequenza, per materiali e strutture diverse

Materiale Frequenze di centro banda[Hz]
Kg/m² 125 250 500 1000 2000 4000 Media
Vetro (4 mm) in infisso di alluminio 10 10 11 12 12 13 11
apribile
Lastra di vetro (4 mm) 10 20 22 28 34 34 29 28
Lastra di vetro-aria-vetro sigillata 22 17 24 37 41 38 30
(4/12/4)
Lastra di vetro-aria-vetro sigillata 25 22 33 41 44 44 35
(4/12/12)
Vetri doppi montati su infissi 29 35 45 56 52 51 44
(6/150/4)
Vetri doppi montati su infissi 27 33 39 42 46 44 39
(4/200/4)
Vetri su ante apribili da 25 mm 15 23 34 32 28 32 27
(4/200/4)
Singolo laterizio intonacato da 240 34 37 41 51 58 60 47
entrambi i lati
Muratura, doppia parete intonacata su 480 41 45 48 56 58 60 61
due lati
Muratura leggera intonacata sui due 32 34 37 45 52 57 43
lati (100 mm)
Muro leggero in laterizi liscio 250 35 38 43 49 54 58 46
(200 mm)
Muro leggero intonacato su due lati 37 39 56 53 57 61 49
(200 mm)
Muro in laterizi, tre strati, intonacato 720 44 43 49 57 66 70 55
su due lati
Due strati di calcestruzzo, 100 mm, 35 41 49 58 67 75 52
cavità 50 mm
Condotto rivestito gesso-lana minerale 30 11 13 12 12 12 21 12
Truciolato 50 mm, laminato dal lato 28 26 28 30 32 33 36 30
sorgente
Truciolato 100 mm, laminato dal lato 50 28 28 32 34 33 38 31
sorgente
Porta di legno pieno, 43 mm 28 17 21 26 29 31 34 26
Porta di acciaio, 50 mm, ben sigillata 21 27 32 34 36 39 32
Porta acustica di metallo, doppi sigilli 36 39 44 49 54 57 47
Pavimento in calcestruzzo rinforzato 460 42 41 50 57 60 65 53
(200 mm)
Pavimento in calcestruzzo rinforzato 690 40 45 52 59 63 67 54
(300 mm)
È importante associare al materiale in quanto tale, una forma in grado di limitare le

riflessioni (deviandole o disperdendole), intrappolare le onde che si desidera eliminare e
quindi dissipare l’energia.
Un isolante riflette, assorbe e trasmette energia acustica, nei modi tipici del materiale,
della sua forma e della sua massa.
IRIFLESSA
IINCIDENTE
ITRASMESSA
IASSORBITA
Ci può essere quindi:

• energia incidente
• energia assorbita
• energia riflessa
• energia trasmessa
R=20dB
LI=80dB LT=60dB
Fisiologia e psicoacustica
L’orecchio
L'orecchio esterno è formato dal padiglione auricolare e dal condotto uditivo (meato
acustico). Il padiglione auricolare è costituito da cartilagine rivestita di pelle. La sua
funzione primaria è infatti quella di raccogliere i suoni per convogliarli all'interno del
condotto uditivo. Il condotto uditivo è una galleria dalle pareti lisce, che secerne un
cerume protettivo destinato a trattenere le impurità che entrano nell'orecchio.
Al termine del condotto uditivo si trova il timpano che è una sottile membrana sensibile
alle onde sonore che vengono a infrangersi su di essa. Il timpano trasforma i suoni in
vibrazioni che vengono trasmesse a tre ossicini, i più piccoli del corpo umano: il martello,
direttamente a contatto col timpano, l'incudine e la staffa.
I tre ossicini dell'udito sono contenuti in una cavità che comunica all'esterno attraverso un
piccolo canale lungo 3-4 cm, la Tromba di Eustachio, che sbocca nella faringe. In questo
modo l'orecchio è collegato con la gola, per mantenere in equilibrio la pressione dell'aria al
di là e al di qua del timpano.
I recettori acustici sono posti nella parte membranosa ossea e sono simili ai recettori
dell'equilibrio. Presentano superiormente una membrana che, sotto la pressione
dell'endolinfa –il liquido qui presente-, stimola i recettori. Gli impulsi nervosi provenienti
dalle cellule cigliate e diretti al cervello viaggiano all'interno di fasci di fibre nervose. Il
cervello ha il compito di interpretare i segnali che gli pervengono. Ciò consente di dare un
significato al messaggio sonoro. Infatti esiste una memoria uditiva che ci permette di
riconoscere un rumore o una musica. Ma abbiamo anche la capacità di cancellare segnali
superflui, ad esempio dopo un po' non sentiamo più il rumore di una cascata o il frastuono
del traffico.
Zone di sensibilità della coclea

La percezione
La sensazione può essere definita come la modificazione dello stato del nostro organismo
a causa del contatto con l'ambiente.
Gli stimoli offerti dall'ambiente vengono catturati dai nostri organi di senso, ognuno dei
quali adibito alla ricezione di uno stimolo particolare.
I canali sensoriali sono:

• udito,
• vista,
• olfatto,
• gusto,
• tatto,
• cinestesia ed equilibrio,
• sensazione di dolore.
Ognuno di essi si avvale per la ricezione dei segnali di specifici organi di senso (gli occhi
ad esempio ci consentono la visione di ciò che ci circonda).
La percezione è definibile come il processo psichico che opera la sintesi dei dati
sensoriali in forme dotate di significato.
Gli assunti allo studio della percezione variano a seconda delle teorie e dei momenti storici
che si susseguono.
La legge di Weber-Fechner fu uno tra i primi tentativi di descrivere la relazione tra la

portata fisica di uno stimolo e la percezione umana dell'intensità di tale stimolo.
La scoperta della relazione esistente tra stimolo e percezione è stata fatta da Weber in
seguito all'esperimento consistente nell'incrementare di una certa quantità il peso di un
oggetto sostenuto da un uomo. La percezione di tale stimolo (l'incremento di peso) è
risultata essere tanto meno accentuata, quanto più pesante era l'oggetto.
In generale viene espressa come:
Dove p è la percezione, S è lo stimolo e S0 rappresenta la soglia di percezione.
La relazione che lega l'intensità dello stimolo alla percezione che si ha di esso è quindi di
tipo logaritmico. Ossia la percezione è proporzionale (secondo un fattore k) al logaritmo
dello stimolo.
Soglie di riferimento. Per ciascuno dei 5 sensi sono definite delle soglie assolute di
percezione:
• Vista: percezione della luce di una candela a 48 km di distanza, in una notte

serena e limpida
• Udito: percezione di un orologio meccanico a 6 metri di distanza all'interno di una
stanza silenziosa
• Gusto: un cucchiaino di zucchero in 7,5 litri di acqua
• Olfatto: una goccia di profumo in appartamento di tre stanze
• Tatto: la pressione di un'ala di ape fatta cadere da 1 cm di altezza
Per comprendere il mondo circostante si tende a identificarvi forme secondo schemi che ci
sembrano adatti - scelti per imitazione, apprendimento e condivisione - e attraverso simili
processi si organizzano sia la percezione che il pensiero e la sensazione; ciò avviene di
solito del tutto inconsapevolmente.
Le regole principali di organizzazione dei dati percepiti sono:
• Buona forma (la struttura percepita è sempre la più semplice)

• Prossimità (gli elementi sono raggruppati in funzione delle distanze)
• Somiglianza (tendenza a raggruppare gli elementi simili)
• Buona continuità (tutti gli elementi sono percepiti come appartenenti ad un
insieme coerente e continuo)
• Destino comune (se gli elementi sono in movimento, vengono raggruppati quelli
con uno spostamento coerente).
Queste regole sono utili per spiegare le diverse forme delle illusioni create dalla
percezione come conseguenza di fenomeni fisici.
Il suono
L'orecchio umano può udire i suoni nell'intervallo dai 20 Hz ai 20.000 Hz. Questo limite
superiore tende ad abbassarsi con l'avanzare degli anni: molti adulti non sono in grado di
udire frequenze oltre i 16 kHz.
Possiamo anche dire che la banda utile di persone urbanizzate, di eta media (compresa
tra 20 e 40 anni), è tra circa 80Hz e 15KHz, con una sensibilità non inferiore ai +20dB.
Per poter dare dei riferimenti, ricordiamo che il rombo di un trasformatore di alimentazione
è 50Hz (la frequenza dell’alimentazione elettrica di rete) ed il fischio prodotto dal
trasformatore di riga dei televisori con tubo a raggi catodici è 1525Hz.
Il intervallo di udibilità è quindi fortemente soggettivo e legato a svariate problematiche,

quali l’età, l’urbanizzazione (e quindi lo stress uditivo) e la salute.
Definiamo quindi, per puro comodo, un intervallo pari 20Hz – 20KHz.
L'orecchio di per sé non è in grado di rispondere alle frequenze inferiori o superiori

all'intervallo indicato, ma quelle inferiori possono essere percepite col corpo attraverso il
senso del tatto.
Tra gli animali, i cani possono percepire frequenze fino a 40Khz mentre le farfalle sino a
180 KHz.
Nel tratto centrale dell'intervallo delle frequenze udibili l'orecchio ha una risoluzione di
circa 2 Hz: significa che sono percepibili modifiche di un suono in altezza solo se queste
sono maggiori di 2 Hz.
Tuttavia, differenze d'altezza minori sono percepibili in altre maniere: per esempio,
l'interferenza tra due altezze può essere spesso ascoltata come una differenza d'altezza di
bassa frequenza. Questo effetto di variazione di fase sul suono risultante è comunemente
conosciuto come fenomeno dei battimenti.
L'effetto della frequenza sull'orecchio umano segue una base logaritmica.
In altre parole, la maniera in cui l'altezza di un suono che viene percepita è funzione
esponenziale della frequenza. La comune scala musicale di dodici suoni è un esempio:
quando la frequenza fondamentale di una nota è moltiplicata per 21 / 12, il risultato è la
frequenza del semitono successivo in direzione ascendente.
Andare più in alto di dodici semitoni, ovvero di un'ottava, è lo stesso che moltiplicare la
frequenza della fondamentale per 212 / 12, ovvero raddoppiare la frequenza.
Denominazione Standard Frequenza

Italiana in Hz
DO4 C4 262
DO#4 C#4 277
RE4 D4 294
RE#4 D#4 311
MI4 E4 330
FA4 F4 349
FA#4 F#4 370
SOL4 G4 392
SOL#4 G#4 415
LA4 A4 440
LA#4 A#4 466
SI4 B4 494
La frequenza di una nota che dista n semitoni dalla fondamentale è data dalla formula:
Come risultato si ha che la risoluzione nel riconoscimento della frequenza assoluta viene
giudicata meglio dall'orecchio in termini di semitoni o in cent, cioè in centesimi di
semitono.
Il rumore
Il rumore è un disturbo causato dall'eccesso di informazioni, tale che anche l'elemento

potenzialmente utile non viene riconosciuto, nemmeno individuato, o individuato con
difficoltà. Il rumore è quindi un segnale di disturbo rispetto all'informazione trasmessa in
un sistema. Come tutti i suoni, il rumore è costituito da onde di pressione sonora.
Costituisce rumore anche l'eccessiva ripetizione di un segnale, poiché le risorse cognitive

utilizzate per la sua interpretazione diminuiscono via via che tale segnale si ripresenta con
cadenza ciclica, limitando il livello dell'attenzione verso di esso.
Per disturbo si intende un segnale o un processo stocastico (casuale), che non è detto
che sia riferibile al rumore, non determinabile e perturbante la percezione.
La percezione sonora
L’area di percezione sonora è ricompresa tra la soglia di udibilità e la soglia di dolore:
Il phon in psicoacustica rappresenta il livello di sensazione sonora sulla base del quale
furono rappresentate le curve di isofonia nel diagramma di Fletcher e Munson.
In particolare il phon definisce il livello di pressione sonora che un suono puro di una
determinata frequenza f, deve avere, al fine di provocare la medesima sensazione uditiva
(in termini di intensità del livello acustico) del suono di riferimento alla frequenza di 1 kHz.
Per esempio, il valore della pressione sonora corrispondente alla curva isofonica di 40
phon, per un suono puro con frequenza pari a 1.000 Hz, equivale a 40 dB mentre alla
frequenza di 100 Hz equivale a circa 50 dB.
Se si prende in considerazione l'intensità del suono, l'intervallo udibile è enorme: il limite

inferiore è definito a 0 dB, mentre il limite superiore (nelle curve in esame) non è fissato.
È possibile individuare un limite superiore approssimativo considerando il punto in cui
l'intensità del suono è tale da danneggiare l'orecchio. In questo modo il limite dipende
dalla durata del suono, poiché l'orecchio può sopportare 120 dB per un breve periodo, ma
può subire sordità permanente se esposto per lungo tempo a un suono oltre gli 80 dB.
Il nome “audiogramma normale” dato da Fletcher e Munson al grafico ottenuto non è

propriamente corretto, perché le condizioni sotto le quali è stato ottenuto (purezza del
suono, onde sinusoidali piane) non sono quasi mai confrontabili con la realtà. L’importanza
di tale grafico è comunque considerevole, in quanto è utilizzato per valutare le misure
effettuate con sistemi che hanno una risposta uguale a tutte le frequenze; su di esso si
basano inoltre le normative che stabiliscono per legge il livello sonoro limite al quale può
essere sottoposto l’uomo.
Le rilevazioni risalgono al 1933 e la loro elaborazione finale al 1937.
Il nome più corretto è curve isofoniche o curve di uguale percezione di volume (equal-
loudness contour).
Successivamente, sono state rettificate e normate nell’ISO 226. Dalla curva a 40dB è stata
derivata la cosiddetta curva pesata A in uso nell’audio per le misurazioni correlate alla
sensibilità.
Nel grafico, ISO 226:2003 (in rosso) raffrontato con le curve originali di Fletcher e Munson
(in blu) e le parti stimate alle alte frequenze (puntinato). Il grafico è in Hz (ascisse) e
dBSPL (ordinate).
Psicoacustica
La psicoacustica è fortemente basata sull'anatomia umana, soprattutto sulle

limitazioni di percezione dell'orecchio.
Dette limitazioni, per riassumere, sono:

• Limiti alle alte frequenze
• Soglia assoluta di udibilità
• Soglia del dolore
• Temporal masking (Mascheramento temporale)
• Simultaneous masking (Mascheramento simultaneo)
Nell’analisi della percezione, l'udito umano può essere assimilato ad un analizzatore di

spettro, così che l'orecchio risolve il contenuto spettrale della pressione dell'onda di
pressione tener conto della fase del segnale.
Realmente, tuttavia, si possono percepire notevoli informazioni della fase. La differenza di

fase tra un orecchio e l'altro fornisce una parte significante nella localizzazione del suono.
Gli effetti di filtraggio della testa offrono un altro importante dato per la localizzazione e la
direzione.
Di conseguenza possiamo pensare che l’orecchio umano riesca ad analizzare i suoni in

base a:
• Frequenza (Hz)
• Intensità (dBSPL)
• Fase destra/sinistra (φ in gradi °, minuti ’ e secondi ’’)
• Ritardo destra/sinistra (in millisecondi)
Nell’elaborazione viene usata anche la correlazione tra i suoni e la sequenza temporale

(inviluppo).
In base al tipo di percezione ed alle caratteristiche delle limitazioni sono state introdotte
delle scale di misura che tengono conto delle correlazioni.
Le principale scale di misura usate in psicoacustica sono Mel e Bark.
Mel
La scala Mel, proposta da Stevens, Volkman e Newman nel 1937 è una scala percettiva
che associa una frequenza alla sua percezione. Nelle ascisse abbiamo le frequenze, nelle
ordinate le frequenze percepite. Il riferimento è pari a 1000 Hz a 40 dB, ovvero 1000 mels.
La scala Mel evidenzia gli errori di percezione rispetto alla frequenza.
Bark
La scala Bark, proposta da Eberhard Zwicker nel 1961, analizza le bande critiche
dell’ascolto in psicoacustica, ovvero il limite di riconoscimento tra suoni ravvicinati in caso
di mascheramento (ovvero due suoni percepiti come uno solo).
La scala è suddivisa in 24 bande i cui valori in Hertz sono:

20, 100, 200, 300, 400, 510, 630, 770, 920, 1080, 1270, 1480, 1720, 2000, 2320, 2700,
3150, 3700, 4400, 5300, 6400, 7700, 9500, 12000, 15500.
Mascheramento
In alcune situazioni, un suono normalmente udibile può essere mascherato da un altro

suono. Ad esempio, la conversazione a una fermata di autobus può diventare
completamente impossibile se si sta avvicinando un rumoroso autobus. Questo fenomeno
è chiamato "mascheramento".
Un suono più debole è detto "mascherato" se è reso inaudibile dalla presenza di un
suono più forte.
Se due suoni vengono prodotti simultaneamente e uno è mascherato dall'altro, si parla di

mascheramento simultaneo.
Un suono di frequenza prossima a quella del suono più forte è mascherato più facilmente
rispetto a uno di frequenza molto diversa. Per questo motivo, il mascheramento
simultaneo è anche chiamato "mascheramento di frequenza".
Un suono leggero emesso appena dopo la fine del suono alto è mascherato da
quest'ultimo.
Persino un suono leggero appena prima di un suono alto può essere mascherato da un
suono alto. Questi due effetti sono chiamati rispettivamente anticipo e ritardo del
temporal-masking (mascheramento temporale).
Conseguenze del mascheramento
Al livello più basso di udibilità, le note gravi possono spesso essere udite chiaramente solo
quando non ci sono altri suoni alla stessa frequenza. La cosa è dovuta al fatto che
l'orecchio opera una sintesi dei suoni a bassa frequenza dalle differenze delle frequenze
armoniche udibili presenti nei suoni in questione.
In alcuni apparecchi commerciali, questo effetto è utilizzato per dare l'impressione di una
risposta estesa alle bassa frequenze quando il sistema non è in grado di riprodurle
adeguatamente.
I principali effetti psicoacustici sono:
• mascheramenti in frequenza
• mascheramenti in tempo
• illusioni di suoni inesistenti
• illusioni armoniche, scale infinite
I domini, le ontologie e le interpolazioni
Nell'informatica, una ontologia è il tentativo di formulare uno schema concettuale

esaustivo e rigoroso nell'ambito di un dato dominio; si tratta generalmente di una
struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di
esse, le regole, gli assiomi ed i vincoli specifici del dominio.
DOMINIO  ONTOLOGIA  INTERPRETAZIONE  INTERPOLAZIONE  PAREIDOLIA
L'uso del termine "ontologia" nell'informatica deriva dal precedente uso dello stesso
termine in filosofia, dove ha il significato dello studio dell'essere o dell'esistere, così come
dalla filosofia sono tratti i concetti fondamentali di categoria e di relazione.
Una ontologia fondazionale è in qualche misura assimilabile ad un glossario di base,

anche se al contrario di questo, usualmente la prima è gerarchizzata in due o più livelli, nei
cui termini tutto il resto deve essere descritto.
In matematica, e in particolare in analisi numerica, per interpolazione si intende un

metodo per individuare nuovi punti del piano cartesiano a partire da un insieme finito di
punti dati, nell'ipotesi che tutti i punti si possano riferire ad una funzione f(x) di una data
famiglia di funzioni di una variabile reale.
Nelle attività scientifiche e tecnologiche e in genere negli studi quantitativi di qualsiasi

fenomeno, accade molto spesso di disporre di un certo numero di punti del piano ottenuti
con un campionamento o con apparecchiature di misura e di ritenere opportuno
individuare una funzione che passi per tutti i punti dati o almeno nelle loro vicinanze.
Pareidolie
La pareidolia (dal greco είδωλον, immagine, col prefisso παρά, simile) è l'illusione
subcosciente che tende a ricondurre a forme note oggetti o profili (naturali o artificiali)
dalla forma casuale.
È la tendenza istintiva e automatica a trovare forme familiari in immagini disordinate;

l'associazione si manifesta in special modo verso le figure e i volti umani.
Qui vediamo alcuni esempi di percezione visiva deformata, ovvero con illusioni relative alle
distanze, alle proporzioni ed alla forma.
Classici esempi sono la visione di animali o volti umani nelle nuvole, la visione di un volto
umano nella luna oppure l'associazione di immagini alle costellazioni. Sempre alla
pareidolia si può ricondurre la facilità con la quale riconosciamo volti che esprimono
emozioni in segni estremamente stilizzati quali le emoticon.
La pareidolia è un caso particolare di apofenia, che si riferisce al riconoscimento di suoni

in stimolazioni casuali, come per esempio sentire il telefono squillare durante la doccia: il
rumore prodotto dall'acqua corrente potrebbe fornire un background casuale da cui
potrebbe essere "prodotta" l'apparenza del suono del telefono.
Ovviamente l’apofenia è stimolata dalla ‘necessità’ dell’esistenza del suono dovuta a
condizioni psicologiche quali, ad esempio, la paura e l’ansia.
Fanno parte delle pareidolie i ‘trucchi’ sonori e musicali nati per provocare effetti
particolari nella percezione.
Tra i vari effetti sonori, possiamo ricordare quelli relativi alla percezione di suoni non
presenti nella realtà –apofenie-, dovuti alla interazione ed al battimento oppure l’idea di
presenza del suono che riteniamo più corretto in un certo momento (illusione di presenza
di una fondamentale o di una melodia nascosta).
Tra gli effetti sonori, il più noto è la Scala Shepard, dal nome dello psicologo Roger
Shepard, che l'ha ideata, è un esempio di canone eternamente ascendente. Una
determinata scala viene infatti suonata contemporaneamente su diverse ottave differenti;
inoltre varia anche l'intensità delle scale, in modo che mentre una diminuisce di intensità,
un'altra aumenta. L'effetto è quello di una scala che sale di altezza in modo indefinito.
Il canone eternamente ascendente, è contenuto nella Offerta musicale di Johann

Sebastian Bach. In questo brano, dopo una serie di modulazioni, ci si ritrova alla identica
tonalità di partenza, senza che l'ascoltatore se ne sia reso conto. Si ascolti Fantasia e Fuga
in Sol minore per organo BWV 542 di J.S. Bach.
Il principio della scala di Shepard è stato utilizzato, in musica moderna, ad esempio dai
Pink Floyd, alla fine della suite Echoes contenuta nell'album Meddle e dai Queen in A day
at the races.
Audio analogico
Dal realistico al finto
Negli ultimi 30 anni si è passati da un mondo acustico analogico ad un mondo digitale.

L’introduzione del CD (1979 – 1982) ha rappresentato il punto più alto dello
sconvolgimento delle tecnologie nel campo audio, andando a sostituire il media principale
per la fruizione. Un altro punto rilevante di questa modificazione è rappresentato dal MP3
(1991 - 1995) e dai media elettronici dedicati allo scopo, ovvero dai vari riproduttori e
dalle chiavette usate come media.
In buona sostanza, in questi anni si è modificato completamente lo scenario e si è giunti
ad una variazione della percezione di cos’è il suono, passando da un ascolto nel quale
distorsione e rumore erano normali ad uno in cui coloriture ed artificiosità sono la norma.
Il rumore è una componente strutturale di qualunque catena di riproduzione. Un

componente elettronico, per quanto perfetto, genera rumore. La sorgente di rumore più
comune negli apparati e dispositivi elettronici è il rumore termico, esso è infatti intrinseco
di ogni elemento dissipativo (es. resistori) che si trovi ad una temperatura diversa dallo
zero assoluto. Questo rumore è conseguenza dell'agitazione termica dei portatori di carica
in un conduttore. Il valore quadratico medio (quadrato del valore efficace) dipende dalla
temperatura ed è pari a
dove:
• k= 1,38 * 10 − 23 W/KHz (costante di Bolzmann);
• R è la resistenza elettrica del conduttore;
• Bn è la banda equivalente di rumore;
• T è la temperatura in kelvin (K)
Semplifichiamo il concetto ignorando le altre tipologie di rumore, ma sapendo che esistono

e sono presenti se esistono componenti attivi o connessioni:
• rumori di tipo shot, flocker e burst, dovuti ai componenti attivi;
• rumori parassiti, microinterruzioni e scricchiolii dovuti alle connessioni;
• rumori e disturbi di interferenza, dovuti a circuiti esterni.
Nell’elettronica analogica (ma non si compia l’errore di pensare che non vi sia nulla di
analogico in una catena digitale) il rumore è imprescindibile e ineludibile. Inoltre è sempre
presente un grado di distorsione del segnale.
Nei tempi dell’audio analogico era normale ascoltare il suono con una percentuale
rilevante di rumore e distorsione.
Il suono risultante era quindi simile all’originale, ma ne era una rappresentazione
infedele, in quanto affetta da disturbi e distorsioni.
Ora, con l’audio digitale, la registrazione dell’evento è estremamente simile all’originale

ma la catena di riproduzione è sempre di più comoda e abbellita.
Si tende a fornire ed a utilizzare sistemi di riproduzione piccoli, poco invasivi e che
rendono il suono in modo tale da essere percepito come fedele, anche se finto.
Come similitudine si pensi all’uso di ritoccare le immagini per accentuarne il realismo,
quando la ripresa in quanto tale non rende l’impressione che si desidera.
Il suono viene spesso abbellito con coloriture (es. accentuazione dei medio-bassi,
accentuazione degli alti, etc.) o modificato durante la registrazione per comodità (es. MP3,
con la soppressione delle parti di suono ritenute non udibili, in maniera similare ai Jpeg
nelle immagini) o con modificazioni della fase o dei ritardi (es. nei sistemi home-cinema).
È difficile spiegare con parole un concetto di questo tipo. L’invito che si può fare è di
ascoltare della musica nella realtà (es. un concerto) e di ascoltare una riproduzione.
Complessità e qualità
In linea di massima, il numero dei componenti di un sistema elettronico aumenta la

possibilità di rumore e riduce il rischio di distorsione.
I puristi affermano da sempre che sarebbe da preferire una catena di riproduzione più
corta e semplice possibile. In linea di massima e nei limiti del ragionevole (es. se si
necessita di un mixer non è facile pensare ad una semplificazione) ciò è corretto, ma
occorre pensare alle necessità che il sistema deve soddisfare. In un sistema digitale ciò è
più semplice, in quanto la parte analogica può essere ridotta all’acquisizione ed alla
riproduzione nello stadio finale.
Elettronica di base
Letteralmente, l'elettronica è la scienza e la tecnologia del controllo degli elettroni. In

pratica questo termine indica oggi l'insieme di conoscenze pratiche e teoriche necessarie
per progettare e realizzare apparati in grado di elaborare grandezze fisiche, tradotte per
mezzo di opportuni dispositivi, servendosi di grandezze fisiche relative alla carica elettrica.
Le realizzazioni dell'elettronica sono dei circuiti elettronici costituiti da dei componenti,
attivi e passivi, collegati per mezzo di fili o tracciati conduttivi, in genere metallici,
attraverso cui circolano correnti elettriche.
L'elettronica si divide in due grandi settori:

• l'elettronica analogica, si occupa di segnali analogici, cioè che variano nel tempo in
modo continuo, e che in linea di principio potrebbero assumere un valore qualsiasi
in qualunque istante di tempo dato (per esempio voci, suoni, intensità luminose
ecc.): operazioni tipiche compiute su questi segnali sono l'amplificazione, la
modulazione, la miscelazione, il filtraggio.
• l'elettronica digitale, che invece tratta dei segnali elettrici che possono assumere
soltanto alcuni valori (predeterminati e finiti) "legittimi" di tensione,
convenzionalmente due valori utilizzando il sistema binario: "alto" o "basso" che
sono associati ai valori logici "vero" e "falso". In questo caso ci si riferisce a segnali
binari che in genere vengono sottoposti a operazioni logiche booleane come l'AND,
l'OR, il NOT eccetera.
Un componente elettronico è un dispositivo atto a regolare il passaggio di corrente

elettrica attraverso di esso e/o il valore di tensione elettrica ai suoi capi secondo una legge
matematica ben determinata. In questa legge possono intervenire anche forze fisiche
esterne, non elettriche: componenti particolari possono o modulare o generare correnti o
tensioni elettriche sotto l'effetto di altre forze fisiche, o ancora a reagire a questo
passaggio generando luce o effetti fisici di altro genere: in questo caso essi sono detti
trasduttori. Alcuni componenti sono comuni sia all'elettronica che all'elettrotecnica,
soprattutto le impedenze e i trasformatori.
Tensione
In fisica, la differenza di potenziale è la differenza in potenziale tra due punti immersi

in un campo vettoriale conservativo. Nel contesto dell'elettricità, il campo vettoriale
conservativo è il campo elettrostatico. Tra due punti nel campo si può definire una
differenza di potenziale elettrico la cui unità di misura è il volt. Tale differenza di potenziale
è talvolta chiamata tensione o, più raramente (ed impropriamente), voltaggio.
Corrente
La corrente elettrica è un qualsiasi flusso ordinato di carica elettrica, tipicamente
attraverso un filo metallico o qualche altro materiale conduttore. La corrente
convenzionale venne definita inizialmente, nella storia dell'elettricità, come il flusso di
carica positiva, anche se sappiamo, nel caso della conduzione metallica, che la corrente è
causata dal flusso di elettroni con carica negativa nella direzione opposta. Nonostante ciò,
l'originale definizione di corrente convenzionale resta valida. Il simbolo normalmente usato
per la quantità di corrente (la quantità di carica che scorre nell'unità di tempo) è I, e
l'unità di misura nel SI della corrente elettrica è l'ampere. La corrente elettrica viene anche
chiamata intensità di corrente
La legge di Ohm esprime una relazione tra la differenza di potenziale V (tensione

elettrica) ai capi di un conduttore e la corrente elettrica I che lo attraversa. Sia R la
resistenza del conduttore, abbiamo:
Gli elementi elettrici per i quali la legge è soddisfatta sono detti resistori (o resistenze)
ideali o ohmici.
In ambito reale, si utilizza la formula:
Dove: per le resistenze, per le induttanze e
per i condensatori.
Le leggi di Kirchhoff descrivono le proprietà dei circuiti elettrici a parametri concentrati.

Furono formulate da Gustav Robert Kirchhoff nel 1845 a seguito di esperimenti empirici.
Nei circuiti a parametri concentrati sostituiscono completamente le leggi
dell'elettromagnetismo permettendo di ridurle a pure relazioni topologiche.
La legge di Kirchhoff delle correnti (LKC o LKI) afferma che, definita una superficie chiusa
che attraversi un circuito elettrico, la somma algebrica delle correnti che attraversano la
superficie (con segno diverso se entranti o uscenti) è nulla.
La legge di Kirchhoff delle tensioni (LKT o LKV) afferma che, in un circuito a parametri
concentrati planare, la somma algebrica delle tensioni lungo una linea chiusa (con il segno
appropriato in funzione del verso di percorrenza della maglia stessa) è pari a zero.
Impedenze
Resistore
Il resistore (comunemente resistenza) è un componente elettrico di enorme importanza
per le sue innumerevoli applicazioni sia in apparecchiature elettriche che elettroniche. I
resistori sono a volte utilizzati per convertire energia elettrica in energia termica.
Nella Teoria dei circuiti il resistore è un componente ideale (resistenza) che risponde, se
lineare, alla legge di Ohm, i resistori non lineari sono essenziali per fare modelli circuitali,
per esempio, degli oscillatori elettronici. Nel mondo reale, i resistori sono dispositivi
multiformi, con caratteristiche e limiti operativi ben determinati.
Induttore
L'induttore è un componente elettrico che genera un campo magnetico al passaggio di
corrente elettrica (continua o alternata od impulsiva).
L'ampiezza della f.e.m. è correlata con l'intensità della corrente e con la frequenza delle
sinusoidi dalla seguente equazione:
dove ω è la pulsazione della sinusoide legata alla frequenza f da: ω = 2 π f

Condensatore
Il condensatore o capacitore è un componente elettrico che immagazzina l'energia in un
campo elettrostatico, accumulando al suo interno una certa quantità di carica elettrica.
Nella teoria dei circuiti il condensatore è un componente ideale che può mantenere la
carica e l'energia accumulata all'infinito, se isolato (ovvero non connesso ad altri circuiti),
oppure scaricare la propria carica ed energia in un circuito a cui è collegato.
dove Q=Carica; C=Capacità
Nei circuiti in regime sinusoidale permanente esso determina una differenza di fase di 90
gradi fra la tensione applicata e la corrente che lo attraversa. In queste condizioni di
funzionamento la corrente che attraversa un condensatore ideale risulta in anticipo di un
quarto di periodo rispetto alla tensione che è applicata ai suoi morsetti.
La quantità di resistenza che un condensatore oppone alla corrente alternata è nota come
reattanza capacitiva e dipende dalla frequenza della AC:
Dalla formula si possono fare alcune interessanti osservazioni:

• la reattanza è inversamente proporzionale alla frequenza;
• si ha la conferma che il condensatore blocca la corrente continua, in quanto
questa ha frequenza nulla e perciò la reattanza del condensatore tende ad
infinito;
• ad alte frequenze la reattanza è così piccola da poter essere tranquillamente
trascurata nell'eseguire i calcoli.
Circuiti
Un circuito RC è un circuito elettronico del primo ordine basato su una resistenza e sulla
presenza di un elemento dinamico, il condensatore. A seconda di come sono disposti i due
componenti del circuito RC esso è in grado di filtrare le frequenze basse (filtro passa
basso) oppure quelle alte (filtro passa alto), realizzando un filtro del primo ordine e se
considerato come cella elementare, esso è in grado di comporre filtri del secondo ordine e
via dicendo come il doppio passa basso e doppio passa alto.
In un circuito RC la costante di tempo è una misura del tempo di risposta caratteristico

del circuito. Il suo inverso è proporzionale alla frequenza di taglio.
Il valore di questa costante si ottiene come prodotto della resistenza e della capacità
elettrica del circuito:
se R viene espresso in ohm e C in farad, τ risulta espresso in secondi.
In pratica è il tempo richiesto per caricare il condensatore, attraverso il resistore, al 63,2

% della sua capacità di carica totale; oppure per scaricarlo al 36,8 % della sua differenza
di potenziale (in volt).
In generale, si dice RLC un circuito che contenga solo resistenze (R), induttori (L) e
condensatori (C). Per estensione, viene spesso definito RLC un circuito che contenga
anche altri elementi passivi, ma nessun elemento attivo.
I circuiti RLC sono sistemi lineari, per lo più stazionari (ma non necessariamente). In
particolare, ciò significa che un circuito RLC non può creare frequenze dal nulla: può
eventualmente sopprimerle. Infatti, la nascita di nuove frequenze (distorsione) avviene
soltanto negli elementi attivi e negli elementi non lineari, come diodi e transistor.
In casi particolari, però, alcuni elementi quali induttanze, capacità e trasformatori possono
avere comportamenti non lineari e quindi introdurre distorsioni (ad esempio, per
saturazione del materiale ferromagnetico presente).
Macchine elettriche: Trasformatori
Il trasformatore è una macchina elettrica statica (perché non contiene parti in

movimento) appartenente alla categoria più ampia dei convertitori. In particolare il
trasformatore consente di convertire i parametri di tensione e corrente in ingresso rispetto
a quelli in uscita, pur mantenendo costante la quantità di potenza elettrica (a meno
delle perdite per effetto dell'isteresi e delle correnti parassite).
Il trasformatore è una macchina in grado di operare solo in corrente alternata, perché

sfrutta i principi dell'elettromagnetismo legati ai flussi variabili.
Componenti attivi
Diodo
Il diodo è un componente elettronico attivo non lineare a due terminali (bipolo), la

cui funzione ideale è quella di permettere il flusso di corrente elettrica in una direzione
e di bloccarla nell'altra, la qual cosa viene realizzata ponendo dei vincoli alla libertà di
movimento e di direzione dei portatori di carica.
In questo modo può essere usato, per esempio, per eliminare una delle due semionde
di un segnale elettrico alternato.
Dalle curve corrente/tensione possiamo vedere come il passaggio di corrente non è lineare
in funzione della tensione applicata ai capi del componente, e con l’applicazione di una
tensione positiva (piccola a piacere) inizia a condurre in maniera ideale (figura a sinistra).
Nella curva centrale si nota come un componente quasi ideale in quanto comincia a
condurre al raggiungimento della tensione caratteristica (in questo caso, 0,7V).
Il diodo reale, figura a destra, inizia a condurre quando ai suoi capi (anodo e catodo) è
presente una tensione positiva simile alla sua tensione caratteristica o di soglia e assume
un comportamento quasi ideale al raggiungimento della soglia.
Componenti attivi a vuoto
Diodo
L'anodo è polarizzato con un potenziale positivo, mentre il catodo con uno negativo. Il
catodo, riscaldato da un apposito filamento, emette elettroni, che sono particelle di carica
negativa. Quando l'anodo è polarizzato positivamente si avrà che gli elettroni emessi dal
catodo vengono raccolti dall'anodo, creando così un flusso di cariche ovvero una corrente
elettrica. Se polarizzassimo il catodo positivamente e l'anodo negativamente non
riusciremmo più ad ottenere un flusso di cariche dal momento che gli elettroni emessi da
catodo verrebbero respinti dal campo negativo dell'anodo. Il tubo permette quindi alla
corrente di scorrere solamente lungo un verso, e permette quindi il raddrizzamento
elettrico. Nei tubi a potenza più bassa il catodo e il filamento sono elettrodi indipendenti e
isolati elettricamente; Il filamento riscalda il catodo e quest'ultimo emette gli elettroni
coinvolti nella conduzione.
Triodo
Aggiungendo una griglia tra il catodo e l'anodo, come fece per primo Lee de Forest nel
1907, si ottiene il triodo.
La griglia, che è generalmente costituita da un filo avvolto a spirale o da una rete

interposta nello spazio intorno al catodo, è in grado, opportunamente polarizzata, di
controllare il flusso di elettroni tra catodo ed anodo: polarizzata negativamente rispetto al
catodo, questa respinge gli elettroni del flusso tanto più quanto più è polarizzata
negativamente, fino alla tensione di cut-off in cui la corrente è zero. Quindi, variando la
tensione della griglia si può controllare il flusso di corrente fra anodo e catodo, da zero
fino al massimo che la valvola consente (punto di saturazione).
Una piccola variazione di tensione sulla griglia provoca una notevole variazione della
Pentodo
Per poter disporre di valvole capaci di amplificare anche segnali in alta frequenza, nel 1927
venne costruito il tetrodo. Ponendo una seconda griglia collegata a massa (la griglia
schermo) tra la griglia controllo e l'anodo, si ottiene uno schermo elettrostatico che
diminuisce la capacità tra anodo e griglia controllo. Il pentodo è, essenzialmente, un
tetrodo con una griglia in più, la griglia di soppressione; questa ha lo scopo di ridurre
l'emissione secondaria e la conseguente distorsione. La terza griglia viene normalmente
collegata al catodo, in genere con un collegamento interno alla valvola, che quindi spesso
ha lo stesso numero di piedini del tetrodo.
Il pentodo è un vero e proprio punto d'arrivo nello sviluppo della valvola: alta
amplificazione, larga banda, bassa distorsione, buona linearità. I pentodi si trovano negli
stadi a radiofrequenza e a media frequenza di un ricevitore, ma anche negli amplificatori
d'uscita. Il difetto principale del pentodo è un maggiore livello di rumore introdotto nel
segnale in uscita, che lo rende inadatto per i primi stadi di amplificazione o quando è
necessaria una amplificazione molto elevata.
Componenti attivi a stato solido
Transistor
Il transistor (o transistore) è un dispositivo a stato solido formato da semiconduttori. Il suo

funzionamento è basato su quello della giunzione P-N, che era stata scoperta casualmente
da Russell Ohl il 23 febbraio 1939, esaminando la differenza di conducibilità tra due lati di
un cristallo di silicio semiconduttore con una crepa.
Bipolari
Un transistor a giunzione bipolare (in inglese bipolar junction transistor o BJT) è un tipo di
transistor, cioè un componente elettronico attivo (nel senso che può pilotare una corrente,
ma non erogare potenza) che funziona come amplificatore o interruttore, ed è formato da
semiconduttori drogati.
Tra i semiconduttori ricordiamo il germanio ed il silicio. La drogatura avviene inserendo

delle impurità nel materiale al fine di modificare il suo comportamento.
La drogatura con fosforo, arsenico, antimonio crea un semiconduttore di tipo N, ovvero
con aumento di elettroni di conduzione.
La drogatura con boro, gallio, indio crea un semiconduttore di tipo P, ovvero con aumento
di lacune di conduzione.
Ogni giunzione PN o NP opera come un diodo.
Il BJT è formato da diversi strati, drogati in modo diverso, che formano transistor NPN o
PNP.
Le tre zone sono chiamate base, quella centrale, collettore ed emettitore quelle laterali,
indifferentemente dal tipo di drogaggio: si può dimostrare che emettitore e collettore non
si possono interscambiare.
Ognuno di questi tre terminali può essere considerato un terminale di ingresso o di uscita
o ancora si possono mettere a comune due terminali, in tal caso si dice che il transistor è
a configurazione a base comune, a collettore comune o a emettitore comune.
FET
Il JFET è un tipo di transistor ad effetto di campo.
L'acronimo JFET sta per junction field effect transistor, o transistor ad effetto di campo a
giunzione. È un dispositivo costruito come sandwitch di semiconduttori drogati in modo
diverso (P-N-P o N-P-N).
Il JFET e' un dispositivo unipolare poiché' solo i portatori maggioritari che costituiscono il
canale si occupano della conduzione.
Al contrario del transistor bipolare, la cui grandezza di controllo è la corrente di base, i FET
sono controllati in tensione e la corrente assorbita dal gate risulta pertanto molto bassa.
MOSFET
MOSFET, è l'acronimo di Metal Oxide Semiconductor Field Effect Transistor, cioè transistor
metallo-ossido-semiconduttore a effetto di campo. Molto frequentemente viene indicato
anche solo come transistor MOS. È un tipo di transistor, molto usato nei dispositivi digitali
grazie al basso consumo di potenza dovuto alla ridotta dispersione di calore rispetto ad
altri tipi.
Il MOSFET è certamente il più comune transistor a effetto di campo sia nei circuiti digitali
che in quelli analogici. Il MOSFET è composto da un substrato di materiale semiconduttore
di tipo n o di tipo p.
Componenti integrati
Composizioni elaborate di transistor e/o di elementi attivi diversi (MosFET, etc.) e passivi
(resistenze, condensatori), trovano collocazione in componenti integrati. Si riescono ad
ottenere densità di componenti estremamente elevate, dell’ordine di milioni di componenti
per centimetro quadrato. L’uso di questi componenti semplifica di svariati ordini di
grandezza la complessità progettuale di un qualunque sistema. Sono in uso ormai da una
quarantina d’anni e nell’audio analogico sono usati in particolare gli amplificatori
operazionali, che permettono una progettazione quasi ideale (in termini di equazioni e di
curve).
Componenti Analogici Complessi
L’amplificazione
Un amplificatore è un dispositivo che modifica l'ampiezza, di un fattore moltiplicativo, del

segnale che lo attraversa. Viene caratterizzato dal guadagno A, a volte espresso in dB. Più
specificamente un generico amplificatore (lineare) ha un ingresso in cui entra il segnale da
amplificare ed una uscita da cui esce il segnale amplificato, che è pari a A volte il segnale
originale. Se il guadagno dell'amplificatore non è costante ma varia in base a determinate
caratteristiche del segnale si parla di amplificatore non lineare.
Amplificatore a transistor bipolare ad emettitore comune.

L’amplificazione è data dal rapporto tra corrente in Base (b) e corrente sul collettore (c).
Le figure che seguono illustrano la modalità di amplificazione, partendo da un segnale

modulante Vsin presente in base mediante Cin ed arrivando alla Vce (tensione tra
collettore ed emettitore) e quindi all’output su Rl mediante Cout.
Amplificatore differenziale
Un amplificatore differenziale è un tipo di amplificatore elettronico che moltiplica la

differenza tra due ingressi per un fattore costante, il guadagno differenziale.
Dati due ingressi e , un amplificatore differenziale fornisce un'uscita Vout:
in cui Ad è il guadagno di modo differenziale e Ac il guadagno di modo comune.

Il rapporto di reiezione di modo comune (CMRR, dall'inglese "common mode rejection
ratio") è di solito definito come il rapporto tra il guadagno di modo differenziale e il
guadagno di modo comune:
Da quest'equazione, si può notare che quando Ac tende a zero, CMRR tende all'infinito.
Maggiore è la resistenza della corrente di emettitore Re, più basso è Ac, e migliore è il
CMRR. Pertanto, per un amplificatore differenziale perfettamente simmetrico, con Ac = 0,
la tensione di uscita è data da
Amplificatore operazionale
Un amplificatore operazionale è un amplificatore differenziale, accoppiato in continua e ad

elevato guadagno (idealmente infinito).
Il nome è dovuto al fatto che con esso è possibile realizzare circuiti elettronici in grado di
effettuare numerose operazioni matematiche: la somma, la sottrazione, la derivata,
l'integrale, il calcolo di logaritmi e di antilogaritmi. Al giorno d'oggi l'amplificatore
operazionale è, in genere, costituito da un circuito integrato.
Un amplificatore operazionale in configurazione in amplificazione non invertente.

Gli amplificatori operazionali sono il tipico e più diffuso caso di componente integrato di
tipo analogico in campo audio.
Illustriamo i più comuni circuiti di elaborazione mediante amplificatore operazionale

(amplificatore, cioè, in grado di compiere operazioni matematiche).
Gli amplificatori possono essere invertenti o non invertenti e le relative formule di

amplificazione sono:
Invertente: Av = - (Z’/Z)
Non invertente : Av = 1+ (Z’/Z)
Introducendo un condensatore nel circuito di retroazione o di ingresso si ottiene un

amplificatore in grado di eseguire operazioni di integrazione o derivazione.
La frequenza minima e massima del segnale è limitata entro determinati valori dai
parametri dei componenti usati (integratore e derivatore limitato), ed in particolare dal
tempo di carica della rete RC, τ = RC. Superati questi limiti il circuito entra in
saturazione distorcendo il segnale.
Operazione di integrazione: Nel caso in cui all'ingresso venga applicato un segnale

sinusoidale, si rileverà in uscita un segnale sempre sinusoidale ma sfasato di +90°. Se
all'ingresso viene applicata un'onda rettangolare, in uscita si avrà un segnale di tipo
triangolare. Se all'ingresso viene applicata un'onda triangolare, in uscita si avrà un
segnale costituito da rami di parabola.
Il componente elettronico principe è il circuito integrato 741 (LM741, UA741, etc.), i cui
nipotini sono ancora in uso.
Il componente LM741 o UA741 ha avuto una enorme diffusione e quello sopra

riportato è lo schema di principio.
Oltre ai terminali di alimentazione (pin 7 e 4) notiamo gli ingressi (2 e 3) e l’uscita (6).
Su alcuni modelli di operazionale sono disponibili dei pin (contatti, ingressi) per il
controllo e l’annullamento della tensione di offset sull’uscita.
Dagli operazionali a transistor bipolari sono derivati gli operazionali a basso rumore
con ingresso a Fet, come la serie TL071/72/74/81/82/84, di cui vediamo lo schema di
principio.
Generalmente i vari tipi di operazionali hanno conservato una piedinatura comune che
qui riportiamo.
Per completezza, introduciamo un paio di circuiti basati su operazionali.
Trigger di Schmitt
Introducendo una moderata retroazione sull'ingresso non invertente, a sommarsi con il

segnale entrante, si può ottenere un comparatore con isteresi o trigger di Schmitt.
Questo tipo di comparatore è impiegato per eliminare eventuali indecisioni e commutazioni
indesiderate prodotte dal rumore elettrico. In pratica la tensione di riferimento non è
costante ma dipende dallo stato dell'uscita, in modo tale che la soglia di commutazione
verso l'alto è superiore di un certo margine rispetto alla soglia di commutazione verso il
basso. In un comparatore Trigger/Schmitt si individuano le tensioni di riferimento e le
soglie di commutazione.
I trigger nella forma invertente e non.
La caratteristica operativa e le forme d’onda associate.

Oscillatori
Introducendo un condensatore in una rete di amplificazione e sfasamento si può produrre

un oscillatore.
In questo caso ad onda quadra.
Quello che segue è un oscillatore a sfasamento, con uscita sinusoidale pari a fn = 1/(2πRC),
che sfrutta l’inversione di fase dell’amplificatore invertente per riportare in fase (e quindi
provocando l’oscillazione) l’uscita mediante due reti RC accordate.
Un altro oscillatore, in questo casi in quadratura, nella quale una doppia sfasatura di 90°
di segno opposto provoca una oscillazione.
Le due uscite sono sfasate ed assimilabili ad un seno ed un coseno.
La distorsione
La distorsione è il cambiamento di una forma d'onda a causa del passaggio attraverso un

componente fisico non lineare.
In linea di massima è un errore sistematico di non linearità in uno qualunque dei parametri
caratteristici di un fenomeno. Nell’audio può quindi essere:
• di forma d’onda o armonica

• di fase
• di intermodulazione
Prendiamo ad esempio un amplificatore a transistor.
La tensione di uscita di un transistor reale non è mai una sinusoide perfetta, e ha un

andamento simile a questo:
Ciò è causato dalle caratteristiche non lineari del dispositivo e dalla struttura cristallina non
omogenea. In particolare, i valori della sinusoide al di sopra di un certo valore vengono
tagliati al valore massimo emissibile dal dispositivo (saturazione), e allo stesso modo
vengono tagliati anche i segnali al di sotto di una certa soglia, generalmente intorno a 0.2-
0.3 V (cutoff). Tale caratteristica introdotta dal transistor è detta distorsione di non
linearità.
Il dispositivo non introduce una distorsione apprezzabile se e solo se l'ampiezza del

segnale di ingresso è relativamente limitata, quindi il punto di lavoro istantaneo I-V non
passa mai per regioni di saturazione o di cutoff e rimane sempre all'interno della regione
attiva diretta.
La regione di cutoff è caratterizzata da una corrente sul collettore praticamente nulla,
mentre quella di saturazione da una tensione tra collettore ed emettitore compresa (ad
esempio) tra 0.2 e 0.3 V.
Circuiti elettronici
Di seguito vengono visualizzati alcuni circuiti elettronici d’uso comune e le relative curve di
trasferimento.
Amplificatore differenziale
(Rf=Rg; R1=R2)
Amplificatore invertente
Amplificatore non invertente
Inseguitore (Follower, Separatore)
Vout=Vin
Sommatore (Mixer)
ovvero
Integratore
Derivatore
Comparatore

 Vout = VH per V1 > V2
 Vout = VL per V1 < V2
Giratore (simulatore di induttanza)
Diodo ideale
Amplificatore logaritmico
in cui Is è la corrente di saturazione del diodo.
Amplificatore esponenziale
Filtri attivi
In elettronica un filtro elettronico è un dispositivo che realizza delle funzioni di

trasformazione dei segnali. In particolare la sua funzione può essere quella di filtrare
determinate bande di frequenza lasciando passare le frequenze più alte o più basse di un
valore determinato, o quelle comprese in un intervallo prestabilito.
La funzione di trasferimento di un filtro può essere rappresentata con un diagramma di

Bode.
I filtri elettronici possono essere:

• Passivi o attivi
• Analogici o digitali
• A tempo discreto (campionato) o a tempo continuo
• Lineari o non lineari
I tipi più comuni di filtri elettronici sono lineari, indipendentemente da altri aspetti del loro
progetto. Molti filtri sono anche dei sistemi risonanti.
Ogni dispositivo reale funge per sua natura da filtro.
In elettronica un filtro passa alto è costituito da un circuito elettronico che permette solo
il passaggio di frequenze al di sopra di una data frequenza detta "frequenza di taglio". Può
essere di tipo attivo o passivo a seconda della presenza di elementi attivi nel circuito quali
amplificatori oppure solo passivi. Inoltre, in base alla pendenza del taglio in frequenza, si
può distinguere in filtro passa-alto di primo ordine (20 dB per decade), di secondo ordine
(40 dv per decade), di terzo ordine (60 dv per decade) e così via.
Un filtro passa basso è costituito da un circuito elettronico che permette solo il
passaggio di frequenze al di sotto di una data frequenza detta "frequenza di taglio". Può
essere di tipo attivo o passivo a seconda della presenza di elementi attivi nel circuito quali
amplificatori oppure solo passivi. Inoltre, in base alla pendenza del taglio in frequenza, si
può distinguere in filtro passa basso di primo ordine (20 dv per decade), di secondo ordine
(40 dv per decade), di terzo ordine (60 dv per decade) e così via, che è anche la
classificazione dei filtri in cascata, come il doppio passa basso e il doppio passa alto.
In elettronica, un filtro passa banda è un dispositivo che permette il passaggio di

frequenze all'interno di un dato intervallo (la cosiddetta banda passante) ed attenua le
frequenze al di fuori di esso. Un esempio di un circuito analogico che si comporta come
filtro passa banda è un circuito RLC (una rete elettrica formata da resistore-induttore-
capacitore prelevando l'uscita sul resistore). I più semplici filtri passa banda però possono
anche essere creati dalla combinazione di un filtro passa basso e un filtro passa alto
opportunamente dimensionati.
Il filtro passa banda ideale ha una banda passante perfettamente piatta, non ha né
attenuazione né guadagno per le frequenze all'interno, e attenua completamente tutte le
frequenze al di fuori di questo intervallo.
Nel caso reale, la banda passante (bandwidth) è rappresentata da una campana che ha il
centro nelle Fc (frequenza di risonanza o frequenza centrale) in corrispondenza del picco
di guadagno e due punti caratteristici di fine campana, dove il guadagno è pari a –3dB.
Il reciproco di un filtro passabanda è il filtro elimina-banda o notch.
Pendenza di un filtro
Andamento della pendenza di un filtro di Butterworth (massima linearità) passa basso del
primo ordine, ovvero 12dB/ottava, ovvero 20dB/decade
Filtri Butterworth / Bessel / Chebyshev
Vi sono varie tecniche di progettazione dei filtri e del loro comportamento. I più usati sono
quelli citati.
Butterworth è caratterizzata da una risposta in ampiezza la più piatta possibile in banda

passante e pertanto e anche nota come risposta massimamente piatta. Questa
caratteristica e l'ideale nelle applicazioni audio ad alta fedeltà in cui è assolutamente
necessario che il filtro amplifichi della stessa quantità tutti i segnali con frequenza
compresa nella banda passante.
Bessel è caratterizzata da una risposta in fase la più lineare possibile in banda

passante. Questa caratteristica fa si che il filtro introduca un ritardo temporale uguale per
tutti i segnali con frequenza compresa nella banda passante.
Il filtro di Bessel e utilizzato soprattutto nelle telecomunicazioni quando sono presenti molti
filtri in cascata ed il ritardo temporale introdotto e notevole.
Chebyshev è caratterizzata da una risposta in ampiezza con oscillazioni di ampiezza

costante in banda passante, tali oscillazioni prendono il nome di ripple e la riposta viene
anche chiamata equi ripple. Questa caratteristica fa si che il filtro presenti in prossimità
della frequenza di taglio una pendenza di taglio molto elevata.
Diagramma di Bode
Un diagramma di Bode è una rappresentazione grafica di una funzione di trasferimento,

ovvero della risposta in frequenza di un sistema lineare per un ingresso di valore unitario,
e consiste di un diagramma di ampiezza (o modulo) e un diagramma di fase.
Qualità di un filtro
I filtri sono misurati con il loro fattore di qualità, fattore di merito o fattore Q.
Si dice che un filtro ha un Q alto, se seleziona o inibisce un intervallo di frequenze stretto,
relativamente alla sua frequenza centrale.
Q = F0/Bw
dove F0 = frequenza di risonanza del filtro, Bw = banda passante del filtro
Ad esempio, i filtri audio per casse acustiche a due vie a 12 dB/ottava sono stati studiati
ed elaborati con particolare attenzione alla zona dove i suoni del tweeter si sovrappongono
con quelli del woofer, tale zona è detta d'incrocio. Il fattore di Q o fattore di merito,
esprime il comportamento del filtro, appunto, nella zona d'incrocio.
Avremo per diversi fattori di Q:
• Linkwitz-Riley, risposta in frequenza PIATTA nel punto d'incrocio.

• Butterworth, risposta in frequenza ENFATIZZATA nel punto d'incrocio.
• Bessel, risposta in frequenza INTERMEDIA fra Linkwitz-Riley e Butterworth nel
punto d'incrocio.
Dispositivi
I trasduttori
Il trasduttore è un dispositivo, generalmente elettrico o elettronico, che converte un tipo

di energia relativa a grandezze meccaniche e fisiche in segnali elettrici o viceversa.
Molti trasduttori sono sia sensori sia attuatori, ovvero possono agire sia da convertitori in
energia elettrica di fenomeni diversi che da convertitori da energia elettrica in fenomeni
diversi (es. meccanico-elettrico, elettrico-meccanico).
In senso lato, un trasduttore è talvolta definito come un qualsiasi dispositivo che converte
dell'energia da una forma ad un'altra, in modo che questa possa essere rielaborata o
dall'uomo o da altre macchine.
Tra i trasduttori in uso nei vari campi dell’audio:
• microfoni: condensatore, dinamici, etc.; idrofoni, catodofoni

• altoparlanti: dinamici, piezoelettrici, al plasma, etc.; casse acustiche
• testine: da giradisco (bobina e magnete mobile), da nastro magnetico, da nastro
ottico, laser, etc.
Un altoparlante, ad esempio, traduce energia elettrica in energia elettromagnetica

attraverso una bobina mobile immersa in un campo magnetico permanente, e quindi il
movimento della bobina stessa, connessa ad un cono in carta od una cupola in plastica, in
energia meccanica e quindi sonora.
L’altoparlante è un trasduttore reversibile, in quanto l’energia sonora che colpisce il cono

muove la bobina nel campo magnetico, provocando quindi la creazione di energia elettrica
ai capi della bobina.
I microfoni
Prima di parlare dei microfoni come trasduttori meccanici, sarà opportuno fare qualche
accenno sui principi elementari che sono alla base del loro funzionamento; in particolare
accenneremo al campo elettrico, al campo magnetico e al campo elettromagnetico. Il
campo elettrico è quello spazio che circonda un corpo elettricamente carico in ogni punto
del quale sia presente l'effetto dell'elettrizzazione stessa.
I corpi elettrizzati normalmente esercitano la loro attrazione o repulsione a seconda che le

rispettive cariche elettriche affacciate siano o no dello stesso segno. Pertanto ogni
conduttore percorso da una corrente elettrica genera intorno a sé un campo elettrico. Il
campo magnetico è quello spazio che circonda un corpo magnetizzato, in ogni punto del
quale sia presente l'effetto della magnetizzazione. Detto campo può essere generato sia
da un magnete permanente che da un elettromagnete e quest'ultimo può anche essere
costituito da un conduttore percorso da una corrente elettrica.
Questa genera sempre, oltre ad un campo magnetico, anche un campo elettrico, mentre
ogni variazione di flusso in un campo magnetico crea una corrente elettrica indotta, per
cui la coesistenza delle due componenti in oggetto, variabili nel tempo, generano un
campo elettromagnetico.
I microfoni sono dei trasduttori di energia sonora in energia elettrica.
Questa conversione avviene generalmente in due fasi: nella prima si ha la conversione di

energia sonora in energia meccanica che, a seconda del principio su cui essa è basata,
consente di individuare una suddivisione dei microfoni in due categorie:
• a pressione
• a gradiente di pressione
Nella seconda fase si ha la conversione di energia meccanica in energia elettrica, la

quale consente di individuare una seconda suddivisione dei microfoni in due categorie:
• a spostamento
• a velocità
Il trasduttore di un microfono a pressione è costituito essenzialmente da un diaframma

Questo diaframma è collegato rigidamente all'elemento che funge da trasduttore di
energia meccanica in energia elettrica. Un sottile foro praticato nella cavità mantiene il
valore medio di pressione uguale a quello della pressione atmosferica.
Il trasduttore di un microfono a gradiente di pressione è costituito essenzialmente da

un diaframma flessibile fissato su un supporto e avente entrambe le facce esposte alle
onde sonore. La deformazione del diaframma dipende in questo caso dalla differenza di
pressione sulle due facce, differenza questa che dipende ovviamente dalla differenza dei
percorsi l1 e l2 che l'onda sonora deve fare per raggiungere la faccia anteriore e quella
posteriore. Se la direzione di provenienza dell'onda è parallela al piano del diaframma i
due percorsi risultano uguali e la differenza di pressione tra le due facce nulla. A seconda
del principio su cui è basata la conversione di energia meccanica in energia elettrica, come
abbiamo visto, si possono individuare due classi di microfoni.
Sono a spostamento quei microfoni nei quali la forza elettromotrice in uscita è
proporzionale allo spostamento dell'elemento mobile.
Sono a velocità quelli nei quali la forza elettromotrice di uscita è proporzionale alla
velocità dell'elemento mobile.
Tecnologie dei microfoni
I microfoni si diversificano in base alla tecnologia di trasduzione meccanico-elettrica:

• a condensatore
• dinamici, elettromagnetici, a bobina mobile, a magnete mobile
• a nastro
condensatore
elettromagnetico
a nastro (obsoleto)
Esistono vari altri tipi di microfoni e trasduttori (a carbone, piezoelettrici, gli idrofoni, i
catodofoni, stetoscopi, laringofoni, etc.), ma non hanno senso in questo ambito o sono
obsoleti.
In particolare, gli idrofoni sono “microfoni” per l’ascolto in acqua; gli stetoscopi e i
catodofoni sono l’equivalente per “ascoltare” vibrazioni su mezzi (un corpo, del metallo, un
muro, etc.). Sono in uso degli stetoscopi detti microfoni endoossei (o microfoni
craniali) per l’uso all’interno dei caschi (motociclisti, piloti, pompieri, etc.) che ricevono il
segnale come vibrazione della scatola cranica.
Qui illustrato uno stetoscopio (microfono per superfici) per l’ascolto via muro (per scopi
di sorveglianza).
Qui invece un idrofono

per la rilevazione di suoni nell’acqua.
Analizzando il mezzo usato per la trasduzione in energia elettrica troviamo, oltre ai

microfoni a condensatore ed a quelli elettrodinamici, altri tipi di sistemi.
I microfoni a carbone erano usati nei telefoni (lo scricchiolio che si udiva nelle
conversazioni era dovuto alla compressione ed al movimento delle particelle di carbone).
I microfoni piezoelettrici utilizzavano dei frammenti di quarzo piezoelettrico o ceramiche

speciali per convertire direttamente la pressione sonora in segnale elettrico, grazie
all’effetto piezoelettrico. Sono ancora in uso come pickup a contatto (es. per strumenti
musicali).
Vediamo ora quali sono le motivazioni di uso di un microfono per tipologia.
Condensatore
Microfono a Condensatore (standard o elettrete)

• facile da miniaturizzare
• tipica risposta in frequenza molto ampia
• tipica risposta in frequenza costante su tutta la gamma
• richiede alimentazione
• la maggior parte dei modelli è relativamente robusta e affidabile
• tipicamente sono impiegati in applicazioni vocali e strumentali in registrazioni e
nel rinforzo sonoro.
Dinamico
Microfono Dinamico
• non può essere facilmente miniaturizzato
• tipica risposta in frequenza non molto ampia
• tipica risposta in frequenza che tende a non essere costante su tutta la gamma
• non richiede alimentazione
• la maggior parte dei modelli è molto robusta e affidabile
• tipicamente sono impiegati in applicazioni vocali nel rinforzo sonoro.
Il microfono a condensatore può essere di tipo standard, se richiede alimentazione esterna

o ad elettrete se utilizza una membrana capacitiva pre-caricata elettricamente.
Alimentazione e phantom
I microfoni a condensatore non elettrete necessitano di un’alimentazione elettrica, detta

phantom (cioè fantasma, a causa del fatto che risulta, appunto, invisibile), la quale viene
fornita al microfono tramite i connettori audio che provengono dal banco mixer o apposite
apparecchiature. L'alimentazione phantom viene applicata fornendo una corrente continua
di +48V ai piedini 2 e 3 della linea microfonica bilanciata su connettore Cannon, mediante
resistenze da 5600 Ohm.
Risposta in frequenza
Una caratteristica che bisogna valutare in un microfono è la sua risposta in frequenza,

legata a vari fattori, non ultimo la direttività.
Si tenga conto che alcuni microfoni dispongono di un circuito elettronico che permette di
variare la risposta in frequenza alle basse frequenza o la direttività.
La limitazione alle basse frequenze è usata per evitare il rombo del vento e per il parlato,
dove le esplosive possono creare problemi; solitamente è un filtro passaalto a 100Hz
munito di interruttore.
La direttività è gestita mediante un commutatore che, in un microfono a condensatore a

due membrane contrapposte (fronte e retro) permette di:
• metterle in parallelo (omnidirezionale)
• usarne una sola (cardioide)
• usarle in controfase (clava, otto o ipercardioide)
In ogni configurazione si ha un cambiamento della curva di risposta in frequenza e

sensibilità.
Ogni microfono deve riportare la curva che rappresenta la sua sensibilità alla pressione a
seconda della frequenza. Quello rappresentato in figura è un grafico caratteristico:
In genere la sensibilità alle basse frequenze subisce notevoli variazioni a seconda della
distanza del microfono dalla sorgente sonora.
Poiché può essere importante valutare questo parametro, in molti casi sono riportate
diverse curve per le basse frequenze, a seconda della distanza.
Un altro dato essenziale per la scelta di un microfono è la massima pressione al quale il

microfono può essere esposto, che indica anche la possibilità d’uso su sorgenti ad alta
pressione (es. tamburi, corni).
Nella figura un esempio tipico di microfono per la voce (es. Shure Beta 58A):
Per informazione, vengono ora fornite le immagini (Neumann) di due diversi tipi di
microfoni: il TLM103, un tipico cardioide da studio e il KM184, multifunzione.
TLM103, gradiente di pressione, cardioide, 20…20KHz, 87dB S/N Ratio, 138dB SPL Max
KM183/184/185, pressione e gradiente di pressione, omnidirezionale|cardioide|

supercardioide, 20…20KHz, 81dB S/N Ratio, 141dB SPL Max
Forma e uso
I microfoni si distinguono, ovviamente, anche per forma e il tipo di uso:
Collo d'oca (Crown LM-300A)
Conferenze e assemblee
Sono normalmente dei supercardioidi o cardioidi. Sono spesso inserite in sistemi di
prenotazione e votazione
Omnidirezionale Boundary
Sulle scrivanie
Riprendono un’emisfera appoggiata sul piano della scrivania a cui sono appoggiati.
Possono avere alcune features per migliorare la modalità di ascolto
Lavalier (Crown CM-10)
I microfoni Lavalier sono spesso in radiofrequenza ed estremamente comodi. Soffrono

tuttavia del rumore indotto dallo strofinio degli indumenti e della copertura della ricezione
a causa dei movimenti del parlatore.
Dispongono di una risposta in frequenza che compensa la risonanza della cassa toracica e
la relativa coloritura del suono.
Da appendere (Crown CM-30/31)
a soffitto
Normalmente sono microfoni direzionali (supercardioidi) usati per ricevere segnale senza
interazione con i parlatori.
Palmare (Crown CM-200A)
A mano o su stativo
Sono i microfoni per antonomasia; detti anche a gelato. Sono disponibili nelle varie
versioni di caratteristica polare e tecnologica.
Headset (Crown CM-311)
I microfoni a cuffia (Headset) sono di fatto una evoluzione dei Lavalier; Sono spesso in
radiofrequenza ed estremamente comodi. Non soffrono del rumore indotto dallo strofinio
degli indumenti e della copertura della ricezione a causa dei movimenti del parlatore.
Da stativo (da studio, Neumann)
Spesso sono a condensatore e rappresentano l’eccellenza in termini di suono.
Array, sistemi intelligenti di più microfoni
Permettono di installare una sola apparecchiatura per raccogliere il suono di più parlatori.
In pratica, sono banchi di microfoni direzionali attivati dal livello sonoro in modo tale da
utilizzare il segnale più elevato ricevuto nel singolo istante.
Da ripresa remota (Audio Technica AT897 Line + Gradient Condenser Microphone)
Sono denominati anche a fucile (area di raccolta molto stretta) e a mezzo fucile.
Sono i classici microfoni di ripresa esterna (telecamera, cinepresa, etc.).
Microfoni di misura
Sono le unità di lettura dei sistemi di misura e controllo. Non sono applicati nell’audio in
quanto tali.
Direzionalità e Diagrammi polari
Ogni microfono possiede una sua specifica risposta direzionale, ed è buona norma
osservare attentamente questa caratteristica di un microfono prima di acquistarlo.
La risposta direzionale di ogni microfono viene riportata mediante un particolare
diagramma, che si dice diagramma polare, ed è in genere riportata sulla confezione del
microfono o nel manuale di accompagnamento.
Viene detto omnidirezionale il diagramma relativo ad un microfono il cui trasduttore sia

sensibile in tutte le direzioni a 360°. Sono direzionali tutte le altre possibilità.
Un microfono bidirezionale è sensibile in due direzioni opposte l'una all'altra (una è quella
che corrisponde alla pressione esercitata sulla parte frontale del diaframma, l'altra alla
pressione esercitata sulla parte posteriore), ed è detto anche Figure8.
Un microfono cardioide è la combinazione di un omnidirezionale e di un bidirezionale, in
modo da ottenere grafici particolarmente utili, con sensibilità accentuata sul fronte.
A seconda della della percentuale dell'uno e dell'altro, si hanno vari tipi di cardioide, che si
si distinguono essenzialmente in cardioide semplice, supercardioide e ipercardioide.
Da sinistra a destra: omnidirezionale, cardioide, supercardioide, ipercardioide,

bidirezionale.
Il diagramma del microfono bidirezionale può essere orientato in qualsiasi modo (ad
esempio con la maggiore sensibilità a 0° e 180° invece che a 90° e 270°) a seconda della
scelta del costruttore; quella illustrata è una delle possibili scelte.
Altri diagrammi particolari che si possono incontrare, si ottengono in realtà con disposizioni
stereofoniche, ossia con l'uso di più trasduttori separati:
Ripresa stereofonica
Esistono varie modalità di ripresa stereo, con microfoni (normalmente dei cardioidi)
disposti in varie configurazioni e con strutture specializzate (p.es. teste artificiali contenenti
delle capsule microfoniche).
Tra le più diffuse:
Distanziati da 90 a 300cm, semplice, tradizionale, non molto precisa, con problemi alle
basse frequenze.
Da 90 a 180° di angolo, imprecisa ma d’effetto.
Da 90 a 135°, a distanza da 4 a 30cm; immagine stereofonica precisa, non semplice come

metodologia, descritta nella tabella sottostante.
Definizione Microfoni Angoli e distanze Caratteristiche

ORTF (francese) Cardioide 110° 20cm bilanciata e definita
NOS (olandese) Cardioide 90° 30cm bilanciata con forte
effetto stereofonico
180 o Lynn T. Olson Ipercardioide 135° 4.6cm estremamente
preciso
Faulkner Bidirezionali parallelo 20cm molto naturale
Gli altoparlanti
I sistemi di trasduzione elettroacustica nella diffusione sonora possono essere:

• altoparlanti
• sistemi di altoparlanti (casse acustiche)
• sistemi di sistemi di altoparlanti (array di casse acustiche)
Gli altoparlanti possono essere di tipo:
• elettromagnetico o magnetodinamico, a bobina o a nastro

• elettrostatico, a condensatore
• piezoelettrico
• a gas plasma
I più diffusi sono il magnetodinamico e il piezoelettrico; il primo sfrutta le leggi

dell’elettromagnetismo, il secondo il fenomeno della piezoelettricità dei cristalli; in tutti i
casi l’altoparlante riceve in ingresso un segnale elettrico amplificato e il conseguente
movimento del suo diaframma o dell’elemento vibrante genera variazioni istantanee della
pressione che lo circonda, ovvero ciò che noi percepiamo come suoni.
Vediamo in analisi un altoparlante magnetodinamico a cono.
Un altoparlante piezoceramico a tromba

Caratteristiche
Le caratteristiche di un altoparlante sono normalmente descritte dai parametri codificati a

suo tempo daThiele e Small.
Parametro Simbolo Unità di misura

frequenza di risonanza in aria
Fs Hz
libera
volume d'aria equivalente Vas m³ litri
fattore di merito meccanico Qms
fattore di merito elettrico Qes
fattore di merito totale Qts
resistenza bobina mobile (in CC) Re ohm
escursione massima Xmax mm
induttanza bobina mobile Le mH
efficienza misurata o SPL 1w/1m Sensibilità dB/1w/1m
massa mobile Mms gr
cedevolezza Cms mm/N
Fattore di forza Bl T-m
superficie d'emissione Sd cm²
Utilizzando questi parametri, calcolati o presi dalle caratteristiche tecniche degli

altoparlanti, è possibile costruire il diffusiore che si preferisce.
In rete sono disponibili svariati siti che spiegano sia il calcolo che l’uso di questi dati nella
costruzione di casse acustiche.
Unità specializzate
L’unità specializzata prende il nome dalla proprietà di questo apparato elettroacustico di

riprodurre il suono limitatamente ad una specifica gamma di frequenze e si possono
suddividere in tre tipi.
il woofer – riproduce i suoni di bassa frequenza, da circa 20 Hz a circa 300 Hz
il midrange – riproduce i suoni di media frequenza, da circa 300 Hz a circa 2000 Hz
il tweeter – riproduce i suoni di alta frequenza, da circa 2000 Hz a circa 20 KHz.

Tra i tweeter troviamo gli esempi di altoparlanti non elettrodinamici.
Piezoelettrici, caricati a tromba, in cui l’elemento di trasduzione è costituito da una

cialda piezoceramica, che si comporta come un condensatore e possiede una resa
estremamente elevata ed un costo molto limitato.
Sono spesso in uso in P.A. (public address, diffusione sonora).
A plasma, in cui la trasduzione è affidata a molecole d’aria ionizzate ovvero un arco

voltaico ad alta frequenza. Oggetto di sperimentazioni da svariati anni, non è mai arrivato
ad essere un prodotto realmente affidabile e di massa. Per approfondimenti: Ionovac,
Magnat e Acapella Ionic Tweeter
Sono reperibili sistemi di diffusione sonora che utilizzano altri tipi

di altoparlanti, elettrostatici o varianti degli elettrodinamici, in
particolare con forme che cercano di evitare i coni utilizzando
sistemi planari o unità di trasduzione in parallelo (anche al fine
di limitare la dimensione dei diffusori nella profondità), oppure
tweeter a nastro, che usano un ribbon di metallo pieghettato in
luogo della bobina mobile, per migliorare la risposta alle alte
frequenze.
Audio professionale
Gli amplificatori
Un amplificatore è un dispositivo che modifica l'ampiezza, di un fattore moltiplicativo, del

segnale che lo attraversa. Viene caratterizzato dal guadagno A, a volte espresso in dB. Più
specificamente un generico amplificatore (lineare) ha un ingresso in cui entra il segnale da
amplificare ed una uscita da cui esce il segnale amplificato, che è pari a A volte il segnale
originale. Se il guadagno dell'amplificatore non è costante ma varia in base a determinate
caratteristiche del segnale si parla di amplificatore non lineare.
Gli amplificatori audio sono macchine che amplificano segnali elettrici in tensione o in
potenza.
Sono denominati PreAmplificatori gli amplificatori che amplificano in tensione sino ad

arrivare a livello standard. Per fare un esempio, il livello emesso da un microfono (10mV)
è insufficiente a pilotare un’unità di potenza o un un’unità di registrazione. Un
preamplificatore opera quindi ad una normalizzazione di livello di tensione amplificando di
un fattore (p.es.) 100 il segnale in ingresso.
Sono denominati Amplificatori di potenza o semplicemente amplificatori le unità che

sono in grado di pilotare i trasduttori di uscita (casse acustiche, altoparlanti) con
sufficiente energia. Un amplificatore opera quindi amplificando di un fattore (p.es.) 100 il
segnale in ingresso in termini di potenza.
I preamplificatori sono quindi suddivisi per categorie e per scopo:
• microfonici
• di linea
• di disaccoppiamento / di isolamento
• etc.
I preamplificatori devono operare senza distorsioni di alcun genere sulla banda necessaria
per le unità accoppiate e per il fattore di moltiplicazione necessario, senza introdurre
rumore di fondo.
Le caratteristiche normali sono quindi:
• banda passante: 20…20KHz

• amplificazione: da un fattore 1 (disaccoppiatori) a oltre 1000 (microfoni e testine)
• livello d’uscita: da alcuni milliVolt a svariati Volt
• segnale/rumore: il più alto possibile (S/N Ratio > 70)
• distorsione armonica: la più bassa possibile (THD < 0.1%)
Gli amplificatori di potenza sono suddivisi per categorie e per scopo:
• musicali (alta distorsione, elevata potenza, entro contenuti nelle casse)
• di linea / a 100V / a tensione
• a ponte (in bridge, ovvero come somma di due amplificatori)
• per PA (public address) (robusti, banda stretta, alta distorsione)
• HiFi
• etc.
Gli amplificatori devono operare senza distorsioni di alcun genere sulla banda necessaria
per le unità accoppiate e per la potenza necessaria, senza introdurre rumore di fondo.
Le caratteristiche normali sono quindi:

• banda passante: 20…20KHz
• potenza: da 0.3 a vari kilowatt (KW)
• segnale/rumore: il più alto possibile (S/N Ratio > 70)
• slew-rate: il più alto possibile (>20V/microSec)
• smorzamento (damping factor): >200
• distorsione armonica: la più bassa possibile (THD < 0.1%)
Gli amplificatori di potenza operano su carichi mediante fornitura di potenza.
I carichi possono essere di tipo:

• Diretti, ohmici o in corrente:
o 4, 8, 16 Ohm
• A linea, a trasformatore, in tensione:
o 100V
Le casse o diffusori in corrente (carico ohmico) non possono essere posti in serie o
parallelo (standard) e consentono il trasferimento diretto tra amplificatore e diffusore
(eccellenti prestazioni in termini di banda e distorsione).
Le casse o diffusori in tensione possono essere poste in parallelo ed operano a tensione

costante mediante trasformatori (colonne da chiesa, aula, etc.) che adattano il carico alla
linea, assorbendo dalla linea il necessario livello di potenza per il diffusore. Le prestazioni
in termini di banda passante e di distorsione non sono paragonabili ai carichi diretti.
Distorsione armonica
La distorsione armonica totale (in inglese total harmonic distortion, da cui l'acronimo THD)
è un parametro che ci informa della distorsione che un dispositivo induce ai segnali
elettrici che passano al suo interno.
Potremmo generalizzare dicendo che il contenuto in frequenza (con la possibilità che la

modifica non sia uniforme alle varie frequenze) del segnale viene alterato passando
attraverso il dispositivo, quindi in uscita avremo un segnale distorto.
La maggioranza delle persone avverte con difficoltà suoni provenienti da amplificatori
audio, aventi una distorsione totale inferiore al 5%, purché la distorsione di terza armonica
non risulti superiore a 2%. Decenni addietro, ai tempi della stesura dalle norme DIN,
ormai ampiamente obsolete, fu stabilito che gli amplificatori Hi-Fi dovevano riportare un
THD inferiore al'1% in corrispondenza della potenza dichiarata. Il THD viene sempre
riportato sui manuali di istruzioni di apparecchi elettronici.
HiFi
Alta fedeltà detto anche Hi-Fi (dall'inglese High Fidelity) è un termine generico che stava
ad indicare prodotti audio e video di qualità superiore.
Negli anni settanta/ottanta, la grande diffusione di impianti per la riproduzione del suono
sempre più sofisticati, ha portato alla decisione di mettere ordine nella dilagante
diversificazione delle soluzioni tecniche adottate dai vari costruttori, stabilendo delle norme
meccaniche e parametri elettrici definiti standard, in conformità ai quali, un apparecchio
poteva essere considerato a pieno diritto Hi-Fi (vedi norme DIN e RIAA).
In linea di massima:
• almeno 10W RMS
• meno di 0.1% di THD
• almeno 40..16KHz di banda a -3dB
Principali parametri di valutazione delle apparecchiature Hi-Fi e degli amplificatori in

generale:
• Rapporto segnale/rumore (S/N Ratio, in dB, pesato o non pesato)

• rapporto dinamico (in dB, derivato dalla potenza e dal S/N R)
• Potenza (in Watt RMS)
• Slew rate (in V/microSecondo, velocità di risposta all’impulso)
• Risposta in frequenza (e linearità della stessa) (banda a -3dB)
• Distorsione armonica totale (THD %)
• Distorsione d'intermodulazione (IMD %)
• Wow & Flutter e Rumble (in giradischi e registratori, errori e rumori meccanici ed
elettrici in dB)
• Fattore di smorzamento (Damping Factor, quoziente tra Icarico e Iampli)
• Fattore di separazione fra i canali (Diafonia o cross-talk, in dB)
La definizione di potenza PMPO, attualmente utilizzata non ha alcuna relazione con la

potenza reale, misurata in valore efficace o in valore RMS. La potenza PMPO (Peak Music
Power Output) è la potenza erogata su un transiente piccolo a piacere su un carico ideale,
per cui (p.es.) 3W RMS possono diventare 20 o 60 o 200W in modalità PMPO, a seconda
della formula utilizzata.
Gli altoparlanti
I trasduttori elettroacustici o meglio le casse e gli altoparlanti (o driver) reagiscono a

precise condizioni di locazione acustica e di configurazione, che possono aumentarne la
potenza o cambiarne la risposta in frequenza.
Costituiscono l’elemento centrale di qualsiasi sistema di diffusione. Ne esistono di vari tipi

ma quelli più diffusi sono il magnetodinamico e il piezoelettrico; il primo sfrutta le
leggi dell’elettromagnetismo, il secondo il fenomeno della piezoelettricità dei cristalli; in
tutte i due i casi l’altoparlante riceve in ingresso un segnale elettrico amplificato e il
conseguente movimento del suo diaframma o del suo elemento vibrante genera variazioni
istantanee della pressione che lo circonda, quello che poi noi percepiamo come suoni.
Più specificamente gli altoparlanti per le basse frequenza (woofer) sono impiegati sia a
radiazione diretta in cassa chiusa o aperta, sia a radiazione indiretta in cassa passa banda;
gli altoparlanti per le medie frequenze (midrange) sono impiegati a radiazione indiretta,
in cassa chiusa, caricati a tromba; gli altoparlanti per le alte frequenze (tweeter) sono
spesso driver a compressione con un condotto di uscita a tromba.
Le trombe ritenute migliori sono quelle che soddisfano una legge di variazione esponen-
ziale: A=Ag ekl dove A è l’area ad una data lunghezza l, Ag è l’area della gola e k è la co-
stante di apertura.
Unità specializzate
L’unità specializzata prende il nome dalla proprietà di questo apparato elettroacustico di

riprodurre il suono limitatamente ad una specifica gamma di frequenze e si possono
suddividere in tre tipi:
il woofer – riproduce i suoni di bassa frequenza, da circa 20 Hz a circa 300 Hz

il midrange – riproduce i suoni di media frequenza, da circa 300 Hz a circa 2000 Hz
il tweeter – riproduce i suoni di alta frequenza, da circa 2000 Hz a circa 20 KHz.
Unità multivia
La suddivisione delle bande audio nei tre intervalli classici (woofer, midrange e tweeter)
anche se possibile, non è di sempre riscontrabile nei prodotti in commercio soprattutto per
quanto riguarda gli estremi di banda, infatti per riprodurre adeguatamente gli estremi di
banda vengono usate altre unità specializzate ovvero il sub-woofer e il super tweeter.
L’unità subwoofer è specializzata nell’emissione al di sotto dei 100-150Hz.
L’unità super-tweeter è specializzata nell’emissione al di sopra di 3-5KHz.
L’unità multivia (sicuramente la più diffusa) è un sistema di altoparlanti con trasduttori di

tipo diverso montati nella stessa cassa (o cabinet), per cui la gamma di frequenza a cui
deve operare l’unità è ripartita in più porzioni (tramite un crossover) ed ognuna viene
affidata ad un tipo di trasduttore, il numero di ripartizione effettuato determina il numero
delle vie del sistema, quindi non necessariamente il numero delle vie corrisponde al
numero di altoparlanti per esempio un sistema a due vie ne avrà almeno una per ogni
altoparlante, ognuno incaricato della riproduzione di una determinata banda sonora, ma
potrebbe avere anche un driver per gli alti e due altoparlanti per i bassi.
Ciò indipendentemente dall'uso di crossover passivi (con un unico amplificatore) che attivi
(con amplificatori separati).
Il sistema può essere suddiviso in base alla banda di frequenza che è incaricato di
riprodurre:
• unità a gamma intera (full range), che riproduce tutte le frequenze audio
• unità a gamma quasi intera, che riproduce tutta la banda audio tranne gli estremi di
banda
• unità a gamma ristretta limitati intervalli di banda
Tipicamente le unità multivia (tranne quelle a gamma ristretta) vengono divise anche per il
numero di vie che utilizzano ovvero
• Unità a 2 vie – costituite da un trasduttore per i medio-bassi e da un driver per i
medio alti
• Unità a 3 vie – costituite da un trasduttore per i bassi, uno per i medi,ed uno per gli
alti
• Unità a 4 vie - costituite da un trasduttore sub-woofer, da un medio-bassi, da un
medio-alti e da un driver per gli alti.
Il numero delle vie non è indice della qualità di un sistema: più è alto il numero delle vie e
più è complicata la sua progettazione (a causa delle regioni di incrocio del crossover).
sistema multivia, subwoofer con due satelliti e cassa frontale

Cabinet e caricamento del trasduttore
Il ruolo della cassa non è di certo secondario per il corretto funzionamento dell’unità, sia
per quella specializzata che per quella multivia. Ad essa è legata l’esigenza di ottenere una
precisa risposta in frequenza.
Le possiamo dividere in base alla loro costruzione e in base al tipo di montaggio

dell’altoparlante:
• cassa chiusa o sospensione pneumatica
• cassa aperta (baffle infinito)
• bass reflex
• dipolo
• linea di trasmissione
• labirinto
• tromba
Esaminiamo quelle d’uso più comune. Per approfondire l’argomento e progettare un

diffusore, sono disponibili in rete svariati siti anche con sistemi di calcolo.
Cassa chiusa o a sospensione pneumatica, prende il nome dalla chiusura ermetica

della cassa in cui viene montato l’altoparlante, al suo interno viene disposto del materiale
fibroso che insieme alla chiusura ermetica della cassa contribuisce ad assorbire la
radiazione sonora posteriore dell’altoparlante (l’altoparlante irradia sia anteriormente che
posteriormente), evitando o al meglio minimizzando il cortocircuito acustico.
Il cortocircuito acustico è che un fenomeno per cui la radiazione sonora anteriore e quella
posteriore si confondono determinando un drastico peggioramento delle prestazioni alle
frequenze più basse.
L’altoparlante per i bassi deve essere munito di una sospensione morbida in quanto la
compressione dell’aria presente nella cassa funge da riequilibratore della posizione del
cono al termine dell’impulso sonoro.
Cassa aperta, prende il nome da una finestra che viene ricavata su di una delle pareti del
mobile che può essere una semplice apertura oppure un condotto tra il volume interno
della cassa e l’esterno, di solito cilindrico, serve al recupero in fase di porzioni utili (di
gamma bassa) della radiazione posteriore dell’altoparlante, questo tipo di cassa viene
detta cassa bass reflex, creando quindi un sistema accordato con un risuonatore ed un
sistema di accordo (tubo).
Variante di questa tecnica è l’uso di un altoparlante o radiatore passivo. Il radiatore

passivo opera come accordatore senza le problematiche connesse al tubo rigido ed alle
relative interferenze.
L’altoparlante per i bassi deve essere munito di una sospensione rigida o semi-rigida in
quanto la compressione dell’aria presente nella cassa non è sufficiente a fungere da
riequilibratore della posizione del cono al termine dell’impulso sonoro.
Tra i tipi di casse acustiche più efficienti troviamo le casse caricate a tromba o a linea di
trasmissione, dove l’onda posteriore anziché essere eliminata viene portata sul fronte in
fase mediante un circuito di ritardo, ovvero un condotto di lunghezza significativa in
campo audio cioè pari alla metà della lunghezza d’onda della frequenza di risonanza o
d’accordo, tenendo conto che 100Hz in aria corrispondono a 3,4 metri.
In tutti i tipi di casse l’altoparlante può essere montato sia a radiazione diretta che a
radiazione indiretta.
Radiazione diretta è in pratica quando la membrana dell’altoparlante si affaccia

direttamente sull’ambiente da sonorizzare.
Radiazione indiretta è in pratica quando la membrana dell’altoparlante si affaccia su
un’anticamera prima di arrivare all’ambiente da sonorizzare, questo sistema tende a
migliorare l’accoppiamento acustico o un filtraggio più naturale della risposta.
Nel caso in cui l’altoparlante (normalmente un woofer) venga montato all’interno del
mobile su una parete delimitata da due camere (una anteriore all’altoparlante ed una
posteriore) eventualmente raccordate tra di loro, si definisce a doppio carico bass reflex,
se invece una è chiusa e l’altra raccordata si definisce a carico simmetrico, in tutti e due i
casi si tratta di casse di tipo passa banda. Un altro tipo di sistema di radiazione indiretta è
la cosiddetta tromba, ovvero il driver è posteriormente chiuso su di una camera senza
apertura e anteriormente raccordato su un condotto a sezione crescente, potremmo
definirla anche a radiazione diretta se consideriamo il raccordo parte del driver.
I Crossover
Per funzionare correttamente le unità multivia hanno bisogno che ogni altoparlante
riproduca principalmente l’intervallo di frequenze assegnato, di questo compito se ne
occupa il crossover.
È un apparato che svolge varie funzioni ovvero, rende uniformi i livelli di sensibilità dei vari
trasduttori dell’unità; protegge i trasduttori delle frequenze medio-alte dai segnali di bassa
frequenza, modella la risposta elettroacustica dei vari altoparlanti in modo da ottenere un
andamento equilibrato della risposta in frequenza dell’unità.
Il crossover è composto da diverse sezioni ognuna delle quali da celle di filtraggio che
sono: i filtri passa-basso (che lasciano transitare solo le frequenze inferiori ad una certa
frequenza detta di taglio), i filtri passa-alto (che lasciano transitare solo le frequenze
superiori alla frequenza di taglio), e i filtri passa-banda (che lasciano transitare solo le
frequenze appartenenti ad una certa banda di frequenze delimitata da una frequenza di
taglio inferiore e da una frequenza di taglio superiore), è doveroso precisare che qualsiasi
filtro non è mai in grado di eliminare completamente le frequenze indesiderate ma li riduce
in modo più o meno consistente, la misura di questa riduzione è detta pendenza di
attenuazione e viene misurata in dB/ottava.
Per esempio, un filtro passa-alto ha una pendenza di attenuazione di 6 dB/ottava e il suo

taglio di frequenza è di 500 Hz, se riceve un segnale di 250 Hz (che è l’ottava inferiore alla
frequenza di taglio) non riuscirà a fermarlo completamente ma lo attenuerà di 6 dB. La
capacità di un filtro di ridurre le frequenza indesiderate viene detta selettività e
chiaramente più è elevata l’attenuazione maggiore è la sua selettività. I filtri vengono
anche suddivisi in famiglie di appartenenza, ovvero in base alla caratteristiche di filtraggio
(Butterworth, Linkwitz, Bessel, Cebicev),la scelta del tipo di filtro da usare è determinata
dall’ottenimento di una risposta acustica dell’unità. Un buon crossover fa in modo che nelle
regioni di incrocio, ovvero nell’intervallo di frequenze in cui più altoparlanti contribuiscono
alla risposta, il livello di pressione sonora sia della stessa grandezza.
Il crossover può essere passivo (normalmente interno e si occupa di ripartire un segnale

amplificato) o attivo (normalmente esterno e si occupa di ripartire un segnale pre-
amplificato), tra i due è sicuramente più versatile il crossover attivo se non fosse per la
necessità di dover utilizzare un amplificatore per ogni via.
Nella figura superiore osserviamo un tradizionale crossover passivo a 12dB/ottava a tre vie
senza resistenze di compensazione. Normalmente sono inserite reti di compensazione per
gestire adeguatamente le potenze e le fasi in gioco, sia nei confronti degli altoparlanti (la
potenza erogata da un woofer è spesso superiore a quella erogata da un tweeter) che
verso l’amplificatore, che deve operare con un carico reattivo non trascurabile; nella figura
che segue vediamo un crossover a due vie, a 12dB/ottava, con correzione delle risonanze
e delle fasi.
L’Impedenza
L’impedenza è una grandezza elettrica che descrive la reazione di un’unità all’applicazione

di un segnale al suo ingresso, un comportamento che varia a seconda della frequenza
considerata.
La caratteristica di impedenza (ovvero la conoscenza del comportamento dell’unità in base
alla frequenza applicata) ci consente di rilevare eventuali incompatibilità di funzionamento
con l’amplificazione finale, di ottimizzare il sistema di collegamento in caso di utilizzo di
unità multivia o di unità specializzate (ottimizzando la rete di filtraggio passiva), e
permette inoltre la definizione della potenza necessaria per l’applicazione di cui abbiamo
bisogno.
L’impedenza è costituita da una parte reale (resistiva) e da una parte immaginaria

(reattiva) detta reattanza, tutte e due le componenti sono determinate da vari fattori come
i trasduttori, le casse o dal sistema di radiazione prescelto, e tutte e due sono variabili in
base alla frequenza.
Nel grafico, che rappresenta l'impedenza e la fase al variare della frequenza applicata,
vediamo un punto di massimo che definiamo Fs o frequenza di risonanza. La parte destra
del grafico, superiore a 500Hz, è dominata dall’influsso della parte reattiva; la parte
centrale del grafico è la parte resistiva. Sul punto Fs notiamo che la fase è a 0°.
Dato che l’unità presenta una impedenza complessa, si determina (in base alla frequenza)
uno sfasamento tra corrente entrante e tensione ad essa applicata, determinando
fenomeni di deterioramento del segnale audio (distorsione di fase) e un non ideale
funzionamenti dell’amplificatore ad esso applicato.
I dati qualificanti di un diffusore sono:

• l’impedenza minima (che corrisponde al valore più basso d’impedenza)
• l’argomento dell’impedenza che non dovrebbe eccedere i 30° per evitare un
deterioramento della qualità delle frequenza riprodotte, e per consentire un ottimale
funzionamento dell’amplificatore.
Normalmente i diffusori sono disponibili con impedenza caratteristica di 4 e 8 Ohm.

Risposta in Frequenza
La risposta in frequenza di un’unità sia di tipo specializzato che di tipo multivia è

strettamente legata all’ambiente e alla posizione in cui viene misurata, il suo andamento è
di solito rappresentato in forma grafica o tabellare, ed è la misura del variare del livello
della pressione sonora in base al variare della frequenza.
Strettamente legata alla risposta in frequenza è la sua risposta assiale ovvero la

rilevazione della sua risposta in base all’angolo di ripresa, tipicamente la rilevazione viene
fatta a 0° o in asse, considerando l’angolo di 0° il centro del cono per le unità a radiazione
diretta in cassa chiusa (o se è composta da più altoparlanti la metà della distanza che
intercorre tra il loro cono e gli altri), e per le unità a radiazione indiretta in cassa aperta
dobbiamo tener presente che il contributo sonoro del condotto (bass reflex) non è
trascurabile quindi la risposta in asse si troverà tra il driver e la sua apertura.
A volte viene fornita anche la misura della risposta in frequenza fuori asse con
un’angolazione di circa 15° e 30° sia sul piano orizzontale che su quello verticale (tutti i
due tipi di risposte in frequenza devono essere rilevate nel medesimo ambiente con le
stesse condizioni e posizionamento).
Bisogna tener presente che l’utilizzo di qualsiasi unità non è mai perfettamente in asse o
fuori asse di 15° o 30° con il nostro ascolto, quindi è bene ricordare che i dati che ci
vengono riferiti sono puramente indicativi in quanto risentono della posizione e
dell’ambiente. Nella rappresentazione grafica della risposta in frequenza possiamo
distinguere tre regioni caratteristiche di frequenza, ovvero roll-on (o roll-off inferiore),
banda passante, roll-off.
Roll-on è la salita in potenza in base alla frequenza analizzata, partendo dal limite
inferiore della banda audio (20 Hz) avremo una salita con una pendenza di circa 12 dB
ottava per gli altoparlanti con caricamento a cassa chiusa, e di circa 18 dB ottava per gli
altoparlanti a cassa aperta.
Banda passante: è questa la regione di frequenza in cui possiamo individuare la gamma
di funzionamento dell’unità. Nella regione di banda passante la curva di risposta tende a
divenire diritta (tranne qualche avvallamento o rigonfiamento) e si ottiene determinando il
picco di potenza di una frequenza e scendendo in una finestra di tolleranza di + o – 3 dB
includendo nella banda passante tutte le frequenze che rispettano questo principio.
Roll-off è la discesa in potenza della frequenza analizzata con una pendenza di circa 36
dB ottava (ogni ottava la pressione sonora diminuisce di 36 dB).
Va inoltre considerato che la risposta in frequenza risente della collocazione e

dell’ambiente a causa delle radiazioni indirette del suono per cui l’unica condizione per un
corretto confronto fra diverse unità è la rilevazione della risposta in frequenza fatta in
camera anecoica ovvero priva di qualsivoglia superficie riflettente (tipo sospesa nel vuoto).
Un altro fenomeno che altera sostanzialmente la risposta in frequenza di un’unità è il

power compression, causato dal riscaldamento della bobina mobile dell’altoparlante a
seguito di un ampio passaggio di corrente (fenomeno non facilmente controllabile se non
si dispone di un adeguato sistema di raffreddamento della bobina).
Sensibilità
È strettamente legata alla risposta in frequenza, ed è il valore del livello di pressione

sonora emesso dall’unità dopo l’applicazione di un segnale ai suoi morsetti, rilevata ad una
distanza e in una posizione adeguata.
Viene espressa in dB SPL (sound pressure level) e di solito ne viene indicato il suo valore
massimo (MAX SPL – metro), la sua rilevazione è piuttosto complessa perché risente
moltissimo della posizione (soprattutto per le unità bassi) e per la poca attendibilità per le
misure fatte per frequenze inferiori ai 150 Hz (sia in camera anecoica che con i sistemi
computerizzati).
Si tenga conto che la collocazione e la presenza di pareti o superfici d’appoggio possono

influenzare pesantemente i dati rilevati.
La stessa superficie di appoggio dell’unità incrementa la sensibilità fino a 6 dB.
Un aumento di sensibilità che può variare dai 3 ai 6 dB si ha se l’unità sia appoggiata ad
un’ampia parete. Un’ulteriore incremento si può ottenere collocando l’unità nella
convergenza fra due ampie pareti, anche qui il valore di incremento può variare dai 3 ai 6
dB. In pratica semplicemente agendo sulla collocazione della nostra unità potremmo avere
un incremento di 18 dB. È chiaro che giudicare un’unità bassi in base ai dati della sua
sensibilità rilevata in campo aperto, non è corretto e non è motivo di scelta tra i vari
modelli disponibili.
Qualche volta si confonde la sensibilità con l’efficienza, sono due concetti distinti e
separati.
L’efficienza è la misura percentuale dell’energia elettrica che viene convertita in energia

sonora, e risente moltissimo del tipo di caricamento dell’unità (l’unità bassi a cassa aperta
ha un’efficienza bassissima intorno al 1-2%, un’unità a tromba ha un’efficienza intorno al
10-15%.
La tenuta in potenza
Rappresenta il massimo segnale accettabile dall’unità prima della rottura dell’altoparlante.

Essendo l’individuazione di questo segnale piuttosto controversa a causa, sia della sua
variabilità d’impedenza con il variare della frequenza applicata, sia per la tensione
applicata ai morsetti dell’altoparlante che non essendo un carico puramente resistivo,
comporta uno sfasamento tra corrente e tensione d’ingresso.
Le norme internazionali prevedono per questo tipo di misura due alternative, in una l’uso
di un segnale sinusoidale con una frequenza scelta all’interno della banda passante, l’altra
l’uso di un segnale complesso con un gran numero di frequenze che coprano almeno una
decade iniziando dal limite inferiore della banda passante.
I dati per definire la tenuta in potenza sono il program capacity e il noise capacity. Il
primo si riferisce al valore di picco di accettabilità di un’unità, il secondo il suo valore
efficace (entrambe definiscono la tenuta in potenza di un’unità).
Il valore di picco sarà più alto del valore efficace (in una sinusoide è pari ad 1,41 volte il
valore efficace), quindi per avere un dato attendibile della tenuta in potenza utilizzeremo
un altro parametro detto MIL maximum input level, ovvero il livello di tensione applicato
all’unità che induce ad una distorsione inaccettabile (ad esempio il 10% di distorsione da
intermodulazione), conoscendo il MIL e la sensibilità dell’unità possiamo stabilire la
massima pressione sonora che la nostra unità ad una distanza adeguata può produrre,
ovvero la minima tensione applicabile per produrre una gittata dell’unità accettabile (la
gittata di un’unità è pari al quadrato inverso della distanza ovvero ad ogni raddoppio della
distanza il valore scenderà di 6 dB).
La distorsione
È d’uso affermare che un’unità genera distorsione e quindi emette suoni distorti quando
tra il segnale da riprodurre ed il segnale riprodotto si accerti un’alterazione, che può
essere composta sia da componenti sonore non presenti all’origine, sia nella variazione dei
livelli della componente da riprodurre. La distorsione viene divisa in due tipi, distorsione
armonica e distorsione da intermodulazione.
Distorsione armonica: è il caso in cui vengono introdotte componenti sonore la cui

frequenza coincide con le armoniche del segnale da riprodurre (su un segnale di 40 Hz,
vengono riprodotte anche componenti pari ad un suo multiplo, 80 Hz, 120 Hz, 160 Hz
ecc.).
Le armoniche di distorsione vengono definite in base al valore del multiplo che le lega alla
componente originaria, gli viene attribuito un ordine (80 Hz di secondo ordine – multiplo 2
della frequenza originale, 120 Hz di terzo ordine – multiplo 3 della frequenza originale
ecc.) La sua entità detta THD – Total Harmonic Distorsion, è un valore percentuale che
rappresenta la media dei tassi di distorsione armonica di ogni ordine.
Il THD varia a seconda della frequenza e della potenza applicata all’unità quindi avremo
bisogno di una tabella composta dal valore di distorsione per ogni frequenza e della
relativa potenza applicata per poter valutare correttamente un’unità, oppure di un valore
comune di riferimento tipicamente 1000 Hz (caratteristica di distorsione).
Distorsione da intermodulazione: è il caso in cui al segnale da riprodurre vengono

aggiunte al segnale da riprodurre componenti date dalla somma e dalla differenza delle
frequenze di base o dalle sue componenti armoniche (su un segnale di 40 Hz verranno
introdotti segnali di frequenza 20 Hz, 60 Hz, 80 Hz ecc).
Questo tipo di distorsione è la più deleteria perché impedisce la intelligibilità del segnale
da riprodurre.
Sarebbe auspicabile che i costruttori inserissero questo dato nelle caratteristiche dei loro
prodotti.
La fase
Qualsiasi sistema di altoparlanti opera uno sfasamento del segnale (quando la stessa
frequenza viene emessa con un andamento sfalsato) con una sua conseguente
diminuzione, aumento o cancellazione (in base al grado di sfasamento)
Il nostro orecchio non è in grado di percepirne la variazione alle basse frequenza e quindi
il panorama acustico non ne è fortemente influenzato. Su frequenze medie ed alte, invece,
distorsioni di fase introducono problemi di riconoscimento posizionale degli strumenti.
I sistemi di compressione digitale a perdita di dati (es. MP3) operano su questa

caratteristica dell’orecchio umano cancellando interi settori di suono ritenuti non udibili o
non rilevabili.
La fase è essenziale per percepire la direzione e la posizione degli strumenti o degli

speaker. Un errore di fase nelle frequenze medio-alte altera in maniera totale la
percezione del suono. Se si prova ad invertire uno dei cavi che collegano l'amplificatore
alle casse, si percepirà l'effetto di totale confusione e di disarmonia. In tutte le fasi di
registrazione e riproduzione occorre porre la massima attenzione per non commettere
errori che alterino la percezione dell'utente finale.
Cavi e connettori
I cavi utilizzati per le connessioni audio sono un argomento spesso sottovalutato ma in

realtà molto importante. Si ritiene che dei cavi di buona qualità sono in grado di “far
suonare meglio” le attrezzature, indipendentemente dalla loro fascia di appartenenza.
In una connessione tra due apparati esiste la Z di uscita dell’apparato emittente e la Z di

ingresso dell’apparato ricevitore. Esiste una Z derivante dalla connessione.
L’impedenza propria del cavo si calcola con la formula:
dove:
XL e XC sono, rispettivamente, le reattanze relative all’induttanza ed alla capacità

specifiche del cavo dovute alle caratteristiche fisiche. Sono quasi sempre trascurate.
Quindi l’impedenza di un cavo è correlata alla lunghezza, alla sezione ed al tipo di

materiale in uso (sensibile anche alla temperatura, che ne varia le caratteristiche).
Come esempio, a 20° abbiamo (espresso in 10-6 Ωm = Ω·mm²/m):
Argento 0.0159
Rame 0.0175
Oro 0.0244
Alluminio 0.0282
Acciaio 0.11
Piombo 0.22
Si tenga conto che i conduttori sono definiti in sezione (mm2) ed usati a metri lineari.
All’uso pratico, un conduttore di rame di 1mm2 di lunghezza pari a 100m (p.es. il

amplificatore – cassa, il cavo degrada sensibilmente l’accoppiamento.
I cavi possono essere suddivisi per:
• utilizzo
o di segnale
o di potenza
• schermatura
o schermato
o non schermato
• bilanciamento
o bilanciato
o non bilanciato
I cavi di segnale sono in grado di trasportare livelli bassi di potenza (piccola sezione) e
collegano trasduttori di ingresso (linee e microfoni) alle apparecchiature e le
apparecchiature tra loro.
I cavi di potenza sono di elevata sezione e collegano amplificatori a trasduttori.
I cavi schermati dispongono di uno schermo (a spirale, a calza o a foglio) collegato a

massa che protegge uniformemente il/i segnali passanti sul cavo, evitando le interferenze.
Cavi bilanciati e sbilanciati
In linea generale l’interno dei cavi bilanciati (balanced) e sbilanciati (unbalanced) può
essere schematizzato in questo modo:
2 Conduttori: Unbalanced
3 Conduttori: Balanced
I cavi possono essere classificati a seconda del numero di conduttori usati (contenuti
nell’unica guaina):
• Mono-polari + Schermo: equivale ad un bipolare. Usato per connessioni sbilanciate.

• Bipolari: è assente la schermatura, dunque è adatto a connessioni di Potenza.
• Bipolari + Schermo: in questo caso lo schermo non viene utilizzato per il trasporto
del segnale. Adatto per connessioni Bilanciate o connessioni Sbilanciate con
Schermo in comune (Stereo unbalanced, Insert…).
• Multipolari + Schermo (Fruste): Possono avere un unico schermo in comune
(immagine esempio) o uno schermo per ogni conduttore.
Mono-polare, sbilanciato, schermato

(microfoni sbilanciati, linee, connessioni)
Mono-polare, sbilanciato, non schermato

(casse, amplificatori)
Bipolare, schermato, bilanciato oppure
Stereo, schermato, sbilanciato

(bilanciato: microfoni, linee, connessioni; sbilanciato: linee, connessioni)
Multipolare, schermato, sbilanciato
Materiali
• Rame: Generalmente il più usato.

• Lega Rame-Bronzo: Più resistente dal punto di vista fisico (Per migliorare la
resistenza fisica, il conduttore è fatto da più fili avvolti assieme).
• Oro, Argento: utilizzati per i connettori e non per i cavi. Il punto di connessione è
placcato in oro per evitare le ossidazioni.
• Oxygen Free: Sono trattati chimicamente per migliorare la conduzione. Il problema
è che durano mediamente 5 volte in meno dei normali cavi.
Connessioni
Sono qui elencate le principali connessioni effettuate con connettori standard Jack, XLR e
RCA. La descrizione dei connettori è disponibile nell’apposito paragrafo.
Ground Loop (Loop di Terra)
Il Ground Loop (ovvero l’anello di terra che comporta l’introduzione del ronzio a 50 Hz
dato dalla tensione di rete) nasce dalla seguente situazione:
Il dispositivo A e quello B sono alimentati, e pertanto vengono messi a terra (attraverso i

loro chassis).
Se le due Ground (dall’inglese: terra) G1 e G2 sono in comune, si ha un circuito chiuso,

che invece di eliminare i disturbi, crea loro un percorso, ovvero un Ground Loop.
Tale problema è peggiorato nel caso di connessioni sbilanciate.
Per ovviare a questo problema si deve tagliare il loop (tagliando letteralmente il cavo
che trasporta la massa) in un punto ottimale, normalmente nel connettore su uno dei
due lati, preferendo la soppressione della calza.
ATTENZIONE: Mai tagliare il loop a livello dell’alimentazione, ma agire sul circuito delle
apparecchiature.
La strategia è quella di fare in modo che le messe a terra vengano convogliate nello
chassis di un’unica macchina.
ESEMPI DI CONNESSIONI per ovviare al problema del loop di Terra
La connessione sbilanciata classica:
Lo schermo fa anche da negativo. In questo caso non è possibile intervenire tagliando

lo shield poiché lo schermo è in questo caso un conduttore.
Cavi dual conductor + shield per connessioni Sbilanciato su Sbilanciato (Unbal to
Unbal) sono utili per tagliare un Ground Loop.
La X determina il taglio che si deve fare, ovvero appena prima che lo schermo arrivi al
source. Così facendo lo schermo esiste comunque per tutto il percorso del cavo, ma non
essendo collegato a monte, non chiude un eventuale loop. Le interferenze e i disturbi
vengono comunque schermati, come nel caso precedente.
Cavi dual conductor per connessioni Sbilanciato su Bilanciato Unbal → Bal (Nei
connettori Jack: TS → TRS).
Fondamentalmente si ottimizza l’uscita Sbilanciata per farla arrivare a una Bilanciata.
Lo schermo Flottante (X = taglio) è coerente con le scelte fatte per il taglio del Ground
Loop.
Cavo Bipolare + Schermo per connessioni Balanced to Balanced (Jack TRS → TRS).
In questo caso il Ring è ponticellato con lo Sleeve nel Source per avere una situazione
simile alla precedente.
Abbiamo un cavo che, dalla parte del source (quindi da dove parte il segnale) è composto
da TIP con il segnale positivo, e RING e SLEEVE collegati tra loro. Lo schermo, come
detto, è flottante.
Cavo Bipolare + Schermo Sbilanciato su Sbilanciato (Unbal to Unbal) con

connessione Jack TS → XLR: si agisce nella stessa maniera: al Tip colleghiamo i due
conduttori (che dal XLR sono collegati ai Pin 2 e 3) lasciando lo schermo flottante per
tagliare il Ground Loop.
Allo stesso modo operiamo con connettori XLR → XLR (sempre con cavo bipolare +
schermo). Dalla parte del Source lasciamo libero il Pin 1 dove normalmente colleghiamo lo
schermo.
Effetto Pelle (Skin Effect)
L’effetto pelle è il fenomeno consistente nell'instaurarsi di una forza elettromotrice in un

circuito elettrico a causa della variazione d'intensità della corrente che in esso circola. Il
principale effetto prodotto dalla circolazione di una corrente è la creazione di un campo
magnetico le cui linee di forza si concatenano con il circuito stesso. Il rapporto tra il flusso
totale concatenato (Nj = numero di volte che il circuito elettrico si concatena con il flusso
magnetico j) e la corrente (i) che lo produce si chiama coefficiente di autoinduzione o
induttanza (L):
L = Nj / i
Se per qualche ragione la corrente ’i’ varia, anche il flusso da essa generato varia.
Per la legge dell'induzione elettromagnetica, nel circuito elettrico nasce una forza
elettromotrice il cui valore dipende dalla variazione di flusso e dalla rapidità con cui tale
variazione avviene.
In presenza di segnali di potenza, alle alte frequenze, si presenta il problema della
autoinduzione a causa degli alti valori di corrente.
La zona contrassegnata con il colore giallo è la “Zona di svuotamento” (all’interno del

conduttore) provocata dalla corrente di autoinduzione che si oppone al passaggio della
corrente (vedi definizione) per questo motivo la corrente si “muove” verso l’esterno del
conduttore. In questo modo diminuisce la sezione utile del connettore e
conseguentemente aumenta la Z (parte resistiva) e la dissipazione di potenza.
Il fenomeno della autoinduzione aumenta in funzione di:
• Corrente circolante (potenza)

• Frequenza del segnale.
Il fenomeno è sensibile nelle connessioni di potenza di sistemi di diffusione per le alte

frequenze, in cui occorre evitare compaia usando ottimi cavi di collegamento.
I connettori fisici: i disturbi
Un cavo sbilanciato dispone di un solo conduttore (in rosso) oltre alla massa.
I connettori jack sbilanciati si distinguono perché hanno un solo anello nero di separazio-
ne. La calza è connessa su un solo lato per evitare fenomeni di ground loop.
Un cavo bilanciato dispone di due conduttori (rosso e blu nella figura) oltre alla mas-
sa. I connettori jack bilanciati si distinguono grazie al doppio anello nero di separazione.
Nei connettori e nei cavi bilanciati, il segnale viene inserito in fase e controfase.
Il ricevitore raccoglie il segnale su un ingresso differenziale, dove i segnali in fase (cal-
do/hot/rosso/+) e in controfase (freddo/cold/bianco/-) vengono sommati mediante inver-
sione.
In sintesi:
output = S + -S
trasporto = S & -S
input = S + -S ovvero S1 = S0 + -(-S0) ovvero S1 = somma di S0 e inverso di –S0

In un cavo sbilanciato, un segnale (A) viene ripartito sui due conduttori, ma con fase
opposta su ognuno di essi (B).
Se un segnale estraneo (C) interferisce con un cavo sbilanciato, esso si somma al segnale
(D).
Se invece lo stesso segnale estraneo interferisce con un cavo bilanciato, esso si somma
ad entrambi i segnali: quello in fase e quello in controfase (E).
Quando il segnale sbilanciato giunge alla preamplificazione del mixer, il segnale estraneo
viene amplificato assieme al segnale originario (F).
Invece quando il segnale bilanciato giunge all'ingresso del mixer, la porzione in

controfase viene riportata in fase e sommata alla porzione in fase. In questo modo il
segnale estraneo subisce una cancellazione di fase,poiché esso si trova ora ad essere
sommato a se stesso ma in fasi opposte.
Dunque dalla preamplificazione del canale risulterà amplificato solo il segnale originario
(G).
I connettori audio
In linea di massima, i connettori utilizzati in ambito audio sono:
• Connettore Jack
• Connettore XLR
• Connettore DIN
• Connettore RCA
• Connettore Speakon
Connettore Jack
Sono disponibili nei formati:

• 2.5 mm (3/32") microjack
• 3.5 mm (1/8") minijack
• 6.3 mm (1/4") jack
È esistita una variante (storica) di 5mm, non più in uso. Una versione particolare è il
cosiddetto connettore Nato (U174), in uso su ricetrasmettitori e cuffie, microfoni e caschi,
a quattro vie ed un diametro di 7.14mm.
È definito TS o TRS a causa della forma: TS=Tip/Sleeve, TRS=Tip/Ring/Sleeve (punta,

anello e manicotto).
1. Sleeve
2. Ring
3. Tip
4. Anelli isolanti
A seconda dell'utilizzo le parti del connettore hanno diverse funzioni.
Nome Output sbilanciato Input sbilanciato Bilanciato Stereo

Sleeve Messa a terra Messa a terra Messa a terra Messa a
terra
Ring Messa a terra Messa a terra Negativo/"Freddo" Canale
destro
Tip Segnale Segnale Positivo/"Caldo” Canale
sinistro
Connettore XLR
Il connettore XLR è utilizzato comunemente per le connessioni elettriche nel campo

dell'audio professionale. Colloquialmente viene chiamato connettore Cannon in
riferimento al costruttore originale: la Cannon Electric (adesso parte della ITT
Corporation). Questo connettore è dotato di un sistema di blocco.
Prodotto per la prima volta negli Stati Uniti dalla Cannon Electric, la sigla XLR deriva dal
nome originale Cannon X , a cui furono aggiunte prima un blocco (Latch) di sicurezza, e
poi un isolante di gomma (Rubber) attorno ai poli. Un connettore XLR può avere diversi
schemi di piedinatura, i tipi più comuni sono a tre, quattro e cinque poli. Numerosi
produttori, tra cui Neutrik e Alcatel, producono questi connettori, sia in versione con
contatti a saldare che con terminazioni a perforazione d'isolante.
Esistono varianti a contatti diversi, da 2 –alimentazione- a 7 poli –video-.
Nell’audio è usato il formato XLR a 3 contatti.

Pin / Funzione
1 Massa (schermatura del cavo)
2 Polarità normale ("caldo")
3 Polarità inversa ("freddo")
Guardando il connettore femmina, il pin in alto a sinistra è il numero 2, quello in alto a

destra è il numero 1 e quello in basso è il 3.
Guardando il connettore maschio, il pin in alto a sinistra è il numero 1, quello in alto a

destra è il numero 2 e quello in basso è il 3.
Come regola, il connettore maschio è usato come uscita e il connettore femmina come
ingresso. I microfoni hanno un connettore maschio integrato come uscita, mentre un cavo
audio è di tipo maschio/femmina. Un mixer audio presenta dei connettori femmina agli
ingressi, mentre le uscite e i ritorni saranno maschi.
Esistono diversi modelli di connettore "combo" femmina in grado di accettare sia XLR che
Jack.
Sono i connettori principalmente usati per i microfoni, i quali possiedono un’uscita XLR
maschio. Il cavo di collegamento sarà quindi munito di un XLR femmina per il
collegamento.
Anche se XLR è un connettore nato e usato principalmente per connessioni bilanciate, può
accadere che sia stato collegato per una connessione sbilanciata. Nel caso si controllino i
collegamenti, come sotto illustrato.
Connettore DIN
Un connettore DIN (Deutsches Institut für Normung) è un tipo di connettore a più pin.
Esistono due famiglie di connettori DIN: quelli normali e quelli in versione mini.
Un numero viene usato alla fine del nome per identificare il numero del pin del connettore,
eventualmente con l’indicazione della disposizione dei pin.
Per esempio, il connettore mini-DIN4 è un connettore del tipo piccolo con quattro pin.
Un connettore DIN-5-270 dispone di 5 pin disposti su un arco di 270°.
Connettori DIN-3 e mini-DIN-3 sono stati usati in maniera diffusa nell'audio-tecnica, per
connettere vari tipi di microfoni.
Connettori DIN-5 (nella versione a croce) erano usati per le cuffie.
Connettori DIN-5 (nella versione a 180°) sono stati usati in maniera diffusa nell'audio
tecnica, per connettere vari tipi di apparecchiature. È inoltre usata per le connessioni
MIDI.
Il connettore DIN a 5 poli veniva utilizzato nel settore audio consumer, ormai è in disuso il
suo posto è stato preso dal connettore RCA e dai vari connettori digitali.
Il connettore DIN offre un buon contatto elettrico, una pessima resistenza meccanica e
una pessima resistenza alla trazione.
A seconda dell'apparecchio che lo monta il connettore DIN può assumere diverse

piedinature.
Di seguito alcuni esempi.
Amplificatore - presa per Registratore / Deck
Contatto N° / Descrizione
1 Uscita Audio canale sinistro
2 Massa
3 Ingresso Audio canale sinistro
4 Uscita Audio canale destro
5 Ingresso Audio canale destro
Amplificatore - presa per input generico, Giradischi, Tuner, etc.
1 N.C.
2 Massa
4 N.C.
Deck - presa per Amplificatore
2 Massa
3 Uscita Audio canale sinistro
5 Uscita Audio canale destro
Deck - presa per Microfono
2 Massa
3 N.C.
5 N.C.
Nelle connessioni MIDI, il connettore DIN 5/180° è usato per i tre tipi di connessione:
MIDI-IN
MIDI-THRU
MIDI_OUT
In particolare, la connessione è la seguente
1,3 non collegati

2 massa
4 source
5 sink
La connessione MIDI è una connessione seriale in corrente a 31.250bps, che consente il

collegamento di strumenti musicali, effetti, sistemi, etc. in tempo reale.
Attualmente le connessioni MIDI sono effettuate anche con connettori Mini-DIN e con
spinotti RCA. Inoltre, la disponibilità di connessioni ad alta velocità quali USB e FireWire
consente l’uso del trasporto dell’informazione MIDI su canali prestazionalmente superiori.
Connettore RCA
I connettori RCA sono conosciuti anche come prese cinch o connettori phono. Quest'ultimo
termine deriva dall'abbreviazione della parola inglese phonograph (giradischi), poiché lo
scopo iniziale delle connessioni RCA (anni ’40) era il collegamento di un giradischi a un
ricevitore radio, usato come amplificatore. Non è molto resistente è non è particolarmente
usato in ambito professionale.
È usato in vari ambiti, sia in audio che in video che in digitale.

la tabella che segue ne illustra i colori:
Audio analogico Sinistro/Mono Bianco

Destro Rosso
Centrale Verde
Surround sinistro Blu
Surround destro Grigio
Surround posteriore sinistro Marrone
Surround posteriore destro Ocra
Subwoofer Viola
Audio digitale S/PDIF Arancione
Video composito analogico Composito Giallo
Video a componenti analogico (YPbPr) Y Verde
Pb Blu
Pr Rosso
Video a componenti/VGA (RGB/HV) R Rosso
G Verde
B Blu
H/Sincronismo orizzontale Giallo
V/Sincronismo verticale Bianco
Connettore SPEAKON
Il connettore Speakon è un tipo di connettore spesso usato nei sistemi di audio

professionale per connettere un altoparlante ad un amplificatore. È disponibile a 2, 4 e 8
poli.
Come si può notare il connettore a due poli può essere inserito nella presa a 4 ma non
viceversa.
Lo stesso produttore produce un altro tipo di connettore PowerCon, che è stato progettato
per supportare potenze maggiori del normale segnale audio. Per maggiore sicurezza, il
segnale audio e l'alimentazione non sono connettibili tra di loro.
Il connettore Speakon, progettato per le connessioni di potenza nel campo audio

(amplificatore – diffusori) dispone di un sistema di bloccaggio che può essere utilizzato per
connessioni con saldatura o ad avvitamento.
Sostituisce le vecchie connessioni a fili liberi su morsetto a vite o su inseritore a

ghigliottina e l’uso dei jack da 6,35mm.
Le apparecchiature di controllo
Mixer
mixer da regia live
Il mixer (mixer audio), è una apparecchiatura utilizzata per mixare segnali audio, utilizzato
dalle persone addette alla regia di spettacoli teatrali, televisivi, concerti e dai DJ.
Un mixer si differenzia da un altro per molti aspetti, numero di canali, sensibilità dei
controlli per il volume, funzioni in generale e amplificazione o meglio dire
preamplificazione.
Il numero di canali determina il numero di periferiche di riproduzioni audio, inseribili nel
mixer, quindi determina anche il numero di suoni udibili contemporaneamente.
I mixer da regia, a differenza dei mixer per dj, dispongono di un notevole numero di canali
che va da 12 fino a 24-48 canali ed oltre (es. 96) per le workstation da studio di
registrazione, che permettono la variazione dei volumi, dei toni, del segnale audio
presente su quel canale.
Il mixer da regia permette inoltre di indirizzare una parte del segnale dei singoli canali
verso eventuali effetti esterni, come delay, riverberatori, equalizzatori, ecc. I mixer da
regia principalmente servono per regolare i volumi dei microfoni e per creare un'immagine
stereofonica.
La qualità sonora di un mixer è data principalmente dalla qualità dei preamplificatori, dei
filtri, dei fader (Il potenziometro, in questo caso detto a 'slitta' serve per regolare il volume
di ogni canale) dalla quantità di distorsione armonica totale, ovvero della misura in cui
ogni dispositivo audio altera il contenuto in frequenza del segnale.
I mixer possono essere manuali (ovviamente) o automatici. I mixer automatici sono

programmabili e possono effettuare operazioni (normalmente legate al livello) durante i
brani, per esempio, di un concerto.
Negli ultimi dieci anni si sono imposti sul mercato con sempre maggiore insistenza i mixer
digitali, che convertono il segnale analogico in digitale e lo processano in dominio
completamente digitale al loro interno.
I mixer digitali dispongono di indubbi vantaggi sia per quanto riguarda il rumore e la
distorsione (limitati alla sezione di digitalizzazione) che all’usura meccanica (e quindi
instabilità e rumore) degli slider (potenziometri del volume) che alla possibilità di
automazione delle operazioni.
mixer da studio di registrazione

Componenti
I diversi tipi di mixer condividono la stessa struttura, che consiste essenzialmente nel
trattare segnali sonori provenienti da diversi canali di ingresso e sommarli in uno o più
canali di uscita.
Vediamo in dettaglio le varie sezioni che compongono un mixer.

Canali di ingresso Ciascun canale di ingresso riceve il suono da una sorgente, che può
essere ad esempio un microfono, uno strumento musicale elettronico, un riproduttore di
CD o altra fonte sonora. A seconda del particolare tipo di mixer e dell'uso per cui è
progettato, ciascun canale possiede una combinazione di funzionalità. Nel layout della
consolle, ciascun canale occupa una striscia verticale nella maggior parte dei modelli, e
molto raramente orizzontale.
17 inserzione diretta, 3 Linea, 1 Microfono, 15 uscita diretta
Connettori di ingresso Questa sezione contiene uno o più connettori per i cavi di
segnale. Tra i connettori usati troviamo gli XLR (noti anche come Cannon, a bassa
impedenza usati tipicamente per i microfoni), i Jack (alta impedenza, usati per sorgenti "in
linea" come tastiere o amplificatori) e gli RCA (usati per lettori CD e simili).
Stadio di ingresso Questa sezione si occupa di adattare il segnale elettrico in ingresso
alle caratteristiche del mixer. Contiene un potenziometro per regolare il livello (Gain) [4],
e talvolta altri controlli, ad esempio per l'alimentazione remota di un microfono a
condensatore (Phantom). È spesso disponibile un pulsante che permette la rotazione della
fase dell’ingresso.
Equalizzatore Questa sezione si occupa di bilanciare le componenti

del suono nelle varie bande di frequenza [6]. Tipicamente gli
equalizzatori sono a tre o quattro bande, e su mixer di fascia medio-
alta alcune bande possono essere parametriche, ovvero è possibile
modificare la frequenza centrale ed eventualmente l'ampiezza di
ciascuna banda. È presente talvolta un filtro passa-alto (HPF); la
frequenza di taglio è generalmente fissa (tipicamente 80 / 100 Hz)
[5]. Sui mixer di fascia alta tale frequenza è modificabile ed è
talvolta presente anche un filtro passa basso (LPF).
Mandate Monitor Questa sezione contiene uno o più potenziometri

per regolare l'invio di segnale ai canali di monitoraggio (palco o
studio). Questi canali generalmente sono pre-fader, ovvero il livello
del segnale inviato ai monitor non viene influenzato dal livello del
fader, ma possono anche essere settati come post-fader, e in questo
caso risentono del livello dei fader [8].
Mandate Effetti Questa sezione contiene uno o più potenziometri

per regolare l'invio di segnale ai canali destinati a processori di
effetto. Questi canali sono post-fader, ovvero il livello del segnale
inviato ai monitor viene influenzato dal livello del fader [7].
Selettore dei gruppi Presente solo su mixer di fascia più alta. Ogni
canale della consolle presenta uno o più tasti che abilitati convogliano
il segnale audio a gruppi di canali in uscita. Nei sistemi di studio di
registrazione questo permette di assegnare la/le piste a cui inviare il
segnale di ingresso, attraverso il gruppo selezionato. [11, 12]
Pan-pot Questo potenziometro permette di distribuire il segnale tra

i due canali di uscita principali, costruendo una immagine sonora
stereofonica [9].
Tasti di controllo Pulsanti che permettono il Muting del canale [10]

o l’ascolto da Solo [13]
Potenziometro (Fader) Questo potenziometro, tipicamente a

slitta, regola l'invio del segnale ai canali di uscita principali, o ai
gruppi se presenti. [14]
Canali di uscita
Master Questi sono i canali di uscita

principali, solitamente due (destro e
sinistro), in consolle di fascia alta è
presente una terza uscita denominata
mono, generalmente dedicata
all'alimentazione di subwoofer. Il master è
principalmente usato per alimentare
l'impianto di amplificazione in ambiente
live, ma anche apparecchiature per
registrazione (sala d'incisione) in fase di
mix-down, ovvero quando il segnale multi-
traccia registrato viene miscelato per
originare il master stereo. [6]
Monitor Questi canali sono usati per

alimentare gli altoparlanti (comunemente
detti spie) usati dai musicisti per ascoltarsi
durante l'esecuzione. Ciascun musicista o
gruppo di musicisti può sentire sul palco
una diversa combinazione di strumenti.
[1]
Effetti Questi canali alimentano

processori di effetti interni o esterni,
permettendo di alimentare l'effetto con
una combinazione specifica dei canali in
ingresso. Il segnale prodotto dal
processore di effetto viene tipicamente
reinserito in un canale di ingresso. Molti
mixer posseggono canali di ingresso
semplificati specificamente per questa
funzione. [20-25]
Gruppi Questa funzionalità permette di

raggruppare i canali di ingresso in gruppi
che possono essere regolati in modo
unitario, ad esempio la batteria o una
sezione di strumenti omogenei. [3]
I gruppi e i bus consentono inoltre l’invio
del segnale alle piste del registratore
multi-traccia.
Applicazioni
Di seguito sono illustrate alcune applicazioni di mixer in ambiti professionali. Nelle figure
sono indicate genericamente le prese disponibili su un ipotetico mixer, suddivise in:
• ingressi di canale (linea e microfono)

• ingressi di linea
• uscite ausiliarie
• uscite principali
• uscite dirette (multi-traccia)
• aggancio processori ed effetti (ingressi e uscite)
• alimentazione
Live
In questo caso abbiamo un sound reinforcement ovvero l’uso del mixer per la
sonorizzazione di un concerto dal vivo.
Vediamo che sono collegate direttamente al mixer le tastiere elettroniche, come input di
linea; sono indicati come eventuali i sistemi subwoofer e gli eventuali registratori (stereo o
multi-pista) connessi al sistema per la registrazione dal vivo.
Registrazione
In questo caso vediamo l’uso del mixer per la registrazione in studio su registratore
multipista.
Sono collegate direttamente al mixer le tastiere elettroniche, come input di linea.

La batteria è registrata da un gruppo di microfoni evidentemente separato da quelli tipici
della voce o di ripresa di strumenti.
Sono inoltre presenti il registratore multipista, il registratore stereo (per il mix-down
finale), gli effetti (es. riverbero, speech processor, etc.) ed il compressore.
Si noti la cuffia separata ed amplificata per la mandata in sala (per i cantanti e gli
strumentisti) ed il sistema di ascolto, composto da diversi tipi di amplificazione e
diffusione, in grado di fornire a chi effettua le registrazioni la sensazione che avrà l’utente
finale nell’ascolto reale.
Conferenza
In questo caso vediamo l’uso del mixer per la diffusione di una conferenza. Nel caso in cui
la conferenza sia diffusa via radio o televisione occorre prevedere una connessione
specifica, esattamente come se si desidera registrare il suono.
Spesso sono connesse apparecchiature di produzione sonora sia per comodità operativa
(es. preparazione e sound check) che per gli intervalli.
Sono connessi, oltre all’eventuale sistema video, un equalizzatore grafico per la correzione
della risposta della sala ed un compressore-limitatore per migliorare la performance del
sistema in presenza di parlatori troppo forti o troppo deboli.
PostProduzione
In questo caso vediamo l’uso del mixer per la post-produzione video.

Si presuppone che la registrazione audio sia effettuata sul video principale.
Sono connessi, oltre all’eventuale sistema video, un’unità di effetti per il miglioramento del
suono della voce dello speaker e un’unità per la produzione di effetti speciali per la
sonorizzazione del video.
Mixer automatici e matrici
Nell’uso pratico, spesso sono in uso apparecchiature che semplificano la vita degli
operatori. I banchi mixer sono quindi spesso automatizzati sia in maniera stand-alone che
in maniera collegata a PC (in ambito di produzione musicale i più usati sono gli Apple
Mac). In questi casi, il primo missaggio viene registrato e fissato in memoria.
Successivamente si opera in correzione e completamento.

L’automazione è principalmente sui livelli:
• livelli (fader)
• filtri
In sostanza viene automatizzato il processo di miscelazione e filtraggio; non le mandate ed

i ritorni ed i controlli relativi.
Nell’ambito delle assemblee e conferenze sono in uso sistemi di automazione di diverso

tipo:
• matrici di commutazione
o manuali
o automatiche
• mixer automatici
• mixer intelligenti
Matrici
Le matrici di commutazione sono sostanzialmente dei banchi di interruttori che

permettono di attivare un singolo microfono da una serie complessa. In fase di
installazione e di manutenzione sono effettuate tutte le regolazioni che riguardano i volumi
generali, la sensibilità di ciascun canale microfonico e ausiliario e la filtratura.
I sistemi automatici possono essere connessi a un sistema di coda di prenotazione; spesso

sono parte di un sistema di votazione elettronica (electronic poll systems, voting systems).
La prenotazione avviene normalmente premendo un bottone alla base del microfono.
Il presidente o il moderatore ha visione delle prenotazioni effettuate e può assegnare la
parola o rifiutare mediante una pulsantiera.
Le matrici sono spesso correlate a sistemi di ripresa video ed a sistemi complessi di
telecamere e banchi regia video.
Mixer automatici
I mixer automatici sono unità nelle quali è il parlatore che impone l’apertura del canale,
semplicemente cominciando a parlare.
Sistemi di programmazione molto semplici (dip switch) consentono di impostare delle

regole operative (es. velocità di commutazione, microfono del moderatore, etc.). Sono
interfacciabili con microfoni predisposti e possono essere connessi in gruppi a cascata.
Sono disponibili sistemi più complessi interfacciabili a sistemi informativi.
Le illustrazioni sono relative a sistemi a 8 e 4 ingressi.

Mixer intelligenti
I mixer intelligenti sono mixer automatici nei quali le regole possono essere cambiate
durante le operazioni mediante un personal computer o una apposita interfaccia e
spesso sono connessi a sistemi di regia evoluta.
Spesso sono digitali e connessi al sistema di controllo mediante interfaccia di rete locale.
Di seguito le specifiche di un mixer automatico digitale intelligente
• 10 channel input (Mic/Line)
• 24-bit ,48khz digital audio converted to analog output

• frequency response +/-0.2dB，20Hz~20kHz
• THD plus noise : <0.01% @4dbu
• Dynamic range : 103dBA，101dB
• Maximum output level: +24dBu, balanced differential
• Output impedance: 100 Ohms designed to drive a minimum load of 600 Ohms
• Two RJ45 network port or optical fiber port

• One RS232 port (9-pin D-type)
Preamplificatori
I preamplificatori, come unità separate, sono normalmente utilizzati per disaccoppiamento

o per normalizzazione dei livelli.
Per isolare e normalizzare un ingresso ad alta impedenza (p.es. uno strumento musicale)
su un ingresso mixer si usa una Direct Injection Box.
Ovvero un preamplificatore con adattatore di impedenza. Nello schema che segue sono
inseriti anche un uscita passante parallela all’ingresso, un attenuatore commutabile (es. da
livello linea a livello amplificato) e un interruttore per la separazione galvanica.
Possono esistere varianti più o meno complesse, passive (come il precedente) o attive, che
attingono energia da batterie o dall’alimentazione phantom presente sul connettore XLR.
Per adattare uno o più microfoni ad un amplificatore senza utilizzare un mixer o per
entrare direttamente su appliances diverse (registratori, banchi di regia video, etc.) si
usano preamplificatori microfonici. Esistono in varie versioni, con effetti e compressori.
Piccolo preampli mono con effetti
Preampli microfonico a otto canali
Preampli duale - tecnologia a tubi a vuoto (valvolare analogico)
Preampli con processore digitale.

Filtri ed equalizzatori
Equalizzatore grafico a terzi di ottava
Permette di operare selettivamente sulle varie componenti del suono esaltando o limitando
frazioni piccole della gamma sonora.
È utile per correggere i difetti di sala (coloriture) e per evitare le risonanze parassite.
Sono disponibili i controlli generali di volume e slider di intervento in dB (di solito + e –

12/15/24 dB) per terzo d’ottava.
Sono in uso sistemi semplificati a mezze ottave e ad ottave.
Equalizzatore parametrico
Molto più efficace dell’equalizzatore grafico ma molto più complesso nell’uso.
Dispone di controlli parametrici quali:

• frequenza centrale del taglio o del boost
• la larghezza di banda (anche detta "Q" o "campana")
• il gain.
Questi controlli, per ogni canale, sono disponibili per bassi, medio-bassi, medi, medio-alti e
alti. Per i bassi e per gli alti sono spesso disponibili anche i controlli di shelf, che
consentono un taglio (o boost) completo al di sotto o al di sopra di una certa frequenza.
Nei casi ideali è possibile anche decidere con quale pendenza vogliamo che avvenga
questo taglio o boost.
In figura un sistema relativamente semplice munito di controlli su:

• bassi (frequenza, tipo di intervento e guadagno/perdita di segnale)
• medio-bassi (frequenza, tipo di intervento, Q o banda e guadagno/perdita di
segnale)
• medio-alti (frequenza, tipo di intervento, Q o banda e guadagno/perdita di segnale)
• alti (frequenza, tipo di intervento e guadagno/perdita di segnale)
• generale (livello complessivo del canale)
Gli equalizzatori si usano, in fase di configurazione, con generatori di rumore ed

analizzatori di spettro.
Compressori
I compressori e i limiter sono processori di segnale che riducono la gamma dinamica del
segnale.
In generale i processori che agiscono sulla dinamica vengono appunto detti processori
di dinamica.
Il compressore comprime la dinamica di un segnale audio. La dinamica di un segnale è il

range nel quale varia l'ampiezza di un segnale.
Il limiter è un processore di dinamica progettato per impedire ai segnali di oltrepassare un

dato livello, generalmente regolabile, detto livello di soglia ( threshold). A volte il limiter
viene configurato come un vero e proprio "muro" (brick wall è esattamente il termine
utilizzato) che impedisce al livello d'uscita di andare oltre la soglia stabilita, qualunque sia
l'incremento del livello d'ingresso.
L'effetto è quello di consentire al segnale solo un piccolo incremento (non lineare) nel
livello d'uscita per qualsiasi incremento del livello d'ingresso oltre la soglia stabilita.
Quest'azione, poiché elimina i picchi di livello di segnale in un programma, è conosciuta
anche come "livellamento" (leveling), ed i limiter sono anche detti "amplificatori di
livellamento audio" (audio leveling amplifiers).
La soglia di intervento (threshold) può essere stabilita in tutto il range di segnale (da
-40dBu a +20dBU)
Per i segnali sopra la threshold, il rapporto tra la variazione nel livello d'ingresso (in dB) e
la variazione del livello di uscita - dopo la compressione - è conosciuto come "rapporto di
compressione" o ratio.
La ratio indica esattamente la percentuale della quale il compressore comprime le

variazioni del livello d'ingresso. Con una ratio di 2:1, ad esempio, il compressore
trasformerà una variazione di 20 dB (ad esempio da 40 dB a 60 dB) in una variazione di
10 dB.
La caratteristica di trasferimento (ossia la pendenza del grafico raffigurante il

cambiamento in uscita del segnale in entrata) cambia al livello di soglia, la soglia o
threshold è anche conosciuta come punto di rotazione (ma si tratta di una dicitura
utilizzata molto raramente).
La curva di trasferimento (mediante adeguati sistemi di controllo) può essere

parametrizzata.
Nel grafico che segue vediamo come cambia la risposta del compressore con un effetto
combinato delle regolazioni di threshold e ratio.
Tra i valori che l'utente può modificare in un compressore che lavori in peak mode, ci sono
l'attack e il release. I compressori che lavorano in rms mode regolano questi valori
automaticamente.
Con il valore di attacco (generalmente compreso tra 0.1 ms e 200 ms) si stabilisce
quanto velocemente la circuiteria interna del compressore/limiter debba reagire ai
cambiamenti nel livello del segnale d'ingresso. Quanto più lungo viene settato il tempo di
attacco, tanta più parte della dinamica del segnale originale viene lasciata inalterata prima
che entri in azione il compressore. Con tempi d'attacco più lenti, si ottiene un suono più
omogeneo, che tende a mantenere le caratteristiche dinamiche del segnale originale, ma
in compenso il compressore non reagirà molto rapidamente a cambi di livello subitanei, e
questo è un fattore di cui tenere conto nella regolazione del tempo di attacco.
Il tempo di release (generalmente compreso tra 50 ms e 5 secondi) determina quanto

impiega il compressore ad interrompere la propria azione. Con tempi di rilascio brevi, il
compressore riproduce ogni minima variazione nel livello d'ingresso, il che può produrre un
effetto irregolare di "ondulazione" che riduce la dinamica ma aumenta il livello di uscita.
Tempi di rilascio più lunghi tendono a schiacciare maggiormente il segnale, producendo un

output più basso ma mantenendo maggiormente le caratteristiche della dinamica del
segnale originale.
Il limiter viene quindi utilizzato in tutte quelle situazioni in cui un improvviso incremento
del livello del segnale possa essere dannoso. Nel settore delle trasmissioni radio-televisive
(broadcast), tali unità impediscono una "sovra-modulazione" del segnale trasmesso.
Nell'amplificazione dal vivo (sound reinforcement) possono essere usati per proteggere i
diffusori da eventuali danni meccanici nel caso, ad esempio, della caduta di un microfono
(limitando il livello di picco che sarà fornito all'amplificatore ed agli altoparlanti).
Il compressore, peraltro molto simile, opera comprimendo la dinamica, mantenendo

all’interno di quanto previsto.
La compressione ha una molteplicità di utilizzi. Nella registrazione analogica, nel broadcast

o nell'amplificazione dal vivo, la compressione può essere usata per schiacciare la gamma
dinamica di un programma al fine di adattarlo alla memorizzazione o al mezzo di
riproduzione.
Anti-larsen
I sistemi di questo tipo effettuano processi di segnale in maniera automatica per evitare
l’insorgenza dell’effetto Larsen o di feedback acustico.
L'effetto Larsen è il tipico fischio/ rumore stridente che si verifica quando un microfono (o
un qualsiasi trasduttore, compresi quelli degli strumenti musicali elettrici) è troppo vicino
all'altoparlante che emette i suoni captati dal microfono stesso; in generale, è il rumore
che si sviluppa quando i suoni emessi da un altoparlante ritornano ad essere captati con
sufficiente "potenza di innesco" da un microfono che li rimanda al medesimo altoparlante,
come in un circuito chiuso.
L'effetto si innesca quando il microfono capta dall'altoparlante una frequenza, in un dato

momento più forte delle altre, che quindi viene amplificata e riprodotta a sua volta con
ampiezza via via crescente, limitata solo dalla saturazione dell'amplificatore.
Tale effetto si può minimizzare utilizzando microfoni direzionali o cambiando

opportunamente le posizioni nello spazio del microfono e / o dell'altoparlante e curando
l'acustica ambientale o, ancora, utilizzando processori di dinamica con funzione di gate,
spesso associata a funzioni di compressione ed espansione. In pratica, la dinamica dei
suoni captati dal microfono viene compressa (i suoni più forti attenuati e quelli più lievi
potenziati, secondo parametri selezionabili) e poi ri-espansa (i suoni che sono inferiori ad
un certo valore vengono eliminati.
Tale procedura però non è sempre efficace o utilizzabile.
I sistemi automatici operano cercando di effettuare una

decorrelazione tra sorgente ed amplificazione, mediante
vari tipi diversi di approccio:
• riduzione delle risonanze
• spostamento nel tempo
• spostamento di frequenza
• cancellazione delle risonanze
Il primo sistema opera come un umano che ricerca una

frequenza di possibile risonanza e, quando avviene
l’innesco di un feedback, limita l’ampiezza del segnale sulla
banda interessata.
Il secondo sistema introduce un ritardo nel suono in modo tale da scorrelare il feedback.
Il terzo sistema evita il feedback scorrelando i due segnali spostando la frequenza del
segnale in ingresso nel sistema (di solito di pochi Hertz). Il quarto sistema è simile al
primo, ma opera iniettando segnali in controfase per bilanciare i feedback, operando cioè
in cancellazione.
Spesso le apparecchiature dispongono di diversi tipi di sistemi combinati.

I disturbi
I disturbi possono essere ricondotti a due grandi famiglie:

• quelli derivanti dal segnale in interazione con il sistema
• quelli derivanti dal sistema in interazione con il segnale
Il primo gruppo sono definiti distorsioni e l’esempio descrive un clipping.
Il secondo gruppo è tipicamente costituito dal rumore, che si sovrappone e modifica il

segnale.
Meccanici
Sono i disturbi derivanti da variazioni del segnale elettronico dovute a problematiche di

tipo meccanico.
Nei registratori a nastro e nei giradischi (e comunque in tutti i sistemi in movimento) sono
il wow, cioè la perdita di velocità del motore o a grandi eccentricità e, di conseguenza, di
frequenza di riproduzione ed il flutter, cioè lo sfarfallio del segnale dovuto a piccole
eccentricità nei meccanismi di riproduzione.
Sono quindi, in generale, modulazioni della frequenza associate a modulazioni del livello.
Elettrici
Quelli elettrici sono quasi sempre derivanti dall’alimentazione elettrica.
La prima e più importante famiglia è quella derivante dalla corrente elettrica alternata,
ovvero i 50Hz di rete ed i suoi armonici. Si tenga conto che il rombo di origine elettrica è
formato non solo dai 50Hz ma soprattutto dalla armonica a 100Hz, in quanto i
raddrizzatori di corrente (contenuti negli alimentatori) generano questo tipo di segnale.
La denominazione storica è rumble.
Si devono filtrare già a livello di progetto.
Nel caso possono essere corrette con:

• se dovute a ground-loop, modificando l’anello di massa
• se dovute a disturbi raccolti nei cavi, utilizzando filtri passa alto a 100Hz
Nel caso di rumori dovuti all’alimentazione ma di tipo PWM o di alimentatori digitali (p.es.
PC portatili), il rumore è tipicamente in banda medio-alta.
Non vi sono alternative alla eliminazione (a parte a livello progettuale) mediante filtri
parametrici.
Elettronici
In elettronica possiamo trovare due diversi tipi di disturbo di origine intrinseca:

• il rumore
• il segnale spurio
Il rumore è in linea di massima non eludibile e può essere corretto l’effetto abbassando gli
acuti.
I segnali spuri di origine analogica sono dovuti a scariche o a instabilità al transiente.
Le scariche possono essere limitate evitando l’uso di componenti non mantenuti (p.es.
potenziometri sporchi o ossidati, spine e prese ossidate, commutatori, etc.).
Le instabilità al transiente sono sostanzialmente legate alle distorsioni per clipping.
Il rumore di origine digitale, invece, non è eludibile in quanto presente in banda e non
correlabile al segnale. Di norma è prodotto dal fenomeno dell’alias.
L'aliasing (dal latino alias, altrove) è il fenomeno per il quale due segnali analogici diversi
possono diventare indistinguibili una volta campionati: questo costituisce un serio
problema che si riflette direttamente sull'uscita del sistema in esame, alterandone la
veridicità.
L'aliasing può verificarsi sia nel tempo (aliasing temporale) che nello spazio (aliasing
spaziale).
I segnali analogici vengono spesso convertiti in digitale per essere successivamente

elaborati o archiviati. Durante questa conversione analogico-digitale il segnale viene
sottoposto a due distinte discrezioni: la discrezione dei tempi, detta campionamento, e la
discrezione delle ampiezze, detta quantizzazione.
Nella conversione digitale-analogica il segnale digitale viene trasformato nuovamente in un

segnale analogico operando una interpolazione.
Interpolando i punti in blu otteniamo un segnale irreale derivato da un difetto di

campionamento.
Il problema del aliasing può essere osservato anche visivamente, basta far caso che in
televisione o al cinema (dove l'immagine è campionata a 25 Hz), oggetti in rotazione a
frequenza superiori, come pale di elicottero o ruote di automobili, spesso ci appaiano
girare lentamente, o addirittura al contrario, rispetto a quanto ci si aspetterebbe.
Nella conversione analogico-digitale sono inseriti, a monte della conversione vera e propria
un sistema di dithering ed un filtro anti-alias.
Il generatore di dither inserisce un rumore di intensità inferiore al passo di quantizzazione

al fine di evitare scalini artificiali nella conversione (e quindi errori rilevabili). Il filtro anti-
alias è un filtro passa-basso che elimina i segnali con frequenze superiori a quelle che il
quantizzatore riuscirebbe con sicurezza (cioè senza generare alias) ad elaborare.
.
Media
Disco analogico
Il disco in vinile (piastra circolare incisa con un solco a spirale per la riproduzione di
suoni) è stato ufficialmente introdotto nel 1948 negli Stati Uniti come evoluzione dei
precedenti dischi, dalle simili caratteristiche inizialmente in gommalacca.
Le migliori caratteristiche del vinile permise di rimpicciolire i solchi e abbassare il numero

di giri per minuto dei dischi dai 78 ai 33⅓ ottenendo così una maggiore durata di ascolto,
che raggiunse circa 25-30 minuti per facciata nei Long-Playing (LP), con punte massime di
anche 38-40 minuti per lato, specie per le opere liriche.
Comparazione 33giri analogico, 45giri analogico, CD audio
Per la riproduzione sonora di un disco viene solitamente impiegato un giradischi collegato

ad un amplificatore. In genere i giradischi supportano diversi formati e, per mezzo di un
selettore, è possibile impostare la velocità di rotazione del disco.
Lettura di disco analogico con testina a magnete mobile

Tabella di comparazione
velocità di durata
denominazione
diametro rotazione approssimativa
comune
in giri al minuto per facciata
12 pollici pari a circa 33 giri o long-playing

33 ⅓ 30 minuti
30,5 cm (LP)
12 pollici pari a circa

45 / 33 ⅓ Maxi Single 15 minuti
30,5 cm
10 pollici pari a circa 78 giri o Single-playing

78 giri 3 minuti
24,5 cm (SP)
7 pollici pari a circa

45 45 giri 4 minuti
17,8 cm
Il suono su disco in vinile è riprodotto analogicamente, l'informazione sonora viene

prelevata per mezzo di una puntina in diamante o altro materiale sintetico, sotto la quale
scorre il solco inciso del disco in rotazione. Scorrendo lungo il solco la puntina ne riproduce
i movimenti che vengono riportati, per mezzo dello stilo su cui è montata, ad un
trasduttore che può essere realizzato con varie tecnologie.
• piezoelettrico
• magnete mobile
• bobina mobile
Le testine a magnete ed a bobina mobile richiedono un preamplificatore adattatore di

livello con una curva di de-enfasi di tipo RIAA. Ciò in quanto il media è stato registrato con
una pre-enfasi (denominata curva RIAA) allo scopo di contenere le oscillazioni della
puntina nel solco e le dimensioni del solco stesso, di migliorare la resa delle alte frequenze
e di potere poi ridurre il disturbo stridente dell’attrito della puntina.
Il media in formato LP ha il limite intrinseco di 60dB di dinamica massima (con
particolari tecniche di registrazione e di riproduzione) ed una banda passante limitata a
8KHz dopo meno di 100 ascolti (15KHz a 10 ascolti).
Nastro magnetico
Il nastro magnetico è un supporto destinato alla memorizzazione di dati che consiste in

una sottile striscia in materiale plastico, rivestita di un materiale magnetizzabile. Il brevetto
originale appartiene a George Telefunken e risale al 1927. Il progetto definitivo prevedeva
due strati di Nitrocellulosa (Celluloide) tra i quali era depositato uno strato misto di
Monossido di Ferro e Biossido di Cromo, materiali con un'elevata permeabilità magnetica e
quindi un'elevata capacità di "memorizzare" le variazioni di flusso magnetico.
Successivamente negli anni 50, alla celluloide si sostituisce il Mylar che raggiungendo
spessori inferiori, mantenendo le stesse proprietà meccaniche, permetteva una
magnetizzazione più profonda e durata del nastro maggiore, dato che la stessa bobina
poteva contenere più di una volta e mezza del nastro normale, visto il ridotto spessore
dello stesso.
registratore multipista analogico

registratore stereofonico
Il formato a bobina aperta fu usato nei primi registratori a nastro, compreso il

Magnetophon tedesco degli anni '30.
Il termine bobina aperta non era usato nei primi tempi, ma fu coniato nei primi anni '60
quando entrarono in commercio le cartucce stereo 8 e le musicassette.
Velocità del nastro
In generale, più elevata è la velocità del nastro migliore è la qualità della registrazione.
Velocità del nastro lente sono molto utili per ottenere buone autonomie di registrazione
nei casi in cui la qualità audio non sia un requisito fondamentale.
• 15/16 pollici per secondo (in/s) o 2.38 cm/s — usata per registrazioni molto lunghe
(per esempio, l'intera emissione di una stazione radio come archivio, o in caso di
reclami)
• 1⅞ in/s o 4.76 cm/s — di solito la velocità inferiore delle registrazioni domestiche,
ideale per lunghe registrazioni di discorsi; è la velocità adottata per le compact
cassette C7
• 3¾ in/s o 9.52 cm/s — offre un buon compromesso tra velocità e durata
• 7½ in/s o 19.05 cm/s — velocità più alta per registrazioni domestiche, e la più
bassa per utilizzi professionali; usata da molte stazioni radio per copie e spot
pubblicitari
• 15 in/s o 38.1 cm/s — registrazioni musicali professionali ed emittenza radiofonica
• 30 in/s o 76.2 cm/s — usata dove si richiede la massima risposta ai toni alti, per
esempio gran parte delle registrazioni di musica classica
Formato del nastro
I nastri magnetici sono disponibili nelle dimensioni:

• 1/8 di pollice (3.18mm) (contenuto nell’audiocassetta C7)
• ¼ di pollice (6.35mm) standard amatoriale
• ½ pollice (12.7mm) standard professionale
• 1 pollice (25.4mm) multi pista
• 2 pollici (5.08cm) multi pista
Musicassette
La musicassetta è un supporto fonografico a nastro magnetico molto diffuso e popolare

per la economicità e la sua semplicità d'uso: un piccolo contenitore con due bobine che
raccolgono il nastro su cui può essere registrato materiale sonoro. La musicassetta è stata
introdotta sul mercato nel 1963 dalla Philips.
In origine era costituita da una certa quantità di nastro magnetico della BASF racchiusa in
un guscio protettivo in materiale plastico. Il nastro disponeva di quattro tracce, dando la
possibilità di registrare due tracce stereo – una riproducibile con il lato 'A' posto in alto e
l'altra utilizzabile capovolgendola – in modo analogo a quanto avviene con i dischi.
Esistevano altri sistemi a cartuccia di nastro (come lo Stereo 8) ma la musicassetta si
affermò col supporto della Philips denominato Compact Cassette e lanciato sul mercato nel
1963. La produzione di massa cominciò nel 1965 ad Hannover in Germania e
contestualmente iniziò la vendita di nastri preregistrati. Attualmente obsoleta e dismessa
dal 2007.
Dat
Il Digital Audio Tape, abbreviato in DAT, è un medium per la registrazione e

riproduzione di audio introdotto da Sony nel 1987.
In apparenza simile ad una videocassetta, utilizzando un nastro magnetico da 1/8",

protetto da una copertura simile a quella di una cassetta. Le dimensioni sono tuttavia circa
la metà di un supporto VHS, 73 mm × 54 mm × 10,5 mm. Come suggerisce il nome, la
registrazione non avviene in modo analogico, ma digitale.
Il DAT converte il suono ad una frequenza di campionamento più o meno elevata rispetto
al CD (48, 44.1 o 32 kHz di frequenza, e 16 bit di quantificazione), senza compressione
audio. Questo significa che tutto il segnale di input viene mantenuto. Se viene riprodotta
una risorsa digitale, allora il DAT produrrà un clone identico, al contrario di quello che
fanno per esempio la musicassetta, che registra il segnale analogico, o il minidisc che usa
una compressione di tipo lossy.
Il formato standard è 16bit, 48kHz.
In gran parte dismessi e resi obsoleti dalle tecnologie su supporto statico o su disco rigido.
I DAT sono di durata variabile tra 15 e 240 minuti; uno di 120 minuti è lungo circa 60
metri.
CD
Il Compact Disc Digital Audio, in sigla CDDA, comunemente chiamato CD Audio, è uno
standard di registrazione audio su compact disc dedicato al home audio.
IL CD Audio è stata la versione originale dei CD, da cui sono derivati tutti gli altri formati.
La struttura fisica del disco ed i protocolli di memorizzazione dei dati è descritta nel Red
Book (traduzione letterale: libro rosso), redatto da Sony e Philips nel 1980, anno in cui
cominciò la vendita dei CD.
Le specifiche prevedono una capacità standard per un CD Audio di 747 MB, equivalenti,
tenendo conto dello spazio occupato per la correzione di errore, a 74 minuti di musica
stereofonica campionata a 44,1 kHz a 16bit (secondo una leggenda la durata è stata
definita tale per contenere la nona sinfonia di Beethoven).
DVD
Il DVD-Audio è un'applicazione DVD riguardante dati audio suddivisi in file, organizzati

secondo le specifiche proposte dal DVD forum, finalizzata alla riproduzione di contenuti
audio in alta fedeltà. I dati audio di questa applicazione sono registrati in un numero di
canali variabile da uno (mono) a sei (5.1), e sono campionati fino a una frequenza di 192
KHz e 24 bit.[1] Il supporto su cui l'applicazione viene memorizzata è, per definizione, un
DVD (quindi almeno DVD-5, singola faccia, singolo strato: 4,7 GB).
I DVD-Audio non contengono alcun tipo di dato video, e non devono essere confusi con i
DVD-Video di concerti o video musicali. Essi sono nati, invece, per rappresentare la
naturale evoluzione di CD-Audio, pur incontrando, in tal senso, notevoli difficoltà di
diffusione e standardizzazione.
Possibili configurazioni dei dati su DVD-Audio
16-, 20- o 24-bit
Numero di canali audio
44.1 kHz 48 kHz 88.2 kHz 96 kHz 176.4 kHz 192 kHz
Mono(1.0) SI SI SI SI SI SI
Stereo(2.0) SI SI SI SI SI SI
Stereo (2.1) SI SI SI SI NO NO
Stereo + mono surround (3.0 o 3.1) SI SI SI SI NO NO
Quadrifonico (4.0 o 4.1) SI SI SI SI NO NO
3-stereo (3.0 o 3.1) SI SI SI SI NO NO
3-stereo + mono surround (4.0 o
SI SI SI SI NO NO
4.1)
Full Surround(5.0 o 5.1) SI SI SI SI NO NO
SA-CD
Il Super Audio Cd (SACD) è un supporto che utilizza la tecnologia di audio digitale DSD
(Direct Stream Digital, senza riconversione da digitale in analogico). Supporta audio in
formato stereo e 5.1. Necessita di un lettore apposito per essere riprodotto. Può essere
abbinato, in un supporto multistrato, ad un CD audio normale per creare un CD ibrido che
può essere letto anche nei normali lettori cd. La tecnologia usata (DSD) è diversa da
quella normalmente utilizzata per gli altri supporti di audio digitale (PCM) e si basa sul
concetto della Delta Modulation. Il SACD riproducendo le forme d'onda originali con
maggiore accuratezza, fornisce un'immagine del suono più definita e aderente al master
originale di studio di registrazione, con eccezionale realismo.
La frequenza di campionamento è 64 volte più alta di quella del normale CD e la risposta

in frequenza arriva fino a 100 kHz, la gamma dinamica fino a 120 dB.
MiniDisc
Il MiniDisc (MD) è un supporto digitale magneto-ottico per la registrazione e

riproduzione di informazione audio lanciato ufficialmente dalla Sony nel 1992.
Il disco è integrato in una custodia di plastica rigida di 7x7cm che lo protegge dagli urti,
dai graffi e dalla polvere e può contenere circa 145 MB di informazione digitale. Grazie
all'algoritmo di compressione audio ATRAC di tipo lossy proprietario della Sony (analogo
all'MP3) su di un minidisc si possono memorizzare circa 74-80 minuti di audio (il doppio se
la registrazione è effettuata in mono). Sebbene sia stato pensato come il successore
digitale della musicassetta, il minidisc non ha goduto di una vasta diffusione, a causa del
successo del compact-disc (CD) come supporto e dell'MP3 come algoritmo di
compressione audio. Obsoleto.
DVD
Il DVD, acronimo di Digital Versatile Disc (in italiano Disco Versatile Digitale,
originariamente Digital Video Disc, Disco Video Digitale) è un supporto di memorizzazione
di tipo ottico.
Il DVD è il prodotto della cooperazione di alcune fra le maggiori aziende nel campo della
ricerca e dell'elettronica di consumo: il cosiddetto DVD forum, ovvero l'istituzione che si è
incaricata di redigere le specifiche del nuovo supporto, era infatti formata da Philips, Sony,
Matsushita, Hitachi, Warner, Toshiba, JVC, Thomson e Pioneer. L'intento era quello di
creare un formato di immagazzinamento di grandi quantità di video digitali che fosse
accettato senza riserve da tutti i maggiori produttori, evitando quindi tutti i problemi di
incertezza del mercato dovuti alla concorrenza fra formati che si erano presentati al tempo
dell'introduzione delle videocassette per uso domestico.
I DVD-Video sono supporti digitali in grado di contenere fino a 240 minuti[1] di materiale
video in formato MPEG-2.
L'audio può essere in formato non compresso PCM (da 1 a 8 canali), in formato Dolby
Digital AC3 (che prevede da 1 a 6 canali), in formato DTS (fino a 8 canali) o in formato
MPEG.
Le dimensioni dei DVD di produzione industriale sono di sei tipi:

• DVD-1, detto più comunemente Mini DVD: 1,4 GB Lato unico e singolo strato, con
diametro minore di 120 mm
• DVD-3: 2,8 GB Double layer Lato unico e doppio strato, con diametro minore di 120
mm
• DVD-5: 4,7 GB Lato unico e singolo strato
• DVD-9: 8,5 GB Lato unico e doppio strato
• DVD-10: 9,4 GB Due lati e singolo strato
• DVD-18: 17 GB Due lati e doppio strato
I DVD "double layer" permettono una doppia incisione nello stesso lato. La capacità del
supporto non raddoppia esattamente, perché una parte di memoria è dedicata alla
creazione di un indice e al controllo della distribuzione dei dati.
Il double side o "doppio lato" è un supporto che può essere inciso o riscritto da tutti e due
i lati.
La minima velocità di trasmissione dati da un DVD è nove volte maggiore di quella di un

CD, cosicché un lettore DVD da 1x è quasi equivalente ad un lettore CD da 8x. Più
precisamente, 1x per un lettore DVD equivale a 1350 kB/s, mentre 1x per un lettore CD
equivale a 150 kB/s.
Il file system largamente usato nei DVDRom è l'UDF (Universal Disk Format).
HD-DVD
HD DVD (acronimo di High Defintion Digital Versatile Disc) era un formato ottico digitale
sviluppato al fine di diventare uno standard per i DVD di nuova generazione adatti ai
contenuti ad alta definizione, promosso da Toshiba, NEC, Sanyo, Microsoft e inizialmente
supportato da Paramount Pictures, Dreamworks e da Universal Studios.
Un disco HD DVD ha una capacità di 15 GB per ogni singolo layer, ed esiste in 3 versioni
differenti: 15 GB (1 layer), 30 GB (2 layer) e 45 GB (3 layer).
Il prodotto è stato abbandonato ed è quindi obsoleto.

Blue-ray Disk
Il Blu-ray Disc è il supporto ottico proposto dalla Sony agli inizi del 2002 come evoluzione
del DVD per la televisione ad alta definizione.
Grazie all'utilizzo di un laser a luce blu, riesce a contenere fino a 54 GB di dati, quasi 12
volte di più rispetto a un DVD Single Layer - Single Side (4,7 GB)
Dati tecnici
Capacità ROM (sola lettura) (1 layer) 25 GB
(2 layer) non disponibile
(3 layer) 50 GB
(4 layer) 100 GB
(8 layer) 200 GB
Capacità RW (riscrivibile) (1 layer) 25 GB
(2 layer) 50 GB
Capacità R (registrabile) (1 layer) 25 GB
(2 layer) 50 GB
Processo produttivo nuova tecnologia
Lunghezza d'onda del laser 405 nm
Apertura numerica 0,85
Strato protettivo 0,1 mm
Dimensione della traccia 0,32 μm
Dimensione minima del pit 149,0 nm
Velocità di trasferimento dati 36 Mbps (1x)72 Mbps (2x)54
Mbps
Risoluzione video 1920 × 1080
Compressione video ROM MPEG-2MPEG-4 AVC
(H.264)VC-1
RW/R MPEG-2
Codifica audio PCM, Dolby Digital, Dolby
Digital Plus, DTS, DTS-
HD, Dolby TrueHD
SD Secure Digital
Una scheda di memoria (memory card), è un dispositivo elettronico portatile di ridotte

dimensioni in grado di immagazzinare dati in forma digitale e di mantenerli in memoria
anche in assenza di alimentazione elettrica. A tale scopo utilizza una memoria flash
(memoria non volatile) contenuta al suo interno.
Secure Digital (chiamate più brevemente SD) è il più diffuso formato di schede di
memoria. Le "Secure Digital" hanno capacità molto elevate, seconde solo alle
CompactFlash; attualmente raggiungono una capacità di 32 GB. Molti Notebook sono già
equipaggiati con lettori appositi che consentono l'utilizzo di queste schede di memoria.
Esistono tre formati:

SD standard (32 x 24 x 2,1 mm)
mini-SD (21,5 x 20 x 1,4 mm)
microSD (11 x 15 x 1 mm).
Sia le microSD che le miniSD possono essere utilizzate con lettori di SD mediante semplici
adattatori.
Le SD sono molto resistenti agli urti (2000 g, contro i 100-200 g di un comune hard disk).
Analogamente alle MultiMediaCard, le SD utilizzano contatti superficiali anziché connettori
maschio-femmina, fatto che ne aumenta ulteriormente la robustezza ma le rende poco
indicate per applicazioni in ambienti particolarmente gravosi (specie in presenza di
vibrazioni).
La capacità massima attuale delle SD è di 32 GB (16 GB prima di gennaio 2008); per le
miniSD e le microSD di 16 GB.
I file audio inseriti nel supporto possono essere in un qualunque formato digitale.
Altri supporti digitali
Attualmente esistono modelli di varie dimensioni, capacità e caratteristiche tecniche, le più

capienti per ora raggiungono 64 GB (CompactFlash).
CompactFlash, SmartMedia, xD e MemoryStick
La veloce diffusione e l'elevato numero di produttori e gli interessi commerciali ad essi

legati, hanno fatto si che non si sia ancora giunti ad uno standard per questi dispositivi di
archiviazione portatili. Esistono molti tipi diversi di schede di memoria, differenti per
dimensione, forma e interfaccia.
Nome Acronimo Dimensione DRM Capacità massima

PC Card PCMCIA 85.6 × 54 × 3.3 mm Nessuno n.d.
CompactFlash I CF-I 43 × 36 × 3.3 mm Nessuno 32 GB
CompactFlash II CF-II 43 × 36 × 5.5 mm Nessuno 64 GB
SmartMedia SM / SMC 45 × 37 × 0.76 mm Nessuno 128 MB
Memory Stick MS 50.0 × 21.5 × 2.8 mm MagicGate 1 GB
Memory Stick Duo MSD 31.0 × 20.0 × 1.6 mm MagicGate 16 GB
Memory Stick Micro M2 15.0 × 12.5 × 1.2 mm MagicGate 8 GB
M2
MultiMediaCard MMC 32 × 24 × 1.5 mm Nessuno 8 GB
Reduced Size Multi RS-MMC 16 × 24 × 1.5 mm Nessuno n.d.
Media Card
MMCmicro Card MMCmicro 12 × 14 × 1.1 mm Nessuno n.d.
Secure Digital SD 32 × 24 × 2.1 mm CPRM 32 GB
miniSD miniSD 21.5 × 20 × 1.4 mm CPRM 8 GB
microSD microSD 11 × 15 × 1 mm CPRM 16 GB
xD-Picture Card xD 20 × 25 × 1.7 mm Nessuno 8 GB
Intelligent Stick iStick 24 x 18 x 2.8 mm Nessuno n.d.
µ card µcard 32 x 24 x 1 mm n.d n.d.
Formati di media
Categoria Tipologia For- Caratteristiche Analogico/ Reperibilità

mato Digitale
dischi 33 1/3 rpm 20-20KHz max A Si (difficilmente)
dischi 45 rpm 40-16KHz max A no
dischi 78 rpm 40-10KHz max A no
nastri audio 1” o 2” 20-20KHz A/D Si (difficilmente)

su bobina
(open reel)
nastri audio 1/2" 20-20KHz A/D Si (difficilmente)

su bobina
(open reel)
nastri audio 1/4" 40-16KHz A Si (difficilmente)

su bobina
(open reel)
Audiocassetta Stereo8 40-16KHz A no
Audiocassetta Musicassette 40-16KHz A Si (difficilmente)
Audiocassetta DCC 40-16KHz D no
Audiocassetta DAT 20-20KHz D 24bit, si

48KHz
Audiocassetta miniCassette 100-10KHz A Si (difficilmente)
Audiocassetta microCassette 100-8KHz A Si (difficilmente)
nastri video U-matic 40-16KHz A Si (difficilmente)

in cassetta
nastri video Betacam 40-16KHz A Si (difficilmente)

in cassetta
nastri video MII 40-16KHz A no

in cassetta
nastri video DV, miniDV 20-20KHz D come DAT si

in cassetta
nastri video Betamax 40-16KHz A no

in cassetta
nastri video Video2000 40-16KHz A no

in cassetta
nastri video VHS 40-16KHz A si

in cassetta
nastri video VHS-C 40-16KHz A no

in cassetta
nastri video Video 8 40-16KHz A Si (difficilmente)

in cassetta
nastri video DVC 20-20KHz D si

in cassetta
Dischi digitali CD, miniCD 20-20KHz D si
Dischi digitali SA-CD e HD- 20-20KHz D Si (difficilmente)

DVD
Dischi digitali DVD, miniDVD 20-20KHz D si
Dischi digitali LaserDisk 20-20KHz A/D no
Dischi digitali MiniDisk 20-20KHz D si
Memorie Sta- SD 20-20KHz D si

to Solido
Memorie Sta- miniSD 20-20KHz D si

to Solido
Memorie Sta- microSD 20-20KHz D si

to Solido
Memorie Sta- CF 20-20KHz D si

to Solido
Memorie Sta- XD 20-20KHz D si

to Solido
Memorie Sta- MemoryStick 20-20KHz D si

to Solido
Memorie Sta- MMC 20-20KHz D si

to Solido
Audio digitale
Lo stato dell'arte attuale prevede che un segnale audio sia convertito (e quindi codificato)
in un analogo segnale elettrico (analogo per informazione contenuta, a meno
dell'inevitabile rumore introdotto da qualsiasi manipolazione) per mezzo di un microfono o
un trasduttore, il quale produce, quando viene colpito da una onda meccanica, un segnale
elettrico ininterrotto, i cui valori di tensione, normalmente compresi in un range (detto
dinamica del segnale e compreso tra un minimo e un massimo), contengono la forma
dell'onda sonora originaria.
Un segnale siffatto, continuo nel tempo e che può assumere con continuità tutti i valori
all'interno della sua dinamica, è detto analogico.
Una seconda conversione può essere fatta associando a questo segnale una serie
numerica (quindi digitale) che codifichi con sufficiente precisione la forma d'onda elettrica
analogica originaria, ottenendo così la conversione analogico-digitale, detta brevemente
conversione A/D.
Per far questo è necessario leggere i valori di tensione continui della forma d'onda
analogica con sufficiente frequenza temporale, cioè effettuare una lettura sufficientemente
fitta di questi valori di tensione, producendo un numero di letture (e quindi di valori
numerici) in genere molto alto per ogni secondo di conversione A/D.
Le singole letture sono dette campioni e il teorema del campionamento afferma che se la
frequenza temporale di queste letture (detta frequenza di campionamento) è
sufficientemente grande, non si hanno perdite di informazione rispetto alla forma d'onda
originale. Cioè la serie di numeri prodotta contiene pressoché intatta tutta la informazione
sulla forma d'onda elettrica analogica iniziale. Nei moderni standard tecnologici, in genere
le frequenze di campionamento spaziano dagli 8.000 campioni al secondo ( Samples per
second, S/s) per la voce telefonica, fino ai 44.100 e più campioni al secondo per la qualità
musicale.
Queste letture di valori di tensione possono poi cadere in un qualsiasi punto della dinamica
del segnale, cioè ogni singolo campione può avere un valore compreso tra il minimo e il
massimo possibile.
Si possono quindi avere infiniti valori di lettura di tensione per ogni singolo campione. Per
effettuare correttamente la conversione del segnale da analogico in digitale, va ora
suddiviso tutto il possibile range dinamico del segnale in un numero finito di intervalli e
ogni singolo intervallo va codificato con un valore numerico determinato. Queste due
operazioni si chiamano quantizzazione e codifica di sorgente. La quantizzazione in
genere suddivide il range dinamico del segnale in un numero di intervalli pari a potenze di
due (2n intervalli), in maniera tale che ogni singolo campione cadrà inevitabilmente in uno
degli intervallini quantizzati e potrà così essere codificato digitalmente con n bit.
I valori più ricorrenti di digitalizzazione attualmente usati vanno da un minimo di 8 bit per
campione in campo telefonico, fino a 24 e più bit per campione (range dinamico del
segnale suddiviso in 28 - 224, pari a 256 – 16milioni di intervalli). Naturalmente
all'aumentare del numeri dei bit per campione aumenta la fedeltà del segnale campionato
alla forma d'onda originale e si riduce l'imprecisione introdotta dalla quantizzazione
(rumore di quantizzazione).
La serie numerica così prodotta è detta segnale audio digitale e contiene in sé tutte le
informazioni necessarie per ricostruire la forma elettrica originale, che a sua volta era
l'immagine quasi perfetta della forma d'onda acustica che l'aveva originata. Volendo, si
potrebbe quindi ora procedere alla sua conversione da digitale ad analogica con
convertitori D/A, per riottenere la forma elettrica originale, che una volta inviata ad un
altoparlante riproduce il suono originario.
Tutto questo processo costa in termini di introduzione di rumore vario, ma con le moderne
tecniche questo può facilmente essere tenuto sotto una soglia in genere accettabile.
Il segnale audio digitale prodotto dai convertitori A/D è in genere codificato con un certo
numero di bit per ogni campione e così una registrazione audio di 60 secondi campionata
a 44.100 campioni al secondo, con ogni campione codificato con 16 bit, dà per risultato
una sequenza di 44.100 campioni al secondo per 60 secondi, pari a 2.646.000 campioni,
che vanno ora moltiplicati per 16 bit per campione, ottenendo una serie di 42.336.000 bit.
Questo segnale audio digitale così codificato è detto “raw”, cioè grezzo.
Un secondo livello di codifica è ora possibile, che consenta di comprimere le informazioni

in sequenze numeriche più corte e che occupino meno bit per ogni secondo di
conversione.
Campionamento
In teoria dei segnali, il teorema del campionamento mette in relazione il contenuto di un

segnale campionato con la frequenza di campionamento e le componenti minime e
massime di frequenza del segnale originale, definendo così la minima frequenza necessaria
per campionare un segnale senza perdere informazioni, detta frequenza di Nyquist o
cadenza di Nyquist.
Il teorema afferma che, sotto le opportune ipotesi, la minima frequenza di campionamento

necessaria per evitare ambiguità nella ricostruzione del segnale è pari al doppio della
banda (ovvero pari ad almeno il doppio della frequenza della componente armonica a
frequenza più alta).
Dato un segnale, con larghezza di banda finita e nota, la frequenza minima di

campionamento di tale segnale deve essere almeno il doppio della sua massima
frequenza.
Il teorema, comparso per la prima volta nel 1949 in un articolo di C. E. Shannon, dovrebbe
chiamarsi Whittaker-Nyquist-Kotelnikov-Shannon, secondo l'ordine cronologico di
chi ne dimostrò versioni via via più generalizzate.
Segnale analogico
Segnale analogico campionato
Il campionamento è un passo del processo di conversione analogico-digitale di un segnale.

Consiste nel prelievo di campioni (samples) da un segnale analogico e continuo nel tempo
ogni secondi.
è l'intervallo di campionamento, mentre è la frequenza di campionamento.

Il risultato è un segnale analogico in tempo discreto. Tale segnale sarà in seguito
quantizzato, codificato e quindi reso accessibile a qualsiasi elaboratore digitale.
In pratica il teorema del campionamento pone un vincolo per la progettazione di apparati

di conversione analogico-digitale: se si ha a disposizione un campionatore che lavora a
frequenza , è necessario mandargli in ingresso un segnale a banda limitata da .
In generale un segnale analogico non è limitato in frequenza, ma dovrà essere filtrato per
eliminare le componenti di frequenza maggiore di , a tale scopo si usa un filtro anti-

alias.
Il teorema del campionamento è utilizzato molto spesso anche in analisi statistica per
stabilire il numero di esperimenti da eseguire per collezionare un numero di dati
(campioni) sufficienti per poter ricostruire correttamente una funzione non nota in alcuni
punti, per esempio in punti inaccessibili a causa di vincoli fisici oppure semplicemente per
ottenere dati tra due punti campionati tramite un esperimento.
La conversione analogico-digitale è un procedimento che associa ad un segnale

analogico (tempo continuo e continuo nei valori) un segnale numerico (tempo discreto e
discreto nei valori). Questo procedimento, oggi è effettuato esclusivamente tramite circuiti
integrati dedicati, o circuiti ibridi.
Nonostante la teoria fosse pronta da molto tempo, la "rivoluzione digitale" che ha

modificato in qualche misura il modo di vivere delle persone, consentendo una vera e
propria "tecnologicizzazione" di massa, inizia nei primi anni ottanta. Si trattava,
sostanzialmente, di risolvere due problemi di carattere prettamente tecnologico:
aumentare la velocità di elaborazione dei circuiti e diminuirne l'ingombro; più tardi si
cominciò a scontrarsi anche con problematiche legate al consumo energetico. Tutto si è
risolto con l'integrazione sempre più spinta dei circuiti, permessa anche dal miglioramento
delle prestazioni dei transistori MOSFET.
L'idea che sta alla base della digitalizzazione è la seguente: qualsiasi grandezza fisica di
interesse (tensione, corrente, pressione, velocità...) viene misurata e il valore della sua
misura codificato come numero binario; se la grandezza assume diversi valori nel tempo,
essa sarà misurata a intervalli regolari, dando luogo ad una sequenza di numeri.
Lo schema rappresenta il procedimento completo.
Formato di un file PCM
WAV (o WAVE), contrazione di WAVEform audio format (formato audio per la forma
d'onda) è un formato audio sviluppato da Microsoft e IBM per personal computer IBM
compatibile. È una variante del formato RIFF di memorizzazione dei dati. I dati vengono
salvati in "chunk" (blocchi), è simile anche al formato IFF o al AIFF utilizzato dai computer
Apple Mac.
Sia i file nel formato WAV che AIFF sono compatibili con i sistemi operativi Windows e
Macintosh. La differenza principale per questo formato è che, essendo progettato per
computer montanti processori Intel o compatibili, i dati vengono memorizzati con la
notazione little endian, a differenza degli altri formati che, essendo sviluppati
prevalentemente per computer con processori Motorola, utilizzano la notazione big endian.
Essendo basato sullo standard RIFF il formato supporta varie modalità di
immagazzinamento dei dati ma nella pratica il più diffuso è il metodo PCM.
Il PCM provvede a salvare i dati audio senza nessun tipo di compressione, la forma d'onda
viene memorizzata direttamente. Quindi i file risultanti sono di elevate dimensioni, ma non
richiedono elevata potenza di calcolo per essere riprodotti, ed essendo la codifica
lossless, viene spesso utilizzata dagli utenti professionali per memorizzare l'audio. Molti
programmi supportano questo formato, dato che è molto diffuso ma non semplice da
manipolare date le sue dimensioni molto elevate di byte.
La struttura di un file wave è modulare e permette di incapsulare flussi audio codificati in

diversi modi con opportuni codec. In questo modo è possibile utilizzare il codec che offre
le prestazioni migliori in rapporto allo scopo che si vuole raggiungere (registrazione ad alta
fedeltà, flusso dati per lo streaming via rete, ecc...) e alla sorgente da registrare (parlato,
musica, ecc...). Allo stesso tempo, la registrazione può essere caratterizzata da altri
parametri: il numero di bit di codifica (generalmente 8, 16 o 24) e la frequenza di
campionamento (11, 22, 44, 96 o 192 KHz). Tutti questi parametri influiscono sulla
dimensione dei file.
Compressione
La compressione audio è una tecnica che permette di ridurre le dimensioni di un file audio
o la banda passante richiesta per una trasmissione audio, anche di molto.
Un file è una sequenza di cifre binarie (bit) utilizzata come veicolo di informazione.
Comprimere significa ridurre il numero delle cifre che costituiscono la sequenza
mantenendo l'informazione inalterata o in un intorno dell'informazione originaria (ossia
facendo in modo che la nuova informazione approssimi quella precedente).
I motivi della compressione sono:
• occupare minor spazio in fase di immagazzinamento

• impiegare minor tempo in fase di trasferimento dati.
Il costo è l'aumento dei tempi di lettura/scrittura legati rispettivamente a tempi di

decompressione/compressione. Nel caso di file audio si ha un costo anche in termini di
qualità dell'audio.
Esistono due tipi di compressione:
• con perdita (lossy): quando l'informazione contenuta nel file compresso è minore
di quella contenuta nel file di origine
• senza perdita (lossless): quando l'informazione contenuta nel file compresso è
identica a quella contenuta nel file di origine
La prima permette compressioni maggiori, ma a scapito della qualità sonora.
Usando un algoritmo di compressione senza perdita, dal risultato della compressione si

può riottenere tutta l'informazione originaria. In questo caso la riduzione massima
generalmente ottenibile, utilizzando algoritmi studiati appositamente per l'audio è
all'incirca del 60%, ma solo con alcuni tipi di suono. Si possono utilizzare gli stessi
algoritmi generali di compressione (come per esempio ZIP o Gzip) ma i risultati in termine
di riduzione sono inferiori.
Codec
Un codec audio è un programma o un dispositivo sviluppato per descrivere un flusso

audio sotto forma di dati numerici adatti ad essere memorizzati su un supporto digitale.
I codec audio possono effettuare anche una compressione dei dati in modo da ridurre la
quantità di dati che compone un flusso audio. I codec possono effettuare una
compressione senza perdita di informazioni o con perdita di informazioni. Nel caso di
compressioni senza perdita di informazioni si possono ottenere dei fattori di compressione
del 50% o meno mentre se si utilizzano compressioni con perdita di informazione si
possono ottenere compressioni anche del 500% con qualità accettabile.
I dati prodotti dai sistemi audio sono relativamente pochi rispetto a quelli prodotti da un
flusso video e difatti esistono codec audio non compressi mentre i codec video non
compressi sono riservati ad applicazioni professionali e non sono diffusi tra i personal
computer. Comunque la maggior parte dei codec audio adottano tecniche di compressione
a perdita di informazione dato che la diffusione di internet ha reso necessario ridurre al
minimo i dati trasmessi mentre la potenza di calcolo necessaria per decodificare i flussi
audio compressi non è un problema per gli attuali computer.
Senza compressione
• AIFF
• WAV/PCM
Compressione lossless
• Apple Lossless Encoding
• FLAC
• IFF
Compressione lossy
• Advanced Audio Coding
• ATRAC
• Dolby Digital
• Digital Theater System
• G.729
• MP3
• Mp3PRO
• Musepack
• RealAudio
• Speex
• Vorbis
• Windows Media Audio
Standard
Di seguito sono elencati alcuni degli standard di formato audio digitale importanti per
diffusione o tecnologia. Alcuni di questi sono sistemi di codifica, con o senza
compressione, altri sono contenitori. Ho ritenuto utile inserire anche Speex, G.729 e CELP
quali esempi di formato specifico per la voce.
MP3
MP3 (per esteso Motion Picture Expert Group-1/2 Audio Layer 3) è un algoritmo di
compressione audio di tipo lossy in grado di ridurre drasticamente la quantità di dati
richiesti per memorizzare un suono, rimanendo comunque una riproduzione fedele del file
originale non compresso.
La codifica MPEG-1/2 Layer 2 iniziò come progetto presso la DAB e promosso dalla
Fraunhofer IIS-A. Venne finanziato dall'Unione europea come parte di un programma di
ricerca più vasto chiamato EUREKA comunemente conosciuto con il codice EU-147.
EU-147 fu attivo dal 1987 al 1994. Nel 1991 vennero fatte due proposte per uno standard
disponibile: Musicam (conosciuto come Layer II) e ASPEC (Adaptative Spectral Perceptual
Entropy Coding) (con analogie con l'MP3). Venne scelto Musicam perché più semplice ed
affidabile.
Un gruppo di lavoro condotto da Karlheinz Brandenburg e Jürgen Herre fece confluire gli
studi su Musicam e ASPEC con alcune loro idee e creò l'MP3, che fu progettato per
realizzare la stessa qualità a 128 kbit/s dell'MP2 a 192 kbit/s.
Entrambi gli algoritmi furono completati nel 1992 con la sigla MPEG-1, come prima fase di
sviluppo del progetto denominato MPEG e definito come standard internazionale con il
codice ISO/IEC 11172-3 e pubblicato nel 1993. Un'ulteriore fase del progetto MPEG Audio
si concluse nel 1994 con la creazione del MPEG-2 definito come standard internazionale
con il codice ISO/IEC 13818-3 e pubblicato nel 1995.
L'efficienza di un algoritmo di compressione è tipicamente giudicata dal bitrate finale che

riesce ad ottenere, mentre la metrica del tasso di compressione, che sembrerebbe più
naturale, dipende sia dalla frequenza che dal numero di bit del segnale in ingresso.
Ciononostante, vengono comunemente comunicati tassi di compressione che utilizzano i
CD come riferimento, uno dei più comuni è quello a 44.1 kHz e 2x16bit. Qualche volta
vengono utilizzati anche parametri DAT SP (48KHz, 2x16bit). Il tasso di compressione in
questo sistema di riferimento è maggiore, il che dimostra le difficoltà nel definire il termine
compressione come perdita di qualità nella codifica. Karlheinz Brandenburg ha utilizzato il
CD di Suzanne Vega, "Tom's Diner" come modello di riferimento dell'algoritmo di
compressione per l'MP3. Questo CD è stato scelto per la sua dolcezza e semplicità,
rendendo facile l'ascolto di qualsiasi imperfezione che la compressione può causare
La pagina web ufficiale pubblica i seguenti tassi di compressione per l'MPEG-1 Layer 1,2 e
3.
• Layer 1: 384 kbit/s, compressione 4:1

• Layer 2: 192...256 kbit/s, compressione 6:1...8:1
• Layer 3: 112...128 kbit/s, compressione 10:1...12:1
Questi sono valori piuttosto aleatori in quanto:
La qualità dipende non solo dal formato di codifica del file, ma anche dalla qualità psico
acustica del codificatore. Il codificatore tipico layer 1 usa un modello psicoacustico molto
elementare che finisce per richiedere molti più bit per un risultato soddisfacente.
• La codifica Layer 1 a 384 kbit/s, anche con questo semplice "psico acustico" è
migliore della codifica Layer 2 a 192 … 256 kbit/s.
• La codifica Layer 3 a 112 … 128kbit/s è peggiore del Layer 2 a 192 … 256 kbit/s
Un modo più realistico per considerare il bitrate è:
• Layer 1: eccellente a 384 kbit/s

• Layer 2: eccellente a 256...320 kbit/s, molto buono a 224...256 kbit/s, buono a
192...224 kbit/s, non si dovrebbe usare sotto i 160 kbit/s
• Layer 3: eccellente a 224...256 kbit/s, molto buono a 192...224 kbit/s, buono a
160...192 kbit/s, non si dovrebbe usare sotto i 128 kbit/s
Il confronto un nuovo formato di file viene fatto confrontando la qualità media di

compressione del nuovo formato con un encoder di alta qualità molto ottimizzato del
vecchio formato.
L'algoritmo che utilizza il formato MP3 si basa su una trasformazione ibrida che trasforma
il segnale dal dominio temporale a quello delle frequenze.
• 32 band filtro in quadratura polifase

• 36 or 12 Tap MDCT, la dimensione può essere selezionata indipendentemente dalla
sottobanda 0...1 e 2...31
• processamento addizionale per ridurre gli effetti di aliasing
AAC MPEG-4
L'AAC MPEG-4, è il formato erede dell'MP3 sempre secondo le specifiche MPEG. Il

formato Advanced Audio Coding (AAC) è un formato di compressione audio creato dal
consorzio MPEG e incluso ufficialmente nell'MPEG-4. L'AAC fornisce una qualità audio
superiore al formato MP3 mantenendo la stessa dimensione di compressione.
Attualmente viene utilizzato principalmente da Apple nei suoi prodotti dedicati all'audio
(iTunes); difatti Apple usa sia una variante dell'AAC che gestisce i diritti d'autore DRM
(AAC Protected), con compressione a 128 kb/s, sia una versione senza protezione (AAC
Plus), con compressione a 256 kb/s, per vendere musica attraverso il proprio negozio di
musica on-line iTunes Store.
Una compressione a 128 kb/s corrisponde all'incirca a quella di un MP3 a 165-175 kb/s.
Ne esiste una variante usata spesso per lo streaming audio a basso bitrate, l'AAC Plus, che
utilizza la compressione AAC per le basse frequenze, e l'SBR, per ricreare le frequenze
alte.
La versione v2 dell'AAC Plus migliora ulteriormente la qualità a bassi bitrate, aggiungendo

il Parametric Stereo alla compressione.
L'AAC è diventato recentemente il formato standard di audio per le console Play Station 3
e Wii.
OGG-Vorbis
Vorbis è un algoritmo open source per la compressione audio digitale di tipo lossy, diretta
antagonista di altri standard come MP3, VQF, AAC. A parità di qualità percepita, permette
una maggiore compressione rispetto al formato MP3, ottenuta mediante avanzate ricerche
di psicoacustica.
Il suo sviluppo si deve soprattutto a Christopher Montgomery, fondatore della Xiph.Org

Foundation (nota anche come Xiphophorous Foundation), che la porta dalla prima alpha
release del settembre 1998 fino al rilascio ufficiale della versione 1.0 avvenuto nel luglio
2002.
Tra i pregi che comunemente si attribuiscono a Vorbis, soprattutto riferendosi

all'inevitabile paragone con lo standard de facto MP3, vanno ricordati la maggior
estensione e pulizia delle alte frequenze (sopra i 16 kHz), il supporto multicanale a livello
nativo e in generale una migliore conservazione delle microinformazioni di spazialità
sonora del segnale originario.
Tra i difetti attribuiti vanno citati la relativa pesantezza dell'algoritmo di decodifica rispetto
al collaudato MP3, e soprattutto una certa tendenza al pre-echo, ovvero un innaturale
fantasma sonoro che sembra precedere di alcuni brevi istanti ogni brusco aumento di
pressione sonora. L'esempio che tipicamente viene portato è quello di una sonata di
pianoforte con attacchi di fortissimo dal silenzio, oppure il suono delle nacchere.
Vorbis è un algoritmo di compressione orientato alla compressione mono, stereo o 5.1

surround di segnale audio PCM campionato a 44.1 kHz o 48 kHz, con una profondità di
campionamento di 16 bit o 32 bit. È comunque in grado di gestire anche segnali in
ingresso differenti da quelli raccomandati.
Nel trattamento di segnale stereo musicale Vorbis ha il suo bit rate ideale intorno ai 128
kbit/s, risultando estremamente difficoltoso da distinguere rispetto all'originale in un
ascolto cieco già da 192 kbit/s.
La sua caratteristica licenza open source ha permesso negli anni lo sviluppo di encoder
paralleli a quello ufficiale, tra i quali aoTuV appare come il più efficiente. Trattandosi di un
algoritmo di compressione lossy, cioè a perdita di informazioni, è l'encoder a svolgere il
compito più delicato in assoluto, dovendo scegliere quale parte di informazione acustica
sacrificare.
Vorbis è un algoritmo dall'approccio pesantemente VBR, ovvero a bit rate estremamente

variabile in base al tipo di segnale sonoro che è chiamato a codificare. Per questo motivo
al posto di riferirsi al valore di kbit/s Xiph.Org raccomanda di usare la nomenclatura q,
ovvero il livello di qualità con cui è stato eseguita la codifica. Il primo encoder ufficiale
prevedeva livelli di qualità da q0 a q10, sotto forma di numeri interi. È stato in seguito
aggiunto il livello di qualità q-1, tipicamente paragonato ai 45 kbit/s, e addirittura un livello
q-2 di circa 32 kbit/s nell'encoder aoTuV. Contestualmente il livello di qualità è stato
convertito in un numero reale.
Tuttavia, a causa del citato approccio a bitrate variabile, l'encoder non è in grado di fornire
alcuna garanzia di coerenza tra il bit rate nominale associato al livello di qualità selezionato
e il bit rate medio finale effettivo risultante dalla compressione.
Vorbis è un algoritmo nato in concomitanza al contenitore multimediale Ogg e con questo

spesso confuso, principalmente a causa:
• dell'iniziale sovrapposizione dei due progetti;

• dell'estensione associata ai file Vorbis (.ogg);
• del MIME-Type associato ai file Vorbis (application/ogg);
• del lungo periodo necessario a sviluppare codec alternativi a Vorbis che potessero
approfittare del medesimo container Ogg, chiarendo le finalità generiche di
quest'ultimo.
Di fatto l'unico modo di fruire di una traccia audio codificata in Vorbis è incapsularla in un
file Ogg, producendo un cosiddetto Ogg Vorbis. Le due tecnologie operano all'unisono ma
a livelli di astrazione diversi.
WMA
Il Windows Media Audio (WMA) è uno standard per file audio inventato dalla Microsoft. I
file con estensione WMA sono file di tipo Advanced Systems Format (.asf) il cui audio è
compresso con il codec WMA. L'unica differenza tra i due formati, al di là delle estensioni,
è il tipo MIME, che per gli .asf è video/x-ms-asf e per i .wma è audio/x-ms-wma. A parte
questo, la struttura di base dei due file è identica.
Il WMA è un formato proprietario che può essere riprodotto e masterizzato su CD-ROM

esclusivamente con il software Windows Media Player, compatibile con il solo sistema
operativo Windows.
Non essendovi versione del player per Linux e Macintosh, il .wma non può essere ascoltato
in questi sistemi operativi.
Windows Media Audio, insieme all'omonimo Player, è ormai giunto alla versione 9.0.Il
formato è dotato di una libreria di codec con una resa qualitativa superiore del 20%
rispetto alla versione precedente.
I codec sono ben ottimizzati per la compressione/decompressione dei contenuti e la

conversione da analogico a digitale.
Dolby Digital AC3
Il Dolby Digital è un sistema di codifica cosiddetto "lossy", ovvero in cui la codifica audio
avviene con perdita di informazioni.
Il sistema prende in input segnali audio digitali PCM, codificati a 48.000 Hz di frequenza di
campionamento e 16 bit di risoluzione, li trasforma analizzandoli nel dominio della fre-
quenza, per poi scartare parte dei dati riducendone la risoluzione effettiva ed innalzando il
livello del rumore digitale. Tutta l'operazione viene eseguita cercando il più possibile di
mantenere la soglia del rumore (di quantizzazione) al di sotto del livello udibile, utilizzando
metodi di analisi di tipo "psicoacustico". L'idea è che la risoluzione effettiva con cui l'appa-
rato uditivo umano è in grado di percepire uno o più suoni, varia dinamicamente con il
contenuto del segnale (musicale) composto. Un tono perfettamente udibile come tono
puro, può essere completamente "inudibile" se mascherato da un tono vicino, magari di
intensità superiore.
Il sistema di compressione psicoacustica utilizzato dal Dolby Digital si chiama AC3. Un

segnale audio mono PCM lineare (quindi non compresso) a 48 kHz/16 bit, richiede 768
kbps per essere codificato, pertanto un segnale stereo di questo tipo necessiterebbe di
1536 kbps, e un segnale a 5 canali di 3840 kbps. L'AC3 permette di ridurre questi valori
anche di un fattore superiore a 10, richiedendo circa 400 kbps per codificare audio 5.1, e
meno di 200 kbps per codificare audio stereo. Tanto maggiore è il fattore di compressione,
ovviamente, tanto maggiore è la probabilità che il livello di rumore introdotto a causa della
perdita di informazioni diventi udibile, causando artefatti di varia natura. Per questo
motivo, tanto maggiore è il bitrate utilizzato per la codifica tanto migliore sarà l'aderenza
alla qualità dell'audio originale non compresso che ci si può aspettare.
APE Monkey’s Audio
Monkey's Audio è uno dei più potenti e diffusi algoritmi di compressione multimediale
lossless per file sonori.
Il formato lossless, ovvero senza perdita di dati, garantisce il mantenimento della qualità
sonora iniziale su file di dimensioni inferiori ai formati a campioni in-compressi (es. wav).
Il formato utilizzato è il ".ape", Monkey's Audio permette la compressione di un sorgente
WAV in ape e anche il procedimento opposto, ovvero la decodifica da ape ad altri formati
come il WAV o l'MP3.
Meridian MLP
La Meridian Lossless Packing è una tecnica proprietaria di compressione audio dei dati di
Pulse-Code Modulation senza perdita d'informazione (lossless), sviluppata dalla Meridian
Audio. L'MLP è lo standard utilizzato per la compressione dei contenuti DVD-Audio e per-
mette, solitamente, una compressione con un fattore di 2:1. Tutti i lettori DVD-Audio sono
equipaggiati con il relativo codec, mentre il suo utilizzo sul singolo DVD è a discrezione del
produttore.
È conosciuto anche con il nome di Packed PCM (PPCM) e, con l'avvento dei DVD di nuova
generazione, prenderà il nome di Dolby TrueHD, aggiungendo un campionamento a
frequenze più elevate, maggior bit rate, 8 canali, metadata completi, il nuovo formato
proposto dalla Society of Motion Picture and Television Engineers (SMPTE) ed il timecode.
MusePack MPC
Musepack (o MPC) è un formato di compressione audio open source a perdita di dati

(lossy). Presenta molte analogie con lo standard MP3, ma la sua qualità è migliore a parità
di bitrate. È noto anche come MPEGplus, MPEG+ o MP+. I codec sono disponibili sulle
piattaforme Microsoft Windows, Linux e Mac OS X, assieme ai plugin per un buon numero
di programmi.
Musepack è ottimizzato principalmente per l'encoding con un bitrate di 175-185 kb/s.
Pochissimi miglioramenti sono stati fatti per i bitrate inferiori (come 128 kb/s). Nonostante
tutto, numerosi test hanno verificato una buona resa in tutti i livelli di bitrate.
FLAC
FLAC (Free Lossless Audio Codec) è un diffuso codec audio libero di tipo lossless, cioè
senza perdita di qualità. A differenza delle codifiche lossy (come l'ogg vorbis, l'MP3 o
di massa. Il formato FLAC è attualmente supportato da una buona parte dei software
audio.
FLAC diversamente dalla maggior parte degli algoritmi di compressione lossless (come ad
esempio ZIP e gzip), raggiunge compressioni importanti, dell'ordine del 30-50% contro il
10-20% raggiunto da quelli tradizionali. Con algoritmi lossy si raggiungono senza difficoltà
riduzioni molto più estreme, a discapito di una perdita di qualità sonora nettamente udibile
anche con sistemi di riproduzione audio non professionali.
Il 29 gennaio 2003 Xiphophorus (adesso Xiph.Org Foundation) ha annunciato l'inclusione
del FLAC fra i propri progetti, insieme con Ogg Vorbis, Ogg Theora e Speex.
A partire dal mese di Dicembre 2008 la prestigiosa casa discografica Deutsche
Grammophon, che sin dai primi anni del '900 pubblica esclusivamente musica classica, ha
iniziato a rendere disponibili, per il download a pagamento, i propri titoli in formato flac.
RealAudio
Il RealAudio è un formato audio proprietario sviluppato da RealNetworks. La prima

versione di RealAudio venne realizzata nel 1995.
L'ultima versione, RealAudio 10.5, è stata rilasciata nel corso del 2006.
Utilizza vari tipo di codec audio, con bitrate da livelli molto bassi a livelli di buona qualità.
Viene usato anche per lo streaming audio.
ATRAC
ATRAC (Adaptive Transform Acoustic Coding) è un sistema di registrazione audio

compresso del tipo lossy impiegato nel Minidisc che tiene conto di fenomeni psicoacustici
quali l'effetto di mascheramento e la soglia di udibilità. È una famiglia di algoritmi di
compressione audio di tipo lossy proprietaria sviluppata da Sony.
Nel tempo i codec utilizzati da tale formato sono stati evoluti e migliorati ed oggi
comprendono ATRAC3 (sviluppato nel 1999), ATRAC3plus (2002) e ATRAC Advanced
Lossless (2006).
Oggi ATRAC viene ancora supportato da molti riproduttori audio realizzati dalla stessa
Sony.
Speex
Speex è un codec open source per la compressione del parlato sviluppato per non
infrangere alcun brevetto software. La sua distribuzione è regolata dalla Licenza BSD e
può essere usato in flussi in formato Ogg oppure trasmesso direttamente usando
UDP/RTP.
Il codificatore Speex usa il formato bitstream Ogg, ed i suoi progettisti vedono il proprio
progetto come complementare a Vorbis un codec di compressione audio di uso generico.
CELP
Codebook Excited Linear Prediction (CELP) è un algoritmo di codifica vocale proposto in

origine nel 1984 da M.R. Schroeder e B.S. Atal. Alla sua introduzione, migliorò
notevolmente la qualità dei vocoder a bassi bitrate presenti, tra i quali ricordiamo l'LPC. È
presente in parecchie varianti: le più importanti sono ACELP, RCELP, LD-CELP e VSELP. Gli
algoritmi di codifica di tipo CELP sono i più diffusi oggigiorno per la voce.
G.729
G.729 è l'identificativo di una raccomandazione ITU-T che standardizza un algoritmo di

compressione audio per la voce per l'impiego nella telefonia.
È utilizzato soprattutto nel Voice over IP (VoIP) grazie ai suoi requisiti di banda.
Normalmente una trasmissione in G.729 utilizza un pacchetto IP con header IP/UDP/RTP.
Nelle applicazioni software spesso l'algoritmo ha una sample period di 20ms. Questo
significa che vengono generati due campioni di 10ms, di 10byte ciascuno. I due campioni
vengono quindi inviati in un pacchetto IP/UDP/RTP con un header non compresso di
40byte. Considerando le reti oggi in uso, di tipo XDSL o Ethernet, un canale G729 a 8kbps
può spesso occupare 26kbps di banda o superiore, a meno di non usare degli
accorgimenti.
Tabella riassuntiva
Compressione ISO/IEC MJPEG · Motion JPEG 2000 · MPEG-1 · MPEG-2

Video · MPEG-4 ASP · MPEG-4/AVC
ITU-T H.120 · H.261 · H.262 · H.263 · H.264
Altri AMV · AVS · Bink · Dirac · Indeo · Pixlet · Real-
Video · RTVideo · SheerVideo · Smacker ·
Snow · Theora · VC-1 · VP6 · VP7 · WMV
Compressione ISO/IEC MPEG-1 Layer III (MP3) · MPEG-1 Layer II ·

audio MPEG-1 Layer I · AAC · HE-AAC · HE-AAC v2
ITU-T G.711 · G.722 · G.722.1 · G.722.2 · G.723 ·
G.723.1 · G.726 · G.728 · G.729 · G.729.1 ·
G.729a
Altri AC3 · AMR · Apple Lossless · ATRAC · FLAC ·

iLBC · Monkey's Audio · μ-law · Musepack ·
Nellymoser · OptimFROG · RealAudio · RTAudio
· SHN · Siren · Speex · Vorbis · WavPack · WMA
· TAK
Compressione ISO/IEC/ITU-T JPEG · JPEG 2000 · lossless JPEG · JBIG · JBIG2
dell'immagine · PNG · WBMP
Altri BMP · GIF · ICER · ILBM · PCX · PGF · TGA ·
TIFF · JPEG XR / HD Photo
Contenitori Impiego gene- 3GP · ASF · AVI · Bink · DMF · DPX · FLV · Ma-
multimediali rico troska · MP4 · MXF · NUT · Ogg · Ogg Media ·
QuickTime · RealMedia · Smacker · RIFF · VOB
Solo audio AIFF · AU · WAV · BWF · RF64

Introduzione Audio

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Introduzione Audio

Caricato da

Copyright:

Formati disponibili

Arcangelo Monetti Introduzione all’Audio

Arcangelo Monetti - berto

Componenti attivi ....................................................................................................76

Connettore Jack .................................................................................................145

Per approfondimento, consiglio caldamente di iniziare con it.wikipedia.org

L’approccio all’argomento è generalista e volutamente non approfondito, in maniera tale

La gamma di frequenze acute, generalmente il limite inferiore è pari a 1000Hz.

La quantità di corrente che scorre in un circuito se applichiamo la tensione di 1 Volt e la

Un apparecchio che incrementa l'ampiezza del segnale applicato al suo ingresso.

La misura dell'ampiezza di un segnale; normalmente viene misurato in V o in dB.

Analizzatore di spettro in tempo reale

Qualsiasi apparecchio che richiede di un'alimentazione per funzionare.

La gamma di frequenze gravi, generalmente il limite superiore è pari a 100Hz.

Un componente in cui l'impedenza scende con l'aumentare della frequenza.

Un materiale che non oppone resistenza al passaggio della corrente.

Un'equalizzatore progettato per mantenere costante la banda passante al variare dell'am-

Corrente alternata (AC)

Decibel (abbreviato dB)

La capacità di un'amplificatore di gestire correttamente il carico al fermarsi del segnale. Il

La frequenza in un segnale in cui si ha il picco di intensità, sia esso minimo o massimo.

Impedenza (misurata in Ohm).

La resistenza che un componente oppone al passaggio della corrente alternata

L'area di frequenze comprese tra i punti a —3 dB di un filtro passa-banda.

Gamma di lavoro di un componente elettronico.

L (Misurata in milliHenry, mH).

L'induttanza elettrica (p.es.: della bobina mobile dell'altoparlante).

LED Light-Emitting Diode.

Un piccolo semiconduttore capace di emettere luce istantaneamente. Non produce calore

Pink Noise — Rumore rosa

Potenza (misurata in Watt RMS).

La frequenza in cui si ha un'attenuazione di 3 dB. Indica l'inizio o la fine di una risposta in

Fattore di qualità di un filtro. Rappresenta il rapporto tra la larghezza di banda e la fre-

Resistenza in DC (Re) (misurata in Ohm).

La reale resistenza di un'altoparlante misurata con un normale voltmetro. Normalmente è

Risonanza in aria libera (Fs o Fo) (misurata in Hz).

La frequenza in cui l'altoparlante presenta la massima efficienza senza essere inserito in

Senso convenzionale di scorrimento della corrente

Sound Pressure Level (SPL)

La misura della pressione sonora, espressa in dB o in dBA (lineare o equalizzata secondo

SPLo (misurato in dB).

L'efficienza di riferimento di un'altoparlante o di una cassa acustica misurata ad 1kHz ad

Piccolo altoparlante adatto a riprodurre le frequenze acute.

Vas (misurato in litri o piedi cubi).

L'unità di misura della tensione elettrica (V)

Normalmente un altoparlante di grande diametro adatto a riprodurre le frequenze basse.

La pressione sonora è la variazione di pressione rispetto alla condizione di quiete

La pressione sonora può essere misurata usando un microfono (misura in aria), un

1 bar 100 000 Pa

Pressione atmosferica su Plutone (approssimativo) 0,5 Pa

Si può distinguere il concetto di suono da quello di rumore. Il suono è in generale una

Il rumore è comunemente identificato come una sensazione uditiva sgradevole e fastidiosa

Il rumore è un segnale di disturbo rispetto all'informazione trasmessa in un sistema.

Come i suoni, il rumore è costituito da onde di pressione sonora.

Il rumore è prodotto da innumerevoli fonti naturali ed artificiali. In generale le sorgenti di

• corpi solidi oscillanti;

• colonne d'aria oscillanti;

• corpi in movimento rapido;

• gas rapidamente fuoruscenti;

• incrementi rapidi di pressione;

• la voce umana, complicata combinazione di corpi solidi oscillanti e colonne d'aria

Il Bel e il suo sottomultiplo decibel sono unità di misura di tipo logaritmico: le

il livello di pressione sonora viene definito invece come dBSPL

SPL = 20 * log10 (P/P0)

che non è il rapporto in dB fra la pressione sonora p e la pressione sonora