AUDIO
Introduzione ai concetti fondamentali
Febbraio 2010
1
Arcangelo Monetti Introduzione all’Audio
Sommario
Sommario.....................................................................................................................2
Sommario.....................................................................................................................2
Prefazione....................................................................................................................6
Glossario di base...........................................................................................................7
Fisica acustica.............................................................................................................14
Acustica..................................................................................................................14
Suono.....................................................................................................................15
Rumore...................................................................................................................16
Intensità: decibel.....................................................................................................17
Percezione...............................................................................................................19
RMS, valore efficace.................................................................................................22
Le onde ed il contenuto armonico.............................................................................23
inviluppo.................................................................................................................26
Timbro....................................................................................................................28
Rumore e contenuto spettrale...................................................................................29
Ottave e suddivisioni................................................................................................31
La musica ed i relativi termini...................................................................................32
Altezza ................................................................................................................32
Armonici..............................................................................................................33
Velocità................................................................................................................39
Direttività.............................................................................................................40
Dinamica.................................................................................................................41
Dinamica e spettro acustico: esempi......................................................................42
Riflessioni in ambiente.............................................................................................45
Riverbero ed Eco..................................................................................................47
Effetto Larsen..........................................................................................................49
Isolamento..............................................................................................................51
Fisiologia e psicoacustica ............................................................................................53
L’orecchio................................................................................................................53
La percezione..........................................................................................................55
Il suono...................................................................................................................57
Il rumore.................................................................................................................59
La percezione sonora...............................................................................................59
Psicoacustica...........................................................................................................62
Mascheramento....................................................................................................64
I domini, le ontologie e le interpolazioni.................................................................66
Pareidolie.............................................................................................................67
Audio analogico...........................................................................................................69
Dal realistico al finto................................................................................................69
Complessità e qualità...............................................................................................70
Elettronica di base...................................................................................................71
Tensione..............................................................................................................71
Corrente .............................................................................................................71
Impedenze ..........................................................................................................73
Circuiti.................................................................................................................74
Macchine elettriche: Trasformatori ........................................................................75
2
Arcangelo Monetti Introduzione all’Audio
3
Arcangelo Monetti Introduzione all’Audio
4
Arcangelo Monetti Introduzione all’Audio
MP3 ..................................................................................................................202
AAC MPEG-4.......................................................................................................203
OGG-Vorbis........................................................................................................204
WMA..................................................................................................................205
Dolby Digital AC3................................................................................................206
APE Monkey’s Audio............................................................................................207
Meridian MLP......................................................................................................207
MusePack MPC...................................................................................................207
FLAC..................................................................................................................207
RealAudio...........................................................................................................208
ATRAC...............................................................................................................208
Speex................................................................................................................208
CELP..................................................................................................................209
G.729.................................................................................................................209
Tabella riassuntiva..............................................................................................210
5
Prefazione
Questo manuale nasce dalla necessità, alcuni anni or sono, di formare alcuni colleghi sulle
tematiche dell’audio in senso generale, spaziando dalla fisica alla fisiologia all’elettronica
analogica e digitale, in modo tale da predisporre un substrato culturale minimo e comune
per la successiva preparazione sul campo nelle problematiche legate all’acquisizione ed
elaborazione analogica e digitale del segnale audio, in particolare del parlato umano.
Del corso tenuto a suo tempo mi erano rimasti solo alcuni appunti e l’indice; ho ritenuto
interessante preparare questo manuale che penso possa essere utile a chi, con minime
basi, decide di interessarsi all’argomento senza dover necessariamente conseguire una
laurea.
Parte dei testi sono ripresi da siti internet ed ho ritenuto inutile nasconderlo modificandoli
ad arte. Sicuramente questo testo contiene inoltre svariati errori ed imprecisioni e non
vuole in nessun caso sostituire i testi veri che si possono consultare sui vari argomenti.
Alti
Ampere
La carica elettrica di base che indica quanta corrente scorre in un circuito elettrico.
Amplificatore
Un apparecchio che genera un gran segnale in uscita avendo al suo ingresso un piccolo
segnale.
Ampiezza
Un apparecchio che su un display può visualizzare l'intensità delle varie frequenze costi-
tuenti lo spettro audio, spesso sostituito da un personal computer. Per rilevare l'acustica
dell'ambiente si usa un microfono e come segnale il rumore rosa. Con esso è possibile in-
crementare notevolmente le performance di qualsiasi sistema modificando l’acustica com-
plessiva per la massima linearità.
Attivo
Bassi
Bass Reflex
Un sistema di diffusore che utilizzando un tubo od una porta accordata, permette all'aria
all'interno della cassa di rinforzare l'emissione dell'altoparlante principale, mediante riso-
nanza (accordo). Può essere chiamata anche vented o ported.
Capacità
E' chiamato anche condensatore. Normalmente è usato nei crossover come filtro passa-
alto. Può essere usato per immagazzinare energia.
Conduttore
Constant Q / Q- costante
Una corrente prodotta quando gli elettroni si muovono prima in una direzione e poi nell'al-
tra. Il segnale musicale di qualsiasi tipo è d'origine alternata (AC)
Corto circuito
Un punto di un circuito che è posto a massa (nella accezione normale, ma vale per ogni
tipo di connessione occasionale) in maniera anomala. Ciò, se riguarda un segnale di infor-
mazione blocca la leggibilità del segnale, se invece riguarda un’alimentazione può causare
un forte passaggio di corrente con conseguente surriscaldamento e bruciature se non si
protegge l'alimentazione con dei fusibili.
l'unità di misura per descrivere un'intensità di segnale o di livello audio. Lavora in scala lo-
garitmica, ed un incremento di 3 dB, significa un aumento del doppio, un aumento di 6
dB, un incremento del quadruplo, ecc. E' 1/10 di un Bel, dove il Bel è il logaritmo del rap-
porto tra due valori.
Distorsione
Qualsiasi differenza apportata alla forma del segnale originario, dopo che questo è passato
attraverso i sistemi d'amplificazione.
Dinamica
La differenza (in Decibel) tra il segnale più basso ed il più alto che un sistema può ripro-
durre o che un brano musicale contiene. Nel caso di un sistema completo è la differenze
tra il rumore di fondo e la massima potenza erogata dall'amplificatore. Nel caso di una re-
gistrazione, è la differenza tra il rumore di fondo e la massima quantità di segnale che il
supporto usato può accettare.
Efficienza
Generalmente s'intende come efficienza il rapporto tra l'energia totale applicata e l'energia
prodotta. E' espressa in percentuale. Un altoparlante normalmente ha un'efficienza molto
bassa, che va dal 1% al 3%. Significa che tra il 97% ed il 99% della potenza è dissipato in
calore. Se si aggiunge a questo l’efficienza dell’intera catena di riproduzione il valore scen-
de ancora.
Equalizzatore
E' un nome utilizzato per definire un controllo di tono multiplo, che può operare anche per
correggere (equalizzare) i difetti acustici di una catena di riproduzione.
F3 (misurata in Hz).
La frequenza in cui la potenza del sistema si dimezza, ed indica anche il limite minimo ri-
producibile; espressa anche nella forma (più corretta): f(-3dB)
Fattore di smorzamento
Filtro passa-banda
Un filtro (attivo o passivo) che permette il passaggio solo di determinate frequenze, atte-
nuando quelle inferiori e superiori.
Frequenza centrale
Ground Loop
Indica quando due o più componenti elettronici sono connessi a masse con diversi poten-
ziali. Quando questo accade, la leggera differenza di potenziale tra i due apparecchi gene-
ra dei fastidiosi ronzii e rumori.
Hertz (Hz)
L' unità di misura della frequenza. Un Hertz è uguale ad un ciclo di una semionda per se-
condo
A volte detto subsonico. Sono le frequenze al di sotto dei 20Hz, sono inudibili dall'orecchio
umano, ma causano il movimento accentuato e visibile dei subwoofer.
Larghezza di banda
Massa
Questo termine indica il potenziale zero di un circuito elettrico. Una buona massa è fonda-
mentale per le corrette prestazioni del sistema, come erogazione di potenza e assenza di
disturbi.
Microfono di misura
Uno speciale microfono progettato per rilevare la risposta in frequenza. La sua risposta è
per quanto possibile piatta. Eventuali irregolarità sono compensate da un'equalizzazione
nel sistema di misura.
Ottava
E' un metodo utilizzato per suddividere lo spettro audio, di derivazione musicale, ed indica
un intervallo di frequenze pari alla distanza (in Hz) tra una frequenza data ed il suo doppio
(es. 440Hz e 880Hz).
Parametrico
Una tipologia di equalizzatore dove si può intervenire sia come regolazione della frequenza
sia come ampiezza della stessa. E' normalmente usato su sistemi professionali, viste le
prestazioni, la versatilità e la complessità nell'uso pratico, normalmente sostituito con
equalizzatori grafici.
Passivo
Un componente che non richiede d'alimentazione. Normalmente presenta una perdita sul
segnale manipolato
Perdita di linea
La quantità di segnale persa a causa di componenti passivi sulla linea del segnale, quali
crossover passivi o resistenze d'attenuazione
E' un segnale dove sono riprodotte tutte le ottave dello spettro audio con la stessa intensi-
tà, ovvero con un decadimento di 3dB per ogni ottava in livello. E un segnale fondamenta-
le per la taratura e la messa punto dei sistemi audio con l'aiuto di un analizzatore di spet-
tro in tempo reale.
Per quanto riguarda gli amplificatori, è normalmente misurata al clipping (ovvero alla mas-
sima elongazione del segnale in uscita, quando le creste del segnale sono tosate) o ad un
distorsione nota (es. 10%) e su un carico dato (es. 8Ohm resistivi). Per gli altoparlanti è la
potenza continua che una bobina mobile immersa nel suo campo magnetico, riesce a dissi-
pare senza danneggiarsi.
Punto a -3dB
Resistenza
Ciò che oppone resistenza al passaggio della corrente elettrica in un circuito, si misura in
Ohm Ω.
Un materiale che secondo i casi si può comportare sia come un conduttore, sia come un
isolante. Sono i componenti strutturali dei normali componenti elettronici attivi (transistor).
Il senso che la corrente assume quando deve scorrere da un punto d'alto potenziale ad un
punto con il potenziale inferiore. E’ il contrario del flusso elettronico della corrente.
Serie
Un circuito dove i componenti sono collegati uno dopo l'altro come in una catena.
Serie-Parallelo (altoparlanti)
La connessione di componenti sia in serie sia in parallelo tra loro, allo scopo di aumentare
la tenuta in potenza rispetto al singolo componente (a parità di impedenza complessiva).
Tensione effettiva
Un valore di tensione di un segnale in AC che abbia gli stessi effetti di un'equivalente ten-
sione in CC. Conosciuta anche come RMS (Root Mean Square).
Tweeter
Volume Acoustic Suspension. E' il volume dell'aria che ha la stessa cedevolezza delle so-
spensioni di un'altoparlante.
Volt
Watt
L'unità di misura per la potenza elettrica. 1 W, per definizione, si ha quando in un circuito
scorre una corrente di 1 A con una tensione di 1 V.
Woofer
Acustica
L'acustica (dal greco ἀκούειν, "udire") è quella branca della fisica che studia il suono, le
sue cause - le onde di pressione -, la sua propagazione e la sua ricezione. In un'accezione
più generale, l'acustica comprende anche lo studio degli infrasuoni e degli ultrasuoni, che
non sono percepibili dall'uomo attraverso l'udito, ma si comportano - da un punto di vista
fisico - nello stesso modo.
Più in generale, si intende talvolta con acustica lo studio delle vibrazioni meccaniche nei
mezzi materiali.
L'unità di misura del Sistema Internazionale della pressione sonora è il Pascal (simbolo
Pa). La pressione sonora istantanea è la variazione di pressione p0 causata da un'onda
sonora in un certo istante e in un certo punto dello spazio. La pressione sonora efficace è
il valore efficace, cioè la media quadratica della pressione sonora istantanea su un dato
intervallo di tempo.
1 Pa = 1N / m2
Livelli di pressione
Suono
Il suono (dal latino sonus) è la sensazione data dalla vibrazione di un corpo in oscillazio-
ne. Tale vibrazione, che si propaga nell'aria o in un altro mezzo elastico, raggiunge l'orec-
chio che, tramite un complesso meccanismo interno, è responsabile della creazione di una
sensazione "uditiva" direttamente correlata alla natura della vibrazione.
Come tutte le onde, anche quelle sonore sono caratterizzate da una frequenza (che nel
caso del suono è in diretta, ma non esclusiva, relazione con la percezione dell'altezza) e
un'intensità (che è in diretta, ma non esclusiva, relazione con il cosiddetto "volume" del
suono). Inoltre, caratteristica saliente delle onde sonore è la forma d'onda stessa, che ren-
de in gran parte ragione delle differenze cosiddette di timbro che si percepiscono tra diver-
se tipologie di suono.
L'orecchio umano è più sensibile agli stimoli acustici le cui frequenze siano comprese fra i
16 Hz e i 20 kHz; nella realtà quotidiana la maggior parte degli umani occidentali, giovani
ed in buona salute, hanno una banda uditiva compresa tra 80Hz e 15KHz ed una soglia
uditiva di +20dB.
Per fenomeni periodici si può operare con il concetto di onda e quindi di lunghezza d’onda,
fase, frequenza, periodo, etc.
Rumore
Intensità: decibel
Il decibel (simbolo dB) è un decimo di Bel (simbolo B) : 10dB = 1B. Il Bel è ormai caduto
in disuso, ma rimane l' unità di misura fondamentale da cui il "deciBel" deriva.
in acustica, si definisce il livello di intensità acustica (Intensity Level, IL) come rapporto in
dB fra il flusso di energia I e il flusso I0 della soglia di udibilità, pari a 20μPa = 20x10-6
Pa, ovvero 10-12 W/m2 (una zanzara a 3 metri).
IL = 10 * log10 (I/I0)
Si noti che la massima pressione in aria è pari a 194dB (livello di saturazione delle
molecole); livelli superiori sono possibili solo in presenza di una atmosfera modificata
(p.es.: particelle d’acqua o vulcaniche).
Il livello fissato come 0dB spl (minimo rumore percettibile) è purtroppo molto inferiore alla
normale sensibilità degli umani.
La percezione del suono da parte dell’uomo è funzione della pressione acustica (intensità)
e della frequenza del fenomeno.
Un’oscillazione del campo acustico, di tipo regolare e periodico, produce una variazione
della pressione con forma sinusoidale.
Ricordando la trigonometria, equivale alla visione del percorso di un oggetto sul bordo di
una circonferenza vista in prospettiva.
• valore di picco
• valore efficace o RMS
• valore medio
Il rapporto tra valore di picco, efficace, RMS e medio dipendo dalla forma dell’onda
analizzata.
RMS, valore efficace
Per segnali sinusoidali, il valore efficace equivale al valore che avrebbe una corrente
continua che causasse gli stessi effetti termici del valore considerato.
che mette in relazione il valore efficace Ieff con il valore di picco Imax.
Le onde ed il contenuto armonico
La sovrapposizione di onde crea una risultante pari alla sommatoria dei livelli puntuali.
Onda quadra pura (con le due semionde pari al 50%): solo le armoniche dispari
Per avere la sensazione del suono, si immagini un clarino o una chitarra elettrica.
Onda triangolare regolare: tutte le armoniche, di intensità esponenzialmente
decrescente
Onda a dente di sega: armoniche pari e dispari ad intensità ognuna pari alla metà della
precedente.
Per avere un’idea del suono risultante si immagini il suono di un organo a canne.
Onda a dente di sega semplificata (fondamentale e due armoniche)
La variazione di intensità è definita come inviluppo, ovvero come insieme delle tangenti
alle curve di intensità.
L’inviluppo è quindi la forma esteriore del livello del suono nel corso del tempo.
Il timbro, invece, è correlato sia al contenuto spettrale:
Ampiezza
Mediante l’analisi FFT (trasformata veloce di Fourier, Fast Fourier Transform) si può avere
visione del contenuto spettrale di un suono.
La visualizzazione in terzi d’ottava permette una visione intuitiva dell’energia nel dominio
delle frequenze.
Rumore rosa: livelli decrescenti di -3dB per raddoppio di frequenza (ottava) = energia
costante
Rumore marrone: livelli decrescenti di -6dB per raddoppio di frequenza (ottava)
32 Non udibile
64
120 Bassi
250 Medio-bassi
500 Medi
1000 Medio-alti
2000 Alti
4000
8000
16000 Non udibile
In relazione ai suoni ed alla loro altezza (frequenza), sono molti i termini usati nella
terminologia corrente mutuati dalle fenomenologie luminose; si veda ad esempio, scuro /
chiaro = basso / alto (riferito a tono, frequenza) = grave / acuto = caldo / freddo, etc.
Per i paralleli tra suono e colore, tra acustica e luce, si vedano i vari scritti di diversi autori
in merito.
Tra i più noti autori, possiamo ricordare Isaac Newton, Johann Wolfgang von Goethe,
Vasilij Vasil'evič Kandinskij e Arthur Schopenhauer.
Il più noto degli scritti è Della Teoria dei Colori (in tedesco Zur Farbenlehre) che è un
saggio scritto da Johann Wolfgang von Goethe nel 1810.
La musica ed i relativi termini
La teoria musicale è la parte della musica che specifica il modo di descrivere suoni,
(consistenti in onde sonore di compressione di un mezzo trasmissivo - che in genere è
l'aria) e descrive le relazioni tra i suoni e la percezione degli ascoltatori (lo studio di come
gli esseri umani interpretano i suoni è chiamato invece psicoacustica).
Spesso gli aspetti fondamentali del suono e della musica sono descritte come altezza,
durata, intensità, e timbro.
Altezza, intensità, timbro e durata sono in realtà quattro parametri del suono, ai quali va
aggiunto il quinto che è la sonorità, ovvero quello che consente al suono di esistere,
mentre l'altezza gli consente di essere notato, l'intensità di essere annotato, il timbro di
essere connotato e la durata di essere denotato.
Altezza
Il la è la sesta nota musicale nella scala diatonica di do, l'unica scala maggiore priva di
diesis e di bemolle.
La frequenza del la sopra il do centrale (la4) è definita per convenzione a 440 hertz, valore
stabilito dalla conferenza internazionale di Londra del 1939. In precedenza, si usavano
spesso le frequenze di 432 e 435 hertz, ma a seconda del luogo, del periodo e del tipo di
musica il la4 poteva variare tra i 415 e 445 hertz, andando a toccare quindi anche
l'odierno la bemolle.
Nella notazione in uso nei paesi di lingua inglese e tedesca, il la corrisponde alla nota A.
Armonici
Gli armonici naturali sono i suoni (ipertoni) emessi in genere dagli strumenti.
Secondo 2f=L/2
Terzo 3f=L/3
Quarto 4f=L/4
Quinto 5f=L/5
Sesto 6f=L/6
Settimo 7f=L/7
Nell’esempio:
la fondamentale è un DO, seguono: DO (2) , SOL (3) , DO (4) , MI, SOL, SIb, DO, RE, MI,
FA#, SOL, LAb, SIb, SI, DO.
Si noti come le note risultanti dagli armonici siano molto ravvicinate, se poste su un’unica
ottava, fenomeno che può dare origine a fastidiose dissonanze:
Nella teoria musicale e, più specificatamente, in quella del suono, si parla di battimenti in
riferimento all'effetto per l'orecchio umano di due onde sonore, pure posizionate vicine tra
di loro, e di frequenza molto vicina, sempre tra di loro.
Entrando più in dettaglio, conviene fare qualche esempio. Prendiamo una chitarra e
suoniamo ad esempio le due corde più alte, il si e il mi. Il nostro orecchio sente le due
note distintamente, e si accorge che il suono complessivo è anche piacevole all'orecchio.
Supponiamo ora di cominciare a tendere sempre di più la corda del si, per alzarne la
frequenza e arrivare al mi.
Per un po' continueremo a sentire due suoni più o meno armonici. Quando le due corde
avranno la stessa frequenza, sentiremo naturalmente un solo suono; ma subito prima ci
sarà uno strano effetto: cominceremo a sentire un solo suono, ma il suo volume ci
sembrerà cambiare nel tempo, ora più forte e ora più piano.
L’effetto ottenuto è il battimento, ovvero la creazione di una differenza tra due suoni. In
linea generale, il battimento è la composizione di due suoni secondo la definizione:
Come esempio:
Possiamo immaginare la variazione di densità sul piano delle pressioni istantanee nello
spazio e quindi nel tempo.
La lunghezza d’onda “λ”, fissata la frequenza “f” del moto armonico della sorgente,
dipende dal valore della velocità c0 secondo la relazione:
c0
λ =
f
Nella figura osserviamo che la stessa potenza sonora passa attraverso A1, A2, A3, A4, ma
le aree aumentano proporzionalmente al quadrato del raggio.
Questo significa che la potenza del suono per unità di area (intensità sonora)
diminuisce proporzionalmente al quadrato del raggio.
La Legge dell’inverso del quadrato stabilisce che l’intensità del suono in campo libero è
inversamente proporzionale al quadrato della distanza dalla sorgente. Se la distanza
raddoppia, l’intensità si riduce a 1/4; se triplica, l’intensità si riduce a 1/9; se quadruplica,
l’intensità si riduce a 1/16.
Velocità
T in °C a in m/s
−10 325,4
−5 328,5
0 331,5
+5 334,5
+10 337,5
+15 340,5
+20 343,4
+25 346,3
+30 349,2
Direttività
La trasmissione del suono non ideale è funzione delle caratteristiche fisiche dell’emettitore
di suono, della sua forma e della sua interazione con il mezzo trasmissivo, ovvero esiste
sempre una forma di emissione caratteristica, cioè non sferica e non puntiforme (come il
caso ideale).
Organo >75
Orchestra sinfonica 75
Pianoforte 70
Voce umana 60
Complesso rock 30
Registratore magnetico digitale a 16 bit 90
Amplificatore 75
Registratore professionale con Dolby A 75
Disco di acetato 74
Registratore professionale 60
Registratore a cassette con Dolby B 60
Trasmettitore radio FM 55
Disco stampato 50
Registratore a cassette 40
Trasmettitore radio AM 30
Nella figura successiva si vede la coda sonora di un suono in ambiente non rumoroso
dovuto alla persistenza da riverbero; il riverbero diviene quindi rumore d’ambiente a causa
dei suoni prodotti nel locale/ambiente.
Dinamica e spettro acustico: esempi
Si noti che variano sia la dinamiche che il contenuto spettrale nel tempo, rappresentato da
colori che vanno dal bianco, al rosso, all’azzurro al variare del livello di intensità nella
singola banda. Le bande sono rappresentate sulle ordinate ed il tempo sulle ascisse.
Trasmissione del suono, direttività, interferenza.
• una riflessione
• una trasmissione
• un assorbimento
La quantità di ciascuno dei tre valori e la relazione tra di loro dipende dalla forma e dalla
natura del corpo.
quindi l’intensità I incidente è pari all’intensità R riflessa, rispetto alla Normale sul Piano.
In realtà, oltre alle ovvie conseguenze dell’interferenza con il piano, vi sono anche quelle
provocate dalle riflessioni e quindi alla interazione tra l’onda incidente e quella riflessa, che
possono dare origine a fenomeni costruttivi o distruttivi.
analizzando l’interferenza:
Riflessione su curve
Il fenomeno delle interferenze è ancora più evidente nel caso di curve, dove possono
formarsi aree di concentrazione (strutture concave) ed aree di diffusione (strutture
convesse).
Le onde sonore si comportano come tutte le onde incidenti, ovvero con i classici rimbalzi
ed angoli rispetto alla normale.
Il suono, in ambiente chiuso appare, a causa delle riflessioni causate dalle pareti,
provenire da più direzioni e con distanze diverse.
Soffitto
dis tanza
s orgente-ricevitore
S
d
R
Pavimento
S2
d2
Soffitto
S
d
R
Pavimento
d1
S1
Si creeranno quindi delle percezioni di distanze temporali e fisiche (S1, d1, S2, d2),
dipendenti dalla forma dell’ambiente. In base all’assorbimento dell’ambiente avremo quindi
la creazione di una coda sonora, formata dalle riflessioni del suono.
Il secondo suono è d1 che possiede un tempo superiore a d ed una direzione dal basso.
Si noti che il livello non decade in campo riverberante in maniera lineare rispetto alla
distanza –come in campo libero- ma tende ad una costante indipendente dalla distanza
dell’uditore.
Sono definiti ed usati i parametri T20 e T60 ovvero i tempi relativi al livello -20dB e -60dB
rispetto al picco sonoro stimolante una coda di riverbero (norme ISO3382).
• aule: 500-1000millisecondi
• cinema: 800millisecondi
• teatri: 1.3-1.5secondi
• sala di concerto: 1.7-2.3secondi
• chiesa: 8-10secondi
Effetto Larsen
L’innesco può avvenire ad una qualunque frequenza, ma solo nel caso in cui vi sia una
possibilità di risonanza dovuta al sistema (microfono + amplificatore + altoparlante +
ambiente + oggetti + …).
La frequenza di innesco può variare, ovviamente, anche in base alla temperatura del
mezzo, ovvero dell’aria.
IRIFLESSA
IINCIDENTE
ITRASMESSA
IASSORBITA
R=20dB
LI=80dB LT=60dB
Fisiologia e psicoacustica
L’orecchio
L'orecchio esterno è formato dal padiglione auricolare e dal condotto uditivo (meato
acustico). Il padiglione auricolare è costituito da cartilagine rivestita di pelle. La sua
funzione primaria è infatti quella di raccogliere i suoni per convogliarli all'interno del
condotto uditivo. Il condotto uditivo è una galleria dalle pareti lisce, che secerne un
cerume protettivo destinato a trattenere le impurità che entrano nell'orecchio.
Al termine del condotto uditivo si trova il timpano che è una sottile membrana sensibile
alle onde sonore che vengono a infrangersi su di essa. Il timpano trasforma i suoni in
vibrazioni che vengono trasmesse a tre ossicini, i più piccoli del corpo umano: il martello,
direttamente a contatto col timpano, l'incudine e la staffa.
I tre ossicini dell'udito sono contenuti in una cavità che comunica all'esterno attraverso un
piccolo canale lungo 3-4 cm, la Tromba di Eustachio, che sbocca nella faringe. In questo
modo l'orecchio è collegato con la gola, per mantenere in equilibrio la pressione dell'aria al
di là e al di qua del timpano.
I recettori acustici sono posti nella parte membranosa ossea e sono simili ai recettori
dell'equilibrio. Presentano superiormente una membrana che, sotto la pressione
dell'endolinfa –il liquido qui presente-, stimola i recettori. Gli impulsi nervosi provenienti
dalle cellule cigliate e diretti al cervello viaggiano all'interno di fasci di fibre nervose. Il
cervello ha il compito di interpretare i segnali che gli pervengono. Ciò consente di dare un
significato al messaggio sonoro. Infatti esiste una memoria uditiva che ci permette di
riconoscere un rumore o una musica. Ma abbiamo anche la capacità di cancellare segnali
superflui, ad esempio dopo un po' non sentiamo più il rumore di una cascata o il frastuono
del traffico.
La sensazione può essere definita come la modificazione dello stato del nostro organismo
a causa del contatto con l'ambiente.
Gli stimoli offerti dall'ambiente vengono catturati dai nostri organi di senso, ognuno dei
quali adibito alla ricezione di uno stimolo particolare.
Ognuno di essi si avvale per la ricezione dei segnali di specifici organi di senso (gli occhi
ad esempio ci consentono la visione di ciò che ci circonda).
La percezione è definibile come il processo psichico che opera la sintesi dei dati
sensoriali in forme dotate di significato.
Gli assunti allo studio della percezione variano a seconda delle teorie e dei momenti storici
che si susseguono.
La relazione che lega l'intensità dello stimolo alla percezione che si ha di esso è quindi di
tipo logaritmico. Ossia la percezione è proporzionale (secondo un fattore k) al logaritmo
dello stimolo.
Soglie di riferimento. Per ciascuno dei 5 sensi sono definite delle soglie assolute di
percezione:
Per comprendere il mondo circostante si tende a identificarvi forme secondo schemi che ci
sembrano adatti - scelti per imitazione, apprendimento e condivisione - e attraverso simili
processi si organizzano sia la percezione che il pensiero e la sensazione; ciò avviene di
solito del tutto inconsapevolmente.
Queste regole sono utili per spiegare le diverse forme delle illusioni create dalla
percezione come conseguenza di fenomeni fisici.
Il suono
L'orecchio umano può udire i suoni nell'intervallo dai 20 Hz ai 20.000 Hz. Questo limite
superiore tende ad abbassarsi con l'avanzare degli anni: molti adulti non sono in grado di
udire frequenze oltre i 16 kHz.
Possiamo anche dire che la banda utile di persone urbanizzate, di eta media (compresa
tra 20 e 40 anni), è tra circa 80Hz e 15KHz, con una sensibilità non inferiore ai +20dB.
Per poter dare dei riferimenti, ricordiamo che il rombo di un trasformatore di alimentazione
è 50Hz (la frequenza dell’alimentazione elettrica di rete) ed il fischio prodotto dal
trasformatore di riga dei televisori con tubo a raggi catodici è 1525Hz.
Tra gli animali, i cani possono percepire frequenze fino a 40Khz mentre le farfalle sino a
180 KHz.
Nel tratto centrale dell'intervallo delle frequenze udibili l'orecchio ha una risoluzione di
circa 2 Hz: significa che sono percepibili modifiche di un suono in altezza solo se queste
sono maggiori di 2 Hz.
Tuttavia, differenze d'altezza minori sono percepibili in altre maniere: per esempio,
l'interferenza tra due altezze può essere spesso ascoltata come una differenza d'altezza di
bassa frequenza. Questo effetto di variazione di fase sul suono risultante è comunemente
conosciuto come fenomeno dei battimenti.
In altre parole, la maniera in cui l'altezza di un suono che viene percepita è funzione
esponenziale della frequenza. La comune scala musicale di dodici suoni è un esempio:
quando la frequenza fondamentale di una nota è moltiplicata per 21 / 12, il risultato è la
frequenza del semitono successivo in direzione ascendente.
Andare più in alto di dodici semitoni, ovvero di un'ottava, è lo stesso che moltiplicare la
frequenza della fondamentale per 212 / 12, ovvero raddoppiare la frequenza.
La frequenza di una nota che dista n semitoni dalla fondamentale è data dalla formula:
Come risultato si ha che la risoluzione nel riconoscimento della frequenza assoluta viene
giudicata meglio dall'orecchio in termini di semitoni o in cent, cioè in centesimi di
semitono.
Il rumore
Per disturbo si intende un segnale o un processo stocastico (casuale), che non è detto
che sia riferibile al rumore, non determinabile e perturbante la percezione.
La percezione sonora
Il phon in psicoacustica rappresenta il livello di sensazione sonora sulla base del quale
furono rappresentate le curve di isofonia nel diagramma di Fletcher e Munson.
In particolare il phon definisce il livello di pressione sonora che un suono puro di una
determinata frequenza f, deve avere, al fine di provocare la medesima sensazione uditiva
(in termini di intensità del livello acustico) del suono di riferimento alla frequenza di 1 kHz.
Per esempio, il valore della pressione sonora corrispondente alla curva isofonica di 40
phon, per un suono puro con frequenza pari a 1.000 Hz, equivale a 40 dB mentre alla
frequenza di 100 Hz equivale a circa 50 dB.
Nel grafico, ISO 226:2003 (in rosso) raffrontato con le curve originali di Fletcher e Munson
(in blu) e le parti stimate alle alte frequenze (puntinato). Il grafico è in Hz (ascisse) e
dBSPL (ordinate).
Psicoacustica
• Frequenza (Hz)
• Intensità (dBSPL)
• Fase destra/sinistra (φ in gradi °, minuti ’ e secondi ’’)
• Ritardo destra/sinistra (in millisecondi)
In base al tipo di percezione ed alle caratteristiche delle limitazioni sono state introdotte
delle scale di misura che tengono conto delle correlazioni.
Le principale scale di misura usate in psicoacustica sono Mel e Bark.
Mel
La scala Mel, proposta da Stevens, Volkman e Newman nel 1937 è una scala percettiva
che associa una frequenza alla sua percezione. Nelle ascisse abbiamo le frequenze, nelle
ordinate le frequenze percepite. Il riferimento è pari a 1000 Hz a 40 dB, ovvero 1000 mels.
La scala Mel evidenzia gli errori di percezione rispetto alla frequenza.
Bark
La scala Bark, proposta da Eberhard Zwicker nel 1961, analizza le bande critiche
dell’ascolto in psicoacustica, ovvero il limite di riconoscimento tra suoni ravvicinati in caso
di mascheramento (ovvero due suoni percepiti come uno solo).
Un suono leggero emesso appena dopo la fine del suono alto è mascherato da
quest'ultimo.
Persino un suono leggero appena prima di un suono alto può essere mascherato da un
suono alto. Questi due effetti sono chiamati rispettivamente anticipo e ritardo del
temporal-masking (mascheramento temporale).
Conseguenze del mascheramento
Al livello più basso di udibilità, le note gravi possono spesso essere udite chiaramente solo
quando non ci sono altri suoni alla stessa frequenza. La cosa è dovuta al fatto che
l'orecchio opera una sintesi dei suoni a bassa frequenza dalle differenze delle frequenze
armoniche udibili presenti nei suoni in questione.
In alcuni apparecchi commerciali, questo effetto è utilizzato per dare l'impressione di una
risposta estesa alle bassa frequenze quando il sistema non è in grado di riprodurle
adeguatamente.
• mascheramenti in frequenza
• mascheramenti in tempo
• illusioni di suoni inesistenti
• illusioni armoniche, scale infinite
I domini, le ontologie e le interpolazioni
L'uso del termine "ontologia" nell'informatica deriva dal precedente uso dello stesso
termine in filosofia, dove ha il significato dello studio dell'essere o dell'esistere, così come
dalla filosofia sono tratti i concetti fondamentali di categoria e di relazione.
La pareidolia (dal greco είδωλον, immagine, col prefisso παρά, simile) è l'illusione
subcosciente che tende a ricondurre a forme note oggetti o profili (naturali o artificiali)
dalla forma casuale.
Qui vediamo alcuni esempi di percezione visiva deformata, ovvero con illusioni relative alle
distanze, alle proporzioni ed alla forma.
Classici esempi sono la visione di animali o volti umani nelle nuvole, la visione di un volto
umano nella luna oppure l'associazione di immagini alle costellazioni. Sempre alla
pareidolia si può ricondurre la facilità con la quale riconosciamo volti che esprimono
emozioni in segni estremamente stilizzati quali le emoticon.
Fanno parte delle pareidolie i ‘trucchi’ sonori e musicali nati per provocare effetti
particolari nella percezione.
Tra i vari effetti sonori, possiamo ricordare quelli relativi alla percezione di suoni non
presenti nella realtà –apofenie-, dovuti alla interazione ed al battimento oppure l’idea di
presenza del suono che riteniamo più corretto in un certo momento (illusione di presenza
di una fondamentale o di una melodia nascosta).
Tra gli effetti sonori, il più noto è la Scala Shepard, dal nome dello psicologo Roger
Shepard, che l'ha ideata, è un esempio di canone eternamente ascendente. Una
determinata scala viene infatti suonata contemporaneamente su diverse ottave differenti;
inoltre varia anche l'intensità delle scale, in modo che mentre una diminuisce di intensità,
un'altra aumenta. L'effetto è quello di una scala che sale di altezza in modo indefinito.
Il principio della scala di Shepard è stato utilizzato, in musica moderna, ad esempio dai
Pink Floyd, alla fine della suite Echoes contenuta nell'album Meddle e dai Queen in A day
at the races.
Audio analogico
dove:
• k= 1,38 * 10 − 23 W/KHz (costante di Bolzmann);
• R è la resistenza elettrica del conduttore;
• Bn è la banda equivalente di rumore;
• T è la temperatura in kelvin (K)
Nell’elettronica analogica (ma non si compia l’errore di pensare che non vi sia nulla di
analogico in una catena digitale) il rumore è imprescindibile e ineludibile. Inoltre è sempre
presente un grado di distorsione del segnale.
Nei tempi dell’audio analogico era normale ascoltare il suono con una percentuale
rilevante di rumore e distorsione.
Il suono risultante era quindi simile all’originale, ma ne era una rappresentazione
infedele, in quanto affetta da disturbi e distorsioni.
È difficile spiegare con parole un concetto di questo tipo. L’invito che si può fare è di
ascoltare della musica nella realtà (es. un concerto) e di ascoltare una riproduzione.
Complessità e qualità
Tensione
Corrente
La corrente elettrica è un qualsiasi flusso ordinato di carica elettrica, tipicamente
attraverso un filo metallico o qualche altro materiale conduttore. La corrente
convenzionale venne definita inizialmente, nella storia dell'elettricità, come il flusso di
carica positiva, anche se sappiamo, nel caso della conduzione metallica, che la corrente è
causata dal flusso di elettroni con carica negativa nella direzione opposta. Nonostante ciò,
l'originale definizione di corrente convenzionale resta valida. Il simbolo normalmente usato
per la quantità di corrente (la quantità di carica che scorre nell'unità di tempo) è I, e
l'unità di misura nel SI della corrente elettrica è l'ampere. La corrente elettrica viene anche
chiamata intensità di corrente
per i condensatori.
La legge di Kirchhoff delle correnti (LKC o LKI) afferma che, definita una superficie chiusa
che attraversi un circuito elettrico, la somma algebrica delle correnti che attraversano la
superficie (con segno diverso se entranti o uscenti) è nulla.
La legge di Kirchhoff delle tensioni (LKT o LKV) afferma che, in un circuito a parametri
concentrati planare, la somma algebrica delle tensioni lungo una linea chiusa (con il segno
appropriato in funzione del verso di percorrenza della maglia stessa) è pari a zero.
Impedenze
Resistore
Il resistore (comunemente resistenza) è un componente elettrico di enorme importanza
per le sue innumerevoli applicazioni sia in apparecchiature elettriche che elettroniche. I
resistori sono a volte utilizzati per convertire energia elettrica in energia termica.
Nella Teoria dei circuiti il resistore è un componente ideale (resistenza) che risponde, se
lineare, alla legge di Ohm, i resistori non lineari sono essenziali per fare modelli circuitali,
per esempio, degli oscillatori elettronici. Nel mondo reale, i resistori sono dispositivi
multiformi, con caratteristiche e limiti operativi ben determinati.
Induttore
L'induttore è un componente elettrico che genera un campo magnetico al passaggio di
corrente elettrica (continua o alternata od impulsiva).
L'ampiezza della f.e.m. è correlata con l'intensità della corrente e con la frequenza delle
sinusoidi dalla seguente equazione:
Nei circuiti in regime sinusoidale permanente esso determina una differenza di fase di 90
gradi fra la tensione applicata e la corrente che lo attraversa. In queste condizioni di
funzionamento la corrente che attraversa un condensatore ideale risulta in anticipo di un
quarto di periodo rispetto alla tensione che è applicata ai suoi morsetti.
La quantità di resistenza che un condensatore oppone alla corrente alternata è nota come
reattanza capacitiva e dipende dalla frequenza della AC:
Circuiti
Un circuito RC è un circuito elettronico del primo ordine basato su una resistenza e sulla
presenza di un elemento dinamico, il condensatore. A seconda di come sono disposti i due
componenti del circuito RC esso è in grado di filtrare le frequenze basse (filtro passa
basso) oppure quelle alte (filtro passa alto), realizzando un filtro del primo ordine e se
considerato come cella elementare, esso è in grado di comporre filtri del secondo ordine e
via dicendo come il doppio passa basso e doppio passa alto.
In generale, si dice RLC un circuito che contenga solo resistenze (R), induttori (L) e
condensatori (C). Per estensione, viene spesso definito RLC un circuito che contenga
anche altri elementi passivi, ma nessun elemento attivo.
I circuiti RLC sono sistemi lineari, per lo più stazionari (ma non necessariamente). In
particolare, ciò significa che un circuito RLC non può creare frequenze dal nulla: può
eventualmente sopprimerle. Infatti, la nascita di nuove frequenze (distorsione) avviene
soltanto negli elementi attivi e negli elementi non lineari, come diodi e transistor.
In casi particolari, però, alcuni elementi quali induttanze, capacità e trasformatori possono
avere comportamenti non lineari e quindi introdurre distorsioni (ad esempio, per
saturazione del materiale ferromagnetico presente).
Diodo
Dalle curve corrente/tensione possiamo vedere come il passaggio di corrente non è lineare
in funzione della tensione applicata ai capi del componente, e con l’applicazione di una
tensione positiva (piccola a piacere) inizia a condurre in maniera ideale (figura a sinistra).
Nella curva centrale si nota come un componente quasi ideale in quanto comincia a
condurre al raggiungimento della tensione caratteristica (in questo caso, 0,7V).
Il diodo reale, figura a destra, inizia a condurre quando ai suoi capi (anodo e catodo) è
presente una tensione positiva simile alla sua tensione caratteristica o di soglia e assume
un comportamento quasi ideale al raggiungimento della soglia.
Componenti attivi a vuoto
Diodo
L'anodo è polarizzato con un potenziale positivo, mentre il catodo con uno negativo. Il
catodo, riscaldato da un apposito filamento, emette elettroni, che sono particelle di carica
negativa. Quando l'anodo è polarizzato positivamente si avrà che gli elettroni emessi dal
catodo vengono raccolti dall'anodo, creando così un flusso di cariche ovvero una corrente
elettrica. Se polarizzassimo il catodo positivamente e l'anodo negativamente non
riusciremmo più ad ottenere un flusso di cariche dal momento che gli elettroni emessi da
catodo verrebbero respinti dal campo negativo dell'anodo. Il tubo permette quindi alla
corrente di scorrere solamente lungo un verso, e permette quindi il raddrizzamento
elettrico. Nei tubi a potenza più bassa il catodo e il filamento sono elettrodi indipendenti e
isolati elettricamente; Il filamento riscalda il catodo e quest'ultimo emette gli elettroni
coinvolti nella conduzione.
Triodo
Aggiungendo una griglia tra il catodo e l'anodo, come fece per primo Lee de Forest nel
1907, si ottiene il triodo.
Per poter disporre di valvole capaci di amplificare anche segnali in alta frequenza, nel 1927
venne costruito il tetrodo. Ponendo una seconda griglia collegata a massa (la griglia
schermo) tra la griglia controllo e l'anodo, si ottiene uno schermo elettrostatico che
diminuisce la capacità tra anodo e griglia controllo. Il pentodo è, essenzialmente, un
tetrodo con una griglia in più, la griglia di soppressione; questa ha lo scopo di ridurre
l'emissione secondaria e la conseguente distorsione. La terza griglia viene normalmente
collegata al catodo, in genere con un collegamento interno alla valvola, che quindi spesso
ha lo stesso numero di piedini del tetrodo.
Il pentodo è un vero e proprio punto d'arrivo nello sviluppo della valvola: alta
amplificazione, larga banda, bassa distorsione, buona linearità. I pentodi si trovano negli
stadi a radiofrequenza e a media frequenza di un ricevitore, ma anche negli amplificatori
d'uscita. Il difetto principale del pentodo è un maggiore livello di rumore introdotto nel
segnale in uscita, che lo rende inadatto per i primi stadi di amplificazione o quando è
necessaria una amplificazione molto elevata.
Transistor
Bipolari
Un transistor a giunzione bipolare (in inglese bipolar junction transistor o BJT) è un tipo di
transistor, cioè un componente elettronico attivo (nel senso che può pilotare una corrente,
ma non erogare potenza) che funziona come amplificatore o interruttore, ed è formato da
semiconduttori drogati.
Il BJT è formato da diversi strati, drogati in modo diverso, che formano transistor NPN o
PNP.
Le tre zone sono chiamate base, quella centrale, collettore ed emettitore quelle laterali,
indifferentemente dal tipo di drogaggio: si può dimostrare che emettitore e collettore non
si possono interscambiare.
Ognuno di questi tre terminali può essere considerato un terminale di ingresso o di uscita
o ancora si possono mettere a comune due terminali, in tal caso si dice che il transistor è
a configurazione a base comune, a collettore comune o a emettitore comune.
FET
L'acronimo JFET sta per junction field effect transistor, o transistor ad effetto di campo a
giunzione. È un dispositivo costruito come sandwitch di semiconduttori drogati in modo
diverso (P-N-P o N-P-N).
Il JFET e' un dispositivo unipolare poiché' solo i portatori maggioritari che costituiscono il
canale si occupano della conduzione.
Al contrario del transistor bipolare, la cui grandezza di controllo è la corrente di base, i FET
sono controllati in tensione e la corrente assorbita dal gate risulta pertanto molto bassa.
MOSFET
MOSFET, è l'acronimo di Metal Oxide Semiconductor Field Effect Transistor, cioè transistor
metallo-ossido-semiconduttore a effetto di campo. Molto frequentemente viene indicato
anche solo come transistor MOS. È un tipo di transistor, molto usato nei dispositivi digitali
grazie al basso consumo di potenza dovuto alla ridotta dispersione di calore rispetto ad
altri tipi.
Il MOSFET è certamente il più comune transistor a effetto di campo sia nei circuiti digitali
che in quelli analogici. Il MOSFET è composto da un substrato di materiale semiconduttore
di tipo n o di tipo p.
Componenti integrati
Composizioni elaborate di transistor e/o di elementi attivi diversi (MosFET, etc.) e passivi
(resistenze, condensatori), trovano collocazione in componenti integrati. Si riescono ad
ottenere densità di componenti estremamente elevate, dell’ordine di milioni di componenti
per centimetro quadrato. L’uso di questi componenti semplifica di svariati ordini di
grandezza la complessità progettuale di un qualunque sistema. Sono in uso ormai da una
quarantina d’anni e nell’audio analogico sono usati in particolare gli amplificatori
operazionali, che permettono una progettazione quasi ideale (in termini di equazioni e di
curve).
L’amplificazione
Da quest'equazione, si può notare che quando Ac tende a zero, CMRR tende all'infinito.
Maggiore è la resistenza della corrente di emettitore Re, più basso è Ac, e migliore è il
CMRR. Pertanto, per un amplificatore differenziale perfettamente simmetrico, con Ac = 0,
la tensione di uscita è data da
Amplificatore operazionale
Il nome è dovuto al fatto che con esso è possibile realizzare circuiti elettronici in grado di
effettuare numerose operazioni matematiche: la somma, la sottrazione, la derivata,
l'integrale, il calcolo di logaritmi e di antilogaritmi. Al giorno d'oggi l'amplificatore
operazionale è, in genere, costituito da un circuito integrato.
Invertente: Av = - (Z’/Z)
Non invertente : Av = 1+ (Z’/Z)
La frequenza minima e massima del segnale è limitata entro determinati valori dai
parametri dei componenti usati (integratore e derivatore limitato), ed in particolare dal
tempo di carica della rete RC, τ = RC. Superati questi limiti il circuito entra in
saturazione distorcendo il segnale.
Dagli operazionali a transistor bipolari sono derivati gli operazionali a basso rumore
con ingresso a Fet, come la serie TL071/72/74/81/82/84, di cui vediamo lo schema di
principio.
Generalmente i vari tipi di operazionali hanno conservato una piedinatura comune che
qui riportiamo.
Trigger di Schmitt
Quello che segue è un oscillatore a sfasamento, con uscita sinusoidale pari a fn = 1/(2πRC),
che sfrutta l’inversione di fase dell’amplificatore invertente per riportare in fase (e quindi
provocando l’oscillazione) l’uscita mediante due reti RC accordate.
Un altro oscillatore, in questo casi in quadratura, nella quale una doppia sfasatura di 90°
di segno opposto provoca una oscillazione.
Le due uscite sono sfasate ed assimilabili ad un seno ed un coseno.
La distorsione
In linea di massima è un errore sistematico di non linearità in uno qualunque dei parametri
caratteristici di un fenomeno. Nell’audio può quindi essere:
Ciò è causato dalle caratteristiche non lineari del dispositivo e dalla struttura cristallina non
omogenea. In particolare, i valori della sinusoide al di sopra di un certo valore vengono
tagliati al valore massimo emissibile dal dispositivo (saturazione), e allo stesso modo
vengono tagliati anche i segnali al di sotto di una certa soglia, generalmente intorno a 0.2-
0.3 V (cutoff). Tale caratteristica introdotta dal transistor è detta distorsione di non
linearità.
Di seguito vengono visualizzati alcuni circuiti elettronici d’uso comune e le relative curve di
trasferimento.
Amplificatore differenziale
(Rf=Rg; R1=R2)
Amplificatore invertente
Vout=Vin
Sommatore (Mixer)
ovvero
Integratore
Derivatore
Comparatore
Vout = VH per V1 > V2
Vout = VL per V1 < V2
Giratore (simulatore di induttanza)
Diodo ideale
Amplificatore logaritmico
Amplificatore esponenziale
Filtri attivi
I tipi più comuni di filtri elettronici sono lineari, indipendentemente da altri aspetti del loro
progetto. Molti filtri sono anche dei sistemi risonanti.
In elettronica un filtro passa alto è costituito da un circuito elettronico che permette solo
il passaggio di frequenze al di sopra di una data frequenza detta "frequenza di taglio". Può
essere di tipo attivo o passivo a seconda della presenza di elementi attivi nel circuito quali
amplificatori oppure solo passivi. Inoltre, in base alla pendenza del taglio in frequenza, si
può distinguere in filtro passa-alto di primo ordine (20 dB per decade), di secondo ordine
(40 dv per decade), di terzo ordine (60 dv per decade) e così via.
Un filtro passa basso è costituito da un circuito elettronico che permette solo il
passaggio di frequenze al di sotto di una data frequenza detta "frequenza di taglio". Può
essere di tipo attivo o passivo a seconda della presenza di elementi attivi nel circuito quali
amplificatori oppure solo passivi. Inoltre, in base alla pendenza del taglio in frequenza, si
può distinguere in filtro passa basso di primo ordine (20 dv per decade), di secondo ordine
(40 dv per decade), di terzo ordine (60 dv per decade) e così via, che è anche la
classificazione dei filtri in cascata, come il doppio passa basso e il doppio passa alto.
Nel caso reale, la banda passante (bandwidth) è rappresentata da una campana che ha il
centro nelle Fc (frequenza di risonanza o frequenza centrale) in corrispondenza del picco
di guadagno e due punti caratteristici di fine campana, dove il guadagno è pari a –3dB.
Pendenza di un filtro
Andamento della pendenza di un filtro di Butterworth (massima linearità) passa basso del
primo ordine, ovvero 12dB/ottava, ovvero 20dB/decade
Filtri Butterworth / Bessel / Chebyshev
Vi sono varie tecniche di progettazione dei filtri e del loro comportamento. I più usati sono
quelli citati.
Qualità di un filtro
I filtri sono misurati con il loro fattore di qualità, fattore di merito o fattore Q.
Si dice che un filtro ha un Q alto, se seleziona o inibisce un intervallo di frequenze stretto,
relativamente alla sua frequenza centrale.
Q = F0/Bw
Ad esempio, i filtri audio per casse acustiche a due vie a 12 dB/ottava sono stati studiati
ed elaborati con particolare attenzione alla zona dove i suoni del tweeter si sovrappongono
con quelli del woofer, tale zona è detta d'incrocio. Il fattore di Q o fattore di merito,
esprime il comportamento del filtro, appunto, nella zona d'incrocio.
I trasduttori
Molti trasduttori sono sia sensori sia attuatori, ovvero possono agire sia da convertitori in
energia elettrica di fenomeni diversi che da convertitori da energia elettrica in fenomeni
diversi (es. meccanico-elettrico, elettrico-meccanico).
In senso lato, un trasduttore è talvolta definito come un qualsiasi dispositivo che converte
dell'energia da una forma ad un'altra, in modo che questa possa essere rielaborata o
dall'uomo o da altre macchine.
Prima di parlare dei microfoni come trasduttori meccanici, sarà opportuno fare qualche
accenno sui principi elementari che sono alla base del loro funzionamento; in particolare
accenneremo al campo elettrico, al campo magnetico e al campo elettromagnetico. Il
campo elettrico è quello spazio che circonda un corpo elettricamente carico in ogni punto
del quale sia presente l'effetto dell'elettrizzazione stessa.
Questa genera sempre, oltre ad un campo magnetico, anche un campo elettrico, mentre
ogni variazione di flusso in un campo magnetico crea una corrente elettrica indotta, per
cui la coesistenza delle due componenti in oggetto, variabili nel tempo, generano un
campo elettromagnetico.
• a pressione
• a gradiente di pressione
• a spostamento
• a velocità
condensatore
elettromagnetico
a nastro (obsoleto)
Esistono vari altri tipi di microfoni e trasduttori (a carbone, piezoelettrici, gli idrofoni, i
catodofoni, stetoscopi, laringofoni, etc.), ma non hanno senso in questo ambito o sono
obsoleti.
In particolare, gli idrofoni sono “microfoni” per l’ascolto in acqua; gli stetoscopi e i
catodofoni sono l’equivalente per “ascoltare” vibrazioni su mezzi (un corpo, del metallo, un
muro, etc.). Sono in uso degli stetoscopi detti microfoni endoossei (o microfoni
craniali) per l’uso all’interno dei caschi (motociclisti, piloti, pompieri, etc.) che ricevono il
segnale come vibrazione della scatola cranica.
Qui illustrato uno stetoscopio (microfono per superfici) per l’ascolto via muro (per scopi
di sorveglianza).
I microfoni a carbone erano usati nei telefoni (lo scricchiolio che si udiva nelle
conversazioni era dovuto alla compressione ed al movimento delle particelle di carbone).
Condensatore
Dinamico
Microfono Dinamico
• non può essere facilmente miniaturizzato
• tipica risposta in frequenza non molto ampia
• tipica risposta in frequenza che tende a non essere costante su tutta la gamma
• non richiede alimentazione
• la maggior parte dei modelli è molto robusta e affidabile
• tipicamente sono impiegati in applicazioni vocali nel rinforzo sonoro.
Alimentazione e phantom
Si tenga conto che alcuni microfoni dispongono di un circuito elettronico che permette di
variare la risposta in frequenza alle basse frequenza o la direttività.
La limitazione alle basse frequenze è usata per evitare il rombo del vento e per il parlato,
dove le esplosive possono creare problemi; solitamente è un filtro passaalto a 100Hz
munito di interruttore.
Ogni microfono deve riportare la curva che rappresenta la sua sensibilità alla pressione a
seconda della frequenza. Quello rappresentato in figura è un grafico caratteristico:
In genere la sensibilità alle basse frequenze subisce notevoli variazioni a seconda della
distanza del microfono dalla sorgente sonora.
Poiché può essere importante valutare questo parametro, in molti casi sono riportate
diverse curve per le basse frequenze, a seconda della distanza.
Per informazione, vengono ora fornite le immagini (Neumann) di due diversi tipi di
microfoni: il TLM103, un tipico cardioide da studio e il KM184, multifunzione.
TLM103, gradiente di pressione, cardioide, 20…20KHz, 87dB S/N Ratio, 138dB SPL Max
Conferenze e assemblee
Sono normalmente dei supercardioidi o cardioidi. Sono spesso inserite in sistemi di
prenotazione e votazione
Omnidirezionale Boundary
Sulle scrivanie
Riprendono un’emisfera appoggiata sul piano della scrivania a cui sono appoggiati.
Possono avere alcune features per migliorare la modalità di ascolto
a soffitto
Normalmente sono microfoni direzionali (supercardioidi) usati per ricevere segnale senza
interazione con i parlatori.
A mano o su stativo
Sono i microfoni per antonomasia; detti anche a gelato. Sono disponibili nelle varie
versioni di caratteristica polare e tecnologica.
I microfoni a cuffia (Headset) sono di fatto una evoluzione dei Lavalier; Sono spesso in
radiofrequenza ed estremamente comodi. Non soffrono del rumore indotto dallo strofinio
degli indumenti e della copertura della ricezione a causa dei movimenti del parlatore.
Da stativo (da studio, Neumann)
Permettono di installare una sola apparecchiatura per raccogliere il suono di più parlatori.
In pratica, sono banchi di microfoni direzionali attivati dal livello sonoro in modo tale da
utilizzare il segnale più elevato ricevuto nel singolo istante.
Sono denominati anche a fucile (area di raccolta molto stretta) e a mezzo fucile.
Sono i classici microfoni di ripresa esterna (telecamera, cinepresa, etc.).
Microfoni di misura
Sono le unità di lettura dei sistemi di misura e controllo. Non sono applicati nell’audio in
quanto tali.
Direzionalità e Diagrammi polari
Ogni microfono possiede una sua specifica risposta direzionale, ed è buona norma
osservare attentamente questa caratteristica di un microfono prima di acquistarlo.
La risposta direzionale di ogni microfono viene riportata mediante un particolare
diagramma, che si dice diagramma polare, ed è in genere riportata sulla confezione del
microfono o nel manuale di accompagnamento.
Un microfono bidirezionale è sensibile in due direzioni opposte l'una all'altra (una è quella
che corrisponde alla pressione esercitata sulla parte frontale del diaframma, l'altra alla
pressione esercitata sulla parte posteriore), ed è detto anche Figure8.
Un microfono cardioide è la combinazione di un omnidirezionale e di un bidirezionale, in
modo da ottenere grafici particolarmente utili, con sensibilità accentuata sul fronte.
A seconda della della percentuale dell'uno e dell'altro, si hanno vari tipi di cardioide, che si
si distinguono essenzialmente in cardioide semplice, supercardioide e ipercardioide.
Altri diagrammi particolari che si possono incontrare, si ottengono in realtà con disposizioni
stereofoniche, ossia con l'uso di più trasduttori separati:
Ripresa stereofonica
Esistono varie modalità di ripresa stereo, con microfoni (normalmente dei cardioidi)
disposti in varie configurazioni e con strutture specializzate (p.es. teste artificiali contenenti
delle capsule microfoniche).
Distanziati da 90 a 300cm, semplice, tradizionale, non molto precisa, con problemi alle
basse frequenze.
In rete sono disponibili svariati siti che spiegano sia il calcolo che l’uso di questi dati nella
costruzione di casse acustiche.
Unità specializzate
Gli amplificatori
Gli amplificatori audio sono macchine che amplificano segnali elettrici in tensione o in
potenza.
• microfonici
• di linea
• di disaccoppiamento / di isolamento
• etc.
I preamplificatori devono operare senza distorsioni di alcun genere sulla banda necessaria
per le unità accoppiate e per il fattore di moltiplicazione necessario, senza introdurre
rumore di fondo.
Gli amplificatori devono operare senza distorsioni di alcun genere sulla banda necessaria
per le unità accoppiate e per la potenza necessaria, senza introdurre rumore di fondo.
Le casse o diffusori in corrente (carico ohmico) non possono essere posti in serie o
parallelo (standard) e consentono il trasferimento diretto tra amplificatore e diffusore
(eccellenti prestazioni in termini di banda e distorsione).
Distorsione armonica
La distorsione armonica totale (in inglese total harmonic distortion, da cui l'acronimo THD)
è un parametro che ci informa della distorsione che un dispositivo induce ai segnali
elettrici che passano al suo interno.
HiFi
Alta fedeltà detto anche Hi-Fi (dall'inglese High Fidelity) è un termine generico che stava
ad indicare prodotti audio e video di qualità superiore.
Negli anni settanta/ottanta, la grande diffusione di impianti per la riproduzione del suono
sempre più sofisticati, ha portato alla decisione di mettere ordine nella dilagante
diversificazione delle soluzioni tecniche adottate dai vari costruttori, stabilendo delle norme
meccaniche e parametri elettrici definiti standard, in conformità ai quali, un apparecchio
poteva essere considerato a pieno diritto Hi-Fi (vedi norme DIN e RIAA).
In linea di massima:
• almeno 10W RMS
• meno di 0.1% di THD
• almeno 40..16KHz di banda a -3dB
Più specificamente gli altoparlanti per le basse frequenza (woofer) sono impiegati sia a
radiazione diretta in cassa chiusa o aperta, sia a radiazione indiretta in cassa passa banda;
gli altoparlanti per le medie frequenze (midrange) sono impiegati a radiazione indiretta,
in cassa chiusa, caricati a tromba; gli altoparlanti per le alte frequenze (tweeter) sono
spesso driver a compressione con un condotto di uscita a tromba.
Le trombe ritenute migliori sono quelle che soddisfano una legge di variazione esponen-
ziale: A=Ag ekl dove A è l’area ad una data lunghezza l, Ag è l’area della gola e k è la co-
stante di apertura.
Unità specializzate
La suddivisione delle bande audio nei tre intervalli classici (woofer, midrange e tweeter)
anche se possibile, non è di sempre riscontrabile nei prodotti in commercio soprattutto per
quanto riguarda gli estremi di banda, infatti per riprodurre adeguatamente gli estremi di
banda vengono usate altre unità specializzate ovvero il sub-woofer e il super tweeter.
Tipicamente le unità multivia (tranne quelle a gamma ristretta) vengono divise anche per il
numero di vie che utilizzano ovvero
• Unità a 2 vie – costituite da un trasduttore per i medio-bassi e da un driver per i
medio alti
• Unità a 3 vie – costituite da un trasduttore per i bassi, uno per i medi,ed uno per gli
alti
• Unità a 4 vie - costituite da un trasduttore sub-woofer, da un medio-bassi, da un
medio-alti e da un driver per gli alti.
Il numero delle vie non è indice della qualità di un sistema: più è alto il numero delle vie e
più è complicata la sua progettazione (a causa delle regioni di incrocio del crossover).
Il ruolo della cassa non è di certo secondario per il corretto funzionamento dell’unità, sia
per quella specializzata che per quella multivia. Ad essa è legata l’esigenza di ottenere una
precisa risposta in frequenza.
Il cortocircuito acustico è che un fenomeno per cui la radiazione sonora anteriore e quella
posteriore si confondono determinando un drastico peggioramento delle prestazioni alle
frequenze più basse.
L’altoparlante per i bassi deve essere munito di una sospensione morbida in quanto la
compressione dell’aria presente nella cassa funge da riequilibratore della posizione del
cono al termine dell’impulso sonoro.
Cassa aperta, prende il nome da una finestra che viene ricavata su di una delle pareti del
mobile che può essere una semplice apertura oppure un condotto tra il volume interno
della cassa e l’esterno, di solito cilindrico, serve al recupero in fase di porzioni utili (di
gamma bassa) della radiazione posteriore dell’altoparlante, questo tipo di cassa viene
detta cassa bass reflex, creando quindi un sistema accordato con un risuonatore ed un
sistema di accordo (tubo).
L’altoparlante per i bassi deve essere munito di una sospensione rigida o semi-rigida in
quanto la compressione dell’aria presente nella cassa non è sufficiente a fungere da
riequilibratore della posizione del cono al termine dell’impulso sonoro.
Tra i tipi di casse acustiche più efficienti troviamo le casse caricate a tromba o a linea di
trasmissione, dove l’onda posteriore anziché essere eliminata viene portata sul fronte in
fase mediante un circuito di ritardo, ovvero un condotto di lunghezza significativa in
campo audio cioè pari alla metà della lunghezza d’onda della frequenza di risonanza o
d’accordo, tenendo conto che 100Hz in aria corrispondono a 3,4 metri.
In tutti i tipi di casse l’altoparlante può essere montato sia a radiazione diretta che a
radiazione indiretta.
Per funzionare correttamente le unità multivia hanno bisogno che ogni altoparlante
riproduca principalmente l’intervallo di frequenze assegnato, di questo compito se ne
occupa il crossover.
È un apparato che svolge varie funzioni ovvero, rende uniformi i livelli di sensibilità dei vari
trasduttori dell’unità; protegge i trasduttori delle frequenze medio-alte dai segnali di bassa
frequenza, modella la risposta elettroacustica dei vari altoparlanti in modo da ottenere un
andamento equilibrato della risposta in frequenza dell’unità.
Il crossover è composto da diverse sezioni ognuna delle quali da celle di filtraggio che
sono: i filtri passa-basso (che lasciano transitare solo le frequenze inferiori ad una certa
frequenza detta di taglio), i filtri passa-alto (che lasciano transitare solo le frequenze
superiori alla frequenza di taglio), e i filtri passa-banda (che lasciano transitare solo le
frequenze appartenenti ad una certa banda di frequenze delimitata da una frequenza di
taglio inferiore e da una frequenza di taglio superiore), è doveroso precisare che qualsiasi
filtro non è mai in grado di eliminare completamente le frequenze indesiderate ma li riduce
in modo più o meno consistente, la misura di questa riduzione è detta pendenza di
attenuazione e viene misurata in dB/ottava.
Nella figura superiore osserviamo un tradizionale crossover passivo a 12dB/ottava a tre vie
senza resistenze di compensazione. Normalmente sono inserite reti di compensazione per
gestire adeguatamente le potenze e le fasi in gioco, sia nei confronti degli altoparlanti (la
potenza erogata da un woofer è spesso superiore a quella erogata da un tweeter) che
verso l’amplificatore, che deve operare con un carico reattivo non trascurabile; nella figura
che segue vediamo un crossover a due vie, a 12dB/ottava, con correzione delle risonanze
e delle fasi.
L’Impedenza
Nel grafico, che rappresenta l'impedenza e la fase al variare della frequenza applicata,
vediamo un punto di massimo che definiamo Fs o frequenza di risonanza. La parte destra
del grafico, superiore a 500Hz, è dominata dall’influsso della parte reattiva; la parte
centrale del grafico è la parte resistiva. Sul punto Fs notiamo che la fase è a 0°.
Dato che l’unità presenta una impedenza complessa, si determina (in base alla frequenza)
uno sfasamento tra corrente entrante e tensione ad essa applicata, determinando
fenomeni di deterioramento del segnale audio (distorsione di fase) e un non ideale
funzionamenti dell’amplificatore ad esso applicato.
A volte viene fornita anche la misura della risposta in frequenza fuori asse con
un’angolazione di circa 15° e 30° sia sul piano orizzontale che su quello verticale (tutti i
due tipi di risposte in frequenza devono essere rilevate nel medesimo ambiente con le
stesse condizioni e posizionamento).
Bisogna tener presente che l’utilizzo di qualsiasi unità non è mai perfettamente in asse o
fuori asse di 15° o 30° con il nostro ascolto, quindi è bene ricordare che i dati che ci
vengono riferiti sono puramente indicativi in quanto risentono della posizione e
dell’ambiente. Nella rappresentazione grafica della risposta in frequenza possiamo
distinguere tre regioni caratteristiche di frequenza, ovvero roll-on (o roll-off inferiore),
banda passante, roll-off.
Roll-on è la salita in potenza in base alla frequenza analizzata, partendo dal limite
inferiore della banda audio (20 Hz) avremo una salita con una pendenza di circa 12 dB
ottava per gli altoparlanti con caricamento a cassa chiusa, e di circa 18 dB ottava per gli
altoparlanti a cassa aperta.
Banda passante: è questa la regione di frequenza in cui possiamo individuare la gamma
di funzionamento dell’unità. Nella regione di banda passante la curva di risposta tende a
divenire diritta (tranne qualche avvallamento o rigonfiamento) e si ottiene determinando il
picco di potenza di una frequenza e scendendo in una finestra di tolleranza di + o – 3 dB
includendo nella banda passante tutte le frequenze che rispettano questo principio.
Roll-off è la discesa in potenza della frequenza analizzata con una pendenza di circa 36
dB ottava (ogni ottava la pressione sonora diminuisce di 36 dB).
Sensibilità
Il valore di picco sarà più alto del valore efficace (in una sinusoide è pari ad 1,41 volte il
valore efficace), quindi per avere un dato attendibile della tenuta in potenza utilizzeremo
un altro parametro detto MIL maximum input level, ovvero il livello di tensione applicato
all’unità che induce ad una distorsione inaccettabile (ad esempio il 10% di distorsione da
intermodulazione), conoscendo il MIL e la sensibilità dell’unità possiamo stabilire la
massima pressione sonora che la nostra unità ad una distanza adeguata può produrre,
ovvero la minima tensione applicabile per produrre una gittata dell’unità accettabile (la
gittata di un’unità è pari al quadrato inverso della distanza ovvero ad ogni raddoppio della
distanza il valore scenderà di 6 dB).
La distorsione
È d’uso affermare che un’unità genera distorsione e quindi emette suoni distorti quando
tra il segnale da riprodurre ed il segnale riprodotto si accerti un’alterazione, che può
essere composta sia da componenti sonore non presenti all’origine, sia nella variazione dei
livelli della componente da riprodurre. La distorsione viene divisa in due tipi, distorsione
armonica e distorsione da intermodulazione.
La fase
Qualsiasi sistema di altoparlanti opera uno sfasamento del segnale (quando la stessa
frequenza viene emessa con un andamento sfalsato) con una sua conseguente
diminuzione, aumento o cancellazione (in base al grado di sfasamento)
Il nostro orecchio non è in grado di percepirne la variazione alle basse frequenza e quindi
il panorama acustico non ne è fortemente influenzato. Su frequenze medie ed alte, invece,
distorsioni di fase introducono problemi di riconoscimento posizionale degli strumenti.
dove:
Argento 0.0159
Rame 0.0175
Oro 0.0244
Alluminio 0.0282
Acciaio 0.11
Piombo 0.22
Si tenga conto che i conduttori sono definiti in sezione (mm2) ed usati a metri lineari.
• utilizzo
o di segnale
o di potenza
• schermatura
o schermato
o non schermato
• bilanciamento
o bilanciato
o non bilanciato
I cavi di segnale sono in grado di trasportare livelli bassi di potenza (piccola sezione) e
collegano trasduttori di ingresso (linee e microfoni) alle apparecchiature e le
apparecchiature tra loro.
In linea generale l’interno dei cavi bilanciati (balanced) e sbilanciati (unbalanced) può
essere schematizzato in questo modo:
2 Conduttori: Unbalanced
3 Conduttori: Balanced
I cavi possono essere classificati a seconda del numero di conduttori usati (contenuti
nell’unica guaina):
Materiali
Sono qui elencate le principali connessioni effettuate con connettori standard Jack, XLR e
RCA. La descrizione dei connettori è disponibile nell’apposito paragrafo.
Ground Loop (Loop di Terra)
Il Ground Loop (ovvero l’anello di terra che comporta l’introduzione del ronzio a 50 Hz
dato dalla tensione di rete) nasce dalla seguente situazione:
Per ovviare a questo problema si deve tagliare il loop (tagliando letteralmente il cavo
che trasporta la massa) in un punto ottimale, normalmente nel connettore su uno dei
due lati, preferendo la soppressione della calza.
ATTENZIONE: Mai tagliare il loop a livello dell’alimentazione, ma agire sul circuito delle
apparecchiature.
La strategia è quella di fare in modo che le messe a terra vengano convogliate nello
chassis di un’unica macchina.
La X determina il taglio che si deve fare, ovvero appena prima che lo schermo arrivi al
source. Così facendo lo schermo esiste comunque per tutto il percorso del cavo, ma non
essendo collegato a monte, non chiude un eventuale loop. Le interferenze e i disturbi
vengono comunque schermati, come nel caso precedente.
Cavi dual conductor per connessioni Sbilanciato su Bilanciato Unbal → Bal (Nei
connettori Jack: TS → TRS).
Fondamentalmente si ottimizza l’uscita Sbilanciata per farla arrivare a una Bilanciata.
Lo schermo Flottante (X = taglio) è coerente con le scelte fatte per il taglio del Ground
Loop.
Cavo Bipolare + Schermo per connessioni Balanced to Balanced (Jack TRS → TRS).
In questo caso il Ring è ponticellato con lo Sleeve nel Source per avere una situazione
simile alla precedente.
Abbiamo un cavo che, dalla parte del source (quindi da dove parte il segnale) è composto
da TIP con il segnale positivo, e RING e SLEEVE collegati tra loro. Lo schermo, come
detto, è flottante.
Allo stesso modo operiamo con connettori XLR → XLR (sempre con cavo bipolare +
schermo). Dalla parte del Source lasciamo libero il Pin 1 dove normalmente colleghiamo lo
schermo.
Effetto Pelle (Skin Effect)
L = Nj / i
Se per qualche ragione la corrente ’i’ varia, anche il flusso da essa generato varia.
Per la legge dell'induzione elettromagnetica, nel circuito elettrico nasce una forza
elettromotrice il cui valore dipende dalla variazione di flusso e dalla rapidità con cui tale
variazione avviene.
In presenza di segnali di potenza, alle alte frequenze, si presenta il problema della
autoinduzione a causa degli alti valori di corrente.
Un cavo sbilanciato dispone di un solo conduttore (in rosso) oltre alla massa.
I connettori jack sbilanciati si distinguono perché hanno un solo anello nero di separazio-
ne. La calza è connessa su un solo lato per evitare fenomeni di ground loop.
Un cavo bilanciato dispone di due conduttori (rosso e blu nella figura) oltre alla mas-
sa. I connettori jack bilanciati si distinguono grazie al doppio anello nero di separazione.
Nei connettori e nei cavi bilanciati, il segnale viene inserito in fase e controfase.
Il ricevitore raccoglie il segnale su un ingresso differenziale, dove i segnali in fase (cal-
do/hot/rosso/+) e in controfase (freddo/cold/bianco/-) vengono sommati mediante inver-
sione.
In sintesi:
output = S + -S
trasporto = S & -S
Se un segnale estraneo (C) interferisce con un cavo sbilanciato, esso si somma al segnale
(D).
Se invece lo stesso segnale estraneo interferisce con un cavo bilanciato, esso si somma
ad entrambi i segnali: quello in fase e quello in controfase (E).
Quando il segnale sbilanciato giunge alla preamplificazione del mixer, il segnale estraneo
viene amplificato assieme al segnale originario (F).
Dunque dalla preamplificazione del canale risulterà amplificato solo il segnale originario
(G).
I connettori audio
• Connettore Jack
• Connettore XLR
• Connettore DIN
• Connettore RCA
• Connettore Speakon
Connettore Jack
È esistita una variante (storica) di 5mm, non più in uso. Una versione particolare è il
cosiddetto connettore Nato (U174), in uso su ricetrasmettitori e cuffie, microfoni e caschi,
a quattro vie ed un diametro di 7.14mm.
Prodotto per la prima volta negli Stati Uniti dalla Cannon Electric, la sigla XLR deriva dal
nome originale Cannon X , a cui furono aggiunte prima un blocco (Latch) di sicurezza, e
poi un isolante di gomma (Rubber) attorno ai poli. Un connettore XLR può avere diversi
schemi di piedinatura, i tipi più comuni sono a tre, quattro e cinque poli. Numerosi
produttori, tra cui Neutrik e Alcatel, producono questi connettori, sia in versione con
contatti a saldare che con terminazioni a perforazione d'isolante.
Come regola, il connettore maschio è usato come uscita e il connettore femmina come
ingresso. I microfoni hanno un connettore maschio integrato come uscita, mentre un cavo
audio è di tipo maschio/femmina. Un mixer audio presenta dei connettori femmina agli
ingressi, mentre le uscite e i ritorni saranno maschi.
Esistono diversi modelli di connettore "combo" femmina in grado di accettare sia XLR che
Jack.
Sono i connettori principalmente usati per i microfoni, i quali possiedono un’uscita XLR
maschio. Il cavo di collegamento sarà quindi munito di un XLR femmina per il
collegamento.
Anche se XLR è un connettore nato e usato principalmente per connessioni bilanciate, può
accadere che sia stato collegato per una connessione sbilanciata. Nel caso si controllino i
collegamenti, come sotto illustrato.
Connettore DIN
Un connettore DIN (Deutsches Institut für Normung) è un tipo di connettore a più pin.
Esistono due famiglie di connettori DIN: quelli normali e quelli in versione mini.
Un numero viene usato alla fine del nome per identificare il numero del pin del connettore,
eventualmente con l’indicazione della disposizione dei pin.
Per esempio, il connettore mini-DIN4 è un connettore del tipo piccolo con quattro pin.
Un connettore DIN-5-270 dispone di 5 pin disposti su un arco di 270°.
Connettori DIN-3 e mini-DIN-3 sono stati usati in maniera diffusa nell'audio-tecnica, per
connettere vari tipi di microfoni.
Connettori DIN-5 (nella versione a croce) erano usati per le cuffie.
Connettori DIN-5 (nella versione a 180°) sono stati usati in maniera diffusa nell'audio
tecnica, per connettere vari tipi di apparecchiature. È inoltre usata per le connessioni
MIDI.
Il connettore DIN a 5 poli veniva utilizzato nel settore audio consumer, ormai è in disuso il
suo posto è stato preso dal connettore RCA e dai vari connettori digitali.
Il connettore DIN offre un buon contatto elettrico, una pessima resistenza meccanica e
una pessima resistenza alla trazione.
Contatto N° / Descrizione
1 Uscita Audio canale sinistro
2 Massa
3 Ingresso Audio canale sinistro
4 Uscita Audio canale destro
5 Ingresso Audio canale destro
Contatto N° / Descrizione
1 N.C.
2 Massa
3 Ingresso Audio canale sinistro
4 N.C.
5 Ingresso Audio canale destro
Contatto N° / Descrizione
1 Ingresso Audio canale sinistro
2 Massa
3 Uscita Audio canale sinistro
4 Ingresso Audio canale destro
5 Uscita Audio canale destro
Contatto N° / Descrizione
1 Ingresso Audio canale sinistro
2 Massa
3 N.C.
4 Ingresso Audio canale destro
5 N.C.
Nelle connessioni MIDI, il connettore DIN 5/180° è usato per i tre tipi di connessione:
MIDI-IN
MIDI-THRU
MIDI_OUT
Attualmente le connessioni MIDI sono effettuate anche con connettori Mini-DIN e con
spinotti RCA. Inoltre, la disponibilità di connessioni ad alta velocità quali USB e FireWire
consente l’uso del trasporto dell’informazione MIDI su canali prestazionalmente superiori.
Connettore RCA
I connettori RCA sono conosciuti anche come prese cinch o connettori phono. Quest'ultimo
termine deriva dall'abbreviazione della parola inglese phonograph (giradischi), poiché lo
scopo iniziale delle connessioni RCA (anni ’40) era il collegamento di un giradischi a un
ricevitore radio, usato come amplificatore. Non è molto resistente è non è particolarmente
usato in ambito professionale.
Come si può notare il connettore a due poli può essere inserito nella presa a 4 ma non
viceversa.
Lo stesso produttore produce un altro tipo di connettore PowerCon, che è stato progettato
per supportare potenze maggiori del normale segnale audio. Per maggiore sicurezza, il
segnale audio e l'alimentazione non sono connettibili tra di loro.
Mixer
Il mixer (mixer audio), è una apparecchiatura utilizzata per mixare segnali audio, utilizzato
dalle persone addette alla regia di spettacoli teatrali, televisivi, concerti e dai DJ.
Un mixer si differenzia da un altro per molti aspetti, numero di canali, sensibilità dei
controlli per il volume, funzioni in generale e amplificazione o meglio dire
preamplificazione.
Il numero di canali determina il numero di periferiche di riproduzioni audio, inseribili nel
mixer, quindi determina anche il numero di suoni udibili contemporaneamente.
I mixer da regia, a differenza dei mixer per dj, dispongono di un notevole numero di canali
che va da 12 fino a 24-48 canali ed oltre (es. 96) per le workstation da studio di
registrazione, che permettono la variazione dei volumi, dei toni, del segnale audio
presente su quel canale.
Il mixer da regia permette inoltre di indirizzare una parte del segnale dei singoli canali
verso eventuali effetti esterni, come delay, riverberatori, equalizzatori, ecc. I mixer da
regia principalmente servono per regolare i volumi dei microfoni e per creare un'immagine
stereofonica.
La qualità sonora di un mixer è data principalmente dalla qualità dei preamplificatori, dei
filtri, dei fader (Il potenziometro, in questo caso detto a 'slitta' serve per regolare il volume
di ogni canale) dalla quantità di distorsione armonica totale, ovvero della misura in cui
ogni dispositivo audio altera il contenuto in frequenza del segnale.
Negli ultimi dieci anni si sono imposti sul mercato con sempre maggiore insistenza i mixer
digitali, che convertono il segnale analogico in digitale e lo processano in dominio
completamente digitale al loro interno.
I mixer digitali dispongono di indubbi vantaggi sia per quanto riguarda il rumore e la
distorsione (limitati alla sezione di digitalizzazione) che all’usura meccanica (e quindi
instabilità e rumore) degli slider (potenziometri del volume) che alla possibilità di
automazione delle operazioni.
I diversi tipi di mixer condividono la stessa struttura, che consiste essenzialmente nel
trattare segnali sonori provenienti da diversi canali di ingresso e sommarli in uno o più
canali di uscita.
Connettori di ingresso Questa sezione contiene uno o più connettori per i cavi di
segnale. Tra i connettori usati troviamo gli XLR (noti anche come Cannon, a bassa
impedenza usati tipicamente per i microfoni), i Jack (alta impedenza, usati per sorgenti "in
linea" come tastiere o amplificatori) e gli RCA (usati per lettori CD e simili).
Stadio di ingresso Questa sezione si occupa di adattare il segnale elettrico in ingresso
alle caratteristiche del mixer. Contiene un potenziometro per regolare il livello (Gain) [4],
e talvolta altri controlli, ad esempio per l'alimentazione remota di un microfono a
condensatore (Phantom). È spesso disponibile un pulsante che permette la rotazione della
fase dell’ingresso.
Selettore dei gruppi Presente solo su mixer di fascia più alta. Ogni
canale della consolle presenta uno o più tasti che abilitati convogliano
il segnale audio a gruppi di canali in uscita. Nei sistemi di studio di
registrazione questo permette di assegnare la/le piste a cui inviare il
segnale di ingresso, attraverso il gruppo selezionato. [11, 12]
Di seguito sono illustrate alcune applicazioni di mixer in ambiti professionali. Nelle figure
sono indicate genericamente le prese disponibili su un ipotetico mixer, suddivise in:
In questo caso abbiamo un sound reinforcement ovvero l’uso del mixer per la
sonorizzazione di un concerto dal vivo.
Vediamo che sono collegate direttamente al mixer le tastiere elettroniche, come input di
linea; sono indicati come eventuali i sistemi subwoofer e gli eventuali registratori (stereo o
multi-pista) connessi al sistema per la registrazione dal vivo.
Registrazione
In questo caso vediamo l’uso del mixer per la registrazione in studio su registratore
multipista.
Si noti la cuffia separata ed amplificata per la mandata in sala (per i cantanti e gli
strumentisti) ed il sistema di ascolto, composto da diversi tipi di amplificazione e
diffusione, in grado di fornire a chi effettua le registrazioni la sensazione che avrà l’utente
finale nell’ascolto reale.
Conferenza
In questo caso vediamo l’uso del mixer per la diffusione di una conferenza. Nel caso in cui
la conferenza sia diffusa via radio o televisione occorre prevedere una connessione
specifica, esattamente come se si desidera registrare il suono.
Spesso sono connesse apparecchiature di produzione sonora sia per comodità operativa
(es. preparazione e sound check) che per gli intervalli.
Sono connessi, oltre all’eventuale sistema video, un equalizzatore grafico per la correzione
della risposta della sala ed un compressore-limitatore per migliorare la performance del
sistema in presenza di parlatori troppo forti o troppo deboli.
PostProduzione
Sono connessi, oltre all’eventuale sistema video, un’unità di effetti per il miglioramento del
suono della voce dello speaker e un’unità per la produzione di effetti speciali per la
sonorizzazione del video.
Mixer automatici e matrici
Nell’uso pratico, spesso sono in uso apparecchiature che semplificano la vita degli
operatori. I banchi mixer sono quindi spesso automatizzati sia in maniera stand-alone che
in maniera collegata a PC (in ambito di produzione musicale i più usati sono gli Apple
Mac). In questi casi, il primo missaggio viene registrato e fissato in memoria.
Matrici
Mixer automatici
I mixer automatici sono unità nelle quali è il parlatore che impone l’apertura del canale,
semplicemente cominciando a parlare.
I mixer intelligenti sono mixer automatici nei quali le regole possono essere cambiate
durante le operazioni mediante un personal computer o una apposita interfaccia e
spesso sono connessi a sistemi di regia evoluta.
Spesso sono digitali e connessi al sistema di controllo mediante interfaccia di rete locale.
Per isolare e normalizzare un ingresso ad alta impedenza (p.es. uno strumento musicale)
su un ingresso mixer si usa una Direct Injection Box.
Ovvero un preamplificatore con adattatore di impedenza. Nello schema che segue sono
inseriti anche un uscita passante parallela all’ingresso, un attenuatore commutabile (es. da
livello linea a livello amplificato) e un interruttore per la separazione galvanica.
Possono esistere varianti più o meno complesse, passive (come il precedente) o attive, che
attingono energia da batterie o dall’alimentazione phantom presente sul connettore XLR.
Per adattare uno o più microfoni ad un amplificatore senza utilizzare un mixer o per
entrare direttamente su appliances diverse (registratori, banchi di regia video, etc.) si
usano preamplificatori microfonici. Esistono in varie versioni, con effetti e compressori.
Permette di operare selettivamente sulle varie componenti del suono esaltando o limitando
frazioni piccole della gamma sonora.
È utile per correggere i difetti di sala (coloriture) e per evitare le risonanze parassite.
Equalizzatore parametrico
Questi controlli, per ogni canale, sono disponibili per bassi, medio-bassi, medi, medio-alti e
alti. Per i bassi e per gli alti sono spesso disponibili anche i controlli di shelf, che
consentono un taglio (o boost) completo al di sotto o al di sopra di una certa frequenza.
Nei casi ideali è possibile anche decidere con quale pendenza vogliamo che avvenga
questo taglio o boost.
Compressori
I compressori e i limiter sono processori di segnale che riducono la gamma dinamica del
segnale.
In generale i processori che agiscono sulla dinamica vengono appunto detti processori
di dinamica.
L'effetto è quello di consentire al segnale solo un piccolo incremento (non lineare) nel
livello d'uscita per qualsiasi incremento del livello d'ingresso oltre la soglia stabilita.
Quest'azione, poiché elimina i picchi di livello di segnale in un programma, è conosciuta
anche come "livellamento" (leveling), ed i limiter sono anche detti "amplificatori di
livellamento audio" (audio leveling amplifiers).
La soglia di intervento (threshold) può essere stabilita in tutto il range di segnale (da
-40dBu a +20dBU)
Per i segnali sopra la threshold, il rapporto tra la variazione nel livello d'ingresso (in dB) e
la variazione del livello di uscita - dopo la compressione - è conosciuto come "rapporto di
compressione" o ratio.
Tra i valori che l'utente può modificare in un compressore che lavori in peak mode, ci sono
l'attack e il release. I compressori che lavorano in rms mode regolano questi valori
automaticamente.
Con il valore di attacco (generalmente compreso tra 0.1 ms e 200 ms) si stabilisce
quanto velocemente la circuiteria interna del compressore/limiter debba reagire ai
cambiamenti nel livello del segnale d'ingresso. Quanto più lungo viene settato il tempo di
attacco, tanta più parte della dinamica del segnale originale viene lasciata inalterata prima
che entri in azione il compressore. Con tempi d'attacco più lenti, si ottiene un suono più
omogeneo, che tende a mantenere le caratteristiche dinamiche del segnale originale, ma
in compenso il compressore non reagirà molto rapidamente a cambi di livello subitanei, e
questo è un fattore di cui tenere conto nella regolazione del tempo di attacco.
Nell'amplificazione dal vivo (sound reinforcement) possono essere usati per proteggere i
diffusori da eventuali danni meccanici nel caso, ad esempio, della caduta di un microfono
(limitando il livello di picco che sarà fornito all'amplificatore ed agli altoparlanti).
I sistemi di questo tipo effettuano processi di segnale in maniera automatica per evitare
l’insorgenza dell’effetto Larsen o di feedback acustico.
L'effetto Larsen è il tipico fischio/ rumore stridente che si verifica quando un microfono (o
un qualsiasi trasduttore, compresi quelli degli strumenti musicali elettrici) è troppo vicino
all'altoparlante che emette i suoni captati dal microfono stesso; in generale, è il rumore
che si sviluppa quando i suoni emessi da un altoparlante ritornano ad essere captati con
sufficiente "potenza di innesco" da un microfono che li rimanda al medesimo altoparlante,
come in un circuito chiuso.
Meccanici
La prima e più importante famiglia è quella derivante dalla corrente elettrica alternata,
ovvero i 50Hz di rete ed i suoi armonici. Si tenga conto che il rombo di origine elettrica è
formato non solo dai 50Hz ma soprattutto dalla armonica a 100Hz, in quanto i
raddrizzatori di corrente (contenuti negli alimentatori) generano questo tipo di segnale.
La denominazione storica è rumble.
Nel caso di rumori dovuti all’alimentazione ma di tipo PWM o di alimentatori digitali (p.es.
PC portatili), il rumore è tipicamente in banda medio-alta.
Non vi sono alternative alla eliminazione (a parte a livello progettuale) mediante filtri
parametrici.
Elettronici
Il rumore è in linea di massima non eludibile e può essere corretto l’effetto abbassando gli
acuti.
I segnali spuri di origine analogica sono dovuti a scariche o a instabilità al transiente.
Le scariche possono essere limitate evitando l’uso di componenti non mantenuti (p.es.
potenziometri sporchi o ossidati, spine e prese ossidate, commutatori, etc.).
Le instabilità al transiente sono sostanzialmente legate alle distorsioni per clipping.
Il rumore di origine digitale, invece, non è eludibile in quanto presente in banda e non
correlabile al segnale. Di norma è prodotto dal fenomeno dell’alias.
L'aliasing (dal latino alias, altrove) è il fenomeno per il quale due segnali analogici diversi
possono diventare indistinguibili una volta campionati: questo costituisce un serio
problema che si riflette direttamente sull'uscita del sistema in esame, alterandone la
veridicità.
L'aliasing può verificarsi sia nel tempo (aliasing temporale) che nello spazio (aliasing
spaziale).
Il problema del aliasing può essere osservato anche visivamente, basta far caso che in
televisione o al cinema (dove l'immagine è campionata a 25 Hz), oggetti in rotazione a
frequenza superiori, come pale di elicottero o ruote di automobili, spesso ci appaiano
girare lentamente, o addirittura al contrario, rispetto a quanto ci si aspetterebbe.
Nella conversione analogico-digitale sono inseriti, a monte della conversione vera e propria
un sistema di dithering ed un filtro anti-alias.
Disco analogico
Il disco in vinile (piastra circolare incisa con un solco a spirale per la riproduzione di
suoni) è stato ufficialmente introdotto nel 1948 negli Stati Uniti come evoluzione dei
precedenti dischi, dalle simili caratteristiche inizialmente in gommalacca.
velocità di durata
denominazione
diametro rotazione approssimativa
comune
in giri al minuto per facciata
• piezoelettrico
• magnete mobile
• bobina mobile
Nastro magnetico
Il termine bobina aperta non era usato nei primi tempi, ma fu coniato nei primi anni '60
quando entrarono in commercio le cartucce stereo 8 e le musicassette.
In generale, più elevata è la velocità del nastro migliore è la qualità della registrazione.
Velocità del nastro lente sono molto utili per ottenere buone autonomie di registrazione
nei casi in cui la qualità audio non sia un requisito fondamentale.
• 15/16 pollici per secondo (in/s) o 2.38 cm/s — usata per registrazioni molto lunghe
(per esempio, l'intera emissione di una stazione radio come archivio, o in caso di
reclami)
• 1⅞ in/s o 4.76 cm/s — di solito la velocità inferiore delle registrazioni domestiche,
ideale per lunghe registrazioni di discorsi; è la velocità adottata per le compact
cassette C7
• 3¾ in/s o 9.52 cm/s — offre un buon compromesso tra velocità e durata
• 7½ in/s o 19.05 cm/s — velocità più alta per registrazioni domestiche, e la più
bassa per utilizzi professionali; usata da molte stazioni radio per copie e spot
pubblicitari
• 15 in/s o 38.1 cm/s — registrazioni musicali professionali ed emittenza radiofonica
• 30 in/s o 76.2 cm/s — usata dove si richiede la massima risposta ai toni alti, per
esempio gran parte delle registrazioni di musica classica
Musicassette
In origine era costituita da una certa quantità di nastro magnetico della BASF racchiusa in
un guscio protettivo in materiale plastico. Il nastro disponeva di quattro tracce, dando la
possibilità di registrare due tracce stereo – una riproducibile con il lato 'A' posto in alto e
l'altra utilizzabile capovolgendola – in modo analogo a quanto avviene con i dischi.
Esistevano altri sistemi a cartuccia di nastro (come lo Stereo 8) ma la musicassetta si
affermò col supporto della Philips denominato Compact Cassette e lanciato sul mercato nel
1963. La produzione di massa cominciò nel 1965 ad Hannover in Germania e
contestualmente iniziò la vendita di nastri preregistrati. Attualmente obsoleta e dismessa
dal 2007.
Dat
Il DAT converte il suono ad una frequenza di campionamento più o meno elevata rispetto
al CD (48, 44.1 o 32 kHz di frequenza, e 16 bit di quantificazione), senza compressione
audio. Questo significa che tutto il segnale di input viene mantenuto. Se viene riprodotta
una risorsa digitale, allora il DAT produrrà un clone identico, al contrario di quello che
fanno per esempio la musicassetta, che registra il segnale analogico, o il minidisc che usa
una compressione di tipo lossy.
In gran parte dismessi e resi obsoleti dalle tecnologie su supporto statico o su disco rigido.
I DAT sono di durata variabile tra 15 e 240 minuti; uno di 120 minuti è lungo circa 60
metri.
CD
Il Compact Disc Digital Audio, in sigla CDDA, comunemente chiamato CD Audio, è uno
standard di registrazione audio su compact disc dedicato al home audio.
IL CD Audio è stata la versione originale dei CD, da cui sono derivati tutti gli altri formati.
La struttura fisica del disco ed i protocolli di memorizzazione dei dati è descritta nel Red
Book (traduzione letterale: libro rosso), redatto da Sony e Philips nel 1980, anno in cui
cominciò la vendita dei CD.
Le specifiche prevedono una capacità standard per un CD Audio di 747 MB, equivalenti,
tenendo conto dello spazio occupato per la correzione di errore, a 74 minuti di musica
stereofonica campionata a 44,1 kHz a 16bit (secondo una leggenda la durata è stata
definita tale per contenere la nona sinfonia di Beethoven).
DVD
I DVD-Audio non contengono alcun tipo di dato video, e non devono essere confusi con i
DVD-Video di concerti o video musicali. Essi sono nati, invece, per rappresentare la
naturale evoluzione di CD-Audio, pur incontrando, in tal senso, notevoli difficoltà di
diffusione e standardizzazione.
Possibili configurazioni dei dati su DVD-Audio
16-, 20- o 24-bit
Numero di canali audio
44.1 kHz 48 kHz 88.2 kHz 96 kHz 176.4 kHz 192 kHz
Mono(1.0) SI SI SI SI SI SI
Stereo(2.0) SI SI SI SI SI SI
Stereo (2.1) SI SI SI SI NO NO
Stereo + mono surround (3.0 o 3.1) SI SI SI SI NO NO
Quadrifonico (4.0 o 4.1) SI SI SI SI NO NO
3-stereo (3.0 o 3.1) SI SI SI SI NO NO
3-stereo + mono surround (4.0 o
SI SI SI SI NO NO
4.1)
Full Surround(5.0 o 5.1) SI SI SI SI NO NO
SA-CD
Il Super Audio Cd (SACD) è un supporto che utilizza la tecnologia di audio digitale DSD
(Direct Stream Digital, senza riconversione da digitale in analogico). Supporta audio in
formato stereo e 5.1. Necessita di un lettore apposito per essere riprodotto. Può essere
abbinato, in un supporto multistrato, ad un CD audio normale per creare un CD ibrido che
può essere letto anche nei normali lettori cd. La tecnologia usata (DSD) è diversa da
quella normalmente utilizzata per gli altri supporti di audio digitale (PCM) e si basa sul
concetto della Delta Modulation. Il SACD riproducendo le forme d'onda originali con
maggiore accuratezza, fornisce un'immagine del suono più definita e aderente al master
originale di studio di registrazione, con eccezionale realismo.
Il disco è integrato in una custodia di plastica rigida di 7x7cm che lo protegge dagli urti,
dai graffi e dalla polvere e può contenere circa 145 MB di informazione digitale. Grazie
all'algoritmo di compressione audio ATRAC di tipo lossy proprietario della Sony (analogo
all'MP3) su di un minidisc si possono memorizzare circa 74-80 minuti di audio (il doppio se
la registrazione è effettuata in mono). Sebbene sia stato pensato come il successore
digitale della musicassetta, il minidisc non ha goduto di una vasta diffusione, a causa del
successo del compact-disc (CD) come supporto e dell'MP3 come algoritmo di
compressione audio. Obsoleto.
DVD
Il DVD, acronimo di Digital Versatile Disc (in italiano Disco Versatile Digitale,
originariamente Digital Video Disc, Disco Video Digitale) è un supporto di memorizzazione
di tipo ottico.
Il DVD è il prodotto della cooperazione di alcune fra le maggiori aziende nel campo della
ricerca e dell'elettronica di consumo: il cosiddetto DVD forum, ovvero l'istituzione che si è
incaricata di redigere le specifiche del nuovo supporto, era infatti formata da Philips, Sony,
Matsushita, Hitachi, Warner, Toshiba, JVC, Thomson e Pioneer. L'intento era quello di
creare un formato di immagazzinamento di grandi quantità di video digitali che fosse
accettato senza riserve da tutti i maggiori produttori, evitando quindi tutti i problemi di
incertezza del mercato dovuti alla concorrenza fra formati che si erano presentati al tempo
dell'introduzione delle videocassette per uso domestico.
I DVD-Video sono supporti digitali in grado di contenere fino a 240 minuti[1] di materiale
video in formato MPEG-2.
L'audio può essere in formato non compresso PCM (da 1 a 8 canali), in formato Dolby
Digital AC3 (che prevede da 1 a 6 canali), in formato DTS (fino a 8 canali) o in formato
MPEG.
I DVD "double layer" permettono una doppia incisione nello stesso lato. La capacità del
supporto non raddoppia esattamente, perché una parte di memoria è dedicata alla
creazione di un indice e al controllo della distribuzione dei dati.
Il double side o "doppio lato" è un supporto che può essere inciso o riscritto da tutti e due
i lati.
Il file system largamente usato nei DVDRom è l'UDF (Universal Disk Format).
HD-DVD
HD DVD (acronimo di High Defintion Digital Versatile Disc) era un formato ottico digitale
sviluppato al fine di diventare uno standard per i DVD di nuova generazione adatti ai
contenuti ad alta definizione, promosso da Toshiba, NEC, Sanyo, Microsoft e inizialmente
supportato da Paramount Pictures, Dreamworks e da Universal Studios.
Un disco HD DVD ha una capacità di 15 GB per ogni singolo layer, ed esiste in 3 versioni
differenti: 15 GB (1 layer), 30 GB (2 layer) e 45 GB (3 layer).
Il Blu-ray Disc è il supporto ottico proposto dalla Sony agli inizi del 2002 come evoluzione
del DVD per la televisione ad alta definizione.
Grazie all'utilizzo di un laser a luce blu, riesce a contenere fino a 54 GB di dati, quasi 12
volte di più rispetto a un DVD Single Layer - Single Side (4,7 GB)
Dati tecnici
Capacità ROM (sola lettura) (1 layer) 25 GB
(2 layer) non disponibile
(3 layer) 50 GB
(4 layer) 100 GB
(8 layer) 200 GB
Capacità RW (riscrivibile) (1 layer) 25 GB
(2 layer) 50 GB
Capacità R (registrabile) (1 layer) 25 GB
(2 layer) 50 GB
Processo produttivo nuova tecnologia
Lunghezza d'onda del laser 405 nm
Apertura numerica 0,85
Strato protettivo 0,1 mm
Dimensione della traccia 0,32 μm
Dimensione minima del pit 149,0 nm
Velocità di trasferimento dati 36 Mbps (1x)72 Mbps (2x)54
Mbps
Risoluzione video 1920 × 1080
Compressione video ROM MPEG-2MPEG-4 AVC
(H.264)VC-1
RW/R MPEG-2
Codifica audio PCM, Dolby Digital, Dolby
Digital Plus, DTS, DTS-
HD, Dolby TrueHD
SD Secure Digital
Secure Digital (chiamate più brevemente SD) è il più diffuso formato di schede di
memoria. Le "Secure Digital" hanno capacità molto elevate, seconde solo alle
CompactFlash; attualmente raggiungono una capacità di 32 GB. Molti Notebook sono già
equipaggiati con lettori appositi che consentono l'utilizzo di queste schede di memoria.
Sia le microSD che le miniSD possono essere utilizzate con lettori di SD mediante semplici
adattatori.
Le SD sono molto resistenti agli urti (2000 g, contro i 100-200 g di un comune hard disk).
Analogamente alle MultiMediaCard, le SD utilizzano contatti superficiali anziché connettori
maschio-femmina, fatto che ne aumenta ulteriormente la robustezza ma le rende poco
indicate per applicazioni in ambienti particolarmente gravosi (specie in presenza di
vibrazioni).
La capacità massima attuale delle SD è di 32 GB (16 GB prima di gennaio 2008); per le
miniSD e le microSD di 16 GB.
I file audio inseriti nel supporto possono essere in un qualunque formato digitale.
Altri supporti digitali
Lo stato dell'arte attuale prevede che un segnale audio sia convertito (e quindi codificato)
in un analogo segnale elettrico (analogo per informazione contenuta, a meno
dell'inevitabile rumore introdotto da qualsiasi manipolazione) per mezzo di un microfono o
un trasduttore, il quale produce, quando viene colpito da una onda meccanica, un segnale
elettrico ininterrotto, i cui valori di tensione, normalmente compresi in un range (detto
dinamica del segnale e compreso tra un minimo e un massimo), contengono la forma
dell'onda sonora originaria.
Un segnale siffatto, continuo nel tempo e che può assumere con continuità tutti i valori
all'interno della sua dinamica, è detto analogico.
Una seconda conversione può essere fatta associando a questo segnale una serie
numerica (quindi digitale) che codifichi con sufficiente precisione la forma d'onda elettrica
analogica originaria, ottenendo così la conversione analogico-digitale, detta brevemente
conversione A/D.
Per far questo è necessario leggere i valori di tensione continui della forma d'onda
analogica con sufficiente frequenza temporale, cioè effettuare una lettura sufficientemente
fitta di questi valori di tensione, producendo un numero di letture (e quindi di valori
numerici) in genere molto alto per ogni secondo di conversione A/D.
Le singole letture sono dette campioni e il teorema del campionamento afferma che se la
frequenza temporale di queste letture (detta frequenza di campionamento) è
sufficientemente grande, non si hanno perdite di informazione rispetto alla forma d'onda
originale. Cioè la serie di numeri prodotta contiene pressoché intatta tutta la informazione
sulla forma d'onda elettrica analogica iniziale. Nei moderni standard tecnologici, in genere
le frequenze di campionamento spaziano dagli 8.000 campioni al secondo ( Samples per
second, S/s) per la voce telefonica, fino ai 44.100 e più campioni al secondo per la qualità
musicale.
Queste letture di valori di tensione possono poi cadere in un qualsiasi punto della dinamica
del segnale, cioè ogni singolo campione può avere un valore compreso tra il minimo e il
massimo possibile.
Si possono quindi avere infiniti valori di lettura di tensione per ogni singolo campione. Per
effettuare correttamente la conversione del segnale da analogico in digitale, va ora
suddiviso tutto il possibile range dinamico del segnale in un numero finito di intervalli e
ogni singolo intervallo va codificato con un valore numerico determinato. Queste due
operazioni si chiamano quantizzazione e codifica di sorgente. La quantizzazione in
genere suddivide il range dinamico del segnale in un numero di intervalli pari a potenze di
due (2n intervalli), in maniera tale che ogni singolo campione cadrà inevitabilmente in uno
degli intervallini quantizzati e potrà così essere codificato digitalmente con n bit.
I valori più ricorrenti di digitalizzazione attualmente usati vanno da un minimo di 8 bit per
campione in campo telefonico, fino a 24 e più bit per campione (range dinamico del
segnale suddiviso in 28 - 224, pari a 256 – 16milioni di intervalli). Naturalmente
all'aumentare del numeri dei bit per campione aumenta la fedeltà del segnale campionato
alla forma d'onda originale e si riduce l'imprecisione introdotta dalla quantizzazione
(rumore di quantizzazione).
La serie numerica così prodotta è detta segnale audio digitale e contiene in sé tutte le
informazioni necessarie per ricostruire la forma elettrica originale, che a sua volta era
l'immagine quasi perfetta della forma d'onda acustica che l'aveva originata. Volendo, si
potrebbe quindi ora procedere alla sua conversione da digitale ad analogica con
convertitori D/A, per riottenere la forma elettrica originale, che una volta inviata ad un
altoparlante riproduce il suono originario.
Tutto questo processo costa in termini di introduzione di rumore vario, ma con le moderne
tecniche questo può facilmente essere tenuto sotto una soglia in genere accettabile.
Il segnale audio digitale prodotto dai convertitori A/D è in genere codificato con un certo
numero di bit per ogni campione e così una registrazione audio di 60 secondi campionata
a 44.100 campioni al secondo, con ogni campione codificato con 16 bit, dà per risultato
una sequenza di 44.100 campioni al secondo per 60 secondi, pari a 2.646.000 campioni,
che vanno ora moltiplicati per 16 bit per campione, ottenendo una serie di 42.336.000 bit.
Questo segnale audio digitale così codificato è detto “raw”, cioè grezzo.
Campionamento
Il teorema, comparso per la prima volta nel 1949 in un articolo di C. E. Shannon, dovrebbe
chiamarsi Whittaker-Nyquist-Kotelnikov-Shannon, secondo l'ordine cronologico di
chi ne dimostrò versioni via via più generalizzate.
Segnale analogico
In generale un segnale analogico non è limitato in frequenza, ma dovrà essere filtrato per
Il teorema del campionamento è utilizzato molto spesso anche in analisi statistica per
stabilire il numero di esperimenti da eseguire per collezionare un numero di dati
(campioni) sufficienti per poter ricostruire correttamente una funzione non nota in alcuni
punti, per esempio in punti inaccessibili a causa di vincoli fisici oppure semplicemente per
ottenere dati tra due punti campionati tramite un esperimento.
L'idea che sta alla base della digitalizzazione è la seguente: qualsiasi grandezza fisica di
interesse (tensione, corrente, pressione, velocità...) viene misurata e il valore della sua
misura codificato come numero binario; se la grandezza assume diversi valori nel tempo,
essa sarà misurata a intervalli regolari, dando luogo ad una sequenza di numeri.
WAV (o WAVE), contrazione di WAVEform audio format (formato audio per la forma
d'onda) è un formato audio sviluppato da Microsoft e IBM per personal computer IBM
compatibile. È una variante del formato RIFF di memorizzazione dei dati. I dati vengono
salvati in "chunk" (blocchi), è simile anche al formato IFF o al AIFF utilizzato dai computer
Apple Mac.
Sia i file nel formato WAV che AIFF sono compatibili con i sistemi operativi Windows e
Macintosh. La differenza principale per questo formato è che, essendo progettato per
computer montanti processori Intel o compatibili, i dati vengono memorizzati con la
notazione little endian, a differenza degli altri formati che, essendo sviluppati
prevalentemente per computer con processori Motorola, utilizzano la notazione big endian.
Essendo basato sullo standard RIFF il formato supporta varie modalità di
immagazzinamento dei dati ma nella pratica il più diffuso è il metodo PCM.
Il PCM provvede a salvare i dati audio senza nessun tipo di compressione, la forma d'onda
viene memorizzata direttamente. Quindi i file risultanti sono di elevate dimensioni, ma non
richiedono elevata potenza di calcolo per essere riprodotti, ed essendo la codifica
lossless, viene spesso utilizzata dagli utenti professionali per memorizzare l'audio. Molti
programmi supportano questo formato, dato che è molto diffuso ma non semplice da
manipolare date le sue dimensioni molto elevate di byte.
La compressione audio è una tecnica che permette di ridurre le dimensioni di un file audio
o la banda passante richiesta per una trasmissione audio, anche di molto.
Un file è una sequenza di cifre binarie (bit) utilizzata come veicolo di informazione.
Comprimere significa ridurre il numero delle cifre che costituiscono la sequenza
mantenendo l'informazione inalterata o in un intorno dell'informazione originaria (ossia
facendo in modo che la nuova informazione approssimi quella precedente).
• con perdita (lossy): quando l'informazione contenuta nel file compresso è minore
di quella contenuta nel file di origine
• senza perdita (lossless): quando l'informazione contenuta nel file compresso è
identica a quella contenuta nel file di origine
Codec
I codec audio possono effettuare anche una compressione dei dati in modo da ridurre la
quantità di dati che compone un flusso audio. I codec possono effettuare una
compressione senza perdita di informazioni o con perdita di informazioni. Nel caso di
compressioni senza perdita di informazioni si possono ottenere dei fattori di compressione
del 50% o meno mentre se si utilizzano compressioni con perdita di informazione si
possono ottenere compressioni anche del 500% con qualità accettabile.
I dati prodotti dai sistemi audio sono relativamente pochi rispetto a quelli prodotti da un
flusso video e difatti esistono codec audio non compressi mentre i codec video non
compressi sono riservati ad applicazioni professionali e non sono diffusi tra i personal
computer. Comunque la maggior parte dei codec audio adottano tecniche di compressione
a perdita di informazione dato che la diffusione di internet ha reso necessario ridurre al
minimo i dati trasmessi mentre la potenza di calcolo necessaria per decodificare i flussi
audio compressi non è un problema per gli attuali computer.
Senza compressione
• AIFF
• WAV/PCM
Compressione lossless
• Apple Lossless Encoding
• FLAC
• IFF
Compressione lossy
• Advanced Audio Coding
• ATRAC
• Dolby Digital
• Digital Theater System
• G.729
• MP3
• Mp3PRO
• Musepack
• RealAudio
• Speex
• Vorbis
• Windows Media Audio
Standard
Di seguito sono elencati alcuni degli standard di formato audio digitale importanti per
diffusione o tecnologia. Alcuni di questi sono sistemi di codifica, con o senza
compressione, altri sono contenitori. Ho ritenuto utile inserire anche Speex, G.729 e CELP
quali esempi di formato specifico per la voce.
MP3
MP3 (per esteso Motion Picture Expert Group-1/2 Audio Layer 3) è un algoritmo di
compressione audio di tipo lossy in grado di ridurre drasticamente la quantità di dati
richiesti per memorizzare un suono, rimanendo comunque una riproduzione fedele del file
originale non compresso.
La codifica MPEG-1/2 Layer 2 iniziò come progetto presso la DAB e promosso dalla
Fraunhofer IIS-A. Venne finanziato dall'Unione europea come parte di un programma di
ricerca più vasto chiamato EUREKA comunemente conosciuto con il codice EU-147.
EU-147 fu attivo dal 1987 al 1994. Nel 1991 vennero fatte due proposte per uno standard
disponibile: Musicam (conosciuto come Layer II) e ASPEC (Adaptative Spectral Perceptual
Entropy Coding) (con analogie con l'MP3). Venne scelto Musicam perché più semplice ed
affidabile.
Un gruppo di lavoro condotto da Karlheinz Brandenburg e Jürgen Herre fece confluire gli
studi su Musicam e ASPEC con alcune loro idee e creò l'MP3, che fu progettato per
realizzare la stessa qualità a 128 kbit/s dell'MP2 a 192 kbit/s.
Entrambi gli algoritmi furono completati nel 1992 con la sigla MPEG-1, come prima fase di
sviluppo del progetto denominato MPEG e definito come standard internazionale con il
codice ISO/IEC 11172-3 e pubblicato nel 1993. Un'ulteriore fase del progetto MPEG Audio
si concluse nel 1994 con la creazione del MPEG-2 definito come standard internazionale
con il codice ISO/IEC 13818-3 e pubblicato nel 1995.
La qualità dipende non solo dal formato di codifica del file, ma anche dalla qualità psico
acustica del codificatore. Il codificatore tipico layer 1 usa un modello psicoacustico molto
elementare che finisce per richiedere molti più bit per un risultato soddisfacente.
• La codifica Layer 1 a 384 kbit/s, anche con questo semplice "psico acustico" è
migliore della codifica Layer 2 a 192 … 256 kbit/s.
• La codifica Layer 3 a 112 … 128kbit/s è peggiore del Layer 2 a 192 … 256 kbit/s
L'algoritmo che utilizza il formato MP3 si basa su una trasformazione ibrida che trasforma
il segnale dal dominio temporale a quello delle frequenze.
AAC MPEG-4
Attualmente viene utilizzato principalmente da Apple nei suoi prodotti dedicati all'audio
(iTunes); difatti Apple usa sia una variante dell'AAC che gestisce i diritti d'autore DRM
(AAC Protected), con compressione a 128 kb/s, sia una versione senza protezione (AAC
Plus), con compressione a 256 kb/s, per vendere musica attraverso il proprio negozio di
musica on-line iTunes Store.
Una compressione a 128 kb/s corrisponde all'incirca a quella di un MP3 a 165-175 kb/s.
Ne esiste una variante usata spesso per lo streaming audio a basso bitrate, l'AAC Plus, che
utilizza la compressione AAC per le basse frequenze, e l'SBR, per ricreare le frequenze
alte.
L'AAC è diventato recentemente il formato standard di audio per le console Play Station 3
e Wii.
OGG-Vorbis
Vorbis è un algoritmo open source per la compressione audio digitale di tipo lossy, diretta
antagonista di altri standard come MP3, VQF, AAC. A parità di qualità percepita, permette
una maggiore compressione rispetto al formato MP3, ottenuta mediante avanzate ricerche
di psicoacustica.
Tra i difetti attribuiti vanno citati la relativa pesantezza dell'algoritmo di decodifica rispetto
al collaudato MP3, e soprattutto una certa tendenza al pre-echo, ovvero un innaturale
fantasma sonoro che sembra precedere di alcuni brevi istanti ogni brusco aumento di
pressione sonora. L'esempio che tipicamente viene portato è quello di una sonata di
pianoforte con attacchi di fortissimo dal silenzio, oppure il suono delle nacchere.
Nel trattamento di segnale stereo musicale Vorbis ha il suo bit rate ideale intorno ai 128
kbit/s, risultando estremamente difficoltoso da distinguere rispetto all'originale in un
ascolto cieco già da 192 kbit/s.
La sua caratteristica licenza open source ha permesso negli anni lo sviluppo di encoder
paralleli a quello ufficiale, tra i quali aoTuV appare come il più efficiente. Trattandosi di un
algoritmo di compressione lossy, cioè a perdita di informazioni, è l'encoder a svolgere il
compito più delicato in assoluto, dovendo scegliere quale parte di informazione acustica
sacrificare.
Tuttavia, a causa del citato approccio a bitrate variabile, l'encoder non è in grado di fornire
alcuna garanzia di coerenza tra il bit rate nominale associato al livello di qualità selezionato
e il bit rate medio finale effettivo risultante dalla compressione.
WMA
Il Windows Media Audio (WMA) è uno standard per file audio inventato dalla Microsoft. I
file con estensione WMA sono file di tipo Advanced Systems Format (.asf) il cui audio è
compresso con il codec WMA. L'unica differenza tra i due formati, al di là delle estensioni,
è il tipo MIME, che per gli .asf è video/x-ms-asf e per i .wma è audio/x-ms-wma. A parte
questo, la struttura di base dei due file è identica.
Windows Media Audio, insieme all'omonimo Player, è ormai giunto alla versione 9.0.Il
formato è dotato di una libreria di codec con una resa qualitativa superiore del 20%
rispetto alla versione precedente.
Il Dolby Digital è un sistema di codifica cosiddetto "lossy", ovvero in cui la codifica audio
avviene con perdita di informazioni.
Il sistema prende in input segnali audio digitali PCM, codificati a 48.000 Hz di frequenza di
campionamento e 16 bit di risoluzione, li trasforma analizzandoli nel dominio della fre-
quenza, per poi scartare parte dei dati riducendone la risoluzione effettiva ed innalzando il
livello del rumore digitale. Tutta l'operazione viene eseguita cercando il più possibile di
mantenere la soglia del rumore (di quantizzazione) al di sotto del livello udibile, utilizzando
metodi di analisi di tipo "psicoacustico". L'idea è che la risoluzione effettiva con cui l'appa-
rato uditivo umano è in grado di percepire uno o più suoni, varia dinamicamente con il
contenuto del segnale (musicale) composto. Un tono perfettamente udibile come tono
puro, può essere completamente "inudibile" se mascherato da un tono vicino, magari di
intensità superiore.
Monkey's Audio è uno dei più potenti e diffusi algoritmi di compressione multimediale
lossless per file sonori.
Il formato lossless, ovvero senza perdita di dati, garantisce il mantenimento della qualità
sonora iniziale su file di dimensioni inferiori ai formati a campioni in-compressi (es. wav).
Il formato utilizzato è il ".ape", Monkey's Audio permette la compressione di un sorgente
WAV in ape e anche il procedimento opposto, ovvero la decodifica da ape ad altri formati
come il WAV o l'MP3.
Meridian MLP
La Meridian Lossless Packing è una tecnica proprietaria di compressione audio dei dati di
Pulse-Code Modulation senza perdita d'informazione (lossless), sviluppata dalla Meridian
Audio. L'MLP è lo standard utilizzato per la compressione dei contenuti DVD-Audio e per-
mette, solitamente, una compressione con un fattore di 2:1. Tutti i lettori DVD-Audio sono
equipaggiati con il relativo codec, mentre il suo utilizzo sul singolo DVD è a discrezione del
produttore.
È conosciuto anche con il nome di Packed PCM (PPCM) e, con l'avvento dei DVD di nuova
generazione, prenderà il nome di Dolby TrueHD, aggiungendo un campionamento a
frequenze più elevate, maggior bit rate, 8 canali, metadata completi, il nuovo formato
proposto dalla Society of Motion Picture and Television Engineers (SMPTE) ed il timecode.
MusePack MPC
FLAC
FLAC (Free Lossless Audio Codec) è un diffuso codec audio libero di tipo lossless, cioè
senza perdita di qualità. A differenza delle codifiche lossy (come l'ogg vorbis, l'MP3 o
di massa. Il formato FLAC è attualmente supportato da una buona parte dei software
audio.
FLAC diversamente dalla maggior parte degli algoritmi di compressione lossless (come ad
esempio ZIP e gzip), raggiunge compressioni importanti, dell'ordine del 30-50% contro il
10-20% raggiunto da quelli tradizionali. Con algoritmi lossy si raggiungono senza difficoltà
riduzioni molto più estreme, a discapito di una perdita di qualità sonora nettamente udibile
anche con sistemi di riproduzione audio non professionali.
Il 29 gennaio 2003 Xiphophorus (adesso Xiph.Org Foundation) ha annunciato l'inclusione
del FLAC fra i propri progetti, insieme con Ogg Vorbis, Ogg Theora e Speex.
A partire dal mese di Dicembre 2008 la prestigiosa casa discografica Deutsche
Grammophon, che sin dai primi anni del '900 pubblica esclusivamente musica classica, ha
iniziato a rendere disponibili, per il download a pagamento, i propri titoli in formato flac.
RealAudio
ATRAC
Speex
Speex è un codec open source per la compressione del parlato sviluppato per non
infrangere alcun brevetto software. La sua distribuzione è regolata dalla Licenza BSD e
può essere usato in flussi in formato Ogg oppure trasmesso direttamente usando
UDP/RTP.
Il codificatore Speex usa il formato bitstream Ogg, ed i suoi progettisti vedono il proprio
progetto come complementare a Vorbis un codec di compressione audio di uso generico.
CELP
G.729
È utilizzato soprattutto nel Voice over IP (VoIP) grazie ai suoi requisiti di banda.
Normalmente una trasmissione in G.729 utilizza un pacchetto IP con header IP/UDP/RTP.
Nelle applicazioni software spesso l'algoritmo ha una sample period di 20ms. Questo
significa che vengono generati due campioni di 10ms, di 10byte ciascuno. I due campioni
vengono quindi inviati in un pacchetto IP/UDP/RTP con un header non compresso di
40byte. Considerando le reti oggi in uso, di tipo XDSL o Ethernet, un canale G729 a 8kbps
può spesso occupare 26kbps di banda o superiore, a meno di non usare degli
accorgimenti.
Tabella riassuntiva