Sei sulla pagina 1di 63

Conservatorio di Musica G.

Verdi di Milano
Dipartimento di Musica con Nuove Tecnologie
Scuola di Musica Elettronica

Acustica musicale

a.a. 2013-14

Settore artistico-disciplinare COME/03


Docente: Angelo Conto
Aula n. 112

Conservatorio di Musica G. Verdi di Milano


Dipartimento di Musica con Nuove Tecnologie
Scuola di Musica Elettronica

Acustica musicale
Psicoacustica
Loudness (sonorit o volume)

Conservatorio di Musica G. Verdi di Milano


Dipartimento di Musica con Nuove Tecnologie
Scuola di Musica Elettronica
Bibliografia:
A. Frova - Fisica nella musica - ed. Zanichelli
Pierce - La scienza del suono - Zanichelli
Campbell and Grated - The musicians guide to acoustics - Oxford Press
Everest - Manuale di Acustica - ed. Hoepli
Wolfe et al. - Sensazione e Percezione - Zanichelli
Gussoni, Monticelli, Vezzoli - Dallo stimolo alla sensazione - CEA

Siti internet:
University of New South Wales; Department of Music Acoustics: http://www.phys.unsw.edu.au/music
Dr. Dan Russell, Grad. Prog. Acoustics, Penn State, http://www.acs.psu.edu/drussell
Fisica Onde Musica http://fisicaondemusica.unimore.it

Immagini, animazioni e video:


Dr. Dan Russell, Grad. Prog. Acoustics, Penn State, http://www.acs.psu.edu/drussell/
Joe Wolf - licensed under a Creative Commons Attribution-Noncommercial-No Derivative Works 2.5
Australia License
http://fisicaondemusica.unimore.it: Licenza Creative Commons: Attribuzione - Non commerciale - Condividi
allo stesso modo 2.5 o successive.

Psicoacustica
Loudness
La loudness (o sonorit o volume) la sensazione in base alla quale possibile ordinare un
insieme di suoni in una scala che va da piano a forte
La rappresentazione grafica musicale :

Villa Lobos As tres Marias

La loudness, a differenza dellaltezza, non monodimensionale, ovvero non dipende in


maniera prevalente da una sola grandezza fisica.

Esempi: bande ISO Norm


Diagramma volume

Psicoacustica
Loudness - suoni semplici
Come abbiamo potuto dedurre dallesperienza precedente, a seconda della frequenza della
sinusoide, il suo volume percepito varia notevolmente, anche se lintensit dellonda sempre
uguale. Di conseguenza, per ottenere delle sinusoidi che diano la stessa sensazione di volume a
tutte le frequenze, esse non possono avere uguale intensit, ma devono essere
opportunamente calibrate.
Uno studio di Fletcher e Munson, risalente agli anni 30, ha messo in luce questa inportante
caratteristica tramite un diagramma, chiamato audiogramma normale di Fletcher-Munson.
Esso composto da curve, dette isofoniche, che indicano suoni che danno la stessa
sensazione di volume. Da una curva alla successiva, la sensazione di volume pressapoco
doppia (o pari alla met, se si passa ad una di minor valore), e come riferimento stata presa la
frequenza di 1000 Hz, dove le curve sono distanziate in maniera regolare di 10 dB.
Ogni curva contrassegnata da un numero, che indica il volume percepito secondo una
apposita scala detta phon.
La curva relativa a 0 phon rappresenta la soglia di udibilit; delimita quindi i suoni che
riusciamo a percepire dai suoni troppo deboli per essere uditi.
La curva relativa a 120 phon rappresenta la soglia del dolore, o soglia lacerante; delimita
quindi i suoni che rappresentano il limite oltre i quali possono danneggiare il timpano o
lorecchio interno.
Possiamo notare che il massimo di sensibilit si ha per le frequenze attorno ai 3000 Hz; la
risposta risulta comunque accentuata nel range 10005000 Hz.

Psicoacustica
Loudness - suoni semplici
AD 6 frequency responce of the ear: comparazione della soglia di udibilit in una stanza

mediante lutilizzo di toni puri di frequenza 125, 250, 500, 1000, 2000, 4000, 8000 Hz. I toni
hanno durata di 100 ms e decrescono di intensit in 10 step di -5 dB ciascuno.
Demonstration 6
L'orecchio umano non ha una risposta in frequenza lineare. E' pi sensibile nel range tra 1000 e
5000 Hz che alle basse ed alte frequenze. La sensibilit ha un picco nel range 2000-4000 Hz
per via della risonanza del condotto uditivo ed ridotta dalla funzione di trasferimento
dell'orecchio medio, la quale meno efficiente alle basse ed alte frequenze. Questi elementi
(acustici) della funzione di trasferimento globale sono descritti dal diagramma di FletcherMunson, che descrive la sensazione di volume di un tono sinusoidale al variare della frequenza.
Le misurazioni ad alte intensit risentono del fatto che quando il livello aumenta, il pattern di
vibrazione della membrana basilare a basse frequenze riguarda una grossa parte della
membrana e quindi coinvolge molti neuroni. Perci le curve di uguale sensazione sonora sono
molto pi lineari ad alta intensit rispetto alla soglia di udibilit.

Psicoacustica
Loudness - suoni semplici

Psicoacustica
Loudness - suoni semplici

Curve isofoniche per ascolto binaurale in cuffia

Psicoacustica
Loudness - suoni semplici
Dalle curve di Fletcher e Munson sono state ricavate tre curve principali che costituiscono degli
standard adottati nelle misurazioni. Queste curve sono dette curve di ponderazione A, B, C e
sono definite come segue:
Curva di filtro A: andamento inverso rispetto alla curva isofonica a 40 phon
Curva di filtro B: andamento inverso rispetto alla curva isofonica a 70 phon
Curva di filtro C: andamento inverso rispetto alla curva isofonica a 100 phon
Il livello sonoro misurato con i filtri A, B, C si esprime in dB(A), dB(B), dB(C).
Limitazioni nelluso delle curve di ponderazione:
curva A per Ltot < 60 dB
curva B per 60< Ltot < 100 dB
curva C per Ltot > 100 dB

Psicoacustica
Loudness - suoni semplici
(Fonte: sito internet prof. Massimo Garai, Universit di Bologna)
La curva di ponderazione "A" risultata quella in media meglio correlata con la risposta
soggettiva umana a rumori generici a larga banda; questo fatto, unito alla facilit di una
misurazione fonometrica in dB(A), ha portato all'adozione della curva "A" in molte norme e
leggi nazionali ed internazionali. D'altra parte, ben noto che questo modo di procedere si
presta a molte critiche:
- vi sono molte altre scale di valutazione della sensazione sonora, in genere ben pi raffinate
della curva "A";
- le curve isofoniche sono state costruite lavorando con toni puri, mentre la curva "A" viene in
genere usata per valutare rumori a larga banda;
- peraltro, ormai ampiamente dimostrato che la curva "A" non da una valutazione adeguata
quando il rumore abbia forti componenti tonali o sia di tipo impulsivo;
- il disturbo da rumore a bassa frequenza certamente sottostimato utilizzando un singolo
numero in dB(A).
Per questi ed altri motivi si ritiene oggi che la curva "A" non abbia pi quel significato che
originariamente le si voleva attribuire. Ciononostante, la curva "A" resta per la sua
semplicit un riferimento comune per una prima approssimata valutazione dei rumori a
larga banda. In realt, la motivazione pi forte al mantenimento della curva "A" sembra
essere la sua onnipresenza nelle normative di settore. A questo punto il suo significato
puramente convenzionale, ragion per cui nelle normative di elettroacustica ,che definiscono
le caratteristiche dei misuratori di livello sonoro, si rifugge dal riferimento a pretese e
ormai superate valenze psicoacustiche e si definisce la curva "A" come un filtro nel dominio
della frequenza dato da una precisa espressione matematica.

Psicoacustica
Loudness - suoni semplici

Frequenza
25
31,5
40
50
63
80
100
125
200
250
315
400
500
630
800
1000
1250
1600
2000
2500
3150
4000
5000
6300
8000
10000
12500
16000
20000

Correzione
-44,7
-39,4
-34,6
-30,2
-26,2
-22,5
-19,1
-16,1
-10,9
-8,6
-6,6
-4,8
-3,2
-1,9
-0,8
0
0,6
1
1,2
1,3
1,2
1
0,5
-0,1
-1,1
-2,5
-4,3
-6,6
-9,3

Psicoacustica
Loudness - suoni semplici
Questa sequenza di suoni la stessa di prima, ma riscalata secondo la curva di ponderazione A
(isofonica a 40 phon):
Esempi: bande ISO Pond A

20 Hz

25 Hz

31.5 Hz

40 Hz

50 Hz

63 Hz

80 Hz

100 Hz

125 Hz

160 Hz

200 Hz

250 Hz

315 Hz

400 Hz

500 Hz

630 Hz

800 Hz

1000 Hz

1250 Hz

1600 Hz

2000 Hz

2500 Hz

3150 Hz

4000 Hz

5000 Hz

6300 Hz

8000 Hz

10000 Hz

12500 Hz

14000 Hz

15000 Hz

16000 Hz

17000 Hz

18000 Hz

19000 Hz

20000 Hz

Psicoacustica
Loudness - suoni semplici
Il seguente diagramma mostra nelle varie zone del diagramma di Fletcher-Munson, quali sono le
regioni che occupano i suoni musicali e della parola.

Psicoacustica
Loudness - suoni semplici
Anche se le curve di Fletcher-Munson sono ottenute mediando le risposte soggettive di umani,
il Livello ottenuto (in Phon) rimane una quantit fisica in quanto si riferisce allintensit dellonda e
non rappresenta una scala del volume percepito in termini assoluti. In altri termini, al raddoppio
del livello in Phon non corrisponde necessariamente il raddoppio del volume percepito.
Una scala psicoacustica della sensazione di volume il son, (Stevens, 1956), il quale viene
definito sperimentalmente comparando suoni di livello diverso e stabilendo quando un suono ha
volume doppio rispetto ad un altro. Il livello corrispondente ad 1 son stato definito
arbitrariamente pari a 40 phones.

AD 7 track 19, 20: loudness scaling

Demonstration: stabilire il volume dei suoni presentati rispetto ad un suono di riferimento.

Psicoacustica
Loudness - suoni semplici
Il grafico rappresenta una possibile curva che emerge dagli esperimenti. La norma ISO usa
lapprossimazione tratteggiata, alla quale corrisponde la formulazione semplificata:
phon - 40
S = 2 10

La relazione inversa la seguente:

P = 40 +10log 2 (S)

Per la frequenza di 1 KHz possiamo


ottenere la seguente relazione:

S=

1 0,6
p
16

Volendo
generalizzare
espressione troviamo:

questa

S = C1 p 0,6

dove la costante C1 dipende dalla


frequenza. In maniera equivalente:

S = C2 I 0,3

Queste formule implicano il raddoppio del volume allaumentare del livello di 10 dB.

Psicoacustica
Loudness - suoni semplici

Grafico son-pressione sonora a f = 1000 Hz

Psicoacustica
Loudness - suoni semplici
La dinamica di cui capace lapparato uditivo approssimativamente pari a 120 db o 100 son.
Ciascuna fibra capace di scaricare con frequenza differente a seconda della frequenza e
dellintensit dello stimolo, ma raggiunge presto la saturazione (ovvero il livello al di sopra del
quale la risposta rimane pressoch costante) attorno ad un livello di 40 db:
Notiamo inoltre che la
selettivit alle frequenze
molto pi netta a bassa
intensit.

Curve di isointensit di una fibra


nervosa
uditiva
con
una
frequenza caratteristica di 2000
Hz. Sono presentati toni di varia
frequenza a 20,40,60 e 80 dB. Il
neurone risponde a una gamma
pi
larga
di
frequenze
(soprattutto a quelle minori)
quando aumenta l'intensit.

Psicoacustica
Loudness - suoni semplici
Per un tono di 1000 Hz intenso 20 dB, la velocit di scarica dell'assone rimane al livello di
riposo. La velocit di scarica supera il livello di riposo quando la frequenza del tono di 20 dB
aumentata a 1700 Hz e raggiunge il massimo quando la frequenza quella caratteristica di
2000 Hz. Quando per l'intensit aumenta a 40 dB, la scala vestibolare si gonfia cos tanto che
le cilia si piegano anche a toni
di 1000 Hz. Incrementando
la frequenza a 1250 Hz,
aumenta la velocit di
scarica, che aumenta ancora
di pi se la frequenza di
1500 Hz.
Il problema che intorno ai
1500 Hz la velocit di scarica
dell'assone
acustico
raggiunge il suo massimo
(saturazione). Le stereocilia
sono piegate al massimo,
quindi l'aumento ulteriore
della frequenza del suono
non ha pi alcun effetto sulla
velocit di scarica.

Psicoacustica
Loudness - suoni semplici
Vi sono quindi cellule ciliate che hanno propriet di scarica diverse: le tre fibre graficate in blu
hanno alta attivit spontanea, e saturano attorno a 30 db. Le fibre in rosso invece hanno bassa
attivit spontanea ed un range dinamico fino a 55 db.
Analogamente
esistono altre fi bre
che
iniziano
a
scaricare a 30 db e
non saturano fino a
70 db e cos via fino
a coprire la gamma
dinamica di 120 db.

Psicoacustica
Loudness suoni complessi
Il volume di suoni complessi (ovvero formati da pi suoni sinusoidali) una grandezza piuttosto
complicata da valutare. Ciascuno dei suoni sinusoidali d il proprio contributo valutabile
secondo quanto visto precedentemente; ciascun contributo va per pesato in maniera
differente a seconda della frequenza. Lintensit soggettiva di suoni complessi non pu essere
determinata per semplice addizione dei valori, validi per i toni puri, misurati dallaudiogramma
normale, a causa del fenomeno del mascheramento.

Psicoacustica
Loudness - mascheramento
Il mascheramento la riduzione nelludibilit di un suono, dovuta alla presenza di un altro
suono.
Si pu descrivere come un temporaneo innalzamento della soglia di udibilit:

Psicoacustica
Loudness - banda critica
Abbiamo gi visto che il sistema uditivo diviso in bande di frequenza, la cui ampiezza
denominata banda critica, la quale pu essere definita come la banda di frequenze la cui
posizione sulla membrana basilare corrisponde alleccitazione di un tono puro. Fisicamente
corrisponde ad una porzione di membrana basilare lunga circa 1,3 mm, in corrispondenza
della quale lavorano circa 1300 cellule ciliate.

Psicoacustica
Loudness - bande critiche

Possiamo pensare allapparato uditivo come un insieme di filtri aventi una determinata
frequenza di centrobanda. Ciascun filtro caratterizzato da una larghezza di banda avente
ciascuno differenti cellule ciliate e differenti circuiti neuronali per processare le informazioni.
Queste informazioni non interagiscono tra loro finch non sono processate dal sistema centrale,
secondo la teoria della fusione.
In pratica possiamo pensare allapparato uditivo,
con una certa approssimazione, come un banco di
filtri passa-banda, di ampiezza pari a 1/3 di ottava.
Un filtro passa-banda un dispositivo che lascia
passare inalterate le frequenze contenute in un
certo intervallo detto banda passante mentre
blocca quelle che si trovano al di fuori di questo.

dB
0
-3

-80

f1

fC

f2

f(Hz)

Psicoacustica
Loudness - bande critiche
Le caratteristiche principali sono:
fc: frequenza di centro banda
f1: frequenza di taglio inferiore
f2: frequenza di taglio superiore
sono le due frequenze in corrispondenza delle quali lampiezza del segnale viene attenuata di 3
db (ovvero si dimezza lenergia)
f = f2 - f1 banda passante
Per quanto abbiamo gi visto a proposito del
sistema uditivo, la banda passante di questi filtri
(e di conseguenza dei filtri usati per lanalisi
audio) deve essere sensibile ai rapporti di
frequenza.
La banda passante non sar perci costante,
ma ad ampiezza percentuale costante. Quindi
le bande soddisfano la relazione:

=Cost
fc

dB
0
-3

-80

f1

fC

f2

f(Hz)

Psicoacustica
Loudness - bande critiche
Nel caso delle bande a terzi di ottava la costante vale 0,232. Quindi lampiezza di ogni banda
pari al 23,2 % della frequenza nominale centrale di ogni banda.
Inoltre:
f
2

f1

=1

di ottava

Ricordando la definizione di intervallo temperato:


f2 12 n
= 2
f1

Possiamo facilmente ricavare lampiezza delle bande.


Frequenze di centrobanda ISO

16 Hz

20 Hz

25 Hz

31.5 Hz

40 Hz

50 Hz

63 Hz

80 Hz

100 Hz

125 Hz

160 Hz

200 Hz

250 Hz

315 Hz

400 Hz

500 Hz

630 Hz

800 Hz

1000 Hz

1250 Hz

1600 Hz

2000 Hz

2500 Hz

3150 Hz

4000 Hz

5000 Hz

6300 Hz

8000 Hz

10000 Hz

12500 Hz

16000 Hz

20000 Hz

Psicoacustica
Loudness - banda critica

Il ruolo delle bande critiche centrale in diversi effetti psicoacustici e ci sono diverse tecniche
per misurarne lampiezza.
Esperimenti nel campo della psicoacustica hanno evidenziato che percepiamo in modo diverso
suoni a banda stretta e a banda larga (Zwicker et al., 1957; Moore, 1995). Ci va ricondotto al
filtraggio del segnale nelle bande critiche e alla non linearit della coclea.
Per percepire allo stesso modo un segnale a banda larga e uno a banda stretta, lintensit del
segnale a banda stretta dovrebbe essere di 1020 dB SPL superiore a quello del segnale in
banda larga.
Ci perch il suono a banda stretta attiva solo un filtro, mentre l'altro stimola l'intera coclea.
Dato che nella normale elaborazione cocleare il segnale viene compresso, la percezione del
volume quando sono stimolati pi filtri superiore che se ne viene eccitato uno solo. Il
fenomeno viene definito sommazione di loudness

Psicoacustica
Loudness - banda critica
Possiamo pensare quindi la membrana basilare come suddivisa come un banco di filtri i quali
aumentano la selettivit e la discriminazione tra suoni.
Questi filtri hanno caratteristiche variabili: le frequenze di centrobanda cambiano a seconda del
suono incidente, e sono non lineari e dipendenti dalla frequenza.
AD 1 track 1: cancelled harmonics

Questa dimostrazione illustra il ruolo di analizzatore di frequenza dellorecchio. Il sistema uditivo


ha labilit di ascoltare i suoni in modi differenti. Quando lascolto analitico noi sentiamo le
singole componenti separatamente; quando olistico noi percepiamo il suono nel suo insieme
e come un evento unico.
Viene presentato un suono complesso, formato da una fondamentale di frequenza 200 Hz, e 20
armoniche.
Quando lintensit relativa rimane costante, anche se lintensit totale varia, noi tendiamo a
percepire olisticamente.
Quando invece, una delle armoniche viene disattivata e riattivata, viene percepita
analiticamente. Lo stesso fenomeno si verifica quando ad una armonica viene dato un effetto di
vibrato.

Psicoacustica
Loudness - bande critiche
AD 2 track 1-6: critical bands by masking

Un modo di misurare lampiezza delle bande critiche attraverso il mascheramento (Fletcher,


1940). Verificheremo lampiezza di banda critica avente centrobanda 2000 Hz. Verr quindi
presentata una sinusoide di frequenza 2000 Hz, con ampiezza decrescente in step di 5 db.
Successivamente alla stessa sinusoide viene sovrapposto un rumore bianco a banda larga.
Successivamente alla stessa sinusoide viene sovrapposto un rumore bianco la cui larghezza di
banda pari a 1000 Hz.
Successivamente alla stessa sinusoide viene sovrapposto un rumore bianco la cui larghezza di
banda pari a 250 Hz.
Successivamente alla stessa sinusoide viene sovrapposto un rumore bianco la cui larghezza di
banda pari a 10 Hz.
Il livello del rumore mantenuto costante, perci lintensit (la loudness percepita) decrescono
sensibilmente. Contiamo quante ripetizioni riusciamo a sentire nei vari casi.

Psicoacustica
Loudness - mascheramento e bande critiche
Questa dimostrazione misura l'ampiezza della banda critica utilizzando come mascherante
rumore di diverse larghezze di banda. Quantitativamente il mascheramento studiato
misurando l'intensit del segnale di soglia, ovvero il segnale che appena percettibile. L'entit
del mascheramento uguale al livello di soglia durante il mascheramento meno il livello di soglia
in quiete. Solo la parte di energia del segnale mascherante che cade entro la banda critica
efficace nell'ottenere il mascheramento.
AD2 track 2-6 critical bands by masking: mascheramento di un tono di frequenza 2000 Hz da

rumore bianco di diverse larghezze di banda (basato su un esperimento di Fletcher del 1940).
Ascoltiamo un tono di freqenza 2000 Hz in 10 step di intensit decrescente di 5 dB ciascuno
(contare quanti step riusciamo a sentire). Poi sentiamo in diverse serie il tono con un rumore
bianco. La larghezza di banda del rumore : banda larga, 1000, 250, 10 Hz. Siccome la
larghezza di banda critica a 2000 Hz circa 280 Hz ci aspettiamo di sentire pi steps del tono a
2000 Hz quando la banda del rumore si riduce al di sotto di questo valore.

Psicoacustica
Loudness
Rumore bianco: segnale aperiodico caratterizzato da valori di ampiezza casuali e di energia
costante su tutta la banda delludibile (analogia con luce bianca la quale contiene tutte le
frequenze visibili)
File_White_noise

Psicoacustica
Loudness

Psicoacustica
Loudness
Rumore rosa: segnale aperiodico caratterizzato da valori di ampiezza casuali e di energia
decrescente (3dB/ottava) su tutta la banda delludibile (analogia con la luce: la luce rosa a
bassa frequenza nello spettro del visibile)
File_Pink_noise

Psicoacustica
Loudness
Rumore marrone: segnale aperiodico caratterizzato da valori di ampiezza casuali e di energia
decrescente (6dB/ottava) su tutta la banda delludibile
File_Brown_noise

Psicoacustica
Loudness
Rumore blu: segnale aperiodico caratterizzato da valori di ampiezza casuali e di energia
crescente (3dB/ottava) su tutta la banda delludibile (analogia con la luce: la luce blu a
frequenza alta nello spettro del visibile)
File_Blue_noise

Psicoacustica
Loudness
Rumore violetto: segnale aperiodico caratterizzato da valori di ampiezza casuali e di energia
crescente (6dB/ottava) su tutta la banda delludibile
File_Purple_noise

Psicoacustica
Loudness
AD 5 track 12-15: filtered noise

Questa dimostrazione mostra gli effetti del filtraggio di un rumore bianco a banda larga con un
filtro passa-basso, passa-alto, passa-banda, e con un filtro la cui pendenza discendente di 3
db/ottava.
AD 5 track 16: filtered noise

Lultima parte paragona campioni di rumore bianco e rosa aventi la stessa potenza. La
differenza spettrale si pu vedere nei grafici seguenti:

Psicoacustica
Loudness - bande critiche
Possiamo notare quindi che la soglia di udibilit ad una data frequenza si abbassa quando la
larghezza di banda del rumore mascherante inferiore alla larghezza di banda critica.
Infatti lenergia utile a contribuire al mascheramento lenergia del rumore mascherante che
cade entro la banda critica. Lenergia al di fuori della banda critica non contribuisce al
mascheramento.

Psicoacustica
Loudness - banda critica
Un secondo modo per misurare l'ampiezza della banda critica attraverso il volume di una
segnale di rumore. Il volume una grandezza psicoacustica, non fisica. Se la banda del rumore
aumenta mentre la densit spettrale diminuisce proporzionalmente, la potenza totale rimane
costante. Per bande la cui larghezza inferiore alla banda critica, il volume rimane costante. Se
invece la banda del rumore supera la banda critica il volume percepito aumenta (Zwicker et al.,
1957). La spiegazione di questo aumento (che avviene sempre a potenza totale costante) nel
fatto che quando la banda stretta sono all'incirca gli stessi neuroni ad essere sollecitati, anche
quando la banda aumenta di poco. Quando la banda supera la banda critica invece vengono
eccitati neuroni differenti. L'aggiunta di questi neuroni da come risultato l'aumento di volume
percepito.

Psicoacustica
Loudness - banda critica
AD3 track 7: critical bands by loudness comparison.
Vengono presentati una serie di 8 rumori, alternando un riferimento con un rumore da testare.
La larghezza di banda del rumore aumentata (mentre la sua ampiezza diminuita per
mantenere la potenza costante). Quando la larghezza di banda maggiore della larghezza di
banda critica il volume percepito del test supera quello del riferimento perch si estende su pi
di una banda critica.
In questa dimostrazione vengono presentati un rumore di centro banda 1000 Hz e larghezza di
banda 15 % (930-1075 Hz), seguito dal rumore test, che inizialmente ha le stesse
caratteristiche, poi viene modificata la larghezza di banda e lampiezza in 7 step come segue:

Psicoacustica
Loudness - scala Bark
La scala Bark una scala psicoacustica proposta da Eberhard Zwicker nel 1961. Essa descrive
la suddivisione in bande critiche dellapparato uditivo ed composta di 24 bande cos definite:

Psicoacustica
Loudness - scala Bark
La relazione tra Bark e terzi d'ottava la seguente:

Psicoacustica
Loudness - suoni complessi
I suoni complessi sono formati come sappiamo da pi suoni semplici sinusoidali.
E fondamentale nello studio della percezione del volume di suoni complessi, stabilire se alcune
tra le varie componenti appartengono alla stessa banda critica oppure no.

pattern spaziale sulla membrana basilare generato da un suono complesso armonico

Psicoacustica
Loudness - Off-frequency listening.
I filtri uditivi possono ridurre leffetto del mascherante, quando si ascolta in un ambiente
rumoroso, tramite il cosiddetto off-frequency listening. Consiste nel fenomeno di
aggiustamento della frequenza di cemtrobanda allo scopo di ottimizzare il rapporto segnalerumore.
Quando la frequenza di centrobanda del mascherante diversa da quella del segnale, il
meccanismo canonico di sintonizzare il filtro della membrana corrispondente alla frequenza
del segnale. In alcuni casi questo filtro pu lasciar passare grandi quantit di rumore, dando
luogo ad un rapporto S/N sfavorevole e quindi a difficolt nel percepire correttamente il suono.

Filtro centrato sul segnale: parte del rumore lasciato passare dal filtro

Psicoacustica
Loudness - Off-frequency listening.
Invece se l'ascoltatore attiva un filtro ad una frequenza leggermente diversa riesce a far passare
una quantit comunque alta di segnale e ad abbassare il rumore che viene tagliato
maggiormente. Il risultato una percezione pi efficace dovuta all'aumento del SNR.

Filtro spostato dal segnale: il rumore maggiormente filtrato e riduce l'effetto del mascherante

Psicoacustica
Loudness mascheramento - asimmetria
Il fenomeno del mascheramento asimmetrico: le basse frequenze mascherano pi
efficacemente le alte che non il viceversa.
AD9 track 22 asymmetry of masking by
pulsed tones
Un tono puro maschera toni di
frequenza maggiore alla sua pi
efficacemente di toni a frequenza
minore. Questo pu essere spiegato con
la risposta semplificata della membrana
basilare per due toni puri A e B in figura.
In (a) le eccitazioni si accavallano
leggermente quindi il mascheramento
avviene poco.
In
(b)
c
un
considerevole
accavallamento: il tono B maschera il
tono A pi che viceversa.
In (c) il tono B pi intenso e maschera
completamente il tono A.
In (d) il tono A pi intenso ma non non
maschera completamente il tono B.
Risposta semplificata della membrana basilare, da Rossing, 1982

Psicoacustica
Loudness mascheramento - asimmetria
La dimostrazione usa treni di sinusoidi di
durata 200 ms separati da 100 ms di
silenzio.
Prima il mascherante ha frequenza di
1200 Hz e il tono da testare 2000 Hz,
Poi il mascherante 2000 Hz e il tono da
testare 1200 Hz.
Il test tone decresce di intensit in 10
step di -5 db ciascuno tranne il primo
step che di -15 db.
Contare quanti test tone riusciamo a
sentire in ciascun caso.

Risposta semplificata della membrana basilare, da Rossing, 1982

Psicoacustica
Loudness - mascheramento
Curva psicoacustica di tuning per
mascheramento simultaneo dovuto a due
toni. Il segnale ha frequenza di 1000 Hz e
livello costante di 5 db e il grafico mostra la
frequenza e il livello minimo del mascherante
necessario ad ottenere il mascheramento.
Vediamo come toni a frequenza inferiore
(900 Hz) raggiungano l'effetto con un livello
di 45 db mentre a frequenza superiore
(110Hz) sono necessari 75 db.

Psicoacustica
Loudness - mascheramento temporale
Il mascheramento pu verificarsi anche quando i due suoni non sono simultanei.
Forward masking o post-masking il fenomeno che si verifica quando il mascherante precede
il suono. Il mascherante pu terminare anche 20-30 ms prima dellinizio del suono mascherato.
Questo fenomeno si spiega supponendo che le cellule ciliate che sono appena state stimolate
non siano sensibili quanto le cellule che agiscono da uno stato di riposo.

Psicoacustica
Loudness - mascheramento temporale
Backward masking o pre-masking il fenomeno di mascheramento dovuto ad un suono
mascherante che inizia qualche millisecondo dopo che il suono mascherato finito. Un suono
puro pu essere mascherato da rumore che inizia fino a 10 ms dopo, anche se il
mascheramento diventa meno efficace man mano che lintervallo cresce (Elliot, 1962). Il b.m.
sembra verificarsi per lazione di meccanismi pi alti a livello del sistema nervoso, dove gli
impulsi neurali di maggiore intensit interferiscono con quelli dello stimolo pi debole.

Il mascheramento temporale ha caratteristiche simili al mascheramento simultaneo ma


permette misurazioni pi precise delle bande critiche.

Psicoacustica
Loudness - mascheramento temporale
AD 10 backword and forward masking
In questa dimostrazione (backward masking) il segnale (treno di sinusoidi di frequenza 2000 Hz
e durata 10 ms) presentato in 10 step decrescenti di -4 dB senza il suono mascherante. Poi
lo stesso segnale seguito da un treno di rumore di durata 250 ms e frequenza 1900-2100
Hz. Lintervallo di tempo tra i due 100 ms, 20 ms e 0 ms. La sequenza ripetuta.
Infine (forward masking) il mascherante presentato prima del tono, con gli stessi intervalli di
tempo 100 ms, 20 ms, e 0 ms.

Psicoacustica
Loudness - mp3
MPEG audio (di cui MP3 un caso particolare) supporta frequenze di campionamento di 32,
44.1 e 48 KHz.
Supporta uno o due canali audio in uno dei quattro modi:
1. Mono: un solo canale single audio
2. Dual-mono: due canali indipendenti (stereo normale)
3. Stereo: i canali stereo condividono alcuni bit, ma senza usare la codifica joint-stereo
4. Joint-stereo: trae vantaggio dalla correlazione fra canali stereo
MPEG definisce 3 layers (strati) per laudio. MP3 in realt MPEG-Layer 3. Il principio di base
lo stesso, ma la complessit della codifica aumenta con ogni layer.
Il funzionamento della codifica MPEG il seguente:
1. Uso di filtri a convoluzione per dividere il segnale audio (p.es. 48 kHz) in sottobande di
frequenza che approssimino le 32 bande critiche (sub-band filtering).
2. Determinazione della quantit di mascheramento per ogni banda causata dalle bande
adiacenti (modellazione psicoacoustica).
3. Se lenergia di una banda al di sotto della soglia di mascheramento, non si codifica quella
banda.
4. Altrimenti si determina il numero di bit necessari per rappresentare il segnale, in modo tale
che il rumore di quantizzazione sia minore delleffetto di mascheramento (ricordando che ogni
bit introduce circa 6 dB d rumore).
5. Formattazione del flusso di bit.
In MPEG non si definisce la dimensione del file, ma piuttosto la dimensione del flusso di dati,

Psicoacustica
Loudness - suoni complessi

Per suoni allinterno della stessa banda critica: in questo caso le intensit dei segnali si
sommano. Per raddoppiare la sensazione percepite necessario un incremento di circa 9
phones.

I = I1 + I 2
Raddoppiando lintensit otteniamo un incremento di 3 phon, quindi per ottenere un incremento
di 9 phon sono necessari 3 raddoppi ovvero un aumento di un fattore 8. Per esempio per
sono necessari 8 strumenti che suonano la stessa nota alla
raddoppiare il volume percepito
stessa intensit (sfasamenti anche minimi fanno s che non si possano considerare correlati)

Psicoacustica
Loudness - suoni complessi
Se i due suoni invece non appartengono alla stessa banda critica il volume risultante
maggiore della somma delle intensit. In questo caso il volume risultante si avvicina (ma
senza raggiungere) al valore dato dalla somma dei volumi:

S = S1 + S2 + S 3 + ...
Pi in dettaglio il procedimento il seguente:

Si analizza lo spettro del suono per bande di 1/3 di ottava


Per ciascuna banda si determina la loudness Si

Si sommano i contributi delle bande con la seguente formula, che tiene conto dei
fenomeni di mascheramento:

dove:
Smax il valore massimo di loudness tra le componenti
F = 0,15 per bande di 1/3 ottava, F = 0,3 per bande di ottava
Si = loudness corrispondente alla i-sima banda
4. Si calcola il livello in phon con la formula:

P = 40 +10log 2 (S)

Psicoacustica
Loudness - suoni complessi
Esempio n. 1 : consideriamo due sinusoidi di livello L1 = 60 db e L2 = 55 db, e di frequenza
rispettivamente la prima pari a f1 = 1000 Hz la seconda ad unottava di distanza, alla frequenza
di 2000 Hz.

Psicoacustica
Loudness - suoni complessi
Esempio n. 1 : consideriamo due sinusoidi di livello L1 = 60 db e L2 = 55 db, e di frequenza
rispettivamente la prima pari a f1 = 1000 Hz la seconda ad unottava di distanza, alla frequenza
di 2000 Hz.
Queste due sinusoidi sono separate di 1000 Hz luna dallaltra, molto pi della banda critica a
quella frequenza (circa 150 Hz).

Psicoacustica
Loudness - suoni complessi
Esempio n. 1 : consideriamo due sinusoidi di livello L1 = 60 db e L2 = 55 db, e di frequenza
rispettivamente la prima pari a f1 = 1000 Hz la seconda ad unottava di distanza, alla frequenza
di 2000 Hz.
Queste due sinusoidi sono separate di 1000 Hz luna dallaltra, molto pi della banda critica a
quella frequenza (circa 150 Hz).
Possiamo calcolare la loro loudness in son:

S 1=2

S 2=2

6040
20

55 40
20

=2 1=2 sones

=1,68 sones

Psicoacustica
Loudness - suoni complessi
Esempio n. 1 : consideriamo due sinusoidi di livello L1 = 60 db e L2 = 55 db, e di frequenza
rispettivamente la prima pari a f1 = 1000 Hz la seconda ad unottava di distanza, alla frequenza
di 2000 Hz.
Queste due sinusoidi sono separate di 1000 Hz luna dallaltra, molto pi della banda critica a
quella frequenza (circa 150 Hz).
Possiamo calcolare la loro loudness in son:

S 1=2

S 2=2

6040
20

55 40
20

=2 1=2 sones

=1,68 sones

Per valutare la loudness complessiva possiamo utilizzare la formula precedente:


N

S =S max +F ( S i S max )
i=1

Psicoacustica
Loudness - suoni complessi
Esempio n. 1 : consideriamo due sinusoidi di livello L1 = 60 db e L2 = 55 db, e di frequenza
rispettivamente la prima pari a f1 = 1000 Hz la seconda ad unottava di distanza, alla frequenza
di 2000 Hz.
Queste due sinusoidi sono separate di 1000 Hz luna dallaltra, molto pi della banda critica a
quella frequenza (circa 150 Hz).
Possiamo calcolare la loro loudness in son:

S 1=2

S 2=2

6040
20

55 40
20

=2 1=2 sones

=1,68 sones

Per valutare la loudness complessiva possiamo utilizzare la formula precedente:


N

S =S max +F ( S i S max )
i=1

Otteniamo quindi:

S =S max +F (S 1+S 2S max )=2+0,151,68=2,25 sones

Psicoacustica
Loudness - suoni complessi
Esempio n. 2 : consideriamo invece due
sinusoidi di livello L1 = 60 db e L2 = 55 db, e di
frequenza rispettivamente f1 = 2000 Hz e 2120
Hz.

Psicoacustica
Loudness - suoni complessi
Esempio n. 2 : consideriamo invece due
sinusoidi di livello L1 = 60 db e L2 = 55 db, e di
frequenza rispettivamente f1 = 2000 Hz e 2120
Hz.
Queste due sinusoidi appartengono alla stessa
banda critica.

Psicoacustica
Loudness - suoni complessi
Esempio n. 2 : consideriamo invece due
sinusoidi di livello L1 = 60 db e L2 = 55 db, e di
frequenza rispettivamente f1 = 2000 Hz e 2120
Hz.
Queste due sinusoidi appartengono alla stessa
banda critica.
Per ottenere la loudness totale dobbiamo
sommare i livelli in db.

Psicoacustica
Loudness - suoni complessi
Esempio n. 2 : consideriamo invece due
sinusoidi di livello L1 = 60 db e L2 = 55 db, e di
frequenza rispettivamente f1 = 2000 Hz e 2120
Hz.
Queste due sinusoidi appartengono alla stessa
banda critica.
Per ottenere la loudness totale dobbiamo
sommare i livelli in db.
Ricorrendo alle tabelle otteniamo:
Ltot = L1 + 1,2 = 60 + 1,2 = 61,2

Psicoacustica
Loudness - suoni complessi
Esempio n. 2 : consideriamo invece due
sinusoidi di livello L1 = 60 db e L2 = 55 db, e di
frequenza rispettivamente f1 = 2000 Hz e 2120
Hz.
Queste due sinusoidi appartengono alla stessa
banda critica.
Per ottenere la loudness totale dobbiamo
sommare i livelli in db.
Ricorrendo alle tabelle otteniamo:
Ltot = L1 + 1,2 = 60 + 1,2 = 61,2
Quindi la loudness totale sar:

S tot =2

61,240
20

=2,08 sones