Il suono è convogliato verso l’ingresso del condotto uditivo dal padiglione che funziona come
elemento direttivo, attraverso il condotto uditivo il suono viene poi raccolto dal timpano.
La funzione del padiglione è di codificare informazioni relative alla provenienza del suono,
viene previlegiata la sezione frontale, da dove viene raccolta la massima energia e dove è
diretto lo sguardo. La direttività frontale permette di sincronizzare vista e udito in caso di
necessità. Vengono quindi parzialmente schermate le vibrazioni provenienti dalla parte
posteriore del cranio, che giungeranno attenuate, ma riconoscibili come provenienti dai
quadranti posteriori, quindi utili per le eventuali decisioni che implicano il riposizionamento (un
rumore improvviso proveniente da dietro ci fa voltare automaticamente la testa con lo scopo
di portare la sorgente nel quadro visivo).
Il timpano è una membrana circolare, per poter raccogliere in modo efficiente le onde
acustiche deve essere sottile ed elastica, la sua natura delicata è uno dei motivi della sua
collocazione alla fine del condotto uditivo dove è protetta dagli agenti esterni che la
esporrebbero a traumi e ne accelererebbero l’invecchiamento, il condotto uditivo presenta
anche il vantaggio di risuonare alle frequenze tipiche del parlato col risultato di migliorarne
l’intellegibilità.
Il movimento del timpano viene elaborato da un sistema di leve ossee, l’orecchio medio, che
ottimizza il trasferimento delle vibrazioni al liquido contenuto nell’orecchio interno (coclea), il
liquido è denominato perilinfa.
La funzione combinata dell’orecchio esterno e medio è quella di condurre il suono fino alla
parte interna dove è situata la componente neurosensoriale dell’orecchio.
L'adattamento di impedenza
Per la maggior parte del tempo gli esseri umani ascoltano suoni che si propagano nell'aria.
Tuttavia le cellule cigliate, che sono i sensori finali destinatari delle vibrazioni raccolte e
convogliate dall'orecchio esterno e medio, sono collocate in un liquido, la perilinfa.
L'aria e i mezzi liquidi hanno impedenze molto diverse. In altri termini i suoni generati nell'aria
sono generalmente riflessi dalla superficie di un liquido quando collidono con la sua
superficie, piuttosto che essere trasmessi al suo interno.
Se il timpano fosse accoppiato direttamente all'orecchio interno il trasferimento di energia nel
liquido sarebbe sfavorevole e gran parte dell'energia andrebbe persa.
La catena di tre ossicini dell'orecchio medio ha la funzione di adattare in modo ottimale le
vibrazioni raccolte dal timpano all'azione della staffa, che è l'ultimo ossicino che si accoppia
con la finestra ovale, punto di ingresso dell'orecchio interno.
La staffa è equiparabile a un pistone idraulico. Il timpano ha una superficie maggiore di quella
della staffa che eccita il liquido nella coclea. Tutta l'energia accumulata sulla più ampia
superficie del timpano viene concentrata sulla più piccola superficie della staffa. Questa
azione accresce la forza di pressione sul liquido della coclea di 17 volte, che moltiplicate per il
fattore 2 fornito dal leveraggio dell'incudine e del martello porta a 35 il moltiplicatore
complessivo della forza.
L'immagine mostra una alta e una bassa frequenza e la loro posizione di massima intensità
lungo la membrana basilare.
I cicli di selezione
Per restringere la ricezione degli impulsi elettrici sulle frequenze giuste, il cervello invia dei
segnali retroattivi con i quali inibisce le cellule che appartengono agli estremi della regione
iniziale. Sono necessari approssimativamente 25 millisecondi perché questo ciclo di
azione-reazione possa completarsi.
Sono necessari 8 cicli successivi per una analisi completa, durante questi cicli la regione di
ricezione viene progressivamente ristretta. L’intero processo richiede circa 200 millisecondi.
L’energia contenuta all’interno della ristretta banda finale viene integrata in una singola
risposta.
La precisione finale dell'analisi è dell'ordine di 1/12 di semitono.
Psicoacustica
Lo studio del comportamento dell'udito nelle bande critiche fa parte della psicoacustica.
La psicoacustica è il punto di contatto tra il suono fisico e il processo mentale.
Le bande critiche
Il meccanismo delle bande critiche è un sistema di analisi delle percezioni che tende a
raggruppare i suoni all’interno di bande di frequenze.
Queste bande sono larghe circa un terzo di ottava, non dobbiamo immaginarle come intervalli
definiti a priori, le bande si centrano di volta in volta sui suoni in entrata, la loro larghezza è
mediamente equiparabile a terzi di ottava, ma in realtà è anche proporzionale all'intensità
dello stimolo. Stimoli acustici più intensi allargano la larghezza della banda critica nella quale
viene effettuata l'analisi.
Alle bande critiche sono legate alcune delle caratteristiche soggettive della percezione del
suono.
Se alcuni toni capitano all'interno della stessa banda critica, l'intensità totale percepita sarà
data dalla somma delle loro potenze sonore, la frequenza percepita sarà invece quella del
tono con potenza più elevata. Se invece i toni sono in bande critiche separate, ogni tono avrà
la sua propria intensità.
La presenza simultanea di più toni nella stessa banda critica ha come conseguenza il
mascheramento dei toni con livello più basso di energia, sebbene i toni siano tutti presenti
sotto forma di vibrazioni della membrana basilare, il sistema neurosensoriale è in grado di
analizzarne uno solo nel dominio delle frequenze, quello con intensità più elevata, gli altri toni
contribuiranno ad incrementare la percezione del livello.
Complessivamente il cervello è in grado di gestire molte analisi simultanee suddivise su
diverse bande critiche.
Comportamento dell'udito alle bande critiche nel dominio del tempo.
La parte mediana del grafico mostra l'evento attorno al quale sono indicate le zone relative al
pre-mascheramento e al post-mascheramento
a - Un tono ad alta frequenza A e un tono a bassa frequenza B entrambi a livello elevato sono
molto separati in frequenza. Vi è una piccola sovrapposizione nelle regioni eccitate della
membrana basilare e di conseguenza poco mascheramento.
c - Un tono più intenso B a bassa frequenza maschera il tono A a frequenza più alta ma
ampiezza inferiore.
d - Il tono più intenso ma a frequenza più alta A non maschera completamente il tono a
frequenza più bassa e ampiezza più bassa B.
- I toni puri a frequenza ravvicinate si mascherano l'un l'altro più completamente dei toni puri
a frequenza molto separate.
- I toni puri a frequenza più bassa mascherano i toni a frequenza più alta più efficacemente
che viceversa.
Loudness o intensità
La sensazione di intensità o rumorosità è una risposta soggettiva che si correla al livello e
viene espressa in son. Un son è la rumorosità di un tono a 1000 Hz a 40 dB. Un raddoppio
del numero di son corrisponde al raddoppio della rumorosità. I son non sono direttamente
correlati ai livelli di pressione sonora (dB SPL), specialmente per i suoni complessi.
Timbro
Timbro è una qualità soggettiva che permette di distinguere tra i differenti tipi di sorgenti
sonore e differenti strumenti musicali.
Il timbro di un suono dipende da parecchi fattori, compresi i risultati dei diversi modi di
vibrazione.
L'orecchio umano è estremamente sensibile al timbro, ci è facile discriminare all'interno di un
campo sonoro una sorgente specifica e distinguerla, una voce umana per esempio, o uno
strumento tra altri.
La sensibilità massima
L'udito umano è maggiormente sensibile nell'ambito delle frequenze comprese tra 2000 Hz e
5000 Hz. Questa regione corrisponde anche al massimo dell'intellegibilità della voce umana,
che è associata principalmente ai suoni consonanti.
Le curve isofoniche indicano quest'area di massima sensibilità.
Le due principali ragioni che spiegano l'aumento della sensibilità in questa regione sono le
risonanze del condotto uditivo e del timpano.
Il condotto uditivo è una piccola cavità cilindrica con un estremo aperto e uno chiuso. La
lunghezza di questa cavità a fondo cieco corrisponde ad una risonanza di circa 3,5 KHz.
Il timpano è una membrana in tensione. Questa membrana ha una risonanza di circa 4 KHz.
In questa gamma di frequenza l'udito umano è abbastanza sensibile da percepire il
movimento casuale di molecole dovuto all'energia termica (in camera anecoica e in assenza
di altri stimoli acustici).
Localizzazione
La localizzazione è l'abilità di identificare la posizione di una sorgente sonora senza l'aiuto
visivo. E' un processo oggettivamente molto complesso che si avvale di tutti gli elementi
direttivi disponibili: posizione delle orecchie, conformazione dei padiglioni, la testa come
elemento di diaframma.
Tutti questi elementi contengono caratteristiche non lineari, è assolutamente errato pensare
all'udito come un sistema lineare di percezione, come un microfono di misura. E' proprio la
sua non linearità a fornire informazioni selezionate tra quelle utili.
Ne sono prova la curva di risposta sbilanciata verso le frequenze del parlato e le
circonvoluzioni dei padiglioni utili per creare ulteriori riflessioni funzionali come elementi di
decodifica della direzione di provenienza delle frequenze medie e alte.
La localizzazione sembra comportarsi in modo specifico per ciascuna delle seguenti regioni di
frequenze: sopra i 4000 Hz, sotto i 1000 Hz e tra i 1000 e i 4000 Hz.
Sopra i 4000 Hz
Per le frequenze sopra i 4000 Hz la localizzazione è dovuta alle differenze di intensità tra le
orecchie. La testa è l'elemento di barriera responsabile delle differenze quando le lunghezze
d'onda sono più piccole di 8 cm.
Se una sorgente si trova in centro di fronte o dietro all'ascoltatore entrambe le orecchie
ricevono la stessa intensità di suono.
Se la sorgente si trova di lato l'orecchio esposto direttamente alla sorgente riceverà una
maggiore intensità, l'altro orecchio riceverà un'intensità ridotta per l'effetto barriera della testa.
Anche un ascolto da un singolo orecchio ci fornisce elementi di localizzazione sebbene
parziali, in questo caso sono disponibili solo le informazioni derivabili dalla diffrazione intorno
al padiglione.
Sotto i 1000 Hz
Per le frequenze comprese tra 1000 Hz e 4000 Hz sono attivi entrambi i modi di
localizzazione: attenuazione e fase.
Alle frequenze sotto dei 150 Hz la capacità di localizzazione dell'udito è molto bassa o nulla,
questo è il motivo per cui la diffusione di queste basse frequenze può essere affidata ai
subwoofer mono (codificare le bassissime frequenze in modo differenziato su due canali
stereo non comporterebbe vantaggi per l’immagine stereofonica).
Effetto precedenza o Haas
L'effetto precedenza è determinante per la localizzazione del suono in un ambiente.
2-Se i suoni arrivano separati da più di 30 millisecondi appaiono come distinti con direzioni di
provenienza tanto più distinte quanto più alto è il ritardo.
Oltre al ritardo è importante il livello SPL della riflessione, la relazione 1 e valida se il suono
ritardato ha un livello uguale o inferiore al suono non ritardato. Aumentando il livello del suono
ritardato rispetto al suono non ritardato si ottiene l'effetto di spostare la sensazione di
provenienza verso il suono ritardato, se il livello del suono ritardato viene portato 10 dB al di
sopra del suono non ritardato la sensazione di provenienza si sposta a metà tra le due
sorgenti, se si sale ancora la sorgente ritardata diviene quella preponderante. Queste ultime
considerazioni non riguardano ovviamente le riflessioni, che per definizione non possono mai
assumere intensità maggiori dei suoni diretti, riguardano invece i sistemi di diffusione del
suono negli ambienti e gli impianti di rinforzo del suono (sound enforcement).