Sei sulla pagina 1di 9

L’udito

Orecchio esterno e funzione conduttiva:

Il suono è convogliato verso l’ingresso del condotto uditivo dal padiglione che funziona come
elemento direttivo, attraverso il condotto uditivo il suono viene poi raccolto dal timpano.
La funzione del padiglione è di codificare informazioni relative alla provenienza del suono,
viene previlegiata la sezione frontale, da dove viene raccolta la massima energia e dove è
diretto lo sguardo. La direttività frontale permette di sincronizzare vista e udito in caso di
necessità. Vengono quindi parzialmente schermate le vibrazioni provenienti dalla parte
posteriore del cranio, che giungeranno attenuate, ma riconoscibili come provenienti dai
quadranti posteriori, quindi utili per le eventuali decisioni che implicano il riposizionamento (un
rumore improvviso proveniente da dietro ci fa voltare automaticamente la testa con lo scopo
di portare la sorgente nel quadro visivo).
Il timpano è una membrana circolare, per poter raccogliere in modo efficiente le onde
acustiche deve essere sottile ed elastica, la sua natura delicata è uno dei motivi della sua
collocazione alla fine del condotto uditivo dove è protetta dagli agenti esterni che la
esporrebbero a traumi e ne accelererebbero l’invecchiamento, il condotto uditivo presenta
anche il vantaggio di risuonare alle frequenze tipiche del parlato col risultato di migliorarne
l’intellegibilità.
Il movimento del timpano viene elaborato da un sistema di leve ossee, l’orecchio medio, che
ottimizza il trasferimento delle vibrazioni al liquido contenuto nell’orecchio interno (coclea), il
liquido è denominato perilinfa.
La funzione combinata dell’orecchio esterno e medio è quella di condurre il suono fino alla
parte interna dove è situata la componente neurosensoriale dell’orecchio.
L'adattamento di impedenza

Per la maggior parte del tempo gli esseri umani ascoltano suoni che si propagano nell'aria.
Tuttavia le cellule cigliate, che sono i sensori finali destinatari delle vibrazioni raccolte e
convogliate dall'orecchio esterno e medio, sono collocate in un liquido, la perilinfa.
L'aria e i mezzi liquidi hanno impedenze molto diverse. In altri termini i suoni generati nell'aria
sono generalmente riflessi dalla superficie di un liquido quando collidono con la sua
superficie, piuttosto che essere trasmessi al suo interno.
Se il timpano fosse accoppiato direttamente all'orecchio interno il trasferimento di energia nel
liquido sarebbe sfavorevole e gran parte dell'energia andrebbe persa.
La catena di tre ossicini dell'orecchio medio ha la funzione di adattare in modo ottimale le
vibrazioni raccolte dal timpano all'azione della staffa, che è l'ultimo ossicino che si accoppia
con la finestra ovale, punto di ingresso dell'orecchio interno.
La staffa è equiparabile a un pistone idraulico. Il timpano ha una superficie maggiore di quella
della staffa che eccita il liquido nella coclea. Tutta l'energia accumulata sulla più ampia
superficie del timpano viene concentrata sulla più piccola superficie della staffa. Questa
azione accresce la forza di pressione sul liquido della coclea di 17 volte, che moltiplicate per il
fattore 2 fornito dal leveraggio dell'incudine e del martello porta a 35 il moltiplicatore
complessivo della forza.

Figura: Martello e incudine forniscono un fattore moltiplicatore 2, il rapporto tra la superficie


del timpano e la superficie del piede della staffa è 17.
La funzione neurosensoriale

La coclea è l’organo che contiene la perilinfa, è un condotto cilindrico avvolto a spirale. Le


onde che si propagano nella perilinfa percorrono tutta la coclea e trovano all’apice della
stessa una apertura nella membrana basilare che permette di ripercorrere la coclea
all’indietro fino alla finestra rotonda, un elemento cedevole alla fine del percorso dove si
scarica l’energia delle vibrazioni.
E’ il caso di ricordare che, a differenza dei gas, i liquidi sono incomprimibili, ed è quindi utile
che vi sia un elemento cedevole alla fine del percorso nell’orecchio interno che accentui il
movimento longitudinale del fluido. Il liquido deve poter scorrere lungo la coclea per
imprimere il massimo movimento alle cellule cigliate. Sarebbe inutile che le pressioni e
depressioni operate dalla staffa si traducessero in pressioni e depressioni generalizzate su
tutta la superficie interna della coclea invece che nello scorrimento del fluido.
La membrana basilare è un diaframma che divide la coclea longitudinalmente, l’onda che si
propaga nella perilinfa eccita le cellule cigliate (poste sulla membrana basilare) che inviano
segnali elettrici al cervello attraverso il nervo uditivo.
Le cellule cigliate sono organizzate in gruppi e hanno dimensioni e forme diverse comprese
tra 10 e 50 millesimi di millimetro.
Il cervello e le cellule cigliate interagiscono mediante un meccanismo di retroazione per
analizzare il suono in entrata.
La coclea contiene complessivamente circa 24000 cellule cigliate differenziate in due tipi
principali: interne ed esterne, in relazione alla loro posizione nella coclea.
Le cellule cigliate sono distribuite lungo la membrana basilare, ogni cellula cigliata può
mandare un segnale distinto al cervello. Quando la staffa mette in movimento la perilinfa, la
membrana basilare risponde come una frusta. La sollecitazione percorre tutta la membrana
basilare ma si presenta più intensamente nel punto in cui è risonante, cioè nel punto in cui la
larghezza della sezione della coclea è correlata alla frequenza del suono in entrata.
Inizialmente è quindi una particolare regione di cellule cigliate a inviare i primi segnali
significativi al cervello, ma è poi necessario affinare la percezione per mezzo di una ulteriore
selezione delle cellule coinvolte.

L'immagine mostra una alta e una bassa frequenza e la loro posizione di massima intensità
lungo la membrana basilare.
I cicli di selezione

La selezione sembra funzionare come segue:


la regione iniziale di eccitazione delle cellule cigliate vicine allo spostamento massimo è circa
al 70% d della frequenza centrale. Ad esempio, un tono di 1 kHz eccita cellule cigliate che
sarebbero eccitate anche (sebbene in misura minore) da toni compresi tra 750 Hz e 1450 Hz.

Per restringere la ricezione degli impulsi elettrici sulle frequenze giuste, il cervello invia dei
segnali retroattivi con i quali inibisce le cellule che appartengono agli estremi della regione
iniziale. Sono necessari approssimativamente 25 millisecondi perché questo ciclo di
azione-reazione possa completarsi.
Sono necessari 8 cicli successivi per una analisi completa, durante questi cicli la regione di
ricezione viene progressivamente ristretta. L’intero processo richiede circa 200 millisecondi.
L’energia contenuta all’interno della ristretta banda finale viene integrata in una singola
risposta.
La precisione finale dell'analisi è dell'ordine di 1/12 di semitono.

Psicoacustica
Lo studio del comportamento dell'udito nelle bande critiche fa parte della psicoacustica.
La psicoacustica è il punto di contatto tra il suono fisico e il processo mentale.

Le bande critiche

Il meccanismo delle bande critiche è un sistema di analisi delle percezioni che tende a
raggruppare i suoni all’interno di bande di frequenze.
Queste bande sono larghe circa un terzo di ottava, non dobbiamo immaginarle come intervalli
definiti a priori, le bande si centrano di volta in volta sui suoni in entrata, la loro larghezza è
mediamente equiparabile a terzi di ottava, ma in realtà è anche proporzionale all'intensità
dello stimolo. Stimoli acustici più intensi allargano la larghezza della banda critica nella quale
viene effettuata l'analisi.
Alle bande critiche sono legate alcune delle caratteristiche soggettive della percezione del
suono.
Se alcuni toni capitano all'interno della stessa banda critica, l'intensità totale percepita sarà
data dalla somma delle loro potenze sonore, la frequenza percepita sarà invece quella del
tono con potenza più elevata. Se invece i toni sono in bande critiche separate, ogni tono avrà
la sua propria intensità.

La presenza simultanea di più toni nella stessa banda critica ha come conseguenza il
mascheramento dei toni con livello più basso di energia, sebbene i toni siano tutti presenti
sotto forma di vibrazioni della membrana basilare, il sistema neurosensoriale è in grado di
analizzarne uno solo nel dominio delle frequenze, quello con intensità più elevata, gli altri toni
contribuiranno ad incrementare la percezione del livello.
Complessivamente il cervello è in grado di gestire molte analisi simultanee suddivise su
diverse bande critiche.
Comportamento dell'udito alle bande critiche nel dominio del tempo.

Pre-mascheramento: un evento acustico ha l'effetto di interrompere un ciclo di analisi già in


corso se si presenta con un'energia maggiore dell'evento che lo precede

Post-mascheramento: un evento acustico maschera un evento successivo di intensità


minore se questo interviene in prossimità.

La parte mediana del grafico mostra l'evento attorno al quale sono indicate le zone relative al
pre-mascheramento e al post-mascheramento

Mascheramento per le frequenze distanti

I suoni possono oscurare o nascondere altri suoni molto distanti in frequenza.


I diversi tipi e qualità dei suoni presentano differenti attitudini a mascherare altri suoni.
Livelli, frequenze e durate possono tutti incidere sul mascheramento.
Con riferimento alla tavola grafica (nella pagina successiva) si possono definire 4 casi:

a - Un tono ad alta frequenza A e un tono a bassa frequenza B entrambi a livello elevato sono
molto separati in frequenza. Vi è una piccola sovrapposizione nelle regioni eccitate della
membrana basilare e di conseguenza poco mascheramento.

b - I toni A e B si sovrappongono. Vi è un significativo mascheramento.


Il tono B maschera il tono A.

c - Un tono più intenso B a bassa frequenza maschera il tono A a frequenza più alta ma
ampiezza inferiore.

d - Il tono più intenso ma a frequenza più alta A non maschera completamente il tono a
frequenza più bassa e ampiezza più bassa B.

Negli esempi c -d le frequenze sono identiche, cambiano solo le ampiezze.


Conclusioni e regole generali

- I toni puri a frequenza ravvicinate si mascherano l'un l'altro più completamente dei toni puri
a frequenza molto separate.

- I toni puri a frequenza più bassa mascherano i toni a frequenza più alta più efficacemente
che viceversa.

- Aumentando l'intensità del tono di mascheramento si amplia la gamma di frequenze che il


tono può mascherare.

- Il mascheramento fornito da una banda ristretta di rumore è simile al mascheramento fornito


da un tono puro.

- Il rumore a larga banda maschera i suoni a tutte le frequenze.

La complessità dei fenomeni di mascheramento è testimoniata dalla capacità dell'udito di


distinguere i toni puri tra i rumori casuali. Un tono puro viene percepito anche se mescolato
ad un rumore ad ampio spettro 9 dB più alto.
Parametri

In psicoacustica si utilizzano parametri e termini diversi per distinguere le grandezze


"oggettive" relative al suono da quelle "soggettive":
la rumorosità (loudness) corrisponde al livello
l'altezza corrisponde alla frequenza
il timbro corrisponde allo spettro.

Loudness o intensità
La sensazione di intensità o rumorosità è una risposta soggettiva che si correla al livello e
viene espressa in son. Un son è la rumorosità di un tono a 1000 Hz a 40 dB. Un raddoppio
del numero di son corrisponde al raddoppio della rumorosità. I son non sono direttamente
correlati ai livelli di pressione sonora (dB SPL), specialmente per i suoni complessi.

Altezza o tonalità (pitch)


L'altezza di un suono è relativa alla percezione della frequenza.

Timbro
Timbro è una qualità soggettiva che permette di distinguere tra i differenti tipi di sorgenti
sonore e differenti strumenti musicali.
Il timbro di un suono dipende da parecchi fattori, compresi i risultati dei diversi modi di
vibrazione.
L'orecchio umano è estremamente sensibile al timbro, ci è facile discriminare all'interno di un
campo sonoro una sorgente specifica e distinguerla, una voce umana per esempio, o uno
strumento tra altri.

La sensibilità massima
L'udito umano è maggiormente sensibile nell'ambito delle frequenze comprese tra 2000 Hz e
5000 Hz. Questa regione corrisponde anche al massimo dell'intellegibilità della voce umana,
che è associata principalmente ai suoni consonanti.
Le curve isofoniche indicano quest'area di massima sensibilità.
Le due principali ragioni che spiegano l'aumento della sensibilità in questa regione sono le
risonanze del condotto uditivo e del timpano.
Il condotto uditivo è una piccola cavità cilindrica con un estremo aperto e uno chiuso. La
lunghezza di questa cavità a fondo cieco corrisponde ad una risonanza di circa 3,5 KHz.
Il timpano è una membrana in tensione. Questa membrana ha una risonanza di circa 4 KHz.
In questa gamma di frequenza l'udito umano è abbastanza sensibile da percepire il
movimento casuale di molecole dovuto all'energia termica (in camera anecoica e in assenza
di altri stimoli acustici).
Localizzazione
La localizzazione è l'abilità di identificare la posizione di una sorgente sonora senza l'aiuto
visivo. E' un processo oggettivamente molto complesso che si avvale di tutti gli elementi
direttivi disponibili: posizione delle orecchie, conformazione dei padiglioni, la testa come
elemento di diaframma.
Tutti questi elementi contengono caratteristiche non lineari, è assolutamente errato pensare
all'udito come un sistema lineare di percezione, come un microfono di misura. E' proprio la
sua non linearità a fornire informazioni selezionate tra quelle utili.
Ne sono prova la curva di risposta sbilanciata verso le frequenze del parlato e le
circonvoluzioni dei padiglioni utili per creare ulteriori riflessioni funzionali come elementi di
decodifica della direzione di provenienza delle frequenze medie e alte.
La localizzazione sembra comportarsi in modo specifico per ciascuna delle seguenti regioni di
frequenze: sopra i 4000 Hz, sotto i 1000 Hz e tra i 1000 e i 4000 Hz.

Sopra i 4000 Hz

Per le frequenze sopra i 4000 Hz la localizzazione è dovuta alle differenze di intensità tra le
orecchie. La testa è l'elemento di barriera responsabile delle differenze quando le lunghezze
d'onda sono più piccole di 8 cm.
Se una sorgente si trova in centro di fronte o dietro all'ascoltatore entrambe le orecchie
ricevono la stessa intensità di suono.
Se la sorgente si trova di lato l'orecchio esposto direttamente alla sorgente riceverà una
maggiore intensità, l'altro orecchio riceverà un'intensità ridotta per l'effetto barriera della testa.
Anche un ascolto da un singolo orecchio ci fornisce elementi di localizzazione sebbene
parziali, in questo caso sono disponibili solo le informazioni derivabili dalla diffrazione intorno
al padiglione.

Sotto i 1000 Hz

Per frequenze sotto i 1000 Hz la localizzazione è dovuta principalmente alla differenza di


tempo che provoca differenze di fase significative tra le due orecchie. La distanza tra le due
orecchie è dell'ordine di grandezza delle lunghezze d'onda di questa regione dello spettro o
dei loro sottomultipli.

Tra 1000 Hz e 4000 Hz

Per le frequenze comprese tra 1000 Hz e 4000 Hz sono attivi entrambi i modi di
localizzazione: attenuazione e fase.

Basse frequenze sotto i 150 Hz

Alle frequenze sotto dei 150 Hz la capacità di localizzazione dell'udito è molto bassa o nulla,
questo è il motivo per cui la diffusione di queste basse frequenze può essere affidata ai
subwoofer mono (codificare le bassissime frequenze in modo differenziato su due canali
stereo non comporterebbe vantaggi per l’immagine stereofonica).
Effetto precedenza o Haas
L'effetto precedenza è determinante per la localizzazione del suono in un ambiente.

1-Se due suoni simili arrivano all'ascoltatore approssimativamente entro 35 millisecondi la


direzione percepita della sorgente sonora è la direzione dalla quale proviene il primo suono in
arrivo.

2-Se i suoni arrivano separati da più di 30 millisecondi appaiono come distinti con direzioni di
provenienza tanto più distinte quanto più alto è il ritardo.

In altri termini, fino a 20-25 millisecondi di ritardo, le riflessioni non interferiscono


negativamente con la determinazione della posizione della sorgente e rinforzano il suono
diretto, tra 20 e 35 millisecondi iniziano a influire in modo negativo con la localizzazione
degradandola progressivamente, ma rimane comunque la percezione di un singolo suono.
Sopra i 35 millisecondi le riflessioni vengono percepite come echi.

Oltre al ritardo è importante il livello SPL della riflessione, la relazione 1 e valida se il suono
ritardato ha un livello uguale o inferiore al suono non ritardato. Aumentando il livello del suono
ritardato rispetto al suono non ritardato si ottiene l'effetto di spostare la sensazione di
provenienza verso il suono ritardato, se il livello del suono ritardato viene portato 10 dB al di
sopra del suono non ritardato la sensazione di provenienza si sposta a metà tra le due
sorgenti, se si sale ancora la sorgente ritardata diviene quella preponderante. Queste ultime
considerazioni non riguardano ovviamente le riflessioni, che per definizione non possono mai
assumere intensità maggiori dei suoni diretti, riguardano invece i sistemi di diffusione del
suono negli ambienti e gli impianti di rinforzo del suono (sound enforcement).

Potrebbero piacerti anche