Sei sulla pagina 1di 170

MANUALE

Federico Albano Leoni, Pietro Maturi

DI FONETICA
Nuova edizione

Carocci
Linguistica
La novità maggiore di questo manuale, rispetto a quelli correnti
in Italia, è lo spazio riservato alla fonetica acustica e, più ancora,
alla fonetica uditiva. È infatti convinzione degli autori
che la conoscenza, anche rudimentale, dell'acustica sia lo strumento
per accedere, oltre che a una descrizione più accurata del segnale
vocale, alle tecniche per il trattamento automatico della voce., -e
e che il ruolo dell'ascoltatore nella comunicazione parlata
vada considerato con un'attenzione maggiore di quanta
-
(t)
-,
o
~
non ne abbia riscossa fino ad oggi, almeno tra i linguisti.
Altro elemento di novità è il tentativo di allargare l'oggetto
-
QJ
e:
:::::!.

di studio della fonetica fino a comprendere, anche se in maniera


non sistematica, le principali manifestazioni del parlato spontaneo,
in genere trascurate.
Infine, il manuale è accompagnato da un CD-ROM che consente
al lettore di approfondire il capitolo sulla fonetica articolatoria
e di esercitarsi nell'ascolto, l'analisi e la trascrizione di parole
e semplici frasi in italiano, inglese, francese e tedesco.
Il manuale si rivolge agli studenti di materie linguistiche
nei Corsi,. di Laurea in Lettere, in Lingue, in Scienze
della comunicazione e della formazione, come pure a coloro
che seguono gli insegnamenti foniatrici, logopedici
e audiologici presso le Facoltà di Medicina e Chirurgia.

Federico Albano Leoni insegna Glottologia presso la Facoltà


di Lettere e Filosofia dell'Università "Federico 11" di Napoli.

Pietro Maturi è attualmente coordinatore tecnico


presso il Dipartimento di Sociologia dell'Università
"Federico 11" di Napoli.

ISBN 88-430-2127-3

€ 19,50
UNIVERSITÀ I 375
LINGUISTICA
I lettori che desiderano
informazioni sui volumi
pubblicati dalla casa editrice
possono rivolgersi direttamente a:
Carocci editore
via Sardegna 50,
oor87 Roma,
telefono 06 42 8 r 84 I7,
fax 06 42 74 79 3r

Visitateci sul nostro sito Internet:


http://www.carocci.it
Federico Albano Leoni Pietro Maturi

Manuale di fonetica
Nuova edizione

Carocci editore
3• edizione, gennaio 2002
2• edizione, giugno 1998
1• edizione, maggio 1995
© copyright 1995 by La uova Italia Scientifica, Roma
© copyright 1998 by Carocci editore S.p.A. , Roma

Finito di stampare nel gennaio 2002


per i tipi delle Arti Grafiche Editoriali Sri, Urbino

ISBN 88-430-2127-3

Riproduzione vietata ai sensi di legge


(art. 171 della legge 22 aprile 1941, n. 633)

Senza regolare autorizzazione,


è vietato riprodurre questo volume
anche parzialmente e con qualsiasi mezzo,
compresa la fotocopia , anche per uso interno
o didattico.
Indice

Premessa II

Premessa alla seconda edizione

Premessa alla terza edizione 15

Avvertenze per l'uso del CD-ROM 17

I. Introduzione 19

I.I. Fonetica e scienze del linguaggio 19


I.2. Articolazioni della fonetica 20
r.2.r. Fonetica articolatoria / r.2.2 . Fonetica acustica / r.2.3 . Foneti-
ca uditiva e percettiva / r.2.4. Integrazione delle fonetiche

Parlato e scrittura 22
r.3.r. Il modello della lingua scritta I r. 3. 2. lperarticolazione e
ipoarticolazione

Le pratiche fonetiche
Applicazioni della fonetica
r.5.1. Applicazioni linguistiche / 1.5 .2 . Altre applicazioni

2. Fonetica articolatoria e trascrizione fonetica 31

2.I. Generalità 31
2.r. r. Gli alfabeti storici e gli alfabeti fonetici / 2. r.2. La trascrizione
fonetica

2 .2. L'apparato fonatorio e la fonazione 35


2.2.r. Anatomia / 2.2.2. Fisiologia I 2.2.3. Il meccanismo laringeo /
2.2.4. Vocali e consonanti / 2.2 .5. Altre modalità di fonazione

7
2.3. Fonetica articolatoria segmentale 44
2.3.1. Generalità / 2.3.2 . Vocali / 2.3 .3. Consonanti

Fonetica articolatoria intersegmentale


2.4.1. Generalità / 2.4.2. La coarticolazione / 2-4-3. Fattori periferici
e centrali della coarticolazione / 2.4.4. Fenomeni dovuti alla coartico-
lazione / 2.4.5 . Fenomeni sistematici / 2.4.6. Fenomeni non sistema-
tici

2.5. Fonetica articolatoria soprasegmentale 68


2.5.1. Generalità / 2.5.2 . Durata / 2.5.3. Intensità / 2.5.4. Altezza /
2.5.5. Fattori prosodici e unità superiori al fono

2.6. I metodi per lo studio della fonetica articolatoria 81


2.6.1. Metodi per lo studio dell'attività laringea / 2.6.2. Metodi per lo
studio dell'attività degli organi superiori

3· Fonetica acustica

3.1. Elementi di fisica acustica


3.1.1. L'onda sonora / 3. 1.2 . I segnali semplici / 3.1.3. I segnali com-
plessi I 3.1-4- L'analisi di Fourier / 3.1.5 . I filtri / 3.1.6. Lo spettro-
gramma / 3.1.7. I risuonatori / 3.1.8. Segnali complessi aperiodici /
3.1.9. Il sonagramma

3.2. Fonetica acustica segmentale 102


3.2.1. La produzione del segnale vocale / 3.2.2. Le vocali / 3.2.3. Le
consonanti

3.3. Fonetica acustica intersegmentale II9


3+ Fonetica acustica soprasegmentale 123
3-4-1. Durata / 3-4-2. Intensità / 3-4-3. Frequenza fondamentale /
3.4.4. L'analisi prosodica

3.5 . Gli strumenti per lo studio della fonetica acustica 129

4• Fonetica uditiva e percettiva 1 33

4.1. Aspetti generali 1 33


4.1.r. La fonetica dell'ascoltatore / 4.1.2. I meccanismi della ricezione

4.2. Anatomia e fisiologia dell'apparato uditivo 1 35


4 .2.1. L'orecchio / 4.2 .2. Il nervo acustico e la corteccia uditiva

4.3. Elementi di psicoacustica


4.3.1. Il campo uditivo /· +3 .2. Discriminazione del suono / 4.3.3 .
Bande critiche / 4. 3.4. Scàle percettive

8
La percezione dei suoni linguistici 1 49
4.4.r. I test / 4.4.2. Percezione dei segmenti: vocali / 4.4. 3. Percezio-
ne dei segmenti: consonanti

4.5. Cenni sulle principali teorie della percezione lingui-


stica 1 55
4.5.r. Teorie passive / 4.5.2. Teorie attive

4.6. Percezione del parlato continuo 1 57

Bibliografia 161

Indice analitico

9
Premessa

Questo manuale è rivolto a studenti di materie linguistiche nelle


facoltà universitarie di Lettere e Filosofia e di Lingue e Letteratu-
re straniere, a studenti di materie foniatriche e logopediche presso
le facoltà di Medicina e chirurgia, e a quanti altri, di formazione
scientifico-tecnologica, studiano i problemi anche applicativi del
trattamento automatico della voce.
Il manuale è volutamente semplice e introduttivo e mira a for-
nire le conoscenze di base per la descrizione e l'analisi dei suoni
linguistici. Non è quindi un'enciclopedia delle scienze fonetiche,
né una descrizione sistematica della fonetica di una determinata
lingua, anche se, nell'esemplificazione, abbiamo tenuto un conto
particolare dell'italiano e, subito dopo, delle principali lingue eu-
ropee occidentali.
Il manuale è articolato in tre capitoli, corrispondenti rispettiva-
mente alla fonetica articolatoria (cAP. 2), a quella acustica (CAP. 3)
e a quella uditiva (cAP. 4), preceduti da una breve introduzione
(cAP. 1), nella quale presentiamo il nostro punto di vista su alcuni
aspetti e problemi generali della fonetica oggi; il volume si chiude
con una bibliografia essenziale e con l'indice analitico.
La novità maggiore di questo libro, rispetto alla manualistica
corrente in Italia, è lo spazio che qui viene dato alla fonetica acu-
stica e, più ancora, alla fonetica uditiva. Siamo infatti convinti che
il ruolo dell'ascoltatore nella comunicazione audioverbale vada
considerato con un'attenzione maggiore di quanta non ne abbia
riscossa fino ad oggi.
Può forse essere considerato un fatto nuovo anche il tentativo
di allargare l'oggetto di studio della fonetica fino a comprendere,
anche se non in maniera sistematica, le manifestazioni principali
del parlato spontaneo, in genere trascurate. Riteniamo infatti che
questo sia oggi un importante banco di prova tanto della capacità

II
MANUAL E DI F ONETIC A

esplicativa delle teorie generali del linguaggio, quanto dell'efficacia


operativa dei sistemi automatici di riconoscimento della voce.
In un nostro itinerario ideale la lettura di questo libro dovreb-
be precedere quella di un libro di fonologia. Vorremmo, cioè, sot-
tolineare che, almeno nelle nostre intenzioni, questo manuale in-
tenderebbe dare ai lettori gli strumenti per una adeguata cono-
scenza della sostanza fonica, osservata spregiudicatamente in tutta
la sua complessità, sulla quale poi applicare la griglia fonologica, o
dalla quale far nascere una teoria adeguata.
Molti dei dati e dei punti di vista confluiti nel manuale sono
nati dalle analisi e dalle discussioni di un piccolo gruppo di fone-
tisti che lavora presso il Centro Interdipartimentale di Ricerca per
l'Analisi e la Sintesi dei Segnali dell'Università di Napoli. Con
Francesco Cutugno, in particolare, abbiamo discusso sempre di
tutti gli aspetti di questo libro e gli siamo debitori di punti di vi-
sta per noi nuovi.
Il manuale è stato ideato congiuntamente dai due autori e co-
mune è anche la stesura definitiva. Tuttavia, Federico Albano Leoni
è autore dei CAPP. 1 e 4, e Pietro Maturi è autore dei CAPP. 2 e 3.

12
Premessa alla seconda edizione

In questa seconda edizione abbiamo apportato solo piccoli ritoc-


chi: abbiamo cioè eliminato alcune formulazioni imprecise o ambi-
gue e abbiamo aggiunto alcune formulazioni di chiarimento non-
ché una migliore illustrazione dell'orecchio. Anche la bibliografia
è stata leggermente ritoccata e aggiornata.
Nel fare questo abbiamo tenuto conto delle osservazioni e dei
suggerimenti di alcuni lettori, tra i quali ricordiamo Luciano Ca-
nepari, Biagio Forino, Sabine Kosters e Miriam Voghera, che qui
rmgraziamo.
Sempre grande rimane il nostro debito nei confronti di Fran-
cesco Cutugno per i capitoli acustico e uditivo.

Napoli, aprile 1998


Premessa alla terza edizione

La novità più consistente di questa terza edizione del nostro Ma-


nuale di Fonetica è data dal CD-ROM che vi è allegato e che è stato
predisposto da un gruppo di allievi dei corsi di Glottologia del-
l'Università di Napoli "Federico n" coordinati da Francesco Cutu-
gno. Abbiamo infatti pensato che i tempi fossero maturi anche in
Italia per integrare, per ora limitandoci alla fonetica articolatoria e
alla trascrizione fonetica, gli strumenti tradizionali della lezione e
della lettura con uno strumento multimediale che rendesse lo stu-
dio individuale più vivace ed efficace. Un sistema di rinvii consen-
tirà al lettore di passare dal libro al CD-ROM. Consideriamo questo
come un primo passo verso la ristrutturazione complessiva dei
supporti alla didattica, se i giudizi degli utenti ci conforteranno.
Inoltre, anche in questa edizione abbiamo apportato piccole
modifiche migliorative in alcune formulazioni, in alcuni esempi e
nella bibliografia.

Napoli, luglio 2001

15
Avvertenze per l'uso del CD-ROM

Il contenuto di questo CD-ROM è organizzato m undici sez1om,


ognuna delle quali consiste di diverse pagine.
Per navigare all'interno del CD-ROM si devono utilizzare i co-
mandi posti in alto sullo schermo. La barra dei comandi è pre-
sente in ogni pagina e contiene diversi simboli. Puntando con il
mouse su questi simboli, si vedrà comparire, alla destra della bar-
ra, la definizione dei rispettivi comandi. Per conoscere più in det-
taglio la funzione di ogni comando si può accedere, cliccando sul
simbolo ? , ad una pagina esplicativa detta Help.
Alcuni comandi (Pag. precedente, Pag. successiva, Sez. prece-
dente, Sez. successiva) rimandano direttamente ad altre pagine del
CD-ROM. I titoli della sezione e della pagina attivate sono sempre
visualizzati, in quest'ordine, sulla sinistra dello schermo.
Altri comandi (Menù, Ricerca, Glossario, Esci) aprono una
nuova finestra, che può essere richiusa usando il tasto X e ritor-
nando così alla pagina da cui si era partiti. Quando questa finestra
è aperta, i comandi della barra di navigazione non sono attivi.
Attraverso Menù si visualizza la suddivisione degli argomenti
del CD-ROM in sezioni e pagine.
Con Ricerca si accede direttamente alle pagine che corrispon-
dono ai richiami inseriti nel secondo capitolo del manuale. Ad
esempio, nel manuale al PAR. 2.r.r la parola trascrizione è seguita
da un rimando al CD-ROM: cliccando sul tasto Ricerca apparirà
una lista di parole chiave, tra cui trascrizione. Cliccando ancora
su questa parola si raggiungerà direttamente la pagina del CD-ROM
che tratta l'argomento.
Alle funzioni Menù e Ricerca si può accedere anche diretta-
mente dalla schermata di avvio del CD-ROM, che contiene inoltre
una Guida animata all'utilizzo del Menù e il pulsante Esci.
I

Introduzione

I.I
Fonetica e scienze del linguaggio

La fonetica (dal greco phoné, "voce, suono") è la scienza che stu-


dia la voce o, in altri termini, i suoni prodotti e percepiti dagli
esseri umani per comunicare verbalmente, e occupa un posto im-
portante tra le scienze del linguaggio.
Se si considera una rappresentazione ideale del processo co-
municativo audioverbale (cfr. FIG . 1.1), si vede, semplificando mol-
to, che esso si articola in almeno tre fasi:
1. ideazione e produzione del messaggio;
2. trasmissione del messaggio in un mezzo;
3. ricezione e interpretazione del messaggio.

FIGURA I. I
Rappresentazione del processo comunicativo audioverbale tra due parlanti-
ascoltatori A e B

A B
Fonte: Saussure, 1997, p. 21.
MA NU AL E DI FONETI CA

La prima e la terza fase sono certamente le più delicate per-


ché, oltre a una componente meccanica, motoria, contengono an-
che una fondamentale componente neurale e mentale. Il processo
comunicativo infatti può essere descritto sommariamente così: un
soggetto decide di parlare e di dire qualche cosa a qualcuno (com-
ponente mentale) e il suo cervello impartisce i comandi che si tra-
smetteranno a determinati muscoli (componente neurale); gli orga-
ni attivati producono sequenze di suoni (componente motoria);
queste sequenze di suoni, dotate di una loro consistenza fisica og-
gettiva, si propagano nell'aria e raggiungono l'orecchio dell'ascol-
tatore (componente fisica); l'orecchio trasforma gli impulsi mecca-
nici che lo hanno raggiunto (componente meccanica) in impulsi
nervosi che si trasmettono al cervello (componente neurale), dove
vengono interpretati e tradotti in informazione linguistica (compo-
nente mentale).
Quale spazio occupa la fonetica in questo processo? In un sen-
so ristretto la fonetica va dal momento in cui gli organi del parlan-
te si mettono in movimento a quello in cui l'orecchio dell'ascolta-
tore ha trasformato gli impulsi meccanici in impulsi nervosi. Ma,
in un senso più ampio, essa non può non considerare che a monte
della produzione fonica e a valle della percezione uditiva esiste
una complessa attività neuropsicologica e cognitiva. Ed è proprio
la considerazione di queste componenti superiori che qualifica la
fonetica non come scienza meramente anatomo-fisiologica e fisica
ma come una delle scienze del linguaggio.

1.2
Articolazioni della fonetica

La fonetica, anche nell'accezione ristretta che abbiamo ricordato,


è comunque una scienza complessa perché deve tenere conto di
almeno tre punti di vista, corrispondenti ciascuno a una fase del
processo comunicativo.

r. 2. r. Fon etica articolatoria

La descrizione del processo di produzione di suoni linguistici


(detti, d'ora in avanti, Joni) è l'oggetto della fonetica articolatoria.
Essa:

20
I . INTRO DUZI O N E

a) descrive l'anatomia degli organi preposti alla produzione, il cui


insieme viene detto apparato fonatorio;
b) studia e descrive la loro fisiologia, cioè il processo, detto fona-
zione, attraverso il quale produciamo i foni;
c) fornisce i criteri e i termini per la classificazione dei foni.

r.2.2. Fonetica acustica

La descrizione della consistenza fisica dei foni e della loro propaga-


zione in un mezzo (generalmente l'aria) è l'oggetto della fonetica
acustica.
Essa costituisce un'applicazione dell'acustica, cioè di una bran-
ca della fisica classica, dei cui principi generali presuppone la co-
noscenza.

r.2.3. Fonetica uditiva e percettiva

La descrizione dei processi della percezione dei /ani è l'oggetto


della fonetica uditiva. Essa:
a) descrive l'anatomia dell'apparato uditivo;
b) studia e descrive la fisiologia dell'apparato uditivo, e in parti-
colare il modo in cui un impulso meccanico (la vibrazione di mo-
lecole d'aria) viene analizzato dall'orecchio e trasformato in impul-
so neurale (cioè elettrico) che il sistema nervoso trasmette al cer-
vello;
c) studia e descrive i processi di categorizzazione dei suoni per-
cepiti.

r.2.4. Integrazione delle fonetiche

Queste tre fonetiche, pur diverse tra loro per le conoscenze pre-
supposte, per metodi e tecniche di analisi, non sono però autono-
me. Al contrario, se l'obiettivo di questi studi è la conoscenza del
ruolo della voce nel processo di comunicazione audioverbale in
quanto tale e nella sua complessità, esse devono integrarsi pro-
fondamente.
Una delle manifestazioni di questa complessità è, come vedre-
mo, la relativa mancanza di simmetria fra le tre fasi. Non c'è infat-
ti perfetta corrispondenza tra le configurazioni articolatorie e la
consistenza acustica dei foni, né tra quest'ultima e le sensazioni
uditive dell'orecchio. Infatti, data un'intenzione comunicativa in

2 1
MANUALE DI FONETI CA

chi parla, non è detto che i foni in cui questa si sostanzia abbiano
sempre le stesse caratteristiche acustiche e, date certe caratteristi-
che acustiche di un fono, non è detto che queste provochino sem-
pre gli stessi effetti percettivi in chi ascolta. Studiare e descrivere
solo una fase del processo, senza tenere continuamente presenti i
suoi correlati, può portare a conclusioni sbagliate o a risultati in-
soddisfacenti.

1.3
Parlato e scrittura

Nel presentare obiettivi e metodi della fonetica, è bene mettere in


evidenza fin da ora due fatti di carattere generale, tra loro collega-
ti e intrecciati ma spesso trascurati nella ricerca fonetica fino ad
anni recenti.

r. 3. r. Il modello della lingua scritta

La comunicazione audioverbale avviene attraverso la produzione e


la percezione di blocchi fonici di varia grandezza (che possono
corrispondere, di volta in volta, a frasi, a gruppi di parole, a paro-
le), modellati al loro interno da una certa intonazione, da variazio-
ni di velocità, dalla posizione degli accenti, e a volte delimitati da
due pause. Questi blocchi sono, nella loro globalità, i veri portato-
ri dell'informazione.
Il compito proprio della fonetica è, o dovrebbe essere, quello
di studiare questi blocchi fonici, descriverne le caratteristiche, la
struttura interna e gli elementi da cui sono costituiti.
Ma i parlanti che appartengono, come noi e moltissimi altri, a
una comunità che usi una scrittura alfabetica sono convinti, a tor-
to, che il parlato si presenti all'incirca come lo scritto: cioè come
una successione di unità discrete, in cui i confini tra i foni o tra le
parole siano netti come lo sono quelli tra le singole lettere o le
singole parole nella forma scritta, e in cui ogni unità fonica, anco-
ra una volta in analogia con l'unità grafica, sia sempre uguale a se
stessa 1 • La conseguenza di questa convinzione è che le unità mini-

r. Ciò vale naturalmente solo per la scrittura a stampa che ormai rappre-
senta, in un certo senso, la forma di base della scrittura alfabetica. Invece le scrit-
ture manuali presentano spesso forti elementi di variabilità e di continuità fino ad
essere, in qualche caso, indecifrabili.

22
I. I N TRO D UZ ION E

me, i foni, sono date per scontate e che le unità superiori (sillabe,
parole, frasi) sono viste come il risultato di una meccanica giustap-
posizione in sequenza lineare delle unità minime stesse.
L'esperienza dell'analisi fonetica mostra invece, come diceva-
mo all'inizio di questo paragrafo, che ciascun blocco comunicativo
parlato è un continuum in cui non solo è a volte molto difficile
individuare i confini tra i singoli foni e le singole parole, ma in cui
si osserva anche come la realizzazione dei foni sia sempre molto
variabile e non sempre prevedibile, e come essi si influenzino reci-
procamente. Si osserva inoltre che singoli foni o gruppi di foni
che, in base alle attese, dovrebbero comparire in un certo punto
della sequenza, sono invece a volte materialmente assenti. L'analisi
fonetica mostra infine come la prosodia (cioè l'insieme di fenome-
ni come pause, variazioni di velocità di eloquio, variazioni di altez-
za e di volume) svolga un ruolo importantissimo nella scansione
del messaggio, mentre la scrittura non dà della prosodia che una
rappresentazione parziale e sommaria.
L'immagine del parlato che ci dà la nostra scrittura alfabetica
è dunque del tutto fuorviante?
Per rispondere a questa domanda è necessario chiarire che
cosa si intenda per "lingua parlata" in fonetica e quali ne siano le
manifestazioni. Veniamo così al secondo dei problemi che abbia-
mo ricordato nel PAR. 1.3.

1. 3 .2. Iperarticolazione e ipoarticolazione

I suoni che produciamo quando parliamo, e che i nostri interlocu-


tori percepiscono, possono essere prodotti e percepiti in condizio-
ni profondamente diverse. Qui ne ricordiamo due che rappresen-
tano gli estremi opposti di una scala.
1. Un professionista della voce (un attore, un annunciatore) viene
introdotto in una cabina di registrazione, o comunque in un luogo
protetto, e gli si chiede di pronunciare in modo lento, netto e
scandito singoli suoni o sillabe o parole o frasi, che egli legge. È
una condizione che per un parlante normale non si verifica quasi
mai. Il destinatario di questa produzione fonica non è un normale
interlocutore ma è un fonetista. Questa produzione fonica va sotto
il nome di "parlato di laboratorio".
2. Un soggetto si rivolge in modo concitato a un amico e gli par-

23
MANUALE DI FONETICA

la in fretta, mangiandosi le parole o appena accennandole. La con-


versazione si svolge in un ambiente naturale, eventualmente di-
sturbato da altre voci o da rumori. È una condizione nella quale si
svolge una buona parte dei nostri atti comunicativi. Questa produ-
zione fonica rappresenta il "parlato spontaneo informale".
Fra questi due estremi si colloca una serie teoricamente infinita
e continua di situazioni intermedie che possiamo collocare lungo
una scala che va dal massimo di formalità (la situazione del labo-
ratorio) al massimo di informalità (il rapido scambio di battute tra
due amici).
La qualità articolatoria, fisica e percettiva dei suoni che vengo-
no prodotti nelle varie situazioni è molto diversa. Il parlato più
accurato e scandito viene detto iperarticolato, quello più informale
e trascurato viene detto ipoarticolato 2 •
Il parlato iperarticolato richiede a chi parla molto lavoro, mol-
ta attenzione e molto controllo ma è di facile interpretazione per
chi ascolta. Il parlato ipoarticolato richiede meno lavoro e meno
attenzione a chi parla ma pone più problemi e più lavoro inter-
pretativo a chi ascolta.
Ogni parlante sceglie, più o meno consapevolmente, il livello
di articolazione che giudica adeguato alla situazione in cui si trova
a parlare (cfr. FIG . 1.2).
Se il parlante ritiene che il suo ascoltatore abbia già informa-
zioni su quello che gli vuole dire, sceglierà una forma tendente
alla ipoarticolazione, contando sul fatto che l'ascoltatore, nell'in-
terpretare un messaggio fonicamente povero, farà ricorso alle in-
formazioni esterne, compresi la mimica e i gesti. Se, viceversa, il
parlante non ritiene di poter contare, per qualsivoglia motivo, su
questi aspetti pragmatici, cercherà di produrre un messaggio foni-
camente più ricco. Se la valutazione del parlante è corretta, la co-
municazione avrà successo; se la valutazione è sbagliata la comuni-
cazione andrà incontro a un parziale o totale insuccesso. Si badi
che l'insuccesso può dipendere tanto da carenza di informazione
(l'ascoltatore non capisce), quanto da eccesso di informazione (l'a-

2 . Il termine "ipoarticolato" non è sinonimo di "dialettale" o "scorretto" o


"non standard", ma indica solo un meccanismo articolatorio meno accurato.
Analogamente "iperarticolato" non è sinonimo di "standard" o "corretto " ma in-
dica solo un meccanismo articolatorio più accurato.
I . I NTRODUZ IONE

FIGURA I. 2
La relazione tra l'informazione esterna al segnale e il livello di articolazione nel-
l'interazione tra parlante e ascoltatore

Q)
o
CO o
o
e ·;::
O> eccesso di
Q)
f/) informazione
CO
CO
e
I... o

-i
Q)
t, e:
Q) oo
Q)
e
o
.N
CO carenza di
E
I...
o informazione
~
.E
e
111
ocn ....__ __ _ _ _ _ _ _ _ _ _ _ _ _ ~

ipoarticolato iperarticolato

segnale

informazione interna al segnale


Fonte: modificato da Lindblom, 1987 , p. 14.

scoltatore può essere disturbato da una pronuncia che giudichi


ipercorretta, ridondante, fuori posto, incongrua rispetto alle
aspettative).
Rispetto alla domanda che avevamo posto nel PAR. r.3.r, pos-
siamo ora dire che l'immagine del parlato che ci dà la nostra scrit-
tura alfabetica non è del tutto fuorviante se noi osserviamo e de-
scriviamo il parlato nelle condizioni più estreme della iperarticola-
zione, cioè nel parlato di laboratorio. In questo caso infatti la seg-
mentazione del segnale è relativamente agevole, le singole unità
presentano abbastanza bene le caratteristiche che ci si aspetta e
appaiono come relativamente costanti.
È invece fuorviante quando noi osserviamo e descriviamo il

25
MA N U AL E DI FONETICA

parlato nelle condizioni che abbiamo chiamato ipoarticolate, per i


motivi che abbiamo detto nel PAR. r.3.r.

1.4
Le pratiche fonetiche

La pratica pm frequente in fonetica è quella di osservare quasi


esclusivamente il parlato che tende alla iperarticolazione, nel quale
sono certamente più evidenti le caratteristiche ideali dei suoni di
una lingua.
I vantaggi di questa pratica sono notevoli, perché essa consen-
te di lavorare su registrazioni di ottima qualità, costruite con ma-
teriali selezionati in base alle specifiche esigenze della ricerca in
corso. È così possibile dare descrizioni precise dei fenomeni fone-
tici, perché i fattori di disturbo che abbiamo ricordato nel PAR.
1. 3. 1 sono sensibilmente ridotti o annullati in queste condizioni
sperimentali.
D'altra parte, però, il ricorso a questo tipo di parlato compor-
ta anche molti svantaggi. In primo luogo, sul piano metodologico,
si può osservare che il ricorso a materiali prodotti ad hoc introdu-
ce una circolarità nella ricerca. Quello che effettivamente si osser-
va e si descrive è una forma di parlato che risente moltissimo delle
condizioni artificiali in cui è prodotto: i parlanti sono spesso sele-
zionati con criteri che, esplicitamente o implicitamente, mirano ad
ottenere proprio il comportamento che si vuole osservare; essi,
poi, tendono a parlare non secondo il loro modo abituale, ma nel-
la maniera che, più o meno consapevolmente, considerano la più
appropriata; la pronuncia di foni isolati o anche di parole e frasi
prive di un contesto reale risulta comunque diversa da quella che
si realizza in condizioni naturali.
Ma ormai da tempo si osserva un'attenzione sempre crescente,
non solo in fonetica ma in generale nelle scienze del linguaggio,
per le manifestazioni del parlato spontaneo.
I parlanti cominciano a essere osservati anche nel loro com-
portamento fonico naturale, cioè nelle situazioni in cui producono
sequenze foniche per un normale scopo comunicativo. Vengono
quindi raccolte e analizzate, ad esempio, le conversazioni private,
faccia a faccia o telefoniche, in treno o in strada, i discorsi pub-
blici, le lezioni universitarie o scolastiche, i notiziari e altre tra-
smissioni radiotelevisive, le conversazioni di ufficio e così via.
r . INTRO D UZ IO N E

La raccolta e la descrizione del parlato spontaneo sono però


estremamente più difficili e complesse di quelle del parlato di la-
boratorio. Innanzitutto esse pongono problemi tecnici e pratici:
a) la difficoltà di ottenere registrazioni di buona qualità in conte-
sti privati o in situazioni ambientali spesso sfavorevoli per la pre-
senza di rumori esterni;
b) la necessità di evitare che i parlanti siano consapevoli della
presenza di un osservatore o di un microfono (o, tutt'al più, di
evitare che colleghino la presenza del registratore ad un interesse
di tipo linguistico);
e) la necessità di disporre di grandi quantità di materiali parlati
che consentano un trattamento statistico dei fenomeni che interes-
sa studiare.
Nel parlato spontaneo si osserva infine spesso una vera de-
strutturazione del segnale che consiste in:
a) velocità di eloquio variabile e spesso molto alta;
b) forte variabilità dei foni e loro riduzione;
e) tendenza all'omissione di segmenti della sequenza, con la ca-
duta non rara di interi foni e qualche volta di intere sillabe.
Il risultato può essere un'impressione di grande confusione
nella quale è difficile orientarsi.
Da quanto abbiamo scritto si potrebbe avere l'impressione che
il parlato iperarticolato sia un'astrazione priva di senso, che non
rifletta in alcun modo la pratica comunicativa dei parlanti. Eppure
non è così: il parlato iperarticolato rappresenta in effetti una sorta
di archivio di riferimento, un principio ordinatore al quale spesso
facciamo ricorso. Ce ne serviamo infatti consapevolmente quando
il nostro interlocutore non ha capito e noi ripetiamo in modo
scandito; ce ne serviamo inconsapevolmente quando, per esempio,
dovendo trascrivere un testo orale, ne ricostruiamo mentalmente
la forma iperarticolata quale che sia il livello di articolazione con-
creto che ascoltiamo. Se ne serve necessariamente il fonetista, e
questo è il punto che qui più ci interessa, perché le forme del par-
lato iperarticolato sono il primo criterio di classificazione e di or-
dinamento dei foni.
Si deve naturalmente evitare di rimanere chiusi dentro questo
sistema di riferimento dimenticando i fenomeni concreti e i com-
portamenti comunicativi della gente. La ricerca fonetica si fonda
su un continuo confronto tra i modelli astratti, rappresentati dal

27
MANUALE DI FONETICA

parlato iperarticolato di laboratorio, e i fenomeni concreti rappre-


sentati da tutte le altre varietà di parlato.

1.5
Applicazioni della fonetica

r. 5. r. Applicazioni linguistiche

In linguistica, la fonetica fornisce la descrizione delle caratteristi-


che foniche di lingue standard, di varietà regionali, di dialetti, di
varietà sociali o stilistiche. Inoltre, grazie alla ingente quantità di
materiale parlato (radiofonico, cinematografico e poi televisivo) re-
gistrato e conservato in modo diffuso a partire dagli anni Trenta,
è oggi possibile una fonetica storica sperimentale.
Nell'ambito dell'insegnamento delle lingue straniere, la foneti-
ca fornisce il materiale da utilizzare negli esercizi di produzione e
in quelli di comprensione della lingua oggetto di studio.

r.5.2. Altre applicazioni

Indichiamo qui alcune applicazioni della fonetica al di fuori delle


scienze del linguaggio propriamente dette.

r. Nell'ambito della rieducazione fonica di pazienti affetti da di-


sturbi del linguaggio di varia natura, cioè in foniatria, audiologia e
in logopedia, la fonetica fornisce strumenti per la descrizione del
disturbo e per le tecniche di rieducazione.
2. In ambito giudiziario, la fonetica fornisce gli strumenti e le
tecniche per il riconoscimento di singoli parlanti, la cui voce sia
stata intercettata o registrata.
3. È ormai attuale il problema dell'interazione verbale uomo-
macchina. Sono in parte già realizzati sistemi informatici che:
a) trasformano un testo scritto in un testo pronunciato da una
voce sintetica (per esempio ausilii per non vedenti);
b) analizzano un testo parlato e lo trasformano in un testo scritto
(per esempio comunicazione a voce, via telefono, della lettura di
un contatore) o eseguono il comando pronunciato (comandi a
voce nella guida di un aereo);
e) riconoscono la voce di una determinata persona (chiavi di ac-
cesso foniche a spazi o funzioni riservati).
4. In psicologia, in particolare nell'ambito della psicologia della
I . I NTRODUZIONE

percezione uditiva, la fonetica fornisce gli strumenti per una scelta


mirata del materiale fonico da usare nei test e riceve in cambio
preziose informazioni sulle reazioni uditive dei parlanti e sui pro-
cessi di riconoscimento fonico che si attivano nella comunicazione
audioverbale.

29
2

Fonetica articolatoria
e trascrizione fon etica

2,I
Generalità

Come abbiamo detto nel PAR. 1.3.2, le modalità di produzione di


sequenze foniche cambiano molto a seconda che ci si trovi in con-
dizioni di parlato iperarticolato (come nel caso del parlato di labo-
ratorio) o di parlato ipoarticolato (come ad esempio nelle conver-
sazioni spontanee tra amici). In questo capitolo la descrizione dei
processi di produzione fonica e delle caratteristiche articolatorie
dei singoli foni o di gruppi di foni (sillabe, parole, frasi) si baserà
su osservazioni condotte sul parlato iperarticolato. Tuttavia, ogni
volta che ciò sarà necessario, verranno descritti i comportamenti
fonici che si manifestano nei casi, più frequenti e naturali, di par-
lato ipoarticolato.
La descrizione dei risultati della fonazione seguirà un ordine
che va dal semplice (i singoli segmenti: PAR. 2.3) al complesso (la
fisionomia prosodica di una sequenza: PAR. 2.5), passando attra-
verso lo stadio intermedio della coarticolazione e della sillaba
(PAR. 2.4).

2. 1. 1. Gli alfabeti storici e gli alfabeti fonetici

In una presentazione scritta della fonetica, come appunto in un


manuale, è indispensabile fare ricorso a una qualche notazione
grafica dei foni di cui si parla, cioè a una trascrizione (v. CD-ROM:
trascrizione).
I sistemi alfabetici (greco, latino, cirillico, arabo, ebraico ecc.),
in uso ormai per tutte le lingue occidentali e per numerose lingue
dell'Asia e dell'Africa, rappresentano un tentativo di rendere grafi-
camente i suoni delle varie lingue. Ma, per varie ragioni di ordine
storico-linguistico, anche lingue che utilizzano uno stesso alfabeto

31
M ANUA LE D I FONETICA

(per esempio quello latino, condiviso dalla maggior parte delle lin-
gue europee) assegnano molto spesso agli stessi simboli alfabetici,
o lettere 1, valori diversi (v. CD-ROM: al/abeti tradizionali) .
2 .
Ad esempio, in it. scialle, fr. chic "elegante", ingl. ship "nave",
ted. Schifi "nave", c'è uno stesso suono iniziale, a cui corrispondo-
no quattro diverse grafie (rispettivamente sci, eh, sh, sch); oppure
si può osservare il caso opposto del gruppo costituito dalle due
lettere c-h, che nelle stesse quattro lingue corrispondono ad alme-
no quattro suoni diversi: ad esempio it. chi, fr. chic "elegante",
ingl. cheap "economico" , ted. ich "io" .
Inoltre anche all'interno di una singola lingua si danno molto
spesso casi di non regolare corrispondenza tra foni e lettere. In
italiano, ad esempio, in quasi, casa, chino, ad uno stesso fono ini-
ziale corrispondono tre differenti grafie (q, e, eh), mentre in cena,
cassa, ad una stessa grafia e corrispondono due diversi foni.
Per tutti questi motivi, i linguisti hanno fatto ricorso a sistemi
di trascrizione dei foni, indipendenti dalle ortografie delle singole
lingue e basati invece su un principio di corrispondenza regolare
tra foni e segni grafici. Un alfabeto fonetico assegna univocamente
a ciascun fono uno e un solo simbolo così come, viceversa, ad
ogni simbolo corrisponderà sempre uno stesso fono (v. CD -ROM:
alfabeti scientifici).
L'alfabeto fonetico oggi più diffuso è il cosiddetto Alfabeto
Fonetico Internazionale, indicato con la sigla francese API (Asso-

r . È molto importante dunque tenere ben distinti i concetti e i termini di


fon o e di lettera: mentre il primo, come vedremo, viene definito in base ai mecca-
nismi effettivi dell'articolazione e alla sua natura acustica, la seconda è soltanto il
simbolo grafico che, in una determinata lingua, è usato per rappresentare il fono
nei testi scritti.
2. Una prima causa della incongruenza tra lettere e suoni nelle lingue mo-
derne sta nel fat~o che un alfabeto, come per esempio quello latino, ideato per
una particolare lingua, venga ada~tato poi, in modi diversi , ad altre lingue (per
esempio le lingue romanze, germaniche, parte delle slave ecc.). La seconda causa
di incongruenza sta nel fatto che, mentre l'ortografia è tendenzialmente stabile e
conservativa nel tempo, la fonetica di una lingua può invece subire nel corso dei
secoli mutamenti profondissimi. Il risultato è che spesso si usano forme ortografi-
che che rispecchiano una pronuncia più antica. Il francese e l'inglese sono due
lingue che manifestano in misura particolare questo grande allontanamento tra
ortografia e fonetica: ad esempio la parola francese roi, "re", oggi si pronuncia
ruà, ma si scrive ancora r-o-i sulla base di un'antica pronuncia successivamente
modificatasi fino alla forma attuale.

32
2. FONETICA ARTICO LATORIA E TRASCRIZ IONE FONETICA

ciation Phonétique Internationale) o con quella inglese IPA (Inter-


national Phonetic Association), dal nome dell'organismo scientifi-
co che lo ha proposto alla fine del xrx sec. Oggi questo alfabeto,
che viene continuamente perfezionato, e che adottiamo in questo
manuale, è il principale strumento di rappresentazione grafica dei
foni.
Per illustrare semplicemente l'utilità dell'IPA, basterà ricordare
alcuni esempi già visti sopra. Le parole italiane quasi, casa, chino,
trascritte in questo alfabeto fonetico, avranno tutte lo stesso sim-
bolo [k] a rappresentare il medesimo fono iniziale. Analogamente
le trascrizioni di fr. coeur "cuore", quo i "che cosa", ingl. can "po-
tere", keep "conservare", queen "regina", ted. kommen "venire",
chaos "caos", sp. queso "formaggio", casa "casa" e così via, i cui
suoni iniziali sono sempre identici, o quasi, a quello di it. casa,
avranno tutte come iniziale il simbolo [k].
Nella FIG. 2.r presentiamo la tavola dei simboli fonetici dell'rPA,
che comprende tutti i foni che descriveremo nei prossimi paragra-
fi, nonché molti altri simboli vocalici, consonantici e diacritici
meno diffusi che non saranno presi in considerazione in questo
manuale.
Il criterio con cui i simboli grafici sono disposti in questa tavo-
la riflette i criteri articolatori che verranno presentati nei PARR.
2.3.2 e 2.3.3 .

2 .r. 2. La trascrizione fonetica

La trascnz1one fonetica è un'operazione consistente nel rappre-


sentare per iscritto la forma fonica di una parola, di una frase, di
un intero testo, di un singolo fono , utilizzando un alfabeto fone-
tico.
Lo scopo di una trascrizione fonetica può essere prescrittivo,
come accade ad esempio nella maggior parte dei dizionari, dove
accanto ad ogni lemma è riportata la sua trascrizione secondo la
pronuncia standard della lingua in questione. In questo caso la
forma trascritta ha il valore di una indicazione normativa, cioè in-
tende prescrivere a chi parla o apprende quella lingua una parti-
colare pronuncia della parola.
Oppure lo scopo può essere descrittivo, come accade quando
si debba annotare graficamente il comportamento fonico di un
parlante o di un gruppo di parlanti, oggetto di un'indagine lingui-

33
MAN UA LE DI FONETICA

FI GURA 2.1
Tavola dei simboli fonetici IPA

ALFABETO FONETICO INTERNAZIONALE (revisione del 1993)


CONSONANTI (POLMONARI)

Plosh-c

N,u!i
Billlbw.o

pb
m
Lob<>do,,,h

Il)
Ocn1alì j Alvmila n IP0111&1veol1n

t d
n
.......... p.,.....
t et
Il
e J k g
J1
Vdm

IJ
q
Uwlm

N
·- I 21
Glomdoh

VibN.nti B r R
Monovibrant' e (

Fricative q> 13 f V e e) i s zlJ 3 ~ ~ ç j X y X K h 1 h fi


Utcrui
fricative i l;3
Approssimanti u J -1. j Uf
La1erali I l I.. L

Quando appare una coppia d i simboli, quello a destra rappresenta una consonante sonora. Le aree in grigio indicano artico-
lazioni considerate impossibili.

CONSONANTI (NON-POLMONARI) SOPRASEGMENTALI TONI E ACCENTI DI PAROLA


Clicks Implosive sonore Eiettive • A,=••pim•- LIVELLO ANDAMENTO
O Bilabiale 6 Bilabiale ' come in: I Accm1o~no .foun~•t•f~D é O7 AJti»11»o e 11
O ~te

I Ocntak Q Dentale/alveolare p' Bilabiale ! l.ung, e!


e•
é i Aho e " Du«ndtn1c

! (Post) alvool.ire J Palaia.le t' Dcn1a.le/alveolare


, Sttiu·lung,
v B- e è -j M""° e 1 ,_,AJ,o
=f, Palatoalveolare g' Velare k' Velare . Con6o<,...,..,.. Ji.a:kt è -l """' è ,.,l """""""s...
JI Alveolare laterale (§ UvuJare S' Fricativa alvl!:'Olare
IGro,.,. ....... ,,...,., è J- e 1=:.
VOCALI

Chiu,:rriyi~Ci\~i__0_~rcri~ri - Lq-,nento ('55enudl(()flfint,)

DIA~~~~~~ 1~a~~~!~! ss~~co~~~ri;~: ;~:!'. sopra ~


Semichiuse e j21 - - ~ \ 8 - -Y O . S«do I} ~ •• 5ono«imon!IOl'tll0 P. ~ n
°"''"' ! g
.) V
""""' § ! - ...,.,,_. Q ~ V
Apicak
!g
Semiaperte E re - 3\0- A :, h A~to th db
- L~.biak 1 cj ,..,,..... ! g
re 1:1 >
Piùarrocondt10
~
W LtbwiuMo tw dw -0

N.u!tntto e
Aperte a Ol_j__ O O Mcno,m,t()n(Wo ~ j P11inafuza10 tJ dl n Ralascionuak d"
'
Quando appare una coppia di simboli, quello a destra
. tYdY

-~·
AvatiU IO Y Vdanzuto 1 Ribsciol,ccrak d'
rappresenta una vocale arrotondata. \I
ALTRI SIMBOLI i ç tç dç ., RiJiaKionoriuwbik d ~
M FricarM.bbt,,H-dmsoi-d• ç 1 frk-M•~•lvcolo-i:>mtali -.. F,ringaliwi10

W Appros,imamc bbio,.whn ,ooon j Mooovibrame alveol.,n: l,m11le "'"'""""" e ~ Vdarinatoofuint:aLu.Mo t


q
H
Appromman1cl~~l-$Of'IONI .lj- •J •
Le: Jfric:tte e le trurolwoni
X
X
Scm1-«n1rllizzM:o è
. lnndz..10 ç <J - fri('MfflaJ,,~art,o,J()B

~
frkt~iv,~gJ,oc1id.kt0ròa
doppie ,i ~ rlpf)te:f<m.UC Stlln>tC'O
~ . Abbusa10
~ cl} sappro5,1imari1c~klfl0ff

1---·-
Fnc."111.M"l)iglottid.icSOl'IOft «M't due $1f!lbo11
kgatnen10. $C
unio d.11...,
t n«c$$1;,io. NonsJJ.abiro
~ . Rtdtçed,ell1~,V1111UAII y
kp ts
.
n

' ""'""""' ;)• R.adi<'f ddl• linawi •neir,u y


Fonte: adattata , da lntemational Phonetic Association, 1993, pp. cen trali.

34
2 . FONETICA ART I CO LAT OR IA E TRA SCR IZ IONE FONETI CA

stica. In tal caso, ovviamente, la trascrizione non dà un'indicazione


normativa, cioè non ha l'obiettivo di dire al lettore come deve o
dovrebbe pronunciare quella parola, ma ha solo una funzione de-
scrittiva e ci dice come effettivamente essa è stata pronunciata.
La sequenza trascritta va sempre racchiusa tra parentesi qua-
dre: [ ] . Ciò è necessario per evitare ogni confusione tra forme or-
tografiche e forme fonetiche. Bisogna quindi fare sempre attenzio-
ne a distinguere tra le /orme ortografiche, da leggere secondo le
regole proprie di ciascuna lingua, e le grafie fonetiche racchiuse tra
parentesi quadre, che vanno lette unicamente in base al valore dei
simboli che le compongono, a prescindere dalla lingua a cui ap-
partengono.
Una trascrizione fonetica rappresenta sempre una certa astra-
zione o, quanto meno, una semplificazione dei dati. Infatti la
realtà fonica è costituita da una infinita varietà di possibili realiz-
zazioni, mentre qualunque sistema grafico, per essere utilizzabile
praticamente, deve comprendere un numero abbastanza ridotto
di simboli, eventualmente arricchito da segni diacritici posti ac-
canto, sopra o sotto i simboli per specificarne meglio il valore
fonetico.
Il grado di questa semplificazione è naturalmente arbitrario: a
seconda delle esigenze, una trascrizione può essere ricca di detta-
gli (trascrizione stretta) oppure più approssimativa (trascrizione lar-
ga). Le trascrizioni che daremo nei paragrafi seguenti saranno tra-
scrizioni larghe.

2.2
L'apparato fonatorio e la fonazione

2.2.r. Anatomia

L'apparato fonatorio è l'insieme delle strutture anatomiche che


l'uomo utilizza per parlare. È formato da organi che svolgono pri-
mariamente altre funzioni, perché alcuni fanno parte dell'apparato
respiratorio, altri di quello digerente, altri ancora di ambedue.
Gli organi che, pur appartenendo primariamente agli apparati
respiratorio e digerente, svolgono anche funzioni fonatorie sono,
procedendo dal basso verso l'alto e dall'interno verso l'esterno
(cfr. FIG. 2.2), i seguenti:

35
MANUALE DI FONETICA

a) i polmoni, la cui funzione, nella fonazione, consiste nel fornire


un flusso d'aria che viene spinto verso l'esterno mediante il nor-
male meccanismo della espirazione 3 : in condizioni normali l'espi-
razione avviene per effetto dell'elasticità dei polmoni che, dopo

FI GURA 2 . 2
Rappresentazione schematica dell'apparato fonatorio

[J
trachea

fJ
bronchi

fJ
polmoni

3. Cfr. però, PAR. 2.2.5, altri meccanismi di fonazione in cui i polmoni inter-
vengono in modo diverso, o non intervengono affatto.
2 . FONETI C A ARTI COL ATO RIA E T RASC RI Z IONE FONETIC A

essersi dilatati nel corso dell'inspirazione a causa della contrazione


del diaframma e di vari altri muscoli del torace e del collo, tendo-
no spontaneamente a ridurre il proprio volume, espellendo l'aria
che si trova al loro interno;
b) i bronchi e la trachea: l'aria espiratoria attraversa poi i bronchi,
due sistemi di tubicini che partono dai due polmoni con numero-
se ramificazioni, le quali poi si uniscono via via in tubi sempre più
larghi; i due condotti bronchiali principali destro e sinistro si in-
contrano poi al centro e confluiscono nella trachea, un grosso
tubo che si trova nella parte superiore e anteriore del torace e che
si dirige verso l'alto;
c) la laringe costituisce il proseguimento superiore del tubo della
trachea ed è individuabile al tatto e alla vista nella parte anteriore
del collo, in corrispondenza del cosiddetto "pomo di Adamo"; la
laringe, pur conservando nel suo insieme una forma tubolare, ha
una struttura cartilaginea e muscolare particolarmente complessa.
Al suo interno essa presenta due pliche (ossia due estroflessioni
delle opposte pareti laterali, simili a pieghe di un tessuto), rivestite
di mucosa, dette pliche vocali 4 . Le pliche vocali durante la norma-
le respirazione silente restano separate, consentendo il libero pas-
saggio dell'aria dall'esterno verso l'interno e viceversa; quando
però i piccoli muscoli vocali che si trovano all'interno delle pliche
si contraggono, queste si tendono sporgendosi verso la parte cen-
trale del condotto laringeo fino a venire a contatto l'una con l'al-
tra, occludendo completamente oppure restringendo parzialmente
il passaggio (cfr. infra, PAR. 2.2.3); la parte della laringe che com-
prende le pliche vocali è anche detta glottide e lo spazio (reale o
virtuale, a seconda della posizione delle pliche) che le separa è
detto rima glottidale;
d) proseguendo nel suo percorso verso l'esterno l'aria espiratoria
passa dalla laringe nella faringe, organo che appartiene contem-
poraneamente all'apparato respiratorio e a quello digerente; infat-
ti la sua parte più bassa, detta laringofaringe, comunica diretta-
mente sia con l'esofago, in basso, sia con la laringe, anteriormen-
te; la parte intermedia, detta orofaringe, presenta anteriormente

4. La più comune dizione "corde vocali" va evitata non solo perché non
corrisponde alla reale struttura anatomica implicata, ma anche perché richiama
alla mente una modalità di vibrazione diversa da quella effettivamente realiz-
zata.

37
MANUALE D I FO ETI CA

un'ampia apertura che consente il passaggio da e verso la• bocca;


la parte superiore, chiamata rinofaringe, comunica invece con le
cavità nasali ed è limitata anteriormente dal velo del palato (cfr.
il punto e);
e) in corrispondenza della parte più alta della faringe, anterior-
mente, si trova il velo del palato (o palato molle), organo muscola-
re che pende dall'alto verso il basso come un sipario e separa la
parte superiore della faringe (rinofaringe) dalla cavità orale; du-
rante la respirazione esso pende inerte dal palato, consentendo il
passaggio dell'aria espiratoria verso le cavità nasali o di quella in-
spiratoria dal naso verso i polmoni; invece, durante l'ingestione di
cibo o liquidi, esso si sposta all'indietro, raggiungendo con il suo
margine inferiore la parete posteriore della faringe, e chiudendo
così la comunicazione tra la faringe e le cavità nasali; durante la
fonazione esso può trovarsi, a seconda dei casi, nell'una o nell'al-
tra posizione, occludendo o lasciando libera la comunicazione tra
faringe e naso;
/) l'ugola, un organello che pende dal margine inferiore del velo
del palato, simile al batacchio di una campana e- visibile in fondo
al cavo orale;
g) la cavità orale nel suo complesso, che va dal velo del palato
alle labbra;
h) la lingua, il più mobile tra gli organi che partecipano alla fona-
zione, ha come funzioni primarie quella di favorire la deglutizione
del cibo e quella di organo del senso del gusto; posteriormente
essa è attaccata alla base del cavo orale, mentre la sua parte ante-
riore si può muovere liberamente; nella lingua si possono distin-
guere una radice (la parte posteriore, in direzione della faringe),
un dorso (la parte centrale, all'altezza del velo e del palato), una
punta o apice (l'estremità libera, a contatto con i denti); la lingua è
caratterizzata da una grande capacità di modificare la propria for-
ma, nonché da una grande libertà di movimento, sia sull'asse oriz-
zontale, sia sull'asse verticale: ciò costituisce una delle variabili più
importanti nella classificazione degli atteggiamenti articolatori (in
effetti la lingua può muoversi anche lungo il terzo asse, e cioè la-
teralmente, ma questo movimento non è utilizzato nella fonazio-
ne); i movimenti della lingua hanno luogo di norma quando la ca-
vità orale è leggermente aperta, grazie all'abbassamento della
mandibola;
2 . FO E TICA AR TI COLAT O RIA E TR ASCRI Z IONE FONETICA

i) il palato duro (o più semplicemente palato) è la cupola ossea,


rivestita di mucosa, che sovrasta la cavità orale separandola dalle
cavità nasali; esso si può suddividere, per comodità descrittiva, in
palato posteriore (o prevelo), palato medio e palato anteriore (o
prepalato);
l) gli alveoli dei denti: nella zona anteriore del palato le radici
dei denti incisivi sollevano la mucosa, che presenta, proprio al di
sopra della faccia interna dei denti stessi, dei leggeri rigonfiamenti,
detti appunto alveoli;
m) i denti, tra i quali sono direttamente coinvolti nella realizzazio-
ne di alcuni foni soltanto gli incisivi;
n) le labbra che, grazie all'azione dei muscoli del viso, possono
essere aperte o chiuse, distese, cioè accostate ai denti, oppure ar-
rotondate e protruse verso l'esterno;
o) le cavità nasali (destra e sinistra, separate dal setto nasale),
sono due cavità di forma estremamente complessa, con pareti co-
stituite da ossa cave e porose e rivestite di mucose molto sviluppa-
te; esse partecipano alla fonazione solo quando il velo del palato si
trova nella posizione di riposo (cfr. supra) e consente il passaggio
dell'aria espiratoria verso il naso attraverso la parte superiore della
faringe.
Gli organi fonatori si dividono in organi mobili e organi fissi, a
seconda che intervengano nella fonazione con movimenti attivi (le
pliche vocali, la lingua, le labbra, il velo del palato) o solo passiva-
mente, in quanto raggiunti da un organo mobile (i denti, gli alveo-
li, il palato duro, la faringe).

2.2 . 2. Fisiologia

Come si è già accennato, durante la fonazione, un flusso di aria


proveniente dai polmoni (aria espiratoria) viene spinto verso l' e-
sterno attraverso la laringe, la faringe, la cavità orale (a volte an-
che le cavità nasali), le labbra. Ma, a differenza di quanto accade
durante la normale respirazione, nella quale l'aria entra ed esce
liberamente dai polmoni senza incontrare alcun ostacolo, nella fo-
nazione l'aria incontra lungo il suo percorso verso l'esterno uno o
più ostacoli, cioè dei restringimenti parziali oppure delle occlusio-
ni complete del canale che attraversa, e solo dopo aver superato
questi ostacoli può raggiungere l'esterno.
È proprio l'incontro tra il flusso dell'aria espiratoria e questi

39
M ANUALE DI FONETICA

ostacoli di vario tipo, situati in diversi punti del sistema fonatorio,


a produrre il suono tipico di ciascun fono. In assenza di ostacoli
l'espirazione sarà invece (salvo condizioni patologiche) del tutto
silenziosa.

2.2 .3. Il meccanismo laringeo

Un primo ostacolo sul percorso dell'aria espiratoria può trovarsi


nella laringe, al livello delle pliche vocali (v. CD -RO M: meccani-
smo laringeo). Le cartilagini che costituiscono lo scheletro rigido
della laringe sono collegate tra loro da piccoli fasci muscolari,
alcuni dei quali (i muscoli vocali) corrono all'interno delle pli-
che vocali. Quando i muscoli vocali si contraggono, le pliche
vocali si tendono, e i loro margini liberi si pongono a contatto
l'uno con l'altro per l'intera lunghezza, venendo così ad ostruire
il canale e a bloccare il passaggio dell'aria (cfr. FIG . 2. 3 , posizio-
ne n. 5).

FIGU R A 2 .3
La glottide vista dall'alto in diverse posizioni

3 5 7

2 4 6 8

Legenda: ,) normale respirazione; 2) respirazione forzata; 3) produzione di Coni sordi; 4) mormorio; 5)


produzione di Coni sonori; 6) laringalizzazione; 7) produzione dell'occlusiva glottidale; 8) bisbiglio.
Fonte:. Mioni, 1986, p. 71.

A questo punto l'aria espiratoria, che i polmoni continuano a


spingere verso l'esterno, si viene ad accumulare e a comprimere a
2. FONETIC A ARTI COLATO RIA E TRASCR IZ IONE FONETI CA

ridosso dell'ostacolo costituito dalle pliche vocali combacianti, fa-


cendo così crescere la pressione subglottidale. Si crea in questo
modo un contrasto tra due forze opposte: la tensione muscolare,
che tiene chiuse le pliche, e la pressione subglottidale, che cerca
di aprire la strada per il passaggio dell'aria.
Quando questa pressione (che continua a crescere per la spin-
ta dei polmoni) diventa più forte della tensione muscolare (che in-
vece rimane costante), l'aria forza l'ostacolo e procede verso l'e-
sterno. Non appena un primo soffio d 'aria avrà superato la glotti-
de, la pressione subglottidale, trovato sfogo, si abbasserà nuova-
mente e la forza muscolare (che continua a rimanere costante) tor-
nerà a prevalere, e le pliche si chiuderanno. A questo punto la
pressione dell'aria ricomincerà a crescere finché non si determine-
ranno un'altra volta le condizioni perché il passaggio sia nuova-
mente riaperto. Il ciclo riprende e continua a ripetersi fino a
quando rimangono attive l'espirazione e la contrazione dei muscoli
vocali.
Ciascun ciclo dura, mediamente e in una situazione ideale, cir-
ca 5 ms (millisecondi) per le voci femminili (le pliche vocali si
aprono e si chiudono 200 volte al secondo) e circa IO ms per le
voci maschili (le pliche vocali si aprono e si chiudono rno volte al
secondo).
La successione di più cicli di apertura e chiusura della glottide
costituisce ciò che viene chiamato meccanismo laringeo, oppure,
anche se impropriamente, vibrazione delle pliche vocali 5 •
Nel corso della fonazione il meccanismo laringeo si attiva solo
per la produzione di alcuni tipi di foni, mentre resta inattivo in
altri. Bisogna tenere presente che nelle fasi in cui il meccanismo
laringeo è attivo si osserva anche una continua variazione della
durata del ciclo di apertura e chiusura della glottide. In altri ter-
mini, lo stesso parlante, durante la fonazione , non aziona il pro-
prio meccanismo laringeo sempre con la stessa velocità, ma la mo-
difica continuamente in funzione di molte variabili linguistiche
(cfr. PAR. 2.5.5).

5. In alternativa alla descrizione che abbiamo dato qui del meccanismo la-
ringeo, che rientra in quella che viene chiamata teoria aerodinamico-mioelastica
(perché si basa sul gioco tra la spinta dell'aria e la resistenza dei muscoli), si
contrapponeva, fino a qualche decennio fa, la teoria neuromotoria, che attribuiva
ad una serie di impulsi nervosi alternativamente di contrazione e distensione l'at-
tivazione della vibrazione delle pliche vocali.

41
MANUALE DI FONETICA

I foni in cui il meccanismo laringeo è attivo (e cioè tutte le


vocali e una parte delle consonanti) sono detti sonori; quelli in
cui le pliche vocali restano invece rilasciate e inattive, non gene-
rando quindi alcuna vibrazione laringea, sono detti sordi (cfr.
PAR. 2.2.4).
La laringe può attivarsi anche in modo diverso da quello de-
scritto, con atteggiamenti delle pliche vocali intermedi tra una
completa chiusura e una completa apertura (cfr. FIG. 2.3, posizioni
4 e 8).
In particolare, sono abbastanza frequenti due modalità:
- il mormorio, in cui le pliche vocali sono tenute insieme molto
debolmente e solo nella loro porzione anteriore, in modo tale che
posteriormente esse lasciano passare l'aria attraverso una stretta
fessura rimasta aperta, e nella parte anteriore tesa vibrano, anche
se con poca energia;
il bisbiglio, in cui pure resta un passaggio per l'aria, come nel
mormorio, attraverso una fessura posteriore, mentre anteriormente
le pliche vocali sono fortemente serrate l'una all'altra e dunque
non vibrano.
Queste due modalità, in cui la vibrazione o è molto debole
(mormorio) o è assente (bisbiglio), sono utilizzate consapevolmen-
te in situazioni nelle quali la conversazione awiene a bassa voce,
per evitare che il suono si propaghi oltre una certa distanza. Foni
mormorati o bisbigliati possono inoltre occorrere in casi di inde-
bolimento articolatorio.

2.2 .4. Vocali e consonanti

L'aria espiratoria, oltrepassato l'eventuale ostacolo laringeo ora de-


scritto, raggiunge le cavità superiori (prima la faringe, poi la cavità
orale ed eventualmente le cavità nasali) che, intanto, avranno as-
sunto, grazie ai movimenti degli organi mobili (velo del palato,
lingua, labbra), una particolare configurazione articolatoria. Se l'a-
ria incontra restringimenti od occlusioni in qualche punto del suo
percorso verso l'esterno, tali da generare un qualche tipo di rumo-
re (per esempio un fruscio come nell'iniziale di /umo, un sibilo
come nell'iniziale di sale, una lieve esplosione come nell'iniziale di
pappa e così via), il fono prodotto è una consonante: questa sarà
sorda in assenza di meccanismo laringeo, sonora in sua presenza.
Se invece la configurazione articolatoria degli organi superiori non

42
2. FONETICA ARTI COLATORI A E T RASC RI Z IONE FONETI CA

crea alcun ostacolo al passaggio dell'aria, avremo vocali in presen-


za di meccanismo laringeo e nessuna produzione di suono in sua
assenza 6 (v. CD-ROM: vocali e consonanti).
Combinando la presenza e l'assenza dell'ostacolo laringeo (so-
norità o sordità dei foni) e di quello situato nelle cavità superiori
(presenza o assenza di rumore) (v. CD-ROM: sorgenti combinate),
avremo le seguenti quattro situazioni, che presentiamo in forma di
matrice binaria (v. CD -ROM: classificazione binaria):

ostacolo laringeo ostacolo superiore


vocali +
consonanti sonore + +
consonanti sorde +
silenzio

I meccanismi che generano l'ostacolo superiore, e che intervengo-


no soltanto per l'articolazione delle consonanti, saranno descritti
nel PAR. 2.3.3.

2 . 2. 5. Altre modalità di fonazione

Nel descrivere i meccanismi di produzione dei foni, abbiamo det-


to (2.2 .2) che in tutti i casi è necessario un flusso d'aria espiratoria
che dai polmoni si diriga verso l'esterno. In effetti, questa modali-
tà di fonazione, detta egressiva, è di gran lunga la più diffusa. Tut-
tavia, ci sono lingue che utilizzano anche altri meccanismi.
Uno di questi è quello ingressivo, che agisce sul flusso d'aria
inspiratoria anziché su quello d 'aria espiratoria. In italiano, ci può
capitare di realizzare suoni ingressivi quando, per la fretta di com-
pletare un racconto, continuiamo a parlare anche mentre ripren-
diamo fiato (ciò è particolarmente frequente nei bambini), oppure
quando contiamo rapidamente senza poterci interrompere.
Un'altra importante modalità di fonazione è quella avulsiva,
completamente indipendente dalla respirazione. I foni avulsivi,

6. Una coppia di termini frequentemente utilizzata in alternativa alla coppia


vocale/ consonante è quella di vocoide e contoide. A rigore, quest'ultima coppia
andrebbe usata in riferimento alle caratteristiche articolatorie dei foni, mentre la
prima andrebbe riferita soprattutto alla funzione dei foni nella sillaba (cfr. pp.
74-6). Tuttavia, per comodità, continueremo ad utilizzare i termini più co~uni di
vocale e consonante.

43
M ANU ALE DI FONETI CA

detti anche clicks, sono prodotti realizzando contemporaneamente


due occlusioni nel canale fonatorio, in modo che tra queste due
occlusioni si venga a creare una piccola cavità; grazie al gioco tra
la minore pressione che si determina all'interno della cavità e la
pressione atmosferica esterna, non appena si rilascia l'occlusione
anteriore, l'aria irrompe bruscamente dall'esterno provocando un
rumore simile a uno schiocco. Si tratta di suoni che produciamo
abitualmente, quando, per esempio, mandiamo un bacio da lonta-
no, o quando diciamo di no con uno schiocco della lingua, o
quando imitiamo scherzosamente il rumore del trotto di un caval-
lo. Numerose lingue africane li usano sistematicamente.
Vanno infine menzionate le articolazioni eiettive e iniettive.
Esse dipendono rispettivamente da una riduzione o un amplia-
mento del volume complessivo della cavità sopralaringea (e dalle
conseguenti variazioni della pressione dell'aria interna) , dovuti a
un innalzamento o a un abbassamento della laringe chiusa, ferma
restando un'occlusione nel cavo orale. Quando l'occlusione orale
si rilascia, l'aria esterna entra nel cavo orale (iniettive) , se questo si
è dilatato e la pressione interna di conseguenza è diminuita, o l'a-
ria interna fuoriesce (eiettive), se il volume del cavo orale si è ri-
dotto e la pressione interna di conseguenza è aumentata.

2.3
Fonetica articolatoria segmentale

2.3.r. Generalità

In questo paragrafo verranno descritte le caratteristiche articolato-


rie dei singoli foni, considerati come segmenti di una sequenza (da
qui deriva l'aggettivo segmentale), osservati ciascuno nella condi-
zione ideale, e artificiosa, dell'isolamento.
Durante la fonazione gli organi mobili assumono diversi atteg-
giamenti, o posizioni, in relazione agli organi fissi, costituendo così
un ampio insieme di configurazioni articolatorie.
Ogni fono sarà dunque qui descritto in base alle posizioni che
i diversi organi fonatori assumono nel momento in cui esso viene
pronunciato, e in base alla presenza o meno di attività laringea.
Per ogni configurazione articolatoria si distinguono tre diverse
fasi:
a) fase di impostazione, in cui gli organi, abbandonando la posi-

44
2. FONETICA ARTICOLAT ORIA E T RASCR IZ IONE FONETICA

zione del fono precedente (o quella di riposo, se ci troviamo all'i-


nizio di una sequenza), vanno progressivamente spostandosi verso
la configurazione caratteristica del fono da articolare;
b) una fase di tenuta, in cui gli organi hanno raggiunto la confi-
gurazione specifica del fono dato (o vi si sono awicinati di più),
restando brevemente fermi in quella posizione;
c) una fase di soluzione, durante la quale la configurazione del
fono viene abbandonata più o meno rapidamente, ma comunque
gradualmente, per passare al fono successivo (o alla posizione di
riposo se ci troviamo alla fine di una sequenza).
Nella descrizione delle diverse configurazioni articolatorie si
tiene conto della fase di tenuta.

2.3 .2. Vocali

Le vocali sono caratterizzate, come abbiamo visto nel PAR. 2.2 .4,
dalla presenza di vibrazione laringea e dall'assenza di ostacoli nelle
cavità superiori (v. CD-ROM: vocali). In base a questa definizione, le
vocali sono sempre sonore 7 •
La produzione dei vari tipi vocalici è determinata dagli organi
mobili (lingua, labbra, velo del palato) che, pur non creando osta-
coli al flusso dell'aria, assumono diverse posizioni e modificano
molto sensibilmente la conformazione delle cavità che l'aria attra-
versa.

1. Per distinguere e classificare le vocali si osserva innanzitutto la


posizione della lingua nel cavo orale. La lingua può muoversi in
due direzioni (escludendo gli spostamenti laterali, che non hanno
alcun interesse fonetico):
a) in senso orizzontale, o antera-posteriore;
b) in senso verticale, dal basso verso l'alto.
Se si marca un punto centrale del dorso della lingua e se ne
osservano ai raggi X i movimenti (cfr. PAR. 2.6.2), si vede che
l'insieme delle posizioni che questo punto può assumere nell'ar-
ticolazione di foni vocalici ha approssimativamente l'aspetto di
un quadrilatero (cfr. FIG. 2.4), di forma trapezoidale, detto per
questa ragione trapezio vocalico (v. CD-ROM: trapezio vocalico).

7. Si parla talvolta di vocali sorde, ma si tratta in realtà di suoni bisbigliati o


mormorati che prevedono comunque una qualche attivazione delle pliche vocali.

45
MAN UALE DI FO N ETI CA

FI GU RA 2 . 4
Il trapezio vocalico rappresentato schematicamente all'interno del cavo orale

Per convenzione la parte sm1stra del trapezio rappresenta la


porzione anteriore della cavità orale e quella destra la porzione
posteriore.
La forma trapezoidale, con la base maggiore in alto, è dovuta
al fatto che, quando la lingua è sollevata, la sua libertà di spo-
stamento in senso antera-posteriore è maggiore che non quando
essa si muove nella parte bassa del cavo orale. Il lato sinistro è più
lungo di quello destro perché nella parte anteriore del cavo orale
lo spazio disponibile per i movimenti verticali della lingua è più
ampio che non nella parte posteriore.
Gli spostamenti della lingua oltre i confini del trapezio vocali-
co, in posizioni di maggiore avvicinamento o di contatto con i vari
organi della cavità orale (velo, palato), danno invece luogo ad arti-
colazioni non vocaliche, poiché determinano, con il restringimento
o la chiusura del canale, la presenza di un ostacolo al passaggio
dell'aria, e quindi di rumore consonantico.
All'interno del trapezio vocalico è possibile immaginare un nu-
mero teoricamente infinito di punti, cioè di diverse posizioni della
lingua, corrispondenti ad un numero infinito di diversi foni vocali-
ci. Ma per convenzione si individuano nel trapezio dodici posizio-
ni, ciascuna delle quali corrisponde ad un insieme di articolazioni
2. FONETICA ARTI COLATORIA E TRASCRIZIONE FONETICA

relativamente simili che vengono identificate con uno stesso slffi-


bolo (cfr. FIG. 2.5) 8.

FI GURA 2.5
Trapezio vocalico semplificato e simboli fonetici dei principali foni vocalici

anteriori centrali posteriori


alte

medio-alte

medio-basse

basse

Le vocali si distinguono in anteriori, centrali e posteriori in base al


grado di avanzamento/arretramento della lingua (da sinistra verso
destra nella FIG. 2.5) 9 e in alte, medio-alte, medio-basse, basse, con
riferimento al grado di innalzamento della lingua rispetto alla sua
posizione di riposo 10 • Ogni vocale è quindi primariamente defini-
ta in base alla posizione della lingua lungo due dimensioni, una
orizzontale e una verticale.

2. Per la determinazione delle caratteristiche articolatorie di un


fono vocalico va osservata anche la posizione delle labbra (v. CD-
ROM: vocali labiali e non labiali).

8. Il quadrilatero in FIG . 2.5 rappresenta una variante semplificata e legger-


mente modificata rispetto a quello presentato in FIG. 2.1.
9. Un'altra terminologia, quasi altrettanto usata e in tutto equivalente alla
prima, è quella che distingue le vocali in palatali, prevelari e velari, con riferi-
mento all'organo fisso (rispettivamente palato, prevelo, velo) cui la lingua è più
vicina nell'articolazione di ciascuna vocale.
10. Anche per questa serie esiste una possibilità alternativa abbastanza dif-
fusa, che usa, nello stesso senso dei precedenti, i termini chiuse, semichiuse, se-
miaperte, aperte, con riferimento all'ampiezza dello spazio tra la lingua e il palato
(o il velo) .

47
MAN U AL E DI FO N E TI C A

Le vocali sono pronunciate o con le labbra distese, ossia non


arrotondate, o con le labbra più o meno sporgenti in avanti e in
varia misura arrotondate. Le vocali che presentano tale arrotonda-
mento sono dette labializzate o procheile, quelle che non lo pre-
sentano sono dette non labializzate o aprocheile.

3. illustriamo ora le caratteristiche dei foni vocalici che rappre-


sentano le posizioni presentate in FIG. 2.5 (v. CD-ROM: inventario
delle vocali).

Vocali anteriori:
[i] anteriore alta non labializzata: è rappresentata in it. di, fili, si-
mili, fr. ici "qua" , ingl. sea "mare", ted. Lied "canzone", sp. mi "me";
[e] anteriore medio-alta non labializzata: è rappresentata in it.
venti " 20", sera, pera , mela, fr. été "estate", ted. sehen "vedere",
ingl. bed "letto", sp. ves "vedi";
[e] anteriore medio-bassa non labializzata: è rappresentata in
it. venti (sostantivo plurale), serra , sette, fr. est "è", ingl. air "aria",
ted. essen "mangiare".

Una trascrizione fonetica, anche larga, dell'italiano mostra in coppie di


parole come [venti] vs. [venti] una differenza fonica importante, non re-
gistrata regolarmente dall'ortografia che la segnala solo in posizione fina -
le accentata (per esempio perché vs. caffè). Tuttavia tale distinzione non
sussiste nel caso di vocali non accentate, come ad esempio la prima voca-
le di ventina o di ventoso, o la vocale finale di sere o di serre: in questi
casi, in una trascrizione larga, è consuetudine usare sempre il simbolo
[e]. Dunque si scriverà [ventina] , [ventoso] , [sere] e [serre].

[re] anteriore bassa non labializzata: è rappresentata in ingl.


man "uomo", cap "berretto" e in alcune pronunce regionali dell'i-
taliano, ad esempio Bari nella varietà regionale pugliese II.

Vocali centrali:
[i] centrale alta non labializzata: non è presente nelle principa-
li lingue europee occidentali a cui stiamo facendo riferimento; è
presente invece, ad esempio, in russo: my "noi";
[~] centrale medio-alta non labializzata: è rappresentata in fr.
j e "io", le "il", ingl. her "lei", giri "ragazza", ted. ge- in gekommen

rr. Mentre in FIG . 2 . 1 [re] è intermedia tra una vocale bassa e una medio-
bassa, a noi sembra più opportuno considerarla bassa.
2. FONETICA ARTICOLATORIA E TRA SCRI Z IO NE FONETI CA

"venuto", nonché in molti dialetti italiani meridionali dove compa-


re per lo più in sillaba non accentata; in italiano compare nel par-
lato spontaneo, dove talvolta sostituisce altre vocali, specialmente
in posizione finale non accentata;
[B] centrale medio-bassa non labializzata: è rappresentata nella
vocale finale dell'inglese so/a "divano" e in ted. Arm "braccio"
([at?m]);
- [a] centrale bassa non labializzata: è rappresentata in it. papa,
ma, patata, fr. papa "papà", ted. sah "vidi, vide", sp. andar "cam-
minare" 12 •
Vocali posteriori:
[u] posteriore alta labializzata: è rappresentata in it. tu, cucù,
fr. tout "tutto", ingl. do "fare", ted. Kuh "mucca", sp. un "uno";
[o] posteriore medio-alta labializzata: è rappresentata in it.
botte "recipiente di legno", torre, voce, fr. beau "bello", dos
" seh.iena " , te d. 0'Jen
1" "forno " , sp. don de "dove " ;
[:,] posteriore medio-bassa labializzata: è rappresentata in it.
bòtte "percosse", toro, corpo, fr. homme "uomo", ingl. floor "pavi-
mento", ted. volt "pieno".
Esattamente come per la coppia [e] vs. [e], e per le stesse ragioni, la
distinzione tra [o] e [:,] ha grande importanza nelle trascrizioni fonetiche
dell'italiano, ma solo per quanto riguarda le vocali toniche, come quelle
citate negli esempi; in posizione atona si usa sempre, nelle trascrizioni
larghe, il simbolo [o] come ad esempio per la prima vocale di bottaio,
bottarella ecc., o per la finale di bottino, vino, lupo ecc.
[a] posteriore bassa non labializzata: è rappresentata in fr. pas
(negazione) , ingl. car "automobile"; è frequente anche in molte
pronunce regionali dell'italiano, come ad esempio la piemontese e
la napoletana.
Ciascuno dei simboli ora introdotti corrisponde, come abbia-
mo detto, ad un insieme di articolazioni che, pur condividendo
alcune caratteristiche comuni, possono essere leggermente diverse
l'una dall'altra.
Così, ad esempio, nella zona della [i], in inglese e in tedesco
sono previste due articolazioni diverse: se si confronta ingl. seen

12. Mentre in FIG. 2.r [a] è una vocale bassa anteriore, a noi sembra più
opportuno considerarla bassa centrale.

49
MA NU AL E DI FO N ETI CA

"visto" con sin "peccato", oppure ted. Lied "canzone" con litt
"soffrii, soffrì", si vede che in ciascuna coppia la vocale del se-
condo membro è meno chiusa e meno anteriore (oltre che più
breve) di quella del primo membro. Per questa seconda vocale si
può usare un simbolo diverso: [1]. Lo stesso vale per il settore
. 1 1.r.00l "sciocco
deli a [u ] : mg. . . " , te d. R uhm "fama " ,
", 1.r.u ll "pieno
Rum "rum", dove la vocale del secondo elemento di ogni coppia è
meno chiusa e meno posteriore di quella del primo, e può essere
rappresentata dal simbolo [u] (cfr. supra FIG . 2.1).
Quando si voglia indicare con maggiore precisione (trascrizio-
ne fonetica stretta) l'esatto punto di articolazione di un fono voca-
lico, e non si disponga, a differenza dei casi ora illustrati, di un
apposito simbolo, si può fare ricorso ai segni diacritici che l'IPA
fornisce (cfr. FIG . 2. 1), i quali segnalano che la posizione della lin-
gua è più avanzata [ + ] , più arretrata [-] , più innalzata [.L] o più
abbassata [T] rispetto alla vocale di riferimento. Tali segni diacriti-
ci vengono scritti al di sotto del simbolo della vocale oppure alla
sua destra, in apice.
Delle dodici vocali esaminate fino a questo punto, nove ([i, e, e,
re, i, ;J, e, a, a]) sono non labializzate e le rimanenti tre ([u, o,:-,])
sono labializzate. Ma poiché la posizione delle labbra non dipende
da quella della lingua, esiste la possibilità di pronunciare vocali ante-
riori e centrali con arrotondamento labiale e, viceversa, vocali poste-
riori senza arrotondamento labiale. In altri termini, in ognuna delle
dodici posizioni identificate nel trapezio vocalico è possibile pronun-
ciare sia la vocale non labializzata, sia la labializzata. La FIG . 2.6. mo-
stra i due trapezi vocalici, relativi alle due modalità 13 .
Non completeremo qui l'esame di tutte le vocali rappresentate
in FIG. 2 .6 , ma ci limiteremo a descrivere, in aggiunta alle vocali
già esaminate, soltanto quelle utilizzate dalle principali lingue eu-
ropee occidentali.
In francese e in tedesco esiste una serie di vocali anteriori la-
bializzate:
- [y] anteriore alta labializzata: corrisponde alla non labializzata
[i] ed è rappresentata in fr. lune "luna", bu "bevuto" , ted. Bucher
"libri";
- [0] anteriore medio-alta labializzata: corrisponde alla non la-

r 3. In FJG. 2. r le vocali non labializzate e labializzate sono affiancate nello


stesso trapezio.
2. FONETICA ARTI COLATORIA E TRAS CRI ZION E FONETICA

FIGURA 2.6
Trapezi vocalici con i simboli delle vocali non labializzate (a sinistra) e delle vo-
cali labializzate (a destra)

vocali non labializzate vocali labializzate

bializzata [e] ed è rappresentata in fr. deux "due", peu "poco",


ted. horen "udire", Ol "olio";
[ce] anteriore medio-bassa labializzata: corrisponde alla non la-
bializzata [e] ed è rappresentata in fr. seul "solo", peur "paura",
ted. o/fnen "aprire", konnen "potere".
In inglese esiste una vocale posteriore non labializzata:
[A] posteriore medio-bassa non labializzata: corrisponde alla la-
bializzata [::,) ed è ·rappresentata in ingl. cup "tazza", love "amore".

Tutte le vocali descritte finora sono dette orali, perché il flusso


dell'aria proveniente dai polmoni trova il velo del palato (PAR.
2.2.1) in posizione arretrata ed è interamente deviato verso la cavi-
tà orale. Se invece il velo del palato si trova in posizione abbassa-
ta, una parte dell'aria espiratoria passa attraverso le cavità nasali e
le vocali così prodotte vengono dette nasali o nasalizzate (v. CD-
ROM: vocali orali e nasali).
In ognuna delle configurazioni articolatorie (labializzate e non
labializzate) che abbiamo visto fino a questo punto, si può realiz-
zare anche la corrispondente vocale nasale. Si osserva però che
mentre tutte le lingue hanno vocali orali, solo alcune hanno vocali
nasali e comunque sempre in numero inferiore a quello delle vo-
cali orali.
Le vocali dell'italiano, dell'inglese, del tedesco, dello spagnolo

51
M ANU AL E DI F ONETI CA

e di molte altre lingue sono, di norma, orali (salvo fenomeni di


nasalizzazione che vedremo nel PAR. 2 .4.5).
Vocali nasali sono presenti in modo sistematico, tra le lingue
europee occidentali, in francese e in portoghese.
Per la trascrizione fonetica delle vocali nasali l'rPA utilizza
simboli delle corrispondenti orali sovrastati da un tilde [-].
Le quattro vocali nasali del francese sono:
[5] posteriore bassa labializzata nasalizzata: in dans "in", dent
"dente";
[6] posteriore medio-alta labializzata nasalizzata: in mon
"mio", monde "mondo";
[i:] anteriore medio-bassa non labializzata nasalizzata: in simple
"semplice", fin "fine" (spesso realizzata e trascritta come [re]);
[&] anteriore medio-bassa labializzata nasalizzata: in un "uno",
brun "bruno".

4. Quando due vocali si trovano all'interno della stessa sillaba


(cfr. pp. 74-6) si dice che costituiscono un dittongo, come, per
esempio, in it. pau-sa, lai-co.
Da questa definizion~ restano escluse tutte le sequenze del
tipo presente in ie-ri, uo-mo ecc. , in cui il primo elemento è una
consonante approssimante (cfr. p. 55) e non una vocale (anche se
tradizionalmente -ie-, -uo-, e simili erano definiti "dittonghi
ascendenti"). Restano esclusi dalla definizione di dittongo anche i
cosiddetti iati, che consistono invece di successioni di vocali ap-
partenenti a sillabe diverse come in pa-e-se, po-e-ta ecc. (sui dit-
tonghi cfr. pp. 67-8).
5. Il vocalismo atono presenta in genere in ogni lingua una dimi-
nuzione dei timbri vocalici (in italiano, per esempio, le vocali toni-
che sono sette, quelle atone cinque), e una loro minore definizio-
ne. Le vocali atone sono in genere più brevi, più centrali e meno
intense delle corrispondenti toniche.

2.3.3. Consonanti

Mentre nella pronuncia delle vocali, come abbiamo visto nel PAR.
2.2.4, l'aria espiratoria, oltrepassate le pliche vocali, non incontra al-
tri ostacoli sul proprio cammino e fuoriesce liberamente attraverso la
bocca ed eventualmente anche attraverso il naso, nel caso delle con-
sonanti essa trova sempre lungo il suo percorso verso l'esterno un

52
2. FONETICA ARTICOLATORIA E TRASCRI ZIONE FONETICA

ostacolo parziale o totale, il cui superamento genera il rumore tipico


di ciascun fono consonantico (v. CD-ROM: consonanti).
Inoltre, mentre le vocali sono sonore, cioè presentano tutte
una vibrazione delle pliche vocali (tranne che nel bisbiglio e in
casi sporadici di desonorizzazione), le consonanti si dividono si-
stematicamente in sonore e sorde (PAR. 2.2.4) (v. CD-ROM: sonorità
vs non sonorità).
Gli ostacoli che l'aria espiratoria incontra nelle cavità superiori
durante le articolazioni consonantiche possono essere di vari tipi e
possono trovarsi in punti diversi del percorso. Inoltre il meccani-
smo laringeo può essere o non essere attivo.
Possiamo quindi classificare le consonanti in base ai seguenti
tre parametri: r. il modo di articolazione, che indica il tipo di osta-
colo che le genera; 2. il luogo di articolazione, che indica quali or-
gani o parti di organi vengono a creare questo ostacolo; 3. la as-
senza/ presenza di meccanismo laringeo, che indica la natura rispet-
tivamente sorda o sonora della consonante (v. CD-RO M: parametri
classificatori consonanti).

Modi di articolazione

Qui di seguito descriviamo i modi di articolazione (v. CD-ROM:


modi di articolazione):
a) occlusivo. L'ostacolo consiste nel blocco totale del passaggio
dell'aria causato dallo stretto contatto tra due organi, ad esempio
le due labbra, o la lingua e il palato. In questo caso l'aria espirato-
ria proveniente dalle cavità inferiori si accumula dietro l'ostacolo
fino a quando la sua pressione non riesce a forzarlo e a proseguire
verso l'esterno. La prima fase , di chiusura totale del passaggio,
viene detta occlusione; la seconda, cioè la brusca riapertura del-
1'occlusione, è detta esplosione. Le consonanti prodotte con questo
meccanismo sono chiamate occlusive; ne è un esempio la p di pap-
pa. La fase di occlusione non produce naturalmente alcun rumore,
che è invece prodotto dall'esplosione. La durata dell'occlusione,
come vedremo alla p. 71, può variare, mentre l'esplosione ha sem-
pre una durata brevissima. Il termine plosivo, meno diffuso, viene
usato per comprendere tanto il meccanismo della esplosione, che
abbiamo appena descritto, quanto quello, meno frequente, della
implosione, legato all'articolazione iniettiva (PAR. 2.2 .5) ;
b) fricativo (o spirante). L'ostacolo consiste nell'avvicinamento sen-

53
MANUALE DI FONETICA

za contatto di due organi articolatori; l'aria può continuare a fuoriu-


scire, sia pure in modo forzato, passando attraverso la stretta fessura
rimasta aperta. Il flusso d'aria diviene in questo modo turbolento
(come quando il vento si infila in uno stretto spiraglio) e produce un
rumore di frizione. Le consonanti prodotte con questo meccanismo
si chiamano perciò fricative, come, per esempio, nei foni iniziali di
faro, sasso, scena. Le consonanti fricative sono continue perché la
sorgente di rumore può restare attiva per un tempo prolungabile a
piacere (teoricamente finché resta fiato nei polmoni);
c) affricato. L'ostacolo consiste in una occlusione determinata dal-
lo stretto contatto tra due organi; questa occlusione però non vie-
ne rilasciata bruscamente, con una esplosione, come abbiamo visto
per le occlusive, ma viene rilasciata gradualmente e gli organi,
dopo essersi staccati, restano molto vicini tra loro, e permettono il
passaggio turbolento dell'aria nel piccolo spazio che li separa, pro-
prio come nel caso delle fricative. Le consonanti affricate consi-
stono dunque di una fase di occlusione seguita da una fase di frizzò-
ne. Un'affricata in italiano è il fono centrale di pezzo, in cui è pos-
sibile riconoscere (come vedremo meglio nel paragrafo seguente)
una prima parte occlusiva simile al fono iniziale di tavolo e una
seconda parte fricativa simile al fono iniziale di sasso 14 ;
d) nasale. Si realizza quando nel canale orale si determina un osta-
colo e contemporaneamente il velo del palato resta abbassato, per-
mettendo all'aria di defluire attraverso le cavità nasali e di aggirare
così l'ostacolo prodottosi nella bocca. A causa del deflusso attraver-
so le cavità nasali, la pressione dell'aria contro l'ostacolo orale è mol-
to debole e non vi si produce rumore. Una nasale è in no, dove la lin-
gua ha all'incirca la stessa posizione che assume in do, ma l'aria esce
dal naso durante la fase di occlusione. Le consonanti nasali sono
continue per gli stessi motivi che abbiamo detto per le fricative;
e) laterale. L'ostacolo è costituito da una occlusione centrale del
canale, provocata dalla lingua, che però consente il passaggio del-
1' aria lungo i due lati, o lungo un solo lato, dell'ostruzione. È il
caso, ad esempio, del fono iniziale in luna. Anche le consonanti
laterali sono continue;
/) vibrante (o trillo). L'ostacolo è prodotto da una debole occlusione

14. Nel sistema IPA (FIG . 2.1) le affricate non figurano come modo di artico-
lazione a sé perché vengono considerate come la successione di una occlusiva e
di una fricativa.

54
2. FONETICA ART ICO LAT O RI A E TRASCRIZIONE FONETI C A

intermittente, cioè che si interrompe e si ripristina velocemente un


certo numero di volte (da· una, due fino a cinque, sei volte). Se la de-
bole occlusione si produce una sola volta si ha il modo di articolazio-
ne monovibrante. Una consonante vibrante è quella che si trova in
raro. Anche le consonanti vibranti sono continue;
g) approssimante (o semiconsonantico o semivocalico). Si tratta di
un modo di articolazione di più incerta definizione perché si situa
al confine tra l'articolazione vocalica e quella consonantica, come
le abbiamo definite nel PAR. 2.2-4- Questa incertezza si manifesta
anche nelle denominazioni tradizionali (semiconsonantico o semi-
vocalico). Infatti, se immaginiamo di pronunciare vocali via via più
alte, ad un certo punto la distanza tra la lingua e il palato o il velo
si sarà talmente ridotta che inizierà a prodursi un rumore di frizio-
ne. Ad esempio, nella parte anteriore del trapezio vocalico, spo-
stando la lingua sempre più in alto e sempre più vicino al palato,
da [e, e, i] arriveremo alla fine ad una consonante fricativa palata-
le. Guardando alle cose in questo modo, la distinzione tra vocali e
consonanti appare come un continuo nel quale è difficile trovare
un preciso confine. Intorno a tale confine si collocano i foni detti
approssimanti, che sono prodotti con gli organi articolatori molto
ravvicinati, ma non quanto per le fricative, così che al passaggio
dell'aria non si produce quasi alcun rumore. La conseguenza di
questa posizione articolatoria intermedia è che i foni approssiman-
ti, che sono generalmente sonori, tendono a confondersi con quel-
li vocalici adiacenti, mentre, nei casi di desonorizzazione, tendono
a confondersi con le fricative corrispondenti. Esempi di approssi-
manti sono i foni iniziali di it. ieri e uomo, ambedue sonori.

Riproponiamo lo schema completo dei vari modi di articolazione


esaminati, riunendo insieme quanto abbiamo già visto:

a) occlusivo occlusione + esplosione


b) fricativo frizione
e) affricato occlusione + frizione
d) nasale ostacolo orale e velo palatino abbassato
e) laterale occlusione centrale e passaggio laterale
aperto
/) vibrante occlusione + esplosione + occlusione
+ esplosione + occlusione + esplosione ...
g) approssimante intermedio tra vocalico e fricativo

55
MANUALE DI FONETI CA

Mentre nei modi di articolazione occlusivo, fricativo, affricato


vengono realizzate consonanti sorde e sonore, nei modi di artico-
lazione nasale, laterale, vibrante e approssimante si hanno di nor-
ma solo consonanti sonore.

Luoghi di articolazione

Descriveremo ora i luoghi di articolazione delle consonanti, cioè i


punti dell'apparato fonatorio nei quali si formano gli ostacoli di cui
abbiamo parlato. Procederemo dall'esterno verso l'interno e, per
ciascun luogo di articolazione, esamineremo i principali tipi conso-
nantici che vi si realizzano (v. CD-ROM: luoghi di articolazione).
Daremo inoltre, insieme ai simboli dell'rPA per ognuna delle
consonanti descritte, una trascrizione fonetica completa delle parole
usate come esempio (in caso di incertezza sui simboli si potrà con-
sultare lo schema presentato in FIG. 2.1). In queste trascrizioni non
terremo conto della lunghezza dei foni (PAR. 2.5 .2). Segnaleremo in-
vece la posizione dell'accento, che sarà definito alle pp. 76-8. L'ac-
cento viene indicato col simbolo ['] posto prima della sillaba accen-
tata (per la definizione di sillaba cfr. pure pp. 74-6).

1. Bilabiale. Le consonanti bilabiali sono articolate unendo o av-


vicinando il labbro inferiore e il labbro superiore:
a) occlusive bilabiali, rispettivamente sorda e sonora:
- [p] di it. papa ['papa], fr. pont "ponte" [pò], ingl. spy "spia"
[spai], sp. pan "pane" [pan], ted. platt "piatto" [plat];
- [b] di it. bimbo ['bimbo], fr. beau "bello" [bo], ingl. boy "ra-
gazzo" [b~1], sp. beso "bacio" ['beso], ted. bis "fino a" [bis];
b) fricative bilabiali, rispettivamente sorda e sonora:
- [<I>], che non è rappresentata nelle lingue europee più diffuse,
ma è ad esempio la realizzazione fiorentina della occlusiva bilabia-
le sorda [p] in posizione intervocalica in la pipa [la '<l>i<l>a];
- [J3] di sp. hube ['uj3e] "ebbi";
c) nasale bilabiale (sonora):
- [m] di it. mamma ['mamma], fr. mot "parola" [mo], ingl. man
"uomo" [mren], sp. mar "mare" [mar], ted. Mann "uomo" [man].

2. Labiodentale. Le consonanti labiodentali sono articolate unen-


do o avvicinando il labbro inferiore ai denti incisivi superiori. In
2. FONETICA ARTICOLATOR IA E TRAS CRIZIO NE FONETICA

questo luogo di articolazione non è possibile l'occlusione perché


l'aria passa comunque attraverso gli interstizi tra i denti:
a) fricative labiodentali rispettivamente sorda e sonora:
- [f] di it. fifa ['fifa], fr. /ou "folle" [fu], ingl. /un "divertimen-
to" [fAn], sp. fin "fine" [fin] , ted. von "di" [fon];
- [v] di it. viva ['viva], fr. vie "vita" [vi], ingl. van "furgone"
[vren] , ted. Weg "via" [vek];
b) affricata labiodentale (sorda):
- [pf] (scritta con un simbolo doppio come tutte le affricate), di
ted. Apfel ['apfal], "mela";
e) nasale labiodentale:
[IIJ] di it. panfilo ['paIIJfilo] , invano [iIIJ'vano], sp. infierno
"inferno" [ill]'fjerno]; in ambedue le lingue occorre solo davanti
a un'altra labiodentale.

3. Dentale-alveolare-postalveolare. Queste consonanti si articolano


accostando la punta (apice) della lingua ai denti incisivi superiori
o agli alveoli o alla zona di confine tra gli alveoli e il palato. Le
differenze tra questi tre punti sono in genere trascurate, tranne
che nel caso delle fricative.

3a. Dentale. Le consonanti dentali si articolano accostando la


punta (apice) della lingua ai denti incisivi superiori. Anche in que-
sto luogo di articolazione non è possibile l'occlusione perché l'aria
passa comunque attraverso gli interstizi tra i denti:
a) fricative dentali rispettivamente sorda e sonora:
- [0] di ingl. bath "bagno" [bo0], sp. hace "fa" ['a0e];
- [ò] di ingl. that "quello" [òret], sp. lado "lato" ['laòo].

3b. Alveolare. Le consonanti alveolari si articolano con la punta


della lingua che si accosta agli alveoli dei denti incisivi superiori:
a) occlusive alveolari rispettivamente sorda e sonora:
- [t] di it. tempo ['tempo], fr. temps "tempo " [t5], ingl. stay
"stare" [ste1], sp. tiempo "tempo " ['tjempo], ted. Hut "cappello"
[hut];
- [d] di it. dente ['dente], fr. dent "dente" [do] , ingl. day "gior-
no" [dei], sp. diente "dente" ['djente], ted. da "là " [da];
b) fricative alveolari rispettivamente sorda e sonora:
- [s] di it. casa ['kasa] , sei [sei] , fr. six "sei" [sis], ing. six "sei"
[s1ks], sp . seis "sei" [seis], ted. Fuss "piede" [fus];

57
MANUALE DI FONETICA

[z] di it. caso ['kazo], asma ['azma], fr. douze "dodici" [duz],
ingl. zoo "zoo" [zu], ted. sechs "sei" [zeks].
In italiano i foni [s] e [z] hanno una diversa distribuzione: ad inizio di
parola davanti a una vocale si ha sempre [s], come in sale ['sale]; da-
vanti ad una consonante sorda si ha sempre la sorda [s], davanti a con-
sonante sonora sempre la sonora [z]: spalla ['spalla] , vispo ['vispo] ,
sballa ['zballa], casba ['kazba], in base ad una regola di assimilazione di
sonorità. In posizione intervocalica invece l'italiano standard ammette
ambedue le possibilità: ad esempio casa ['kasa], caso ['kazo]. Tuttavia in
gran parte delle varietà centro-meridionali dell'italiano in posizione inter-
vocalica si ha sempre la sorda [s], mentre in quelle settentrionali si ha
sempre la sonora [z], per cui si avrà a Napoli, Roma , Palermo ecc.
['kasa] e ['kaso], a Milano, Torino, Venezia ecc. ['kaza] e ['kazo] ;

c) affricate alveolari rispettivamente sorda e sonora:


- [ts] di it. pezzo ['pettso], ted. Zahn "dente" [tsan];
- [dz] di it. mezzo ['meddzo].
Le consonanti [ts] e [dz] in italiano sono sempre lunghe in
posizione intervocalica (cfr. p. 71).
d) nasale alveolare (sonora):
- [n] di it. nano ['nano], Nando ['nando], fr. nain "nano" [ne] ,
ingl. nine "nove" [nam], sp. nada "niente" [' naòa] , ted. null
"zero" [nul];
e) laterale alveolare (sonora):
- [1] di it. letto ['letto], fr. lit "letto" [li], ingl. light "luce"
[la1t], sp. luna "luna" ['luna] , ted. Lampe "lampada" [lamp~];
/) vibrante alveolare (sonora):
- [r] di it. rana ['rana], sp. rueda "ruota" ['rrweòa];
g) approssimante alveolare (sonora):
- [1] di ingl. run "correre" [1An].

3c. Postalveolare (o prepalatale) . Le consonanti postalveolari sono


articolate con la parte anteriore della lingua che si accosta alla
parte anteriore del palato, immediatamente dietro gli alveoli:
a) fricative postalveolari rispettivamente sorda e sonora:
- [f] di it. scena ['Jena], ascia ['aJJa], fr. chou "cavolo" [Ju],
ingl. fish "pesce" [f1f], ted. Fisch "pesce" [f1f]; la [f] in italiano è
sempre lunga in posizione intervocalica;
- [3] di fr .je "io" [3~] , ingl. vision "visione" ['v13~n]. In italiano
si trova solo in prestiti dal francese, come in garage [ga'ra3~], o
nella varietà regionale toscana, per esempio in cugino [ku'3ino];
2. FONETICA ARTICOLATORIA E TRASCRIZIONE FONETI CA

b) affricate postalveolari rispettivamente sorda e sonora:


- [tJ] di it. ciao ['tfao], ingl. much "molto" [mAtJ], sp. mucho
"molto" ['mutfo], ted. Deutsch "tedesco" [d:-,ytJ];
- [d3] di it. giallo ['d3allo], ingl. John "Giovanni" [d3:-,n].

Nella varietà regionale toscana dell'italiano le affricate prepalatali in posi-


zione intervocalica vengono realizzate come fricative: cucina [ku 'Jina],
cugina [ku'3ina]. Per la sola sorda ciò accade anche in altre varietà cen-
tro-meridionali, tra cui la laziale e la campana. In queste stesse varietà la
sonora resta affricata ma è sempre lunga: cugina [kud'd3ina].

4. Retro/lesso. Le consonanti retroflesse (dette a volte anche cacu-


minali) si articolano flettendo leggermente in alto e all'indietro l'a-
pice della lingua, in direzione della parte anteriore del palato, subi-
to al di sopra degli alveoli. In italiano appaiono solo nelle varietà re-
gionali siciliana, calabrese, sarda e salentina, come realizzazione di
gruppi come tr, dr, str, ll, in cui tutte le consonanti si retroflettono:
per esempio nell'italiano regionale di Sicilia in treno ['treno], ladro
['laclro], strada ['~rada], o in sardo nulla ['nuqqa] ecc. Si noti che
i simboli delle retroflesse sono ricavati da quelli delle corrisponden-
ti alveolari, con l'aggiunta di una coda in basso.

5. Palatale. Le consonanti palatali si articolano col dorso della


lingua a contatto col palato:
a) occlusive palatali rispettivamente sorda e sonora:
- [e];
- L1-J;
appaiono in parole come it. chiesa ['cjcsa], ghianda ['j.janda] da-
vanti ad approssimanti palatali;
b) fricative palatali rispettivamente sorda e sonora:
[ç] di ted. Chemie "chimica" [çe'mi], ich "io" [1ç], Milch "lat-
te" [milç] (può trovarsi solo in inizio di sillaba davanti a vocali
anteriori, dopo vocali anteriori o dopo consonante);
- [jJ non è utilizzata nelle lingue a cui facciamo riferimento;
c) nasale palatale (sonora):
- [J1] di it. regno ['reJ1J10], fr. gagne "(io) guadagno" ['gajlg],
sp. aiio "anno" ['aj10];
d) laterale palatale (sonora):
[A] di it. paglia ['pa.{.{a], sp. llano "pianura" ['.{ano].
Queste ultime due consonanti sono sempre lunghe in italiano
standard in posizione intervocalica (pp. 71-2);

59
MANUALE DI FONETICA

e) approssimante palatale (sonora):


- [j] di it. ieri ['jeri], piove ['pj:we], fr. pied "piede" [pje],
ingl. yes "sì" [jes], sp. hielo "ghiaccio" ['jelo], ted. ja "sì" [ja].
Il francese possiede anche una approssimante palatale labializ-
zata (o labiopalatale) [q], ad esempio in lui "lui" [lqi], che si pro-
duce nel punto di articolazione palatale con contemporaneo arro-
tondamento delle labbra.

6. Velare. Le consonanti velari sono articolate col dorso della lin-


gua a contatto col velo del palato:
a) Occlusive velari rispettivamente sorda e sonora:
- [k] di it. caro ['karo], china ['kina], fr. cou "collo" [ku], ingl.
can "potere" [kren], sp. queso "formaggio" ['keso], ted. kann
"posso, può" [kan];
- [g] di it. gatto ['gatto], ghiro ['giro], fr. gant "guanto" [go],
ingl. get "arrivare" [get], sp. gato "gatto" ['gato], ted. geh "va"'
[ge];
b) fricative velari rispettivamente sorda e sonora:
- [x] di sp. hoja "foglia" ['oxa], ted. Bach "torrente" [bax],
Buch "libro" [bux] (in tedesco può trovarsi solo dopo vocali cen-
trali o posteriori);
- [)(] di sp. hago "faccio" ['a)(O];
c) nasale velare (sonora):
[JJ] di it. anche ['auke], ingl. thing "cosa" [01u], sp. cinco
"cinque" ['0iuko], ted. sang "cantai, cantò" [zau]. In italiano e in
spagnolo [JJ] appare solo davanti a un 'altra consonante velare; in
inglese e in tedesco può occorrere anche in altre posizioni (ma
mai ad inizio di sillaba): ted. Siinger "cantante" [zeu;;,J, ted. singst
"(tu) canti" [ziust], ingl. singer "cantante" [siu;;,], ingl. sings
"(lui/lei) canta" [sius]. In varietà settentrionali di italiano occorre
in posizione finale: non [nou]; _
d) approssimante velare (labializzata) o labiovelare. È prodotta nel
luogo di articolazione velare con contemporaneo arrotondamento
delle labbra:
- [w] di it. uovo ['w:wo], fr. mois "mese" [mwa], sp. huevo
"uovo" ['wej3o], ingl. one "uno" [wAn].

7. Uvulare. Le consonanti uvulari si articolano col dorso della lin-


gua a contatto con l'ugola (lat. uvula):

60
2. FONETI CA ARTI COLATORIA E TRASCRIZIONE FONETICA

a) occlusive uvulari rispettivamente sorda e sonora:


[q];
[G];
non si trovano nelle lingue europee a cui facciamo riferimento;
b) fricative uvulari rispettivamente sorda e sonora:
[x] è presente in arabo e in ebraico;
- [K] di fr. rose "rosa" ['Kozg], ted. Rat "consiglio" [Kat];
c) vibrante uvulare (sonora):
[R] di ted. Rat "consiglio" [Rat] 15 . In italiano molti parlanti
utilizzano foni uvulari (come la vibrante o le fricative sorda e so-
nora) in luogo della vibrante alveolare [r] dello standard 16 .

8. Faringale. Le consonanti faringali sono articolate ponendo la


radice della lingua a contatto con la parete posteriore della farin -
ge. Se ne trovano esempi, tra l'altro, in arabo, dove sono presenti
le consonanti fricative faringali sorda [h] e sonora ['ì].

9. Glottidale (o laringale). Le consonanti glottidali hanno la sor-


gente di rumore nella glottide (e non nelle cavità superiori, come
le altre consonanti):
a) occlusiva glottidale: si realizza con una brusca apertura delle
pliche vocali (e dunque non può essere mai accompagnata dalla
vibrazione laringea, cfr. FIG. 2. 3, posizione 7):
[?] del ted. auch "ahche" [?aox], einatmen "inspirare"
[?aen'?atmgn]. In tedesco [?] appare davanti ad ogni vocale ini-
ziale di sillaba. In italiano può occorrere, facoltativamente, davanti
a vocale iniziale di parola, soprattutto se preceduta da altra vocale:
è Andrea [can'drca] oppure [?c?an'drca];
b) fricativa glottidale sorda: si realizza con un avvicinamento delle
pliche vocali che, al passaggio dell'aria, determina un rumore di
frizione:

15. [ff] e [R] possono essere utilizzati in tedesco nelle stesse sequenze, come
varianti libere.
16. Queste varianti, insieme ad altre varianti non uvulari anch'esse molto
diffuse, come ad esempio l'approssimante labiodentale sonora [u], in Italia vanno
comunemente sotto il nome generico di "erre moscia".
Anche se in alcune regioni la "erre moscia ", di vario tipo, è più diffusa che
in altre (soprattutto nel nord-ovest), si tratta essenzialmente di una variazione in-
dividuale e non geografica, come mostra il fatto che spesso perfino all'interno
della stessa famiglia si presentano varianti diverse.

61
MANUALE DI FONETICA

- [h]: di ingl. hat "cappello" [hret], ted. Hut "cappello" [hut].


Nell'italiano regionale toscano [h] sostituisce la velare sorda in
posizione intervocalica: poco ['p::,ho]; la casa [la 'hasa].

2.4
Fonetica articolatoria intersegmentale

2 + r. Generalità

Nel corso della fonazione i foni non sono prodotti isolatamente


l'uno dopo l'altro, ma sono concatenati in una rapida successione
ininterrotta, in cui il passaggio da una configurazione articolatoria
alla successiva awiene senza soluzione di continuità. Quindi non
bisogna immaginare il parlato come una serie di posizioni statiche
degli organi della fonazione che scattano con passaggi repentini da
una posizione all'altra, ma come un continuo nel quale si passa
con gradualità da un fono al successivo, attraverso le fasi interme-
die della soluzione e dell'impostazione (PAR. 2.3.1).
Nel PAR. 2.3 abbiamo descritto i foni considerando solo le fasi
stazionarie. Ora mostreremo invece le modifiche che i foni subi-
scono in conseguenza della presenza di altri foni, awicinandoci
quindi a una presentazione più realistica dei processi fonatori.

2.4.2. La coarticolazione

La realizzazione di ciascun fono in un determinato contesto di-


pende anche dalle caratteristiche articolatorie dei foni precedenti e
seguenti.
Infatti, mentre gli organi si stanno disponendo in una determi-
nata configurazione articolatoria, conservano ancora in parte gli
atteggiamenti delle precedenti articolazioni e nello stesso tempo
già iniziano a prepararsi per quelle successive. Questo fenomeno
di reciproca interferenza tra foni vicini in una sequenza prende il
nome di coarticolazione (v. CD-ROM: coarticolazione). Ad esempio,
nelle sequenze [fu], [fa], [fi], già durante l'articolazione della [f]
la lingua e le labbra iniziano ad assumere la posizione tipica ri-
spettivamente delle vocali [u], [a] , [i]. Ancora, il luogo di artico-
lazione della consonante iniziale di chi (di norma trascritta [k]) è
anteriorizzato dalla presenza della vocale anteriore [i].
Nella catena parlata gli effetti della coarticolazione si possono
trasmettere sia all'indietro (coarticolazione regressiva), sia in avanti
2 . FONETICA ARTI COLATO RIA E TR ASC RI Z IONE FONETI CA

(coarticolazione progressiva) e anche a distanza di molti foni. Gli


effetti della coarti colazione possono portare ad un'assimilazione
totale o parziale.

2.4.3. Fattori periferici e centrali della coarticolazione

Il fenomeno della coarticolazione è dovuto all'interazione tra:


a) i meccanismi centrali che governano la produzione della paro-
la, cioè la /unzione neuromotoria del sistema nervoso centrale;
b) l'inerzia degli organi articolatori, che non sempre riescono a
modificare la propria forma e posizione abbastanza rapidamente
per eseguire la corretta sequenza di movimenti.
Manifestazioni evidenti della coarticolazione sono fenomeni
come l'undershoot, cioè il mancato raggiungimento della posizione
prevista (detta bersaglio) da parte dell'organo articolatore, e l'o-
vershoot, owero il superamento del bersaglio. Essi sono infatti il
risultato di imprecisioni, per difetto o per eccesso, nell'esecuzione
di gesti articolatori.
Ma un grande peso nel determinare i fenomeni di coarticola-
zione va attribuito all'attività di programmazione temporale dei co-
mandi neuromotori. Infatti, per l'esecuzione di una determinata
configurazione articolatoria è necessario coordinare un gran nume-
ro di movimenti di organi diversi.
Questi movimenti a volte devono essere simultanei: per esem-
pio l'abbassamento del velo del palato e l'occlusione bilabiale nel-
la produzione di [m] ; a volte invece devono seguire una successio-
ne precisa: per esempio, per l'affricata [dz], l'occlusione deve es-
sere seguita dalla frizione mentre resta sempre attivo il meccani-
smo laringeo.
Inoltre il cervello, per far sì che due organi posti a distanza
diversa si attivino contemporaneamente (per esempio laringe e
labbra in una bilabiale sonora), deve inviare i relativi comandi cal-
colando il tempo che gli impulsi impiegano a raggiungere gli orga-
ni interessati.
A tutti questi fattori, che riguardano la programmazione dei
gesti necessari per produrre un singolo fono , si aggiungono quelli
relativi alla produzione di foni in successione. La programmazione
temporale dei gesti necessari per l'articolazione di un segmento
deve infatti iniziare mentre è ancora in corso l'esecuzione del seg-
mento o dei segmenti precedenti. Inoltre la programmazione tem-
MANUA L E DI FONETI CA

porale dei movimenti deve tener conto anche delle loro diverse
durate: per esempio, nella parola mamma ['mamma] la vibrazione
laringea dura per l'intera sequenza, mentre l'abbassamento del
velo sarebbe previsto solo per i foni consonantici.
La complessità dei meccanismi di programmazione neuromoto-
ria determina dunque un notevole carico organizzativo per le
strutture centrali. A questo carico si oppone la spontanea tenden-
za al minimo sforzo, che riduce quanto più può la complessità
della programmazione. Per esempio, per tornare ancora al caso di
mamma, si osserva di fatto che il velo non si rialza, come previsto,
durante la produzione delle vocali, che diventano quindi nasalizza-
te: ['mamma].

2.4-4- Fenomeni dovuti alla coarticolazione

Passeremo qui in rassegna alcune manifestazioni della coarticola-


zione, esaminandole in rapporto ai meccanismi articolatori che le
determinano. Nel PAR. 2-4-5 descriveremo alcuni fenomeni molto
diffusi in tutti i livelli di parlato; nel PAR. 2.4.6 analizzeremo inve-
ce alcune manifestazioni della coarticolazione tipiche del parlato
ipoarticolato.

2.4.5. Fenomeni sistematici

Descriveremo qui alcune manifestazioni della coarticolazione mol-


to diffuse e regolari. È opportuno ricordare che i fenomeni che
esamineremo sono conseguenza di meccanismi coarticolatori i cui
effetti si sono, per così dire, grammaticalizzati e lessicalizzati, così
che oggi la loro manifestazione è automatica.
r. Quando in una parola sono presenti vocali diverse per apertu-
ra, anteriorità o labializzazione, può accadere che la tendenza alla
riduzione del lavoro articolatorio porti ad un'assimilazione (parzia-
le o totale) tra queste vocali.
In lingue come l'ungherese, il finlandese, il turco esiste un
meccanismo noto come armonia vocalica, in base al quale le vocali
di una parola sono tutte anteriori o tutte posteriori (lingue ugro-
finniche), tutte labializzate o tutte non labializzate (turco).
In molte lingue germaniche si è determinato storicamente un
fenomeno noto come metafonesi o Umlaut che consiste in una as-
similazione (parziale o totale) della vocale radicale al timbro della
2 . FONETICA ARTI COL ATORI A E TRASC RIZIONE FONETICA

vocale del suffisso. Per esempio la presenza, in una parola, di ter-


minazioni contenenti vocali anteriori ha provocato l'anteriorizza-
zione anche della vocale radicale; successivamente la vocale che ha
causato tale assimilazione è caduta, ma la vocale radicale è rimasta
modificata: per esempio ted. falle "io cado" ['fal~], /iillst "tu
cadi" [fdst], dovuto alla vocale anteriore dell'antica desinenza -ist
della seconda persona singolare del verbo.
Anche in molte varietà romanze si sono verificati fenomeni
analoghi: cfr. ad esempio in molti dialetti italiani meridionali mese
['mes~], mise "mesi" ['mis~], dove la (i], vocale alta della antica
desinenza del plurale, ha determinato la metafonesi, in questo
caso un innalzamento da [e] a (i], nella vocale radicale.
2. Accade regolarmente che in una sequenza si alternino foni sor-
di e foni sonori e che quindi l'attività laringea sia intermittente.
In una sequenza come ['tonto] , il meccanismo laringeo si deve
attivare subito dopo la fine della [t] per i foni [o] e [n] , che sono
sonori, deve interrompersi per la produzione di [t] , riattivarsi su-
bito dopo per la [o] finale. Può accadere che, per semplificare la
programmazione, l'attività laringea non venga interrotta tra la [n]
e la [o] finale: il risultato è una sonorizzazione del fono [t] che
diventa [d], eventualmente con una pronuncia mormorata (PAR.
2 .2. 3). Questo fenomeno si è verificato nella storia di molti dialetti
italiani centro-meridionali, dove le consonanti sorde dopo nasale si
sono regolarmente sonorizzate.
Viceversa può accadere che l'attività laringea si interrompa pri-
ma del dovuto, anticipando la natura sorda di un fono successivo.
Per esempio in ted. lobt "loda" [lopt], l'antica [b] (che invece nel
plurale loben "lodano" ['lob~n] si è mantenuta sonora) si è deso-
norizzata per effetto della [t] finale.
In italiano si osserva che nei casi in cui una consonante fricati-
va alveolare ([s] o [z]) sia seguita da un'altra consonante (sorda o
sonora) l'attività laringea è presente o assente dall'intero gruppo:
[sten'tato], con gruppo [st] sordo, o [zden'tato] , con gruppo
[zd] sonoro, ma non si ha mai [sd] o [zt] ecc.
Ai tempi di attivazione del meccanismo laringeo è legato un
fenomeno noto come VO T (Voice Onset Time, "tempo di attacco
della sonorità"), particolarmente evidente in lingue come l'inglese
e il tedesco.
In una sequenza che inizi con una consonante sonora in tede-
sco accade regolarmente che l'attività laringea non inizi simulta-
MANUA LE D I FONETI CA

neamente al costituirsi dell'ostacolo, ma cominci con un certo ri-


tardo, provocando quindi un effetto di parziale o totale desono-
rizzazione della consonante (per esempio Bein "gamba" [!Jaen]).
Oppure, quando una consonante occlusiva sorda è seguita da
una vocale, il meccanismo laringeo dovrebbe attivarsi immediata:
mente dopo la fase di esplosione della consonante; invece esso si
attiva sempre con un qualche ritardo che in inglese e in tedesco è
particolarmente lungo per le occlusive sorde in sillaba accentata.
Durante questo intervallo si produce una leggera frizione glottida-
le sorda (detta aspirazione). Nelle trascrizioni accurate questa fri -
zione viene indicata con un [h]: ingl. pen [phen] "penna" , ted. tun
[thu:n] "fare". L'aspirazione delle occlusive sorde non si produce
però quando sono precedute da una fricativa: ingl. spy [spai]
"spia" , ted. Stein [ftaen] "pietra".
3. Accade frequentemente che in una sequenza si alternino foni
nasali e foni orali: il velo palatino deve dunque cambiare rapida-
mente e tempestivamente di posizione.
Se ciò non avviene ne consegue che foni orali adiacenti a foni
nasali si nasalizzano. L'esperienza di laboratorio mostra che in se-
quenze come cane, vinz; mamma ecc. le vocali adiacenti alle conso-
nanti nasali si presentano sistematicamente nasalizzate: ['kane],
['vini], ['mamma].
4 . In una sequenza possono alternarsi foni labializzati e foni non
labializzati, sia consonantici sia vocalici. In questi casi le labbra
dovrebbero compiere rapidi movimenti di arrotondamento e di di-
stensione. Ma, in una sequenza come [kostru'ire] (fatta di [k],
non labializzata, [o] , labializzata, [s] , [t], [r], non labializzate, [u]
labializzata, [i] , [r], [e] non labializzate) , è facile osservare come
le labbra siano protruse già con [k] e lo rimangano almeno fino
all'inizio della [i].
5 . Nei gruppi consonantici sono frequentissimi gli effetti di coar-
ticolazione. Consonanti a contatto tra loro tendono ad assimilare il
luogo o il modo di articolazione, o ambedue.
In una sequenza come ['tondo] può accadere che il velo tardi
a risollevarsi dopo il fono [n] e rimanga abbassato anche durante
la produzione del fono successivo, che di fatto viene a essere
un'altra [n]. Il risultato sarà la sequenza ['tonno], che rappresenta
un'assimilazione totale di modo di articolazione nasale, verificatasi
molto frequentemente in dialetti italiani centro-meridionali.
In sequenze come un padre [um'padre] , un figlio [uIIJ'fLUo],

66
2 . FONETI CA ARTICOLATORI A E TRASC RI ZIONE FONETICA

un dente [un'dcnte], un gatto [uIJ'gatto] si osserva come in italia-


no la consonante nasale assuma sistematicamente il luogo di arti-
colazione della consonante seguente.
A questi meccanismi vanno ricondotti evidentemente numerosi
fenomeni osservabili, per esempio nel passaggio dal latino all'ita-
liano: lat. octo > it. otto, è un caso di assimilazione di luogo; lat.
adventum > it. avvento è un caso di assimilazione di luogo e di
modo.
6. Le consonanti provocano un effetto coarticolatorio sulle vocali
immediatamente precedenti e seguenti. Per esempio le [a] di [pa],
di [ta] e di [ka] sono diverse tra loro, perché nella loro porzione
iniziale risentono, come vedremo meglio nel CAP. 3, delle diverse
conformazioni che la cavità orale assume in rapporto all'articola-
zione della consonante. Lo stesso accade in [ap] , [at] e [ak] per
la porzione finale della vocale.

2.4.6. Fenomeni non sistematici

In questo paragrafo segnaliamo, a titolo esemplificativo, alcuni fe-


nomeni che si manifestano nel · parlato connesso ipoarticolato. A
differenza di quelli elencati nel paragrafo precedente, questi sono
il risultato di meccanismi coarticolatori che si attivano di volta in
volta, benché non sistematicamente, e che non hanno ancora de-
terminato la generalizzazione dei loro risultati.
r. Quando in una sequenza si trovano due o più foni vocalici a
contatto, sia che si tratti di dittonghi, sia che si tratti di iati, la
lingua deve spostarsi da un punto all'altro del quadrilatero attra-
versando tutte le posizioni intermedie. Poiché in questo tragitto
non c'è alcuna discontinuità, dal punto di vista strettamente arti-
colatorio questa articolazione andrebbe considerata come una vo-
cale lunga variabile. La consuetudine, sostenuta anche da una tra-
dizione ortografica, vuole invece che essa venga considerata come
la successione di due vocali rappresentate rispettivamente dalla po-
sizione iniziale e da quella finale della lingua. La trascrizione fone-
tica segue questa consuetudine (e quindi la trascrizione di una pa-
rola italiana come hai è [ai]).
Inoltre, come è particolarmente evidente nel parlato ipoartico-
lato, il punto di partenza e il punto di arrivo spesso sono meno
distanziati di quanto appaia dalla trascrizione, per cui in questo
caso hai andrebbe più esattamente trascritto come [ree]. Nei casi
M A N U A LE DI FO N ETIC A

di parlato veloce, infine, a volte l'intera sequenza si riduce alla sua


porzione intermedia [e] o [re]. Quest'ultimo fenomeno è detto
monottongazione.
2. Nell'articolazione di gruppi di consonanti che abbiano lo stes-
so luogo di articolazione (per esempio [st] in ['kwesto], [rn] in
['d3orno]), gli organi fonatori compiono movimenti brevi e veloci:
nel gruppo [st] la punta della lingua deve chiudere per un attimo
il varco e trasformare la fricativa alveolare [s] in occlusiva alveola-
re [t], per poi subito dopo riaprirlo per la pronuncia della [o];
nel gruppo [rn], ancora la punta della lingua deve colpire legger-
mente due o tre volte gli alveoli per produrre la vibrante [r], e
subito dopo deve effettuare una leggera occlusione alveolare men-
tre simultaneamente si abbassa il velo per l'articolazione di [n]. Si
può osservare sperimentalmente (e, in alcuni casi, si può anche
percepire) che, specie nel parlato ipoarticolato, alcuni di questi
movimenti vengono a volte semplificati od omessi: così, nel grup-
po [st] di ['kwesto] la lingua non chiude il passaggio in corri-
spondenza della occlusiva e il risultato articolatorio è ['kwesso]; o
nel gruppo [rn] di ['d3orno] il velo può anticipare il suo abbassa-
mento e la lingua può omettere le vibrazioni dell'apice rimanendo
brevemente ferma contro gli alveoli e il risultato articolatorio è
['d3onno].
Alla coarticolazione nel parlato connesso si possono attribuire
fenomeni di generale indebolimento articolatorio delle consonanti.
Nelle occlusive la chiusura è talvolta talmente breve e debole che
la successiva esplosione risulta praticamente assente; a volte gli or-
gani non completano il movimento di chiusura e quindi il fonò
prodotto tende a essere fricativo. Nelle fricative a volte gli organi
non completano il movimento di avvicinamento che deve produrre
il rumore di frizione e il fono tende a essere realizzato come
un'approssimante.

2.5
Fonetica articolatoria soprasegmentale

2. 5. r. Generalità

Abbiamo detto nel CAP. r che la comunicazione audioverbale si


realizza attraverso la produzione e la ricezione di blocchi fonici di

68
2 . FON ETI C A ARTICOLATORIA E TRAS CRIZION E FON ETIC A

varia grandezza (frase, gruppo di parole, singole parole o loro


frammenti) e che questi blocchi sono modellati al loro interno da
una certa intonazione, da variazioni di velocità, dalla posizione de-
gli accenti. Questi fenomeni nel loro insieme vengono detti proso-
dici o, più spesso, soprasegmentali, cioè al di sopra dei segmenti,
perché riguardano l'intera sequenza. Essi sono di grande impor-
tanza per la comprensione del messaggio.
Infatti, nel parlato noi acceleriamo e rallentiamo continuamen-
te la velocità con cui si muovono gli organi fonatori, aumentiamo
e diminuiamo continuamente la pressione dell'aria, aumentiamo e
diminuiamo continuamente la tensione delle pliche vocali. Tutto
ciò, naturalmente, non avviene a caso ma è mirato alla struttura-
zione prosodica complessiva della produzione fonica, alla organiz-
zazione di frasi in unità minori, alla messa in evidenza delle parti
che riteniamo importanti, di nostri stati d'animo o delle nostre in-
tenzioni comunicative (affermazioni, interrogazioni, comandi e
così via).
Nei paragrafi successivi presenteremo dunque i meccanismi ar-
ticolatori che, nei singoli foni e nelle unità superiori, sono respon-
sabili delle variazioni di:
a) durata;
b) intensità, cioè della quantità di energia con la quale i foni ven-
gono articolati, corrispondente al volume della voce che parla;
e) altezza, cioè della velocità con cui vibrano le pliche vocali du-
rante l'articolazione, che corrisponde alla sensazione di acutezza
della voce.
Le caratteristiche soprasegmentali dei foni si differenziano da
quelle segmentali anche perché esse hanno sempre un carattere re-
lativo rispetto ai foni circostanti. Un fono è considerato di mag-
giore o minore durata, di maggiore o minore intensità, di maggio-
re o minore altezza, non in termini assoluti ma sempre e soltanto
in rapporto al resto della sequenza di foni in cui esso è inserito.
Ad esempio una vocale della durata di 80 ms andrà considerata
breve se è inserita in una frase pronunciata molto lentamente (per-
ché le altre vocali avranno presumibilmente durate sensibilmente
maggiori), mentre sarà da definire lunga se è inserita in un parlato
molto rapido (perché tutte le altre vocali avranno durata inferio-
re). Lo stesso vale, come vedremo nei prossimi paragrafi, per la
definizione dell'intensità e dell'altezza di un fono.
MANUALE DI FONETICA

2.5.2 . Durata

Qui di seguito esamineremo variazioni di durata di foni vocalici e


di foni consonantici e le conseguenti variazioni nella velocità di
eloquio.

Variazioni di durata di /oni vocalici

L'articolazione di una vocale può essere mantenuta per un tempo


più o meno lungo. Alcune lingue, come l'inglese e il tedesco, o
come il greco antico e il latino, distinguono (o distinguevano) re-
golarmente tra vocali brevi e vocali lunghe. Ma naturalmente in
qualsiasi lingua è sempre possibile prolungare la durata di una vo-
cale a scopi espressivi, enfatici ecc. , come ad esempio in italiano
Cheee?, Aaah ! e così via.
Per indicare che una vocale ha una durata maggiore delle altre
si usa il simbolo [:], ad esempio [a:] , eventualmente ripetuto più
volte ad indicare una tenuta particolarmente lunga come in Aaah !
[a:::]. Un allungamento di minore entità (vocali semilunghe) può
essere segnalato invece con il simbolo rappresentato da un punto
in alto [·J.
Per avere un'idea concreta della durata di una vocale, si tenga
presente che nel parlato spontaneo una vocale breve può durare
circa 40-80 ms, una lunga circa 80-150 ms.
In italiano le vocali toniche (cfr. pp. 76-8) finali di sillaba
(cfr. p. 75 ) tendono ad essere più lunghe delle vocali in tutte le
altre posizioni: ad esempio la [a] di ['ka:ne], che risponde a
questi due requisiti, è lunga e si trascrive [a:]; la [a] di ['kanne] ,
che è tonica ma non finale di sillaba, è breve; la [a] di
[ka'ni:le], che è finale di sillaba ma non è tonica, è breve. Solo
le vocali toniche finali di parola sono sempre brevi, come in
[tfit 'ta].
Quanto abbiamo detto vale prevalentemente per il parlato ipe-
rarticolato, e in particolare per misurazioni condotte su parole iso-
late o su sillabe e sequenze di sillabe. Misurando invece le durate
di vocali finali e non finali di sillaba, estratte da parlato più spon-
taneo, si vede con chiarezza che la correlazione tra tipo sillabico e
durata vocalica non è più sistematica, perché essa è alterata dalle
continue variazioni nella velocità di eloquio.

70
2. FONETICA ARTICOLATORIA E TRASCRIZIONE FONETICA

Variazioni di durata di foni consonantici

Anche le consonanti possono avere una durata minore o maggio-


re. Per le consonanti occlusive e affricate le variazioni di durata
riguardano la fase dell'occlusione e non quella dell'esplosione o
della frizione; nel caso di tutte le altre consonanti le variazioni di
durata riguardano l'intera fase della costrizione o, nel caso delle
vibranti, il numero dei cicli di occlusione e rilascio.
Una consonante lunga può essere trascritta con il corrispon-
dente simbolo fonetico seguito da [:] (esattamente come abbiamo
già visto per le vocali), oppure con la ripetizione del simbolo della
consonante. Per esempio: mamma può essere trascritto come
['mam:a] oppure ['mamma]. In questo manuale utilizziamo siste-
maticamente la seconda possibilità. Le affricate lunghe vengono
rese ripetendo solo il primo simbolo del digramma (per esempio
oggi ['Jdd3i]).
La lingua italiana è l'unica fra le principali lingue europee oc-
cidentali moderne a fare un uso sistematico di questa distinzione
per quasi tutte le consonanti 17 •
Alcune consonanti italiane, come le approssimanti [j, w], la fri-
cativa [z] e le nasali [qi, IJ] sono tuttavia sempre brevi; altre, come le
palatali [f, Jl, A] e le affricate alveolari [ts, dz] sono sempre lunghe
in posizione intervocalica o tra vocale e approssimante: ascia ['aJJa],
ragno ['raJlJlO], aglio ['aAAO], vizio ['vittsjo], azoto [ad'dzJ:to].
L'italiano standard (con tutte le sue varietà regionali centro-
meridionali, ma non quelle settentrionali) presenta un particolare
fenomeno detto rafforzamento sintattico, che consiste nell'allunga-
mento della consonante iniziale di una parola quando questa è
preceduta da: a) polisillabi tronchi (p. es. cantò in [kan'tJb'bc:ne],
mangerà in [mand3e 'ram'molto] ); b) forme verbali, sostantivi, ag-
gettivi, pronomi, avverbi monosillabici terminanti in vocale (p. es.
ho in "ho visto" ['Jv'visto], tu in "tu sei" ['tus'sd], giù in "giù

17. L'ortografia italiana distingue in genere tra consonanti brevi o scempie,


scritte per lo più con una sola lettera, e consonanti lunghe, doppie, o geminate,
scritte generalmente con la stessa lettera ripetuta due volte (ad esempio cane-
canne ). Non tragga invece in inganno l'ortografia di altre lingue, come francese,
inglese, tedesco, dove la lettera doppia nelle forme scritte non corrisponde ad un
reale allungamento del suono consonantico: per esempio fr. quitter "lasciare"
[ki'te], ingl. happy "felice" ['hrepi], ted. sollen "dovere" ['z:,l;m], le cui conso-
nanti, rispettivamente [t, p, I] , non sono foneticamente lunghe.

71
M ANUALE DI FONETICA

da me" [ 1d3udda'me], chi in "chi vuole" [kiv'vw::,le], che in


"che fai" [kef'fai], blu in "blu cupo" ['bluk'ku:po]); c) alcune
preposizioni e congiunzioni terminanti in vocale (p. es. a "a casa"
[ak'ka:sa], tra in "tra poco" [trap'p::,:ko], fra in "fra tre giorni "
[frat'tred'd3orni], e in "e poi" [ep'p::,i], o in "o quando"
[ok'kwando], ma in "ma tu" [mat'tu], né in "né molto né poco"
[nem'moltonep'p::,:ko], se in "se vuoi" [sev'vw::,i], che in "dico
che viene" ['di:kokev'vjene]); d) alcuni bisillabi piani (p. es. come
in "come me" ['ko:mem'me], qualche in "qualche volta" ['kwaU
kev'v::,lta], ogni in "ogni volta" [ :JJ1J1iv'v::,lta]). L'ortografia tie-
1

ne conto di questo fenomeno solo in locuzioni cristallizzate come


davvero, apposta, affare, soprattutto, pressappoco ecc.

Variazioni nella velocità d'eloquio

La durata assoluta dei foni nel parlato connesso dipende dalla co-
siddetta velocità di eloquio, la cui misurazione avviene contando le
unità pronunciate (foni o sillabe) nell'unità di tempo (in genere il
minuto secondo). La velocità di eloquio varia molto in relazione
alle caratteristiche soggettive del parlante, alla situazione in cui si
svolge la comunicazione, ma varia molto anche all'interno di un
unico enunciato, con accelerazioni e rallentamenti che segnalano,
tra l'altro, il grado di attenzione che il parlante richiede all'ascolta-
tore (eloquio più veloce quando è richiesta minore attenzione, più
lento quando è richiesta maggiore attenzione).
La velocità di eloquio diminuisce inoltre in prossimità di una
pausa o comunque della fine di un'unità tonale (PAR. 3.4-4).

2.5.3. Intensità

Come abbiamo visto nel PAR. 2.2.4, ogni fono è prodotto con l'at-
tivazione di una o due sorgenti: quella laringea per le vocali, quel-
la superiore per le consonanti sorde, ambedue per le consonanti
sonore. L'attivazione di queste sorgenti è sempre determinata dalla
pressione dell'aria espiratoria che supera un ostacolo. Quanto più
alta è la pressione dell'aria espiratoria contro l'ostacolo o gli osta-
coli che essa incontra, tanto maggiore è l'intensità del fono emes-
so.
Nel considerare le funzioni linguistiche di questa variabile,
dobbiamo ricordare che il valore assoluto dell'intensità di un fono

72
2 . FO N E TI C A ARTI CO LA TO RI A E TRA SCRI Z I ONE FONETICA

non ha in sé alcuna importanza, dal momento che, sia che la si


urli a squarciagola, sia che la si pronunci a voce bassissima, una
sequenza, come per esempio vado a casa ['va:doa'kka:sa], rimane
la stessa dal punto di vista segmentale. Quello che invece conta
sono i rapporti tra le intensità dei vari foni di uno stesso enuncia-
to. Si parla quindi di intensità relativa , e si misurano le differenze
di intensità tra i diversi elementi (foni, sillabe ecc.) all'interno del-
la stessa sequenza.
Oltre che dalla pressione dell'aria espiratoria, l'intensità di un
fono dipende anche dalle sue caratteristiche articolatorie.
A parità di spinta espiratoria, infatti, i foni si collocano lungo
una scala di intensità (detta scala di sonorità intrinseca) in funzione
del grado di apertura dell'articolazione. Nel punto più alto di que-
sta scala si collocano le vocali aperte, seguite dalle vocali via via
più chiuse, dalle approssimanti, dalle vibranti, dalle nasali, dalle
laterali, dalle fricative, dalle affricate e, all'ultimo posto, dalle oc-
clusive. Dunque in una sequenza vi saranno un aumento dell'in-
tensità in corrispondenza di ogni vocale e una sua diminuzione in
corrispondenza di una consonante o di un gruppo di consonanti.
Diamo qui la scala di sonorità intrinseca dei foni dell'italiano.
Ciascun livello è indicato da un numero progressivo.
r) [a]; 2) [e,:-,]; 3) [e, o]; 4) [i, u]; 5) [j, w]; 6) [r]; 7) [m, n, Jl,
IJJ, 1J]; 8) [l, A]; 9) [f, v, s, z, f]; ro) [ts, dz, tJ, d3]; rr) [b, d , g,
p , t , k].
Se prendiamo in esame, ad esempio, la parola italiana patata
[pa'ta:ta], troveremo un andamento altalenante dell'intensità, in
conseguenza della successione di vocali e consonanti sorde, che
possiamo schematizzare nel seguente modo:

p-a-t-a-t-a
~ ~ ~

2.5.4. Altezza

Per definizione, l'articolazione di ogni fono sonoro (vocale o con-


sonante sonora) prevede la vibrazione delle pliche vocali. Il nume-
ro dei cicli di apertura e chiusura della glottide per ogni secondo
corrisponde alla frequenza fondamentale della voce (generalmente
abbreviata con F 0 ); questa, a sua volta, determina nell'ascoltatore
la sensazione di altezza (o "acutezza"). Dunque, quanto più brevi

73
MANUA L E DI FONETICA

e veloci sono le vibrazioni della glottide, tanto più alta è la F0 •


L'unità di misura di FO è lo Hertz (Hz), cioè il numero dei cicli
per secondo (cfr. PAR. 3.r.2).
Se si considera il funzionamento del meccanismo laringeo
(PAR. 2.2.3), risulta evidente che la velocità con la quale si ripete il
ciclo di apertura e chiusura della glottide è tanto maggiore quanto
più alta è la pressione subglottidale, e tanto minore quanto più
forte è la tensione muscolare.
Ciascun parlante ha una sua frequenza media di base (determi-
nata dalle sue caratteristiche anatomiche) . Le differenze di altezza
individuali sono un importante fattore di caratterizzazione della
voce di categorie di parlanti suddivisi per sesso (uomini con fre-
quenza più bassa, donne con frequenza più alta) e per età (bambi-
ni con frequenza più alta, adulti con frequenza più bassa); all'in-
terno di ciascuna categoria queste differenze sono un fattore di ca-
ratterizzazione individuale. E infine in base a questa caratteristica
che si definiscono i tipi di voce cantata (basso, baritono, tenore
per gli uomini, contralto, mezzosoprano e soprano per le donne) .

2. 5. 5 . Fattori prosodici e unità superiori al fono

Esamineremo qui la sillaba, l'accento, l'intonazione e la dinamica


prosodica complessiva.

La sillaba

Come abbiamo visto nel PAR. 2.5.3, ogni fono si dispone lungo
una scala di intensità. Il tracciato di una sequenza basato sulle va-
riazioni di intensità è quindi una successione di picchi e di avval-
lamenti. Riprendiamo l'esempio di [pa'ta:ta].

p-a-t-a-t-a

In questa rappresentazione (semplificata perché ancora non tiene


conto dell'accento) si osservano tre picchi, in corrispondenza delle
tre vocali, e tre avvallamenti, in corrispondenza delle tre conso-
nanti. A ciascun picco corrisponde una sillaba: la sillaba rappre-
senta un'unità prosodica costituita da uno o più foni agglomerati
intorno a un picco di intensità.

74
2 . FONETICA ARTICOL ATO RI A E T RASC RI ZIONE FONETI CA

Ogni sillaba inizia in corrispondenza di up minimo di intensità


e termina prima del minimo successivo ' 8 • Tra questi due minimi
è sempre compreso un picco di intensità detto nucleo sillabico, per
lo più costituito da una vocale.
La sillaba minima è formata dal solo nucleo, come in italiano
la prima sillaba [a] di a-mo-re. Il nucleo può essere preceduto da
una testa, formata da una o più consonanti, come in italiano [ra:]
di ra-na, [tra:] di tra-ma, [stra:] di stra-da. Il nucleo può essere
seguito da una coda formata da una consonante, come in italiano
[ran] di an-da-re, o da più consonanti, come nel monosillabo tede-
sco Herbst "autunno" [hcRpst]).
Una sillaba priva di coda è detta sillaba aperta, come [a], [ra:],
[tra:], [stra:], viste sopra; una sillaba che invece ha una coda è
detta sillaba chiusa, come [an], [hcRpst].
Vi sono lingue in cui il nucleo della sillaba può essere costitui-
to da una consonante che assume il ruolo che abitualmente è svol-
to dalle vocali. La parola krk "collo" del ceco è formata da una
sola sillaba con una vibrante [r] che presenta il massimo di inten-
sità e funge quindi da nucleo sillabico:
k-r-k

In questo caso la consonante è detta sillabica e viene segnalata


nell'IPA col segno diacritico [ ] sottoscritto: [krk]. Possono pre-
' I
sentarsi come sillabiche in diverse lingue europee consonanti late-
rali, nasali e vibranti, come ad esempio nel bisillabo inglese little
"piccolo" ['htl],
I
in quello tedesco singen "cantare" ['z11Jn],
I
nel
monosillabo sloveno Trst "Trieste" [trst]
I
:
l-1-t -lI
A A

Z-1-IJ -i;t
A A

t-r-s-t
I
A

18. La divisione in sillabe fonetiche può non coincidere con quella tradizio-
nale: ad esempio posto è tradizionalmente diviso in po-sto, mentre la sillabazione
fonetica dà pos-to perché il minimo di intensità si trova nella occlusiva [t] .

75
MANUALE DI FONETICA

Da questo punto di vista, anche il fonosimbolo italiano pst [pst],


I
usato per richiamare l'attenzione di qualcuno, può essere conside-
rato una sillaba con nucleo consonantico perché il fono [s] rap-
presenta un picco rispetto ai foni [p] e [t]. '

L'accento

È facile osservare che in una sequenza come prendi la penna!


[pn:ndilapenna] le sillabe [pn:n] e [pen] hanno una prominenza
rispetto alle altre. Di queste sillabe, e delle vocali che contengono,
si dice che esse sono accentate o toniche. L'accento è l'insieme delle
caratteristiche fonetiche che mettono in rilievo una sillaba nella se-
quenza. Esamineremo ora i diversi tipi di accento (v. CD-ROM: ac-
cento).
r. Una sillaba può essere messa in rilievo rispetto a quelle adia-
centi mediante un aumento della intensità con cui è prodotta. È
quanto avviene in italiano e nella maggior parte delle lingue eu-
ropee.
Riprendendo gli schemi utilizzati alle pp. 74-5 per illustrare la
struttura sillabica di alcune parole, possiamo ora ridisegnarli te-
nendo conto di questa nuova osservazione circa le relazioni tra i
vari picchi di intensità:

it. patata
p-a-t-~-t-a

ingl. little "piccolo"


l-1-t-lI

ted. singen "cantare"


Z-1-IJ-1;}

La sillaba corrispondente al picco di intensità più elevato è chia-


mata sillaba tonica e la sua prominenza sulle altre sillabe è definita
accento intensivo. Le sillabe non toniche, e le vocali che esse con-
tengono, sono dette atone. Naturalmente non ha senso parlare di
2 . FONETICA ARTI COLATORIA E TRASCRIZIONE FONETICA

prominenza o di sillaba tonica in monosillabi pronunciati in isola-


mento.
Il simbolo IPA per l'accento, che di fatto abbiamo già intro-
dotto nelle trascrizioni a partire da p. 56, è ['] e va collocato in
alto a sinistra prima del primo fono della sillaba tonica: papa
['pa:pa]; papà [pa'pa] (v. CD-ROM: accento primario).
È importante, comunque, tenere presente che le variazioni di in-
tensità sono accompagnate abitualmente da contemporanee e paralle-
le variazioni di altezza e di durata della sillaba tonica, per cui si parle-
rà più esattamente, per l'italiano e le altre lingue che si comportano
come l'italiano, di accento di parola prevalentemente intensivo.
Sequenze di tre o più sillabe possono presentare, oltre ali' ac-
cento principale, anche dei picchi secondari di intensità su sillabe
diverse da quella tonica. Per esempio in capostazione, oltre alla sil-
laba tonica ['tsjo:], che presenta il massimo di intensità, anche la
sillaba [ka:], benché più debole della tonica, presenta una leggera
prominenza rispetto alle altre atone.
Schematizzando:

capostazione
k-a-p-o-s-t-a-t-t-s-j-<;:-n-e

In questo caso si parla di accento secondario e di sillaba semito-


nica, e il simbolo IPA corrispondente è [,], che va posto in bas-
so a sinistra prima del primo fono della sillaba in questione:
[,kapostat'tsjo:ne]. L'accento secondario tende a collocarsi per
lo più ad una certa distanza da quello primario (v. CD-ROM: accen-
to secondario).
L'alternanza tra sillabe toniche, semi toniche e atone è un
aspetto importante per la individuazione delle unità che costitui-
scono una sequenza e per la definizione del ritmo di una lingua.
In lingue come l'italiano, l'inglese, lo spagnolo e il tedesco
l'accento è detto libero perché può collocarsi in posizioni diverse
della parola (per esempio it. ['ka:pito], [ka'pi:to], [kapi't~]). In
lingue come il francese l'accento è detto fisso perché può trovarsi
solo in una posizione (che in francese è sempre l'ultima sillaba
della parola o la penultima quando la vocale finale è [;J]).

77
M AN UALE DI FO N ETI CA

2. Una sillaba può essere prominente rispetto a quelle adiacenti


perché le sue componenti sonore sono prodotte con una maggiore
frequenza della vibrazione laringea, e dunque con una maggiore
altezza. Questo tipo di prominenza è detto accento musicale. L'al-
tezza è in questo caso il parametro prevalente, che tuttavia si ac-
compagna abitualmente ad un aumento di durata e di intensità.
Questo tipo di accento è presente nelle lingue cosiddette a
toni (come il giapponese e numerose lingue africane). Per esem-
pio, in giapponese niiga "verdura" presenta un tono alto nella pri-
ma sillaba, mentre nagii "nome" presenta un tono alto nella se-
conda sillaba. I simboli IPA per la rappresentazione dei toni sono
nella tabella di p. 34 19 .
Nel caso dell'accento musicale visto qui sopra, si determina
una situazione in cui l'altezza musicale di una sillaba supera quella
delle altre sillabe della stessa parola. L'unico elemento significati-
vo, dunque, è ancora una volta la prominenza della sillaba tonica.
Ci sono inoltre lingue, come il cinese mandarino, in cui tutte
le sillabe sono caratterizzate da toni modulati, che prevedono va-
riazioni di altezza all'interno stesso della sillaba. In cinese manda-
rino si trovano quattro diversi toni: un tono alto [-]; un tono
ascendente [ , ]; un tono discendente [ ' ]; un tono discendente-
ascendente [ V]. La stessa sillaba potrà dunque avere quattro di-
versi toni e acquistare, a seconda del tono, quattro diversi signifi-
cati: per esempio [-ma] "mamma" , [ , ma] "lino", [ ' ma] "ingiuria-
re", [vma] "cavallo". Altri simboli IPA per la rappresentazione dei
toni modulati sono nella tabella di p. 34.

L'intonazione

Nel corso della fonazione la frequenza di vibrazione delle pliche


vocali può variare anche considerevolmente in funzione della dina-
mica prosodica complessiva dell'enunciato o intonazione. In linea
generale si osserva una tendenza a una graduale diminuzione del-
1' altezza nel corso dell'enunciato, detta declinazione naturale.
Abbiamo visto che alcune lingue utilizzano le variazioni di al-
tezza per segnalare la posizione dell'accento (accento musicale) o

19. Termini come "accento acuto" e "accento grave", che oggi si riferiscono
solo a una realtà grafica, dipendono da una terminologia di origine greca che
rifletteva per quella lingua un sistema di accenti musicali.
2. FONETI CA ART ICOL ATORIA E TRA SCRI Z IONE FONETIC A

per realizzare toni. Nella maggior parte delle lingue europee, inve-
ce, l'altezza musicale ha solo un ruolo accessorio nella realizzazio-
ne dell'accento di intensità, mentre la sua funzione principale è
legata all'intonazione della frase. Infatti opposizioni del tipo "frase
dichiarativa" vs. "frase interrogativa" vengono espresse con diffe-
renti andamenti melodici (cioè variazioni dell'altezza nel corso del-
la frase). Ad esempio in italiano la differenza tra la frase Giovanni
mangia la mela e la frase Giovanni mangia la mela? consiste in un
forte aumento di altezza nella parte finale della interrogativa vs.
una normale declinazione dell'altezza nella dichiarativa.

La dinamica prosodica

Nei paragrafi precedenti abbiamo preso in esame molti fenomeni


legati a tre soli parametri prosodici: durata, intensità, altezza. Ab-
biamo visto che ciascuno di questi deve svolgere diverse funzioni.
La durata rappresenta in numerose lingue un elemento essen-
ziale per la realizzazione dei foni vocalici o consonantici (lunghez-
za) ma dipende, nello stesso tempo, da altri fattori come la veloci-
tà di eloquio e come la struttura sillabica e accentuale di una se-
quenza.
L'intensità riveste una funzione fondamentale nel segnalare la
prominenza della sillaba tonica (accento di intensità), ma varia an-
che in funzione di fenomeni come l'enfasi ecc., e inoltre accompa-
gna le variazioni dell'altezza nel disegnare l'intonazione della frase.
L'altezza ha il suo ruolo principale nell'intonazione, ma a sua
volta accompagna le variazioni dell'intensità dovute alla struttura
accentuale della sequenza, e in alcune lingue è responsabile della
prominenza accentuale (accento musicale) e dei toni.
Infine tutti e tre i parametri presentano anche variazioni casua-
li nel corso della fonazione, dovute alla fisiologica imprecisione del
controllo che siamo in grado di esercitare sui muscoli articolatori.
Tutte queste considerazioni fanno comprendere la complessità
dell'effettiva dinamica prosodica nel parlato continuo, dove tutti i
fenomeni che abbiamo ricordato (intonazione, accenti, ritmo, du-
rata dei foni ecc.) sono realizzati simultaneamente dal parlante at-
traverso il controllo di questi tre soli parametri. Di conseguenza,
quando si vuole esaminare questa dinamica per osservare ciascun
singolo fenomeno ci si trova di fronte ad un compito molto com-
plesso.

79
MANUALE DI FONETICA

FIGURA 2.7
Un esempio di rappresentazione grafica dell'intonazione basato su analisi proso-
dica soggettiva

Credo che sia il mio

Fonte: Cruttenden, 1986, p. 159.


•• . .. '.
L'analisi prosodica si può effettuare con metodo soggettivo o stru-
mentale. Il metodo soggettivo (o uditivo) è basato sull'ascolto del-
la sequenza, effettuato naturalmente da un esperto fonetista, e sul-
la rappresentazione grafica dell'andamento che egli ha sentito.
Questo metodo osserva e descrive soprattutto le variazioni dell'al-
tezza, e più sommariamente di intensità e durata. Il limite di que-
sto tipo di analisi sta nella sua soggettività e nella sua incapacità a
fornire dati quantitativi verificabili.
La rappresentazione dell'andamento dell'altezza più frequente-
mente utilizzata nel caso dell'analisi soggettiva è quella visibile nel-
la FIG. 2.7, nella quale ciascun punto rappresenta una sillaba, la
posizione del punto sull'asse verticale rappresenta la valutazione
dell'altezza della sillaba (la eventuale coda rappresenta la variazio-
ne di altezza interna alla sillaba), le dimensioni del punto rappre-
sentano la valutazione dell'intensità.
L'analisi strumentale, che descriveremo nel PAR. 3.4, consente
invece di misurare oggettivamente ciascuno dei tre parametri, e di
ottenere quindi un'informazione più completa e affidabile sulla di-
namica prosodica.
La descrizione della dinamica prosodica è un'operazione di
grande importanza e delicatezza anche per un altro motivo. Infat-
ti, a differenza dello scritto, in cui gli spazi segnalano i confini tra
unità che chiamiamo "parole", e la punteggiatura segnala i confini
tra unità che chiamiamo proposizioni, frasi, periodi ecc., nel parla-
to si presentano, tra un silenzio e l'altro, blocchi fonici spesso lun-
ghissimi e privi di ogni evidente demarcazione interna.
Per orientarci all'interno di questi lunghi blocchi e procedere
alla suddivisione della ininterrotta successione del parlato in unità

80
2 . FONETICA ARTICOLATORIA E TRASCRIZ IONE FONETIC A

più piccole di vario livello (dalla frase alla sillaba), i parametri


prosodici ci forniscono un aiuto di primaria importanza.

2.6
I metodi per lo studio della fonetica articolatoria

Daremo ora alcuni cenni, molto sintetici, su alcune tra le più im-
portanti tecniche usate dai fonetisti per studiare i meccanismi arti-
colatori che si attivano durante la fonazione.
Qui di seguito descriveremo i metodi con i quali si può osser-
vare il funzionamento della glottide (PAR. 2.6.1), e quelli con i
quali si può studiare l'attività degli organi superiori (PAR. 2.6.2).
Come si vedrà, tutti questi metodi consentono la rilevazione di
fenomeni articolatori in parlato non spontaneo e quindi rendono
solo parzialmente conto della fisiologia della fonazione.

2.6.1. Metodi per lo studio dell'attività laringea

L'attività laringea può essere studiata con diversi sistemi. Il meto-


do più diretto consiste nell'osservazione visiva (laringoscopia diret-
ta), ottenuta tramite l'inserimento nel canale fonatorio del parlante
di minuscoli specchi, sorgenti di luce, obiettivi fotografici, sonde
con fibre ottiche. ·
Tuttavia, le metodologie usate più frequentemente sono quelle
di tipo indiretto.
1. Elettromiografia. Consiste nell'inserimento di microelettrodi al-
l'interno dei muscoli vocali, allo scopo di rilevarne e di misurarne
l'attività elettrica.
2. Elettroglottografia. Due elettrodi sono posti esternamente nella
parte anteriore del collo del parlante in corrispondenza delle carti-
lagini della laringe; una corrente elettrica di alta frequenza e bassa
intensità viene fatta passare da un elettrodo all'altro attraverso i
tessuti della glottide: quando le pliche vocali sono accostate il pas-
saggio della corrente è molto più veloce in quanto il percorso tra i
due elettrodi è più breve e l'area complessiva oppone una minore
resistenza (impedenza); quando le pliche vocali si separano, acca-
de il contrario. Misurando le variazioni del flusso della corrente si
ricavano informazioni sull'attività della glottide. Rispetto agli altri
metodi descritti sopra, questo è certamente il meno fastidioso per
il soggetto che vi si sottopone e il più semplice da applicare anche

81
MANUALE DI FONETICA

per i ricercatori non medici. Inoltre il minore disagio del parlante


consente di considerare più affidabili i dati ricavati, in quanto si
discostano di meno da una situazione naturale.

2.6.2. Metodi per lo studio dell'attività degli organi superiori

r. Radiografia. La radiofotografia e la radiocinematografia del cra-


nio, eseguite in genere di profilo, consentono di studiare diversi
aspetti dell'articolazione. In alcuni casi, come per l'osservazione
dei movimenti della lingua, che è un organo privo di elementi os-
sei, è necessario usare mezzi di contrasto che la rendano visibile ai
raggi X, come il bario, che viene cosparso su un punto o un'area
della lingua stessa. Si può così misurare la distanza tra la lingua e
il palato, e si possono osservare gli spostamenti longitudinali della
lingua. Anche per misurare radiograficamente la distanza tra le
labbra bisogna usare sostanze radiopache come il bario. Quando
invece si vogliono descrivere gli spostamenti della mandibola, è
sufficiente, senza ricorso a mezzi di contrasto, studiare le normali
immagini radiografiche del cranio, e misurare l'angolo formato tra
la mandibola, organo mobile, e le ossa mascellari superiori, che
restano fisse (angolo mandibolare). Infine, anche la misura della
distanza tra i denti incisivi superiori e inferiori è agevole con mez-
zi radiografici.
2. Palatografia. I metodi palatografici sono utilizzati per studiare
se e in quali punti la lingua viene a contatto con il palato, e sono
dunque utili per la descrizione delle consonanti.
La palatografia diretta si basa sull'applicazione di sostanze co-
lorate sul palato. Dopo la produzione di un fono consonantico,
osservando il palato si può verificare se e dove il contatto con la
lingua abbia rimosso la sostanza.
La palatografia indiretta consiste invece nell'introduzione, al-
l'interno del cavo orale, di cupole artificiali che aderiscono al pala-
to e che registrano gli eventuali contatti con la lingua. Tradizio-
nalmente le cupole erano formate di materiali plastici che si de-
formavano meccanicamente là dove venivano toccati dalla lingua.
Oggi esse sono collegate a computer e sono ricoperte di sensori
che trasmettono informazioni sulla esistenza e sulla posizione del
contatto tra lingua e palato.
3. Aerometria. La misura dei flussi d'aria che attraversano le di-
verse cavità è di grande importanza per alcune articolazioni, come
2 . FONETICA ARTICOLATOR I A E TRASCRI Z I ONE FONETICA

le nasali, che prevedono il passaggio contemporaneo dell'aria at-


traverso la bocca e il naso, oppure quando si voglia verificare la
presenza di occlusione, e quindi la momentanea interruzione del
flusso orale.
4. Elite. È un sistema elettronico che registra i movimenti di mar-
kers applicati su organi esterni (labbra, naso, mento) e acquisisce
contemporaneamente il segnale acustico. Esso consente di misura-
re gli spostamenti verticali delle labbra (apertura labiale), gli spo-
stamenti laterali degli angoli delle labbra (larghezza labiale), gli
spostamenti antero-posteriori delle labbra (protrusione) , gli sposta-
menti verticali della mandibola (apertura mandibolare), e di met-
tere in relazione i movimenti e la loro velocità con il segnale ver-
bale corrispondente.
3
Fon etica acustica

3.1
Elementi di fisica acustica

Lo studio dei suoni linguistici dal punto di vista della loro concretez-
za fisica presuppone la conoscenza di alcuni elementi di base dell'a-
custica che qui presenteremo in modo semplice e discorsivo.

3. r. r. L'onda sonora

Dal punto di vista fisico il suono consiste nella oscillazione delle


particelle di un mezzo.
Questa oscillazione è provocata dai movimenti vibratori di un
corpo, detto sorgente del suono, i quali si trasmettono alle moleco-
le del mezzo (aria, acqua ecc.) in cui esso è immerso. Queste mo-
lecole, sollecitate dalle vibrazioni della sorgente, si mettono a loro
volta in movimento, oscillando in avanti e all'indietro rispetto al
proprio punto di riposo (cioè al punto in cui si trovavano prima
che l'oscillazione avesse inizio e nel quale, in assenza di altre solle-
citazioni, ritornano quando l'oscillazione è terminata), in modo si-
mile al movimento di un pendolo.
Se facciamo vibrare un diapason (l'oggetto metallico a forma di
forcella usato tradizionalmente per accordare alcuni strumenti mu-
sicali), le sue vibrazioni provocheranno nelle molecole di aria che
lo circondano analoghi movimenti oscillatori; questi movimenti
prima spingeranno le molecole in direzione opposta al diapason e
subito dopo le riattireranno verso di esso, e così via finché dura la
vibrazione del diapason. A sua volta, ciascuna di queste particelle
adiacenti alla sorgente, così sollecitata, eserciterà una identica sol-
lecitazione sulle altre molecole ad essa adiacenti, imprimendo loro
un identico movimento pendolare, e così via. Tale processo è illu-
strato nella FIG. 3.r.
MANUALE DI FONETICA

FIGURA 3 . 1
Rappresentazione schematica del processo di propagazione delle oscillazioni di
un diapason (a sinistra) alle particelle del mezzo (A, B, C, D, E, F)
Dia p a s o n - - - - - - - - - - - - - - - - - - - - - - - - - - ~

V @ @ © @) © ®
V @ "@ © @ © ®
V @ ® © @ © ®
Q @ @ © @) © ®

V @ @ © @ © ®
y @ @ © @) © ®

V @ ® © @) © ®
Q @ @ © @ © ®

V @ ® © @ © ®
y @ @ © @ © ®

V @ ® © @ © ®
Q @ @ © @ © ®

V © @ © ®
y @ @ © @ © ®

V @ © @) © ®

Nell'istante iniziale (in alto) il diapason e le particeUe si trovano neUe loro rispettive posizioni di riposo.
Scorrendo lo schema dall'alto in basso si possono osservare i movimenti di ciascuna particeUa, nonché il
propagarsi deU'oscillazione da sinistra verso destra.
Fonte: Ferrero e/ al., 1979 , p. 12.

Questo fenomeno, detto onda sonora, tenderà così a propagarsi


dalla sorgente verso tutte le direzioni libere.
Le spinte che le particelle si trasmettono l'una all'altra tendo-
no a indebolirsi sempre più via via che ci si allontana dalla sorgen-

86
3. FONETICA ACUSTICA

te, fino a quando, raggiunta una certa distanza, esse finiscono per
annullarsi.
Se si prende in considerazione, partendo ancora dalla FIG. 3. r,
una serie di particelle durante la propagazione di un'onda sonora,
si potrà constatare che in ogni momento si alternano zone in cui
le particelle si sono awicinate l'una all'altra e zone in cui esse si
sono allontanate l'una dall'altra. Le prime sono dette zone di con-
densazione e le seconde zone di rare/azione. Si può allora descrive-
re un'onda sonora come alternanza di condensazioni e rarefazio-
ni.
La velocità con cui l'onda sonora si propaga nello spazio di-
pende unicamente dal mezzo e dalle sue caratteristiche fisiche
(densità, temperatura, pressione ecc.). A parità di tutte queste va-
riabili, la velocità del suono è costante. Nell'aria, alla temperatura
di 20 °C e alla pressione atmosferica di 760 mm di mercurio, qua-
lunque suono si propaga sempre alla velocità di circa 343 m al
secondo (owero a circa r.235 km all'ora).
Se osserviamo una fila di particelle come quella schematizzata
nella FIG. 3. r, possiamo misurare la distanza tra due successive
zone di condensazione, oppure, che è lo stesso, tra due successive
zone di rarefazione. Questa distanza è detta lunghezza d'onda.

3.r.2. I segnali semplici

Gli spostamenti di una particella nel tempo si possono rappresen-


tare su un grafico cartesiano disponendo il tempo sull'asse delle
ascisse e gli spostamenti sull'asse delle ordinate.
Nel caso dell'onda sonora prodotta da un diapason, otterremo
una curva come quella rappresentata nella FIG. 3.2.
Per la sua forma, identica a quella prodotta dalla funzione ma-
tematica detta seno (lat. sinus), questa curva è chiamata sinusoide.
Si può anche osservare come la curva tenda periodicamente a
ripetersi uguale a se stessa: questo tipo di oscillazione viene perciò
definito periodico.
Un ciclo oscillatorio consiste di quattro fasi:
r. Spostamento in avanti.
2. Ritorno all'indietro fino al punto di riposo.
3. Spostamento all'indietro.
4. Ritorno in avanti fino al punto di riposo.
MANUALE DI FONETICA

F IGURA 3.2
Un'onda semplice o sinusoidale

~
Q)
·a.
E a
<11

tempo

T rappresenta il periodo, a l'ampiezza.

Il tempo T, necessario perché si compia un intero ciclo oscillato-


rio è detto periodo dell'onda sonora.
Sull'asse delle ordinate nella FIG . 3.2, come accennato sopra,
sono rappresentati gli spostamenti della particella. Gli spostamenti
in avanti (lontano dalla sorgente) sono indicati con valori positivi,
quelli all'indietro (in direzione della sorgente) sono indicati con
valori negativi. La misura degli spostamenti massimi (sia di quelli
positivi sia di quelli negativi, che sono identici ai primi), rappre-
sentati nel diagramma dai picchi della curva, è detta ampiezza del-
1' onda sonora (rappresentata nella FIG . 3.2 dal segmento a).
I due valori del periodo T e dell'ampiezza a sono sufficienti a
descrivere in maniera completa qualunque onda periodica sinusoi-
dale. Tuttavia, per descrivere la dimensione temporale del fenome-
no, in luogo del periodo si usa molto più spesso il concetto di
frequenza, che indica quante volte il ciclo di oscillazione si ripete in
un secondo. Se ad esempio un'onda sonora ha un periodo che
dura un decimo di secondo, essa evidentemente avrà una frequen-
za (F) di ro cicli per secondo (c.p .s.); se dura un centesimo di
secondo, la sua frequenza sarà mo c.p.s. ecc. Questa semplice re-
lazione matematica, detta di proporzionalità inversa, si esprime
con la seguente formula:

F i/T
oppure

T i/F

88
3. FONETIC A AC USTICA

L'unità di misura della frequenza, il c.p.s., è detta anche, molto


più comunemente, Hertz (Hz).
Nel PAR. 3.r.1 abbiamo parlato della lunghezza d'onda (À).
Poiché la velocità del suono è costante, la lunghezza d'onda è in-
versamente proporzionale alla frequenza, secondo la formula

À = V/F

Per esempio, per un'onda sonora che si propaghi nell'aria alla ve-
locità di 343 m/s e che abbia una frequenza di 100 Hz, si avrà
una lunghezza d'onda di 3,43 m.
La misura della lunghezza d'onda in luogo della frequenza di
un segnale è utilizzata, ad esempio, nella radiofonia.
Secondo la nostra definizione, l'ampiezza è la distanza massima
della particella dalla posizione di riposo. Si tratta dunque di una
misura di spazio. Se però guardiamo il fenomeno sonoro da un
altro punto di vista, è evidente che un'onda dotata di ampiezza
maggiore sarà caratterizzata anche dal fatto che le spinte che le
particelle oscillanti esercitano sulle particelle adiacenti saranno più
forti. Si osserva cioè una relazione di proporzionalità diretta tra
l'ampiezza degli spostamenti delle particelle e la forza delle spinte
esercitate. L'entità di queste spinte si misura in termini di pressio-
ne sonora che le particelle esercitano su una determinata superfi-
cie. Questa pressione sonora può essere espressa in termini di in-
tensità 1 •

L'unità di misura dell'intensità più comunemente usata è il de-


cibel (dB).
Il decibel è un'unità relativa. Ciò vuol dire che l'intensità di un
suono è misurata non in termini di potenza assoluta (che si misura
in watt) ma in rapporto ad un suono di riferimento scelto conven-
zionalmente, che è il suono di intensità più debole che mediamen-
te l'orecchio umano possa udire alla frequenza di r.ooo Hz (PAR.
4. 3. 1), e che quindi corrisponde in questa scala a o dB. Questa
misura relativa dell'intensità è detta livello di intensità sonora (IL) .
Stabilita l'intensità del suono più debole percepibile, bisogna

1. Ampiezza e intensità sono dunque due grandezze diverse, ma tanto stret-


tamente collegate che spesso, in maniera a rigore scorretta ma sostanzialmente
non infondata, in fonetica vengono considerate equivalenti e i termini sono usati
come sinonimi.
MA NUA L E DI FON ETIC A

osservare che il suono più forte percepibile (PAR. 4.3.r) è cento-


mila miliardi (I0 14 ) di volte più forte: dunque una scala di misu-
razione lineare non sarebbe pratica. Perciò si è fatto ricorso a
una scala logaritmica, basata sugli esponenti delle potenze di IO,
che va quindi soltanto da o a 14. L'unità di misura così definita
è detta Bell. Il decibel si ottiene infine moltiplicando il Beli per
IO. Questo complesso procedimento è condensato nella formula:

IL = IO log I/I 0

che si legge così: il livello di intensità sonora IL è uguale a IO volte


il logaritmo del rapporto tra l'intensità I del segnale in esame e
l'intensità I 0 del segnale preso convenzionalmente come riferi-
mento.

3.r.3. I segnali complessi

L'esempio del diapason è stato scelto perché l'onda sonora che


esso produce è la più semplice. Infatti, come abbiamo visto, essa
consiste di un moto periodico rappresentabile come una curva si-
nusoidale. Tale onda è semplice perché semplice è il moto oscilla-
torio che la genera. Ma se la sorgente oscilla in modo complesso,
anche l'onda che viene generata è complessa.
Quindi, la /orma sinusoidale e la periodicità non sono comuni a
tutti i tipi di onda sonora. In base alla presenza o assenza di que-
ste due caratteristiche è possibile suddividere le onde sonore in:
- onde periodiche sinusoidali o semplici, come quella prodotta dal
diapason;
onde periodiche non sinusoidali o complesse, che hanno una
forma diversa dalla sinusoide, ma sono comunque dotate della
periodicità;
onde non periodiche o aperiodiche, che non presentano alcuna
periodicità, cioè che non sono suddivisibili in cicli successivi tutti
uguali: un termine equivalente usato per definire questo ultimo
tipo di segnali acustici è quello di rumore 2 •

Tutti i suoni linguistici appartengono a queste ultime due cate-


gorie: sono cioè o segnali periodici complessi, prodotti dalla vi-

2 . Nell'uso comune si adopera invece il termine "rumore" per indicare qua-


lunque suono non gradevole, periodico o aperiodico, per esempio un suono mol-
to intenso o molto acuto.
3. FONETI CA ACUSTI CA

brazione complessa delle pliche vocali, o segnali aperiodici, pro-


dotti dalle esplosioni o frizioni che hanno luogo nell'apparato fo-
natorio (PAR. 3.2.r).
Nella FIG. 3.3 è rappresentata un'onda periodica complessa.

FIGURA 3.3
Un'onda periodica complessa di periodo T

Come si può osservare, la forma della curva è diversa da una sinu-


soide (cfr. supra FIG. 3.2) e quindi l'onda è complessa. Questa for-
ma si ripete regolarmente ogni volta che è stato completato un pe-
riodo T, ossia un ciclo, e quindi l'onda è periodica. Come per
l'onda semplice vista sopra, anche nell'onda complessa periodica
possiamo individuare l'ampiezza massima e il periodo. Analoga-
mente a quanto abbiamo detto per i segnali semplici, la frequenza
di un segnale periodico complesso può essere calcolata come l'in-
verso del periodo ed espressa in Hertz.
Nella FIG. 3.4 è rappresentata un'onda aperiodica.

FIGURA 3 .4
Un'onda aperiodica

~
Cl)
·o.
E
<O

91
MANUALE DI FONETI CA

In questo caso è possibile stabilire l'ampiezza massima raggiunta


dall'oscillazione in un determinato intervallo di tempo, ma non è
possibile determinare in alcun modo né il periodo né la frequenza,
dal momento che non è presente alcuna periodicità.

3.1.4. L'analisi di Fourier

L'ampiezza e la frequenza sono i due soli parametri necessari e


sufficienti per definire esattamente un segnale sinusoidale. Ma per
descrivere in maniera non ambigua un'onda periodica complessa
questi due parametri da soli non sono più sufficienti: per esempio,
le diverse due onde rappresentate nella FIG. 3.5 hanno la stessa
ampiezza e la stessa frequenza, ma le loro forme sono diverse
l'una dall'altra.

FIGURA 3.5
Due diverse onde periodiche complesse di uguale ampiezza e uguale periodo

Per descrivere in modo non ambiguo le onde periodiche comples-


se è dunque necessario ricorrere ad un altro sistema. Esso consiste
nell'applicazione di un metodo sviluppato nel XVIII secolo dal ma-
tematico francese Fourier [fu'rje] per descrivere molti tipi di fun-
zioni matematiche complesse, ed è detto per l'appunto analisi di
Fourier. Alla base di tale metodo è il seguente principio generale:

92
3. FONETICA ACUSTICA

qualunque funzione complessa periodica può essere considerata


come la somma di n funzioni semplici. Tradotto nei termini acu-
stici che a noi qui interessano ciò significa che ogni onda periodica
complessa può essere scomposta e analizzata come una serie di onde
periodiche semplici (sinusoidali); ciascuna di queste potrà poi esse-
re descritta in maniera diretta e non ambigua in base alla sua am-
piezza e alla sua frequenza (cfr. FIG . 3.6).
Queste componenti semplici dell'onda periodica complessa
vengono dette armoniche del segnale complesso, e il loro insieme è
chiamato spettro.
Un postulato molto importante dell'analisi di Fourier è che le
frequenze delle armoniche sono i multipli interi della frequenza del
segnale complesso. Ad esempio, un segnale periodico complesso
della frequenza di roo Hz verrà scomposto in una serie di armoni-
che di frequenze uguali rispettivamente a roo.,.c1, 100*2, 100*3,
roo.,.,n ovvero roo Hz, 200 Hz, 300 Hz e così via. Questa serie di
armoniche è detta serie di Fourier. La frequenza della prima armo-
nica, che per definizione è uguale a quella del segnale complesso
(roo Hz,~1 nel nostro esempio), è chiamata frequ enza fondamenta-
le, ed è abitualmente indicata con la sigla F0 (che viene letta "effe
con zero").
Le ampiezze delle diverse armoniche non sono invece calcola-
bili con una semplice operazione aritmetica, come le frequenze. Il
loro calcolo richiede invece il ricorso a procedimenti matematici o
elettronici sofisticati.

3.1.5. I filtri

Nella pratica dei laboratori di fonetica sperimentale la scomposi-


zione di un'onda complessa periodica viene abitualmente eseguita
con un metodo fisico basato su dispositivi detti filtri. Un filtro è
un sistema capace di individuare in un segnale complesso le armo-
niche che si trovano all'interno di un determinato intervallo di fre-
quenza, e di separarle da tutte le altre componenti di frequenza
diversa.
Per esempio, possiamo avere un filtro capace di isolare tutte
le componenti comprese in una banda che va dai 50 ai 150 Hz.
Immaginiamo allora di partire da un segnale periodico complesso
della frequenza di roo Hz: sappiamo che le armoniche di questo

93
MANUALE DI FONETICA

segnale hanno frequenze di roo, 200, 300, 400 Hz e così via. Il


filtro che stiamo usando come esempio sarà dunque in grado di
individuare la prima armonica (quella di roo Hz) e di separarla
dalle altre. Per individuare la seconda armonica potremo usare
poi un filtro capace dì isolare le frequenze comprese tra i 150 e
i 250 Hz; per la terza un filtro che isoli la banda 250-350 Hz e
così via. Con un sistema di molti filtri (banco di filtri) di questo
tipo, tutti della stessa larghezza di banda (cioè capaci di discrimi-
nare le frequenze all'interno di un intervallo di larghezza costan-
te, che nell'esempio fatto qui è sempre di roo Hz), giungeremo
a scomporre il segnale periodico complesso in tutte le sue armo-
niche. Di ciascuna armonica il sistema di analisi ci darà poi, ol-
tre alla frequenza, anche il valore dell'ampiezza, e cioè tutta l'in-
formazione necessaria per descrivere lo spettro del segnale com-
plesso.
Se proviamo invece ad analizzare lo stesso segnale complesso
con un banco di filtri di maggiore larghezza di banda, per esem-
pio di 200 Hz, non raggiungeremo lo stesso risultato, perché ogni
filtro avrà selezionato due armoniche insieme: per esempio se il
primo di questi filtri avrà una banda che va da 50 a 250 Hz, non
riuscirà a separare la prima dalla seconda armonica, e non potrà
quindi darci i valori delle loro frequenze e delle loro ampiezze e
così di seguito.
Ogni volta che si adopera un filtro con una larghezza di banda
sufficientemente stretta da separare l'una dall'altra tutte le armoni-
che, si dice che si esegue un'analisi a banda stretta. In caso con-
trario, si dice invece analisi a banda larga.

3.1.6. Lo spettrogramma

Una volta eseguita la scomposizione di un segnale periodico com-


plesso, disponiamo dei valori di frequenza e di ampiezza di un
certo numero, spesso molto alto, di armoniche.
Questo risultato può essere rappresentato sotto forma di una
serie di oscillogrammi, corrispondenti ciascuno ad un'armonica
(come nella FIG. 3.6).
Ma la rappresentazione più frequente è un grafico detto spet-
trogramma, in cui la frequenza è in ascissa e l'ampiezza in ordina-
ta. Dal momento che ogni armonica è caratterizzata proprio dai

94
3. FONETI CA ACUSTICA

FIGURA 3.6
Un'onda periodica complessa e le sue prime quattro armoniche (dall'alto in
basso)

tempo

~
Q)
·a.
E
"'
tempo

T1

Si osservino le relazioni tra i periodi delle armoniche e quello dell'onda complessa.

95
MANUA LE DI FONETICA

FIGURA 3. 7
Spettrogramma di un'onda periodica complessa

50 a)

40

30
I (dB)
20

10

f (Hz)

b)
50

40

30
I (dB)
20

10

~--------------------:,:>
500 1000 1500
f (Hz)
a) a banda stretta, con evidenziazione delle armoniche; b) a banda larga, con evidenziazione del solo
inviluppo spettrale.

valori della frequenza e dell'ampiezza, questo grafico conterrà tut-


ta l'informazione necessaria per descrivere la serie di Fourier, e
cioè tutto il contenuto spettrale del segnale complesso (cfr. FIG .
3.7) .
Nella FIG. 3.7a è presentato lo spettrogramma del segnale pe-
3 . FONETI CA ACUSTICA

riodico complesso corrispondente all'oscillogramma di FIG . 3.6: ad


ogni armonica corrisponde una colonnina che parte in corrispon-
denza della rispettiva frequenza e si estende verso l'alto in pro-
porzione alla rispettiva ampiezza. Si ottiene così un grafico forma-
to da numerose righe verticali, detto spettro a righe. Le righe si
dispongono a distanza regolare l'una dall'altra dal momento che le
loro frequenze sono separate sempre da un intervallo di frequenza
costante, poiché le frequenze delle armoniche sono per definizione
i multipli interi della frequenza dell'armonica fondamentale.
Se congiungiamo con una linea le estremità superiori delle ri-
ghe dello spettro otteniamo l'inviluppo spettrale.
Se si esegue l'analisi di un segnale periodico complesso con un
filtro a banda larga (cioè di larghezza di banda maggiore della fre-
quenza fondamentale), si otterrà come risultato che le singole ar-
moniche non saranno evidenziate, ma si ricaverà soltanto l'infor-
mazione relativa all'ampiezza globale delle singole bande filtrate.
In questo caso dunque non avremo uno spettro a righe, bensì uno
spettro continuo (cfr. FIG . 3.7b) .

3.1.7 . I risuonatori

Ogni corpo elastico (solido, liquido o gassoso) ha la proprietà di


entrare in vibrazione quando è sollecitato da una particolare fre-
quenza (frequenza di risonanza) legata alle dimensioni e alla forma
del corpo stesso.
Se un'onda complessa, che abbia uno spettro del tipo di quel-
lo visto in FIG . 3.7, attraversa un corpo cavo pieno d 'aria, il suo
spettro subirà alcune sensibili modifiche perché le armoniche di
frequenza uguale alla frequenza di risonanza della cavità verranno
amplificate. Altre saranno indebolite o addirittura del tutto can-
cellate.
Una cavità che modifica lo spettro di un segnale è detta risuo-
natore. Le frequenze delle armoniche rinforzate sono dette riso-
nanze, quelle delle armoniche indebolite sono dette antirisonanze.
Si pensi ad esempio all'effetto prodotto dalla cassa di uno stru-
mento come il violino o la chitarra: il suono prodotto dalla vibra-
zione della corda viene profondamente modificato dalla cassa di
risonanza. Qualcosa di simile accade (come vedremo meglio nel
PAR. 3.2 . 1) nella voce umana: il segnale prodotto dalla vibrazione

97
MANUALE DI FONETI CA

FIGURA 3.8
Spettrogramma di un'onda periodica complessa il cui inviluppo spettrale presen-
ta dei picchi, detti/ormanti (Fr, F2)

50

40
F1
30
I (dB)
20 F2

10

500 1000 1500


f (Hz)

delle pliche vocali è modificato dalla cassa di risonanza costituita


dalle cavità superiori del condotto vocale.
Nella FIG. 3.8 è rappresentato lo spettrogramma del segnale
di FIG . 3.7 dopo che è passato attraverso un sistema di risuona-
tori.
Lo spettro si presenta ancora a righe, ma mentre le armoniche
in FIG. 3.7 hanno un'ampiezza regolarmente decrescente, qui le ar-
moniche hanno ampiezze diverse e distribuite in modo apparente-
mente irregolare.
In corrispondenza dei gruppi di armoniche amplificate dal ri-
suonatore l'inviluppo spettrale presenta dei picchi, detti formanti
(F) . Gli avvallamenti dell'inviluppo spettrale rappresentano invece
le armoniche indebolite dalle antirisonanze.

3.1.8. Segnali complessi aperiodici

In FIG. 3.4 è presentato, come abbiamo detto nel PAR. 3.1.3, l'o-
scillogramma di un segnale complesso aperiodico.
Dal punto di vista matematico non ha senso parlare di analisi
di Fourier di un segnale aperiodico, per la definizione stessa che
3. FONETICA ACUSTICA

FIGURA 3.9
Spettrogrammi di onde aperiodiche (è assente ogni struttura armonica)

a)

40

30
I (dB)
20

10

20 20.ooof (Hz)

b)

40

30
I (dB)
20

10

20 20.ooof (Hz)
L'inviluppo spettrale piatto di a) rappresenta un rumore bianco; quello mosso di b) un rumore colorato.

abbiamo dato di questo procedimento (v. PAR. 3.1.4). È possibile


invece osservare la risposta di un banco di filtri a questi segnali.
Naturalmente nessun filtro , per quanto stretta possa essere la sua
banda, potrà individuare armoniche in un segnale aperiodico, e
dunque non otterremo mai spettri a righe, ma solo spettri continui
e i relativi inviluppi spettrali. Se lo spettrogramma risultante mo-
stra a tutte le diverse frequenze la stessa ampiezza (e quindi un
inviluppo spettrale con andamento piatto orizzontale) si parla di

99
MAN U AL E DI FONETI C A

rumore bianco. Se invece alcune frequenze risultano dotate di am-


piezza maggiore di altre, e l'inviluppo mostra dei picchi e degli
avvallamenti, si dice invece che il rumore è colorato (FIG. 3.9).

3.r.9. Il sonagramma

Gli spettrogrammi, come abbiamo visto, consentono rappresenta-


zioni analitiche e complete dei segnali complessi per quanto ri-
guarda la frequenza e l'ampiezza delle loro componenti ma non
forniscono informazione sulla durata dei fenomeni e sul loro varia-
re nel tempo.
Per analizzare in maniera completa un segnale dinamico
(come, per esempio, quello prodotto dall'apparato fonatorio uma-
no) è indispensabile prendere in considerazione anche la variabile
tempo. Bisogna quindi disporre di uno strumento in grado di ana-
lizzare lo spettro del segnale dinamico istante per istante e di for-
nire una rappresentazione che evidenzi simultaneamente la struttu-
ra spettrale istantanea e le sue variazioni nel tempo.
La rappresentazione che meglio consente di studiare la varia-
zione del segnale nel tempo è detta sonagramma. Un sonagramma
è un grafico che presenta il tempo in ascissa e la frequenza in or-
dinata .
In FIG . 3.10 sono presentati, in alto, gli spettrogrammi di una
[a] e di una [i] (relativi a un istante centrale di ciascuno dei due
foni) e, in basso, il sonagramma della sequenza [ai].
Le striature orizzontali visibili nel sonagramma, come le colon-
ne verticali degli spettrogrammi, rappresentano le armoniche viste
qui nel loro sviluppo temporale (infatti la dimensione frequenza è
sull'asse delle ascisse negli spettrogrammi ma su quello delle ordi-
nate nei sonagrammi).
La terza dimensione del segnale acustico, cioè l'ampiezza, è
rappresentata nel sonagramma in modo indiretto, mediante un
maggiore o minore annerimento del tracciato. Nel sonagramma di
FIG . 3. 10 le varie armoniche sono annerite in misura diversa: un
maggiore annerimento corrisponde a una maggiore ampiezza, una
minore intensità del grigio ad un'ampiezza minore.
Guardiamo ancora il sonagramma di FIG. 3.10. Tra la prima
parte ([a]) e la seconda ([i]) si osserva una fase intermedia di pas-
saggio graduale dal primo al secondo fono. Il sonagramma con-
sente infatti di ricavare informazioni anche sulla fase di transizione

IOO
3. FONETICA ACUSTICA

FIGURA 3.10
Spettrogramma di una [a] (in alto a sinistra); spettrogramma di una [i] (in alto a
destra) ; sonagramma a banda stretta della sequenza [ai] (in basso)

da un fono all'altro, che, in questo caso, appare graduale e conti-


nua (cfr. PAR. 2.4.6).
Il sonagramma consente infine di misurare la durata della se-
quenza o di sue porzioni.
Il sonagramma che abbiamo descritto, in cui sono ben visibili
tutte le componenti armoniche dei segnali sotto forma di striature
più o meno annerite, è un sonagramma a banda stretta. Infatti esso
è stato realizzato con un banco di filtri in grado di separare tutte
le armoniche presenti nel segnale complesso.
Se effettuiamo invece un'analisi sonagrafìca con filtri a banda
larga otterremo dei sonagrammi a banda larga come quello in FIG.
3 .1 r, che rappresenta la stessa sequenza [ai].
Qui, come si vede, il sistema di filtri non ha separato l'una dal-
l'altra le singole armoniche, e le striature che apparivano in FIG.
3. ro sono scomparse. Le fasce più larghe e più scure che si vedo-
no al loro posto in FIG. 3. u corrispondono invece alle parti dello
spettro dotate di maggiore ampiezza, cioè alle formanti. Un sona-
gramma effettuato con filtri a banda larga contiene dunque soltan-

101
MA NUA L E DI FO NETICA

FI GUR A 3 .11
Sonagramma a banda larga della sequenza [ai)

to l'informazione relativa alle formanti, e non rappresenta tutta la


struttura armonica del segnale.

3.2
Fonetica acustica segmentale

3.2.r. La produzione del segnale vocale

Il segnale vocale può essere visto come il risultato dell'attivazione


di una sorgente di segnale periodico e/ o di una sorgente di rumo-
re, combinate con un sistema di risuonatori.
Come abbiamo visto nei PARR. 2.2.3 e 2.2.4, la sorgente del se-
gnale periodico si trova nella glottide (meccanismo laringeo) e la
sorgente del rumore si trova nei diversi luoghi di articolazione
consonantici.
In seguito all'attivazione del meccanismo laringeo, si genera
nell'aria espiratoria un'onda periodica complessa detta segnale
glottico (nella FIG . 3.12 sono rappresentati la sua forma d'onda e il
suo spettro), la cui frequenza corrisponde alla frequenza delle vi-
brazioni laringee 3 .

3. Il segnale glottico non è osservabile direttamente e quindi le sue rappre-


sentazioni si basano su procedimenti matematici o elettronici indiretti.

102
3. FONETICA ACUSTICA

FIGURA 3 .12
Forma d'onda (in alto) e spettro (in basso) del segnale glottico

tempo
T

50

40

30
I (dB)
20

10

;,>
500
f (Hz)

L'inviluppo spettrale del segnale glottico è regolarmente decre-


scente, con una riduzione dell'ampiezza delle armoniche detta de-
cadimento.
Il segnale glottico, così come lo abbiamo rappresentato nella
FIG. 3.12, non raggiunge mai le nostre orecchie. Infatti, nell'attra-
versare il condotto vocale, esso viene profondamente modificato.
La parte superiore dell'apparato fonatorio, dalla laringe alle
labbra, può essere rappresentata schematicamente come un tubo
di diametro variabile della lunghezza di circa 17-18 cm (FIG.
3· 1 3).
Questo tubo, in conseguenza dei movimenti delle labbra, della
lingua, della mandibola e del velo, può configurarsi in modi di-
MANUAL E DI FO N ETICA

FIG URA 3.13


Rappresentazione schematica del condotto vocale visto come un tubo composto
da segmenti di differente diametro

Glottide Labbra
__ i__
"'
Fonte: Ferrero et al. , 1979, p. n.

versi fungendo quindi come una cassa di risonanza variabile (a


differenza di quella degli strumenti musicali che è fissa).
Il segnale glottico emesso dalla laringe viene dunque modifica-
to in modo diverso se, ad esempio, la lingua si trova in posizion<'l:
arretrata o avanzata, abbassata o innalzata, oppure se le labbra si
trovano in posizione distesa o arrotondata, o il velo del palato al-
zato o abbassato. Il risuonatore conferisce dunque al segnale glot-
tico di volta in volta un diverso inviluppo spettrale, al quale corri-
sponde il timbro proprio di un determinato fono sonoro (v. anco-
ra in FIG. 3.10 gli inviluppi spettrali di [a] e [i]).
È importante notare che, al contrario delle ampiezze, le fre-
quenze delle armoniche non vengono modificate dal risuonatore, e
che quindi la frequenza fondamentale resta determinata dalla sola
attività della laringe.

3.2.2. Le vocali

La produzione delle vocali, che sono sempre sonore, prevede l'at-


tivazione del meccanismo laringeo, che conferisce periodicità al se-
gnale, e l'intervento del risuonatore orale, che ne determina il
timbro.
I foni vocalici sono infatti caratterizzati dalla presenza di alcu-
ne formanti molto evidenti nelle rappresentazioni spettrografiche e
sonagrafiche (cfr. ancora supra FIGG. 3.10 e 3.n). Per classificare
le vocali sono determinanti i valori di frequenza delle prime due
3. FONETICA ACUSTICA

FIGURA 3.14
Sonagramma a banda larga delle vocali [u, o, :,, a, e, e, i, ;}]. Le formanti consi-
derate sono quelle evidenziate con un trattino orizzontale

formanti, dette F1 e F2. Lo spettro delle vocali mostra comunque


anche altre formanti (F 3 e F 4) che sono però secondarie per la
definizione del timbro e che qui non considereremo.
F1 si trova a frequenze più basse (200-300 Hz) per le vocali
alte, e presenta valori via via più alti man mano che si passa alle
vocali medio-alte, medio-basse e infine alle basse (700-800 Hz). Si
può quindi dire che F r è direttamente proporzionale al grado di
apertura della vocale.
F 2, invece, ha il suo valore minimo per le vocali posteriori alte
(700-800 Hz) e va aumentando man mano che si avanza nel cavo
orale, fino a raggiungere una frequenza massima per le vocali an-
teriori alte (circa 2.200 Hz). Si può dire quindi che F2 è diretta-
mente proporzionale al grado di anteriorità della vocale.
Nella FIG. 3.14 presentiamo un sonagramma a banda larga del-
le vocali [u o :, a e e i ;')].
Si osservi come F 1 varii in funzione del grado di apertura, cre-
scendo via via che da [u] si passa ad [a] e diminuendo da [a] a
[i], e come invece F2 varii in funzione dell'anteriorità, crescendo
regolarmente da [u] a [i]. La [;')] ha lo stesso grado di apertura e
lo stesso valore di F1 di [e] e [o], e lo stesso grado di anteriorità
e lo stesso valore di F 2 di [a].
Nella TAB. 3.1 diamo invece i valori medi di F1 e di F2 (ac-
compagnati dalle rispettive deviazioni standard) ricavati per un
MANUALE DI FONETI CA

TABELLA 3.1
Valori medi e deviazioni standard delle prime due formanti delle vocali toniche
dell'italiano in un campione di 12 soggetti maschili
Fr F2

[u] 3o5 :':: 55 861 :':: 135


[o] 4o9 :':: 58 1001 :':: 257
[:,] 554 :':: 65 1055 :':: 191
[a] 708 :':: 87 1466 :':: 109
[e] 500 :':: 77 1844 :':: 181
[e] 375 + 63 2028 :':: 195
[i] 2 75 :':: 61 2240 :':: 160

campione di 12 soggetti maschili italiani (giornalisti RAI) ed estratti


da sequenze di italiano parlato naturale (telegiornali regionali del
Lazio, della Lombardia e della Campania).
Se si costruisce un grafico con i valori medi di F1 e F2 ri-
spettivamente in ascissa e in ordinata (cfr. FIG. 3.15), le vocali vi si
dispongono in un modo che rende ancora più evidente e imme-
diata la stretta relazione intercorrente tra le principali caratteristi-
che articolatorie delle vocali (grado di apertura e grado di anterio-
rità) e le loro caratteristiche acustiche (F1 e F2).
Nella FIG. 3. 16, costruita in modo analogo alla precedente,
sono riportati i valori delle singole realizzazioni delle diverse voca-
li, dai quali si erano ricavate le medie di TAB. 3.1 e FIG. 3.15.
In questo caso si vede come ogni tipo vocalico si distribuisca
in una zona relativamente ampia del grafico. Inoltre, si vedono
delle zone di sovrapposizione tra le aree occupate da vocali adia-
centi. La presenza di queste sovrapposizioni significa di fatto che
due diverse vocali (per esempio una [u] e una [o]) possono essere
realizzate in modo identico. In altri termini può accadere, ad
esempio, che la realizzazione della vocale [a] prodotta da un certo
parlante in una determinata parola sia assolutamente identica alla
realizzazione di [::,] di un altro, o anche dello stesso parlante.
La correlazione tra caratteristiche articolatorie e caratteristiche
acustiche delle vocali non si limita naturalmente alle sette vocali del-
l'italiano che abbiamo usato come esempio. Anzi, proprio in base
alla regolarità ora descritta, è possibile prevedere con buona appros-
simazione la struttura formantica di una vocale conoscendone le ca-
ratteristiche articolatorie. Analogamente, dati i valori formantici di
una vocale, si potrà risalire alle sue caratteristiche articolatorie.
106
3 . FO NETI CA ACU STICA

FI GU RA 3.15
Grafico F1/F2 dei valori medi delle sette vocali toniche dell'italiano

2500

•i

2000 •e

• e:

F2(Hz)1500
•a

• :,
1000 •o

•u

500
200 300 400 500 600 700 800
F1 (Hz)

Nella FIG . 3.17 riportiamo il grafico F1-F2 con i valori formantici


delle vocali del francese (pronunciate in laboratorio). Ciò consente
di osservare gli effetti acustici della labializzazione e della nasa-
lizzazione.
Le due serie di vocali anteriori labializzate [y 0 ffi] e non la-
bializzate [i e e] presentano gli stessi gradi di apertura (rispettiva-
mente chiuso, semichiuso e semiaperto) ma il grafico mostra che
esistono differenze sensibili tra le due serie per quanto riguarda
F 2, che nelle vocali labializzate ha valori più bassi rispetto alle
non labializzate. Ciò dipende dall'effetto dell'arrotondamento del-
le labbra sulla forma e soprattutto sulla lunghezza del tubo di ri-
MANUALE DI FONETICA

FIG URA 3.16


Grafico F1/F2 delle sette vocali toniche dell'italiano realizzate da 12 soggetti
maschili (ro repliche per ogni tipo vocalico per ogni soggetto) in parlato sponta-
neo

o u • o 6 J • a + E • e • i
2500
B

2000

;:.

:!:
N
1500
u..
+

I:,

.
1000

o 00 1 •
o
00
500
150 250 350 450 550 650 750 850
F1 (Hz)

sonanza che, così modificato, amplifica armoniche di frequenza


più bassa e produce un timbro diverso.

108
3. FONETICA ACUSTICA

FIGU RA 3 . 1 7
Grafico F r/F2 dei valori medi delle vocali del francese

2500 •i

•e

2000

•y •E
riÉ

•0

F2 (Hz) 1500 •5
• ce
"'
• ce •a

•a

1000
• '.) • o

•u •o •o

500
200 300 400 500 600 700 800
Fl (Hzl
Fonte: dati di Delattre, 19-6:;:, p. 49.

Nel caso delle vocali nasali (cfr. ancora FIG . 3.17) interviene anche
la cavità nasale, caratterizzata da alcune risonanze supplementari
e, soprattutto, da forti antirisonanze che determinano in questi fo-
ni il tipico indebolimento di alcune componenti frequenziali. Si
vede che Fr tende a stabilizzarsi intorno ai 600 Hz, indipendente-
mente dal grado di apertura, e F 2 risulta leggermente più bassa
rispetto ai valori delle corrispondenti vocali orali.
Nella FIG . 3.18 sono rappresentati, in alto, i sonagrammi dei
dittonghi italiani [ai] e [au] pronunciati in laboratorio. Il tracciato
dei sonagrammi mostra bene la continuità della transizione tra la
fase iniziale e la fase finale dei dittonghi.
MANUALE DI FONETICA

FIGURA 3.18
Sonagrammi a banda larga dei dittonghi [ai] e [au] realizzati isolatamente in
laboratorio (in alto) ed estratti da sequenze di parlato spontaneo (in basso)

.. .
• D>SPG 0 . 80088<
-----------•-.. ---•······--·------·--·--·----•-··---·······--·------·-··---
0)

H
:i:
•···•·•••• .. ········-••B,A-1:
y

In basso sono rappresentati i sonagrammi degli stessi dittonghi


estratti da una sequenza di parlato spontaneo ipoarticolato (rispet-
tivamente ['laiko] e ['mauro]). Il tracciato del sonagramma mo-
stra bene l'assenza di porzioni iniziali e finali stazionarie dei dit-
tonghi, così che essi consistono di fatto solo della porzione cen-
trale dinamica.

3.2.3. Le consonanti

Mentre le vocali costituiscono, da molti punti di vista incluso


quello spettroacustico, una categoria molto omogenea di foni, le

110
3. FONETI CA ACUS TICA

FIGU R A 3. 1 9
Consonanti occlusive. Le formanti considerate sono quelle evidenziate con un
trattino orizzontale
a)
• B>SPG 0 )
N -•·- ·-

.. .
N
:i:

a 'p a 't a 'k


b)
• B >SPG 0)
~

'
"
:i:

a
.••

'b a 'd a a 'g a

a) sonagrammi a banda larga delle sequenze [a'pal, [a' tal. [a' ka]; b) sonagrammi a banda larga delle
sequenze [a'ba]. [a'dal, [a'ga].

consonanti, al contrario, presentano grandi differenziazioni dovute


essenzialmente alla varieta dei modi di articolazione.
r. Occlusive. Nelle occlusive, dal punto di vista spettroacustico, la
fase di occlusione non produce naturalmente alcun effetto, dal
momento che in quell'intervallo l'aria è bloccata dietro l'ostacolo.
La fase di esplosione, al contrario, produce un rumore abbastanza
intenso ma brevissimo. Essa è generalmente seguita da un ulterio-
re breve intervallo di silenzio (detto voT; cfr. PAR. 2.4.5 ) che pre-
cede il fono successivo.
Nella FIG. 3.19a sono rappresentati i sonagrammi di sequenze,

III
MAN U AL E DI FO N ETI C A

pronunciate in laboratorio, contenenti le occlusive sorde dell'italia-


no ([p, t, k]) e in 3.19b quelli relativi alle sonore ([b, d, g]).
Nel tracciato delle occlusive sorde, in corrispondenza della
fase di occlusione, si osserva l'assenza di qualunque traccia sona-
grafìca; in corrispondenza della fase dell'esplosione, molto breve,
si osserva una sottile riga verticale, detta spike; in corrispondenza
del VOT, infine, si osserva un'altra brevissima zona di assenza di
traccia.
Nelle occlusive sonore le tracce dell'esplosione e del VOT sono
molto meno evidenti. In conseguenza dell'attività laringea che ac-
compagna la loro articolazione si osserva per tutta la durata della
occlusione una formante di bassa frequenza, detta barra sonora.
' La principale traccia sonagrafìca delle occlusive è dunque lo
spike. Questo è però, specialmente nel parlato ipoarticolato, spes-
so molto debole o addirittura assente, a causa dell'indebolimento
dell'articolazione (cfr. PAR. 2.4.6 e FIG. 3.20a) .
In FIG. 3.20b è presentata una sequenza contenente una occlu-
siva sorda iperarticolata con uno spike molto evidente e un lungo
VOT, che corrisponde ali' aspirazione.
Nei casi, non frequenti, in cui lo spike sia ben visibile, il suo
spettro può costituire un elemento per differenziare le occlusive in
base al luogo di articolazione.
Ma l'identificazione sonagrafìca del luogo di articolazione del-
le occlusive si basa non tanto sulle caratteristiche del segmento
consonantico in sé, quanto su quelle delle vocali che precedono
e/ o seguono la consonante. Infatti, negli esempi riportati nella
FIG . 3.19a e b, si può osservare come le formanti della vocale [a]
presentino, in prossimità della consonante, nette deviazioni verso
il basso o verso l'alto, a seconda della consonante con cui sono a
contatto. Queste deviazioni sono dette transizioni /ormantiche e
rappresentano la traccia sonagrafìca della rapida variazione della
forma del condotto vocale nel momento in cui l'articolazione vo-
calica si sposta verso quella consonantica e viceversa. La frequen-
za di Fr si abbassa nel passaggio da un fono più aperto (la voca-
le) a uno più chiuso (la consonante), poiché la frequenza di Fr,
come abbiamo visto, è funzione del grado di apertura (natural-
mente l'inverso accade nel passare dalla consonante alla vocale).
La transizione di F2 , invece, corrisponde alla variazione del luo-
go di articolazione nel passaggio dalla vocale alla consonante o
viceversa.

112
3 . FONETICA AC USTICA

FIGURA 3.20
Sonagrammi a banda larga della sequenza [a'pa]
a)
• B>SPG 0.1181188( 0>

.
N -·· ------. ·- --- .. ----------
:,:

a
!

·0 ~
. ee0
- - - - - -- - - - -YiMe
~ (sec>
------------- 1
1 . 003
a 'p
b)
• B>SPG 0 . 00088( 8)
i. . '. .
.
N -----···•···········-·····-
:,:
V

a
La sequenza è realizzata: a) in modo ipoarticolato; b) in modo iperarticolato con allungamento del VOT e
aspirazione.

Nella FIG. 3.r9a e b si vede che la prima formante di [a] presenta


in tutti i casi una deviazione verso il basso per tutti i luoghi di
articolazione consonantici. Le transizioni della seconda formante
consentono invece di identificare il luogo di articolazione: infatti le
consonanti bilabiali attirano la F2 di [a] verso il basso (transizione
discendente); le alveolari la lasciano quasi inalterata (transizione
costante o leggermente ascendente); le velari la attirano invece
verso l'alto (transizione ascendente).
2 . Fricative. Dal punto di vista spettroacustico il rumore delle fri-
cative si manifesta in modo diverso a seconda che siano sorde o
M ANUAL E DI FONETI C A

sonore. Infatti in queste ultime il rumore è a volte meno intenso e


può presentare tracce evidenti di una struttura formantica.
Le fricative sorde presentano nel sonagramma un diffuso e
irregolare annerimento che si estende verticalmente attraverso
un'ampia banda di frequenze e che lungo l'asse orizzontale si
mantiene abbastanza costante per tutta la durata della conso-
nante.
Nella FIG. 3.21a sono riprodotti i sonagrammi delle fricative
sorde [f' e, S, f, x].
Le frequenze attraverso le quali si estende il rumore sono di-
verse a seconda del luogo di articolazione: il rumore della labio-
dentale [f] e della dentale [0] ha la banda più ampia, e va dai
2.000 agli 8.000 Hz; l'alveolare [s] ha una prevalenza delle com-
ponenti più alte (4.000-8.000 Hz); la palatale [f] ha una preva-
lenza di quelle tra i 2.000 e i 6.000 Hz; la velare [x] ha una di-
stribuzione discontinua dell'energia in una banda ampia.
Nella FIG. 3.21b sono riprodotti i sonagrammi delle sonore
[v, ò, z, 3, y]. Come si vede, la traccia del rumore è presente in
maniera evidente solo nell'alveolare [z] e nella palatale [3], men-
tre [v, ò, y] presentano scarse tracce di rumore e una struttura
formantica ben definita che le avvicina alle approssimanti (cfr. p.
115). Tutti i sonagrammi presentano naturalmente la barra so-
nora.
Poiché ciascuna fricativa è riconoscibile nel sonagramma o per
il suo rumore o per la sua struttura formantica, le transizioni voca-
liche non sono determinanti per l'identificazione dei diversi luoghi
di articolazione. Tuttavia, quando le si osserva, si riscontra un
comportamento analogo a quello descritto per le occlusive.
3. Affricate. Dal punto di vista spettroacustico, le affricate (FIG.
3.22a e b) si manifestano con una parte iniziale di assenza di trac-
cia (corrispondente alla fase occlusiva) e una parte finale (frizione)
analoga al tracciato delle fricative. Le affricate sonore presentano
la barra nella parte bassa del sonagramma.
La fase fricativa consente di distinguere le affricate alveolari
(rumore a frequenze più alte) dalle palatali (rumore a frequenze
più basse) . L'osservazione delle transizioni, infine, conferma l' esi-
stenza di foci distinti per i diversi luoghi di articolazione.
4. Nasali. Le manifestazioni spettroacustiche delle nasali (cfr. FIG .
3.23) mostrano una struttura formantica simile a quella delle voca-
li, ma molto più debole.
3. FONETICA ACUSTICA

FIGURA 3.21
Consonanti fricative
a)
• B>SPG 0.23238( 0)

'a f a 'a 0 a 'a s a 'a JJ 'a x a

b)

IUlllll TiMe (sec) 3.861


'a V 'a ò 'a z a 'a 3 a 'a y a

a) sonagrammi a banda stretta delle sequenze ('afa], ['a0a], ('asa] , ['aJJal, ('axa]; b) sonagrammi a
banda larga delle sequenze ['ava] , ['aòa], ('aza], ('a3a], ('aya].

115
MANUALE DI FONETICA

FIGURA 3.22
Consonanti affricate
a)
• B>SPG
1········ · ······-···. ,----••"••· 0.088118( 0)

(D,f - - - - - - - - ~ ~ t ì i " -

N -···.. ·--· ···-----•---------··


:i:

IUl61l 2.287
'a tt 'a Il I
b)
0.0011118( 8)

-----------------•-•-----•··--- ...----··-. ---

"N
:i:

TiM@! (sec> 2.265


'a dd a 'a dd 3

a) sonagrammi a banda larga delle sequenze ('attsa], ['attJa]; b) sonagrammi a banda larga delle sequen-
ze ('addza] , ['add3a].

II6
3. FONETICA ACUSTIC A

La F 1 ha in tutti i casi una frequenza di circa 300 Hz, mentre


la F 2 ha una frequenza diversa in relazione al luogo di articolazio-
ne: più bassa per la bilabiale [m] e per la labiodentale [IIJ] (intor-
no ai 1.000 Hz); intermedia per la alveolare [n] (intorno ai 1.300
Hz); alta per la palatale [J1] (intorno ai 2.000 Hz) e per la velare
[IJ] (intorno ai 2.500 Hz).
5. Laterali. La manifestazione spettroacustica delle laterali (cfr.
FIG. 3.24) mostra una struttura formantica simile a quella di una
vocale.
L'intensità delle formanti è intermedia tra quella delle vocali e
quella delle consonanti nasali.
La laterale alveolare [1] ha una F1 a circa 400-500 Hz e una
F2 a circa 1.200 Hz; la laterale palatale [i] ha una F1 a circa 300
Hz, e una F2 intorno ai 2.000 Hz.
6. Vibranti. Le vibranti si manifestano nel sonagramma (cfr. FIG.
3 .25 ) con una serie di brevissime fasi di silenzio (occlusioni) sepa-
rate da deboli spikes (esplosioni) e con la barra di sonorità (nel

FIGURA 3.23
Consonanti nasali: sonagrammi a banda larga delle sequenze ['amma], ['ail)va],
['anna], ['ajljla], ['al)ka]

• B>SPG 0.000811( Il>


1··· ~,~···•···········-· ··························-···········

' -·· ·

"H
:i:
"'.
1T

11 .11611 TiMe <sec) 'l.1111


'a mm a 'a llJ v a 'a nn a 'a JlJl a 'a o k a

II7
MANUALE DI FONETICA

FIGURA 3 . 24
Consonanti laterali: sonagrammi a banda larga delle sequenze ['ala], ['a,Cfa]

• B>SPG 0. llltll08( 8)

i:Ulllil TiMe ( sec ) 2.812

'a 'a

FIGURA 3.25
Consonanti vibranti: sonagramma a banda larga della sequenza ['ara]

• B>SPG 11 .0&263< 8)
r,. ________
Q

"H
:i:

ili..__ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
il .Ollll TiMe <sec) 2.'1811
'a

II8
3 . FONETICA AC USTI CA

FI GU R A 3 . 26
Consonanti approssimanti: sonagrammi a banda larga delle sequenze ('aja],
('awa]

• B>SPG
r -- 0 .00080( 0)

, - ·---·······--·
··---· ·•-r•··•·-•-- ·· --•- ··-•-·-·---

N
I
"'.
0'
t
li,

tiMe ( sec ) 2 . 8 118


'a 'a w

caso delle monovibranti si osserverebbe nel sonagramma un'unica


breve zona di interruzione del segnale compresa tra i foni che le
precedono e seguono) .
7. Approssimanti. La manifestazione spettroacustica delle appros-
simanti (sonore) mostra che esse sono di fatto delle articolazioni
vocaliche deboli, brevi e senza fasi stazionarie (FIG. 3.26).
Le occasionali manifestazioni sorde delle approssimanti presen-
tano caratteristiche sonagrafiche simili a quelle delle fricative.
Tutto ciò conferma le incertezze nella classificazione di questo
gruppo di foni.

3.3
Fonetica acustica intersegmentale

Le descrizioni delle vocali e delle consonanti che abbiamo dato


nei PARR. 3.2 .2 e 3 .2.3, e che sono basate su registrazioni di par-
lato iperarticolato, disegnano un quadro molto complesso ma ab-
bastanza regolare. In effetti, se si dispone del sonagramma di

119
MANUAL E DI FONETI CA

una sequenza fonica iperarticolata, con un po' di pratica si può


arrivare abbastanza presto a decifrarlo e a riconoscere la parola o
le parole rappresentate con una buona probabilità di successo. E
tuttavia, anche a questo livello, si pongono alcuni problemi per
l'individuazione dei confini tra un fono e il successivo. Infatti le
transizioni tra un fono e l'altro sono spesso graduali. Questo
comporta come prima conseguenza l'impossibilità di segmentare
le sequenze in unità dai confini sempre certi e definiti, come ci
si potrebbe aspettare. E ciò non tanto nel caso che abbiamo di-
scusso in maggior dettaglio, e cioè quello delle transizioni tra
consonante occlusiva e vocale (dove comunque rimane quasi
sempre una discontinuità abbastanza evidente tra i due foni),
quanto nel caso delle sequenze formate da vocali con nasali, late-
rali o approssimanti, nelle quali è spesso molto difficile o addi-
rittura impossibile stabilire una qualunque soluzione di continuità
tra i segmenti (come si può facilmente verificare ritornando alle
FIGG. 3.23, 3.24 e 3.26).
Nel caso di sequenze formate da due vocali, per esempio nei
dittonghi (cfr. anche pp. 109-10 e FIG. 3. r8), si osserva uno dei
casi più macroscopici di insegmentabilità.

FIGURA 3.27
Sonagrammi a banda larga delle sequenze ['vi:ni] e ['vi:di]

• B>SPG

.
N --· ·------·----·. ---·•··~••-

N
:,:

.
o·'"'"
'v i: n 'v i: cl

Una conseguenza della coarticolazione è la nasalizzazione delle vo-


cali adiacenti a consonanti nasali (p. 66). La FIG. 3.27 mostra i

120
3 . FONETI CA ACUSTI CA

F IGU RA 3 .2 8
Sonagramma a banda larga della sequenza giornalisti in parlato ipoarticolato (a) e
iperarticolato (b)
a)

if e '! Il e e
b)
• B>SPG
.
iB

N
:z:

8 . 1100

r n a 'I

sonagrammi di [i] in contesto nasale (['vi:ni]) e in contesto orale


(['vi:di]): appaiono chiaramente tracce di antirisonanze nasali nel-
la [i:] tonica di ['vi:ni] e di una formante nasale supplementare
nella [i] finale.
Nelle FIGG . 3.28 e 3.29 diamo due esempi di sonagrammi di
sequenze ipoarticolate (a) confrontate con le stesse sequenze pro-
nunciate in modo iperarticolato (b).
Nella FIG. 3.28b (giornalisti) e in 3.29b (n ell'amministrazione) è
possibile riconoscere i tratti acustici e i segmenti fonici previsti.
Viceversa, in 3.28a e in 3.29a si osserva una profonda destruttura-
zione delle stesse sequenze.

1 21
MANUALE DI FONETICA

FIGURA 3.29
Sonagramma a banda larga della sequenza nell'amministrazione in parlato ipoarti-
colato (a) e iperarticolato (b)
a)

b)

n e ll a mmi n s t r a 'tt o: n e

In giornalisti di FIG . 3.28a l'affricata iniziale non presenta barra


sonora; la presunta [o] presenta una F1 di 420 Hz e una F2 di
1.720 Hz, e corrisponde a [e]; il gruppo [rn] risulta semplificato e
simile a una laterale; la [a] si manifesta con una F1 di 580 Hz e
una F2 di 1.400 ed è dunque medio-bassa; [1] non ha alcun corri-
spettivo spettrografico; la [i] tonica si manifesta con una F 1 di
440 Hz e con una F2 di 2.200 Hz, e corrisponde quindi a una
[e]; nel gruppo [st] la manifestazione di [s] è conforme alle
aspettative, mentre manca qualsiasi traccia di [t]; infine, la [i] fi-
nale presenta una F1 di 440 Hz e una F2 di 2.000 Hz e dunque
ricade in pieno nell'area spettroacustica di [e]. La trascrizione fo-

122
3. FON ETIC A ACU STIC A

netica di giornalisti sarà dunque in questo caso [tfc'leese], molto


diverso dall'atteso [d3orna'listi].
Nella FIG. 3.29a la [e] ha una Fr di 480 Hz e una F2 di r.600
Hz, e corrisponde a [e]; [11] sparisce; la [a] ha una Fr di 640 Hz
e una F2 di r.520 Hz, e corrisponde a [re]); la [mm] si abbrevia;
la porzione [ini] è ridotta a [e], con una Fr di 480 Hz e una F2
di r.920; nella porzione [stra] è individuabile solo il segmento
[s:], con la scomparsa di [tr] e con un brevissimo segmento voca-
lico che ha una Fr di 480 Hz e una F2 di r.520 Hz; la parte
finale [t:sjo:ne] è ridotta a [tsc:], con un segmento vocalico lun-
go che, nella porzione centrale, ha una Fr di 480 Hz e una F2 di
r.800 Hz. Il tutto è diventato quindi [ncremes:~'tsc:], molto di-
verso dall'atteso [nellamministra'ttsjo:ne].
Riepilogando, il parlato ipoarticolato può manifestare desono-
rizzazioni ([d3] > [tJ]), semplificazioni di gruppi consonantici
([rn] > [1], [st] > [s], [str] > [s]), centralizzazione di vocali,
caduta di intere porzioni foniche. Per i meccanismi di interpreta-
zione linguistica di questi segnali così deteriorati, cfr. PAR. 4.6.

3.4
Fonetica acustica soprasegmentale

3-4-1. Durata

La durata è una variabile importante per la determinazione della


lunghezza di un fono, della prominenza accentuale, della velocità
di eloquio e dell'approssimarsi di una pausa. La misura strumenta-
le della durata si può avere solo su tracciati (oscillogrammi, sona-
grammi) che tengano conto della variabile tempo.
La possibilità di misurare la durata di una sequenza o delle
sue componenti è naturalmente subordinata alla possibilità di indi-
viduarne con esattezza i confini.

3.4.2. Intensità

Le variazioni dell'intensità hanno un importante ruolo nel deter-


minare la struttura sillabica della parola e la prominenza accentua-
le di una sillaba sulle altre. Vedremo ora in quale modo queste
variazioni si manifestano dal punto di vista spettroacustico.
Nei sonagrammi l'intensità è rappresentata dal grado di anneri-
mento della traccia. Tuttavia, per la natura stessa del sonagramma,

123
MANUALE DI FONETICA

FIGURA 3.30
Tracciato dell'intensità della sequenza ritorni domenica

• B>EHEJIGY 0 .00800 ( 30.70)

i 't o n i d o 'm e: n i k

le diverse componenti del segnale (armoniche, formanti, bande di


rumore ecc.), individuate secondo l'analisi di Fourier, sono rappre-
sentate separate l'una dall'altra, ciascuna più o meno annerita a se-
conda della rispettiva intensità. Dal punto di vista della fonetica
soprasegmentale, invece, quello che conta non è il rapporto tra le
intensità delle diverse componenti dello stesso segmento, bensì il
rapporto tra le intensità totali dei diversi segmenti.
Il miglior modo per osservare direttamente le variazioni del-
l'intensità totale del segnale è dunque quello di produrne un trac-
ciato indipendente, che viene definito curva dell'intensità o, più
esattamente, curva del!' intensità relativa, e cioè un grafico con il
tempo in ascissa e l'intensità (misurata in dB) in ordinata (cfr. FIG .
3.3o).
Nella figura si può riscontrare direttamente che le vocali pre-
sentano un'intensità maggiore delle consonanti, e che tra queste
ultime vi sono notevoli differenze in base alla scala di sonorità in-
trinseca (cfr. PAR. 2.5.3). Inoltre si vede chiaramente che le sillabe
toniche [tor] e [me:] presentano un'intensità maggiore rispetto
alle altre sillabe.

3-4-3. Frequenza fondamentale

Anche le variazioni della frequenza fondamentale (F indicate 0 ),

spesso anche con il termine inglese pitch, hanno un ruolo lingui-

124
3. FO NETI CA ACUSTICA

FlGURA 3.31
Tracciato della F 0 della sequenza ritorni domenica

• B>PITCH 8.11811118( 8)

! ..::.......... ............... ········· ····························•·· ······················· ···············:·: :::::::: .............


. ' ' . . . . . . ..... .
H
:,:
· . ... ' .
..... . . ' . . ......
• • --- • ----• . --•• •• • • -••• • ' ..... • ••-•· ••· •.•••••o • • • •• .. . • . .. . . . . . . .. . . O.O- .. • O. O . M,> • • •• O><• • ••n O•••- ••• • - -- •••v - • •-••• --- • • • .• •••• • • •O •••• •••• on•••

"''8.080
- - - - - - - - - - - -TiMe
- -(.aeo)
- - - - - - - - - - - -t - •
.3 17

i 't o n i d o 'm e: n i k

stico importantissimo, sia a livello di parola (nelle lingue ad accen-


to musicale e nelle lingue a toni), sia a livello di frase, in quanto
costituiscono il principale veicolo dell'intonazione (cfr. PAR. 2. 5 .4).
Ricordiamo che si può parlare di frequenza fondamentale solo per
i suoni periodici, dunque solo per i foni sonori.
Per osservare le variazioni di F O si fa ricorso a strumenti in
grado di estrarre dal segnale, e di rappresentare graficamente, una
curva della frequenza fondamentale (FIG. 3.31), cioè un grafico con
il tempo in ascissa e F O in ordinata, accompagnato da una scala in
Hertz che consente di apprezzare quantitativamente i valori assun-
ti istante per istante dalla F 0 •
La curva presenta delle interruzioni in corrispondenza delle
consonanti sorde, dove naturalmente lo strumento non può rileva-
re alcuna periodicità.

3.4-4- L'analisi prosodica

Per una descrizione completa delle caratteristiche prosodiche di


una sequenza è quindi necessario effettuare una serie di misurazio-
ni della durata, dell'intensità e della frequenza fondamentale in
corrispondenza dei diversi segmenti di cui è composta la sequen-
za. L'analisi degli andamenti di questi parametri consente di seg-
mentare un testo parlato in unità prosodiche, dette unità tonali o
TU (Tone-Units).

r25
MANUALE DI FO NETIC A

I confini tra le diverse unità tonali sono identificabili grazie


alla presenza, nella parte finale di ogni unità tonale, dei seguenti
fenomeni o, più spesso, di alcuni di essi.
1. Calo dell'intensità.
2. Calo della F0 •
3. Rallentamento della velocità di eloquio (aumento della durata
dei singoli foni), noto come allungamento prepausale.
4. Presenza di una pausa.
L'inizio della unità tonale successiva è segnalato invece con un
ritorno dei vari parametri ai valori medi del parlante.
L'unità tonale così individuata rappresenta una sequenza pro-
sodicamente indipendente, e corrisponde nello stesso tempo a
un'unità di informazione semanticamente e sintatticamente com-
patta, anche se non si può stabilire una corrispondenza diretta tra
le unità tonali e le unità di altro livello. Infatti l'unità tonale ha

FIGURA 3.32
In alto: tracciati dell'intensità (linea continua) e della F O (linea a punti) della se-
quenza sono troppi, mi sembra; in basso: sonagramma a banda larga della stessa
sequenza

."'
• C>ENEIIGY 0 . 110800( 48.89)

~ ..
· ~
~
~
·j N1"\J" ..
,··.\ '"' ..• >'°'\'..
-._/' ~,
/"' ---,.., .
····'~J:..✓ v---~
/' ..

s o n o 't r :, PP i m i 's e m br

126
3. FONETIC A ACUSTIC A

F I GU RA 3.33
In alto: tracciati dell'intensità (linea continua) e della F O (linea a punti) della
sequenza sono partiti (dichiarativa) ; in basso: sonagramma a banda larga della
stessa sequenza

• C>ENERGY

... ---- -- -- . - - - .. -- .. - . - . - - ----··---· --- -- . --- . --- _. ___ . -·-.


."'
U)

.
'O
·.· ✓:'v\Jv~
6 .9 1 •
Il >

"·""" 's o n o p a 't i:

una lunghezza limitata e dunque una struttura sintattica lunga può


risultare spezzata in due o più unità tonali. Nella FIG. 3.32 è rap-
presentata una sequenza articolata in due unità tonali.
L'andamento dei parametri prosodici consente anche di osser-
vare la struttura interna di ciascuna unità tonale. In particolare, le
loro variazioni consentono di classificare l'unità tonale come di-
chiarativa, interrogativa, sospensiva ecc. (cfr. FIGG . 3.33, 3.34 e
3.35) .
L'andamento dei parametri prosodici consente infine di osser-
vare i meccanismi di messa in rilievo di parti di un enunciato e
consente di verificare, ad esempio, l'effettiva presenza delle promi-
nenze accentuali sulle sillabe previste oppure la loro scomparsa,
definita deaccentazione (FIG . 3.36).
L'analisi strumentale è dunque, come si vede, in grado, a diffe-
renza di quella uditiva, di fornire una grande quantità di dati, di
misure molto sottili, accurate e verificabili. Ma proprio questa

127
MANUALE DI FONETICA

FIGURA 3.34
In alto: tracciati dell'intensità (linea continua) e della F O (linea a punti) della
sequenza sono partiti? (interrogativa); in basso: sonagramma a banda larga della
stessa sequenza

>ENERGY 8 . 110e80< 48.86 )

's o n o p a 't i:

FIGURA 3.35
In alto: tracciati dell'intensità (linea continua) e della F O (linea a punti) della
sequenza sono partiti... (sospensiva); in basso: sonagramma a banda larga della
stessa sequenza

• C>ENERGY 8 . 08888( 511.74)

's o n o p a 't i:

128
3. FONETICA ACUSTI CA

FI GURA 3.36
Tracciati dell'intensità (linea continua) e della F 0 (linea a punti) della sequenza
farà molto caldo, con evidente deaccentazione di molto

• B>ENEIIGY
1· ....... . ········•······· •···· •· · .. ·•··· 0 ..08888( _ 52.58)

B . 1Hn1 TiMe <!lec> 1 _395

'r a m o I t o 'k a d o

grande quantità di dati analitici disponibili rende al tempo stesso


complesso e faticoso il lavoro di sistemazione di questi dati in un
modello di rappresentazione più generale e schematico sul quale
avviare la riflessione linguistica.

3.5
Gli strumenti
per lo studio della fonetica acustica

La strumentazione utilizzata nello studio della fonetica acustica è


estremamente varia e complessa. Qui ci limiteremo a dare alcune
informazioni generali sui metodi e sugli strumenti di uso più co-
mune.
L'acquisizione. L'acquisizione avviene attraverso un microfono
che trasduce il segnale da meccanico a elettrico; il segnale così tra-
sdotto viene memorizzato su un supporto magnetico o elettroni-
co.
Il microfono può essere collocato in una cabina di registrazione
o ali' aperto, a seconda delle finalità dell'acquisizione.
Il segnale può naturalmente provenire anche da un registratore
a bobine, a cassette, a dischi digitali, a videocassette o da un ap-
parecchio radiotelevisivo. .
La digitalizzazione. I moderni sistemi di analisi spettroacustica
sono basati su tecniche computerizzate. Il segnale acquisito, quale

129
MANUAL E D I FONETI CA

che ne sia la fonte, viene campionato, cioè dal segnale vengono


prelevati e misurati dei campioni (una campionatura media di se-
gnali di interesse linguistico prevede dai ro.ooo ai 20.000 campio-
ni per secondo; una campionatura per supporti ad alta fedeltà può
raggiungere i 44.000 campioni per secondo). Il segnale campiona-
to viene digitalizzato, cioè trasformato in informazione binaria e
conservato sotto forma di file su dischetti o su disco rigido in un
computer.
L'analisi. Gli strumenti di analisi si possono suddividere in
due gruppi:
a) computer espressamente costruiti per eseguire analisi spettroa-
custiche ed esclusivamente dedicati ad esse, come lo spettrografo
digitale;
b) schede dedicate ad analisi spettroacustiche da inserire in per-
sona! computer, ormai sempre più diffusa.
Si tratta in ambedue i casi di strumenti completi e versatili in
grado di eseguire in tempo reale (cioè in un tempo così breve da
apparire nullo all'operatore) analisi di moltissimi tipi, tra cui:
- sonagrammi con diversi filtri di larghezza di banda compresa
tra 15 e 600 Hz (e quindi analisi a banda larga e stretta di qua-
lunque segnale fonico umano);
- spettrogrammi istantanei e spettrogrammi medi di intervalli di
segnale selezionati dall'operatore;
- oscillogrammi;
- curve dell'intensità;
- curve della frequenza fondamentale.
I tracciati sono visibili su schermo a colori e possono essere
stampati. Lo spettrografo digitale permette di effettuare tutte le
suddette analisi su segnali di qualunque durata compresa tra pochi
millesimi di secondo e 2 minuti e di osservare sul monitor i relati-
vi tracciati nella scala temporale che l'operatore ritiene più ap-
propriata.
Un'altra importante funzione è quella dell'ascolto selettivo,
cioè la possibilità di "ritagliare" porzioni di segnale di qualunque
durata e di ascoltarle isolatamente.
Le stesse porzioni possono anche essere montate e riascoltate
in qualunque ordine.
Per ogni tipo di tracciato, oltre all' evidenziazione grafica su

130
3 . FONETIC A ACUSTICA

monitor, è prevista la possibilità di eseguire misurazioni delle va-


riabili desiderate (frequenze in Hz, intensità in dB, durate in ms)
puntando cursori mobili sulle porzioni di segnale che interessano,
e i valori richiesti appaiono in tempo reale in apposite finestre del-
lo schermo.

1 31
4
Fon etica uditiva e percettiva

4.1
Aspetti generali

4. r. r. La fonetica dell'ascoltatore

Alla fisiologia dell'udito e ai meccanismi di interpretazione centra-


le del segnale i linguisti e i fonetisti prestano in genere meno at-
tenzione che non ai processi di produzione. Ciò avviene per un
vasto complesso di ragioni, tra le quali ha un grande peso il fatto
che i meccanismi della ricezione presentano, rispetto a quelli della
produzione, una minore "visibilità" , perché sono processi intera-
mente interni, non osservabili direttamente dal parlante comune,
né dal linguista o dal fonetista, ma solo dall'anatomo-fisiologo, per
quanto riguarda la componente sensoriale e neurologica della rice-
zione, e dallo psicologo per la componente mentale del processo.
Inoltre, ha molto pesato la diffusa convinzione di una essenzia-
le simmetria tra i procedimenti della codifica del segnale da parte
del parlante e della sua decodifica da parte dell'ascoltatore. Tale
simmetria rendeva dunque superfluo occuparsi della ricezione, dal
momento che si dava per scontato che le sue fasi rispecchiassero
quasi perfettamente, sia pure in ordine capovolto, i meccanismi
della produzione.
Vi sono invece oggi ragioni, che si dimostrano essere sempre
più numerose via via che procedono le ricerche sulla percezione
linguistica, le quali inducono a negare l'esistenza della presunta
simmetria tra produzione e ricezione e a postulare, nell'ascoltato-
re, l'esistenza di meccanismi profondamente diversi da quelli attivi
nel parlante, non soltanto nella fase periferica ma anche e soprat-
tutto in quella centrale.
Inoltre, proprio dagli studi sulla percezione linguistica, emer-
gono elementi che possono gettare nuova luce sugli stessi mecca-

1 33
M ANU AL E DI FO E TI CA

nismi della produzione: infatti negli ultimi decenni sono stati ela-
borati modelli teorici che assegnano un ruolo fondamentale, nella
fase della produzione, all' autopercezione 1 da parte del parlante
della propria produzione fonica.
Un altro aspetto dei processi di decodifica, molto discusso ne-
gli ultimi anni anche da alcuni fonetisti, è quello del ruolo che vi
svolgono da un lato le caratteristiche oggettive del segnale stesso e
dall'altro le conoscenze già possedute dall'ascoltatore. È sempre
più evidente infatti che, nella grande maggioranza delle situazioni
comunicative reali, l'ascoltatore riconosce il segnale e ne individua
il significato sia in base alla percezione diretta della sostanza foni-
ca che il parlante gli ha inviato, sia in base alla propria conoscen-
za generale della situazione in cui avviene la comunicazione, alla
sua precedente esperienza extralinguistica e alle sue previsioni ri-
guardo al messaggio che sta per ricevere (cfr. PAR. 4.6).

4.1.2. I meccanismi della ricezione

L'intero procedimento della ricezione del segnale fonico-acustico


da parte dell'ascoltatore può essere suddiviso in due fasi: una fase
peri/erica, in cui il segnale viene raccolto e analizzato nell'orecchio
e poi inviato al cervello, e una fase centrale, in cui il risultato della
prima fase viene interpretato dall'ascoltatore e in cui viene com-
preso il significato del segnale ricevuto.
Il complesso procedimento che porta dalla vibrazione delle
molecole dell'aria fino all'interpretazione del segnale può essere
così schematizzato.
r. Le vibrazioni acustiche del mezzo (l'aria) che costituiscono il
segnale vengono captate dall'orecchio esterno.
2. Esse sono poi trasformate in impulsi meccanici, cioè in vibra-
zioni di particolari strutture anatomiche, che fanno parte del co-
siddetto orecchio medio.
3. Queste vibrazioni, a loro volta, sono convertite, nell'orecchio
interno, in vibrazioni di un mezzo liquido, le quali inducono uno
spostamento della membrana basilare.
4. I movimenti della membrana basilare sono trasdotti in impulsi

r . Per "autopercezione" si intende qui non solo la percezione uditiva della


propria voce da parte del parlante, ma anche la "propriocezione" , cioè la perce-
zione dei movimenti dei propri organi fonatori.

1 34
4. FONETI C A U DITIVA E PE RCETTI VA

nervosi, cioè elettrici, dall'organo del Corti, il vero e proprio orga-


no sensoriale, che si trova a contatto con la membrana basilare.
5. Gli impulsi nervosi sono trasmessi lungo il nervo acustico, at-
traverso vari centri intermedi, fino al cervello.
6. Qui gli impulsi raggiungono la corteccia uditiva, cioè quella
parte della corteccia cerebrale situata in ciascun lobo temporale
del cervello, nella quale ha luogo la conversione dei suoni in rap-
presentazioni mentali e la loro associazione ad un significato.
Le prime cinque tappe costituiscono la fase periferica e la se-
sta quella centrale.

4.2
Anatomia e fisiologia dell'apparato uditivo

4.2.1. L'orecchio

Le strutture dell'orecchio sono connesse sia alla funzione dell'udi-


to sia a quella dell'equilibrio. In questa sede descriveremo solo i
meccanismi uditivi. A differenza di quanto visto per gli organi del-
1' apparato fonatorio, la cui funzione primaria non è la fonazione,
l'udito è una funzione primaria dell'orecchio che è perfettamente
sviluppata e funzionante già prima della nascita.
Per raggiungere le strutture sensoriali vere e proprie, situate
nella parte più interna dell'orecchio, il segnale deve penetrare at-
traverso un sistema di canali, membrane, cavità, ossicini (FIG.
4.r).
L'orecchio esterno è costituito dal padiglione e dal condotto udi-
tivo esterno.
Il padiglione è la parte visibile dell'orecchio situata a ciascuno
dei due lati del capo. La sua particolare forma ha la proprietà di
rinforzare il suono.
Il condotto uditivo esterno è un canale che conduce dal padi-
glione al timpano. Le onde sonore captate dal padiglione percor-
rono questo canale, che ha anche la proprietà di amplificarle, e
raggiungono il timpano.
In fondo al condotto uditivo esterno si trova la membrana
del timpano, un sottile organo di forma circolare e sezione coni-
ca, che separa completamente l'orecchio esterno dall'orecchio
medio. Le vibrazioni dell'aria che attraverso l'orecchio esterno
raggiungono il timpano si trasmettono a questa membrana, che

1 35
MANUALE DI FONETICA

FIGURA 4.1

a) Rappresentazione dell'orecchio

Elice

Anielice -

Membrana
timpanica - .ak.:.:;w~==
Meato
acustico
esterno Platina della
staffa che scopre
la finestra ovale

Lobulo
Tuba di
Eustachio
che si apre
nel rinofa-
ringe

b) Rappresentazione dell'orecchio medio e interno

4) successivamente
trasmesse al dotto
cocleare esse deter-
2) causando così la minano degli impulsi
vibrazione degli ossi- nervosi i quali ven ·
3) le vibrazioni del
cini e di conseguenza gono poi trasportaci
suono passano attra•
il movimento della al cervello attraverso
verso la finestra ova-
platina della staffa ..
le fino a raggiungere
il nervo cocleare.
il canale spirale della
coclea pieno di liqui-
do ..

uno spostamento
della Membrana
Timpanica ...

timpanica

Fonte: adattata da poster Viennatone ®.


4. FONET IC A UDITIVA E PERCETTIVA

FIGURA 4.2
In alto: rappresentazione schematica della coclea, vista in sezione verticale; in
basso a destra: dettaglio

Canale endo-
linfat ico

Cetl ute di Cort i

Membrana
di Re issner

Cana le endo -
linfat ico

Membrana
bas i lare

Rampa timpanica

Fonte: Calogero, 1983, p. 56 .

è particolarmente elastica, trasformandosi così m vibrazioni di


un corpo solido.
Al di là del timpano si trova, scavata nell'osso temporale, una
piccola cavità, detta cavo del timpano (questa cavità è collegata,
tramite un canale detto tuba di Eustachio, con la faringe).
Dal lato opposto al timpano, il cavo del timpano presenta due
piccoli fori: uno superiore, ovale, detto finestra ovale, e uno infe-
riore, rotondo, detto finestra rotonda, che separano l'orecchio me-
dio dall'orecchio interno.
Una catena di tre ossicini, chiamati rispettivamente, per la loro
forma, martello, incudine e sta/fa, attraversa orizzontalmente il

1 37
MANUALE D I FONETI CA

cavo del timpano, collegando la membrana del timpano alla fine-


stra ovale, su cui poggia la base della staffa, che la chiude com-
pletamente.
Questa catena di ossicini ha la delicatissima funzione di tra-
smettere le vibrazioni dal timpano fino all'orecchio interno, e ha
anche la proprietà di amplificare tali vibrazioni, sia a causa del
gioco favorevole di leve che si stabilisce tra gli ossicini, sia grazie
al fatto che la superficie della finestra ovale è circa venti volte più
piccola di quella del timpano e dunque la stessa potenza sonora vi
esercita una pressione sonora venti volte maggiore.
I due fori che si trovano nella parte più interna dell'orecchio
medio, la finestra ovale, su cui poggia la staffa, e la finestra ro-
tonda, che è chiusa da una membrana detta timpano secondario,
separano l'orecchio medio dall'orecchio interno. Questo è costi-
tuito dall'organo dell'equilibrio, o labirinto, di cui qui non ci oc-
cuperemo, e dall'organo dell'udito, detto coclea (cfr. FIGG . 4.1b e
4.2).
La finestra ovale e la finestra rotonda sono collegate da un
lungo e stretto canale, pieno di un liquido detto perilinfa. Questo
canale parte dalla finestra ovale e a metà della sua lunghezza torna
indietro e raggiunge la finestra rotonda. La prima parte del canale,
quella che si allontana dall'orecchio medio, è detta scala vestibola-
re, la seconda, che ritorna verso l'orecchio medio, scala timpanica;
il punto di svolta si chiama elicotrema .
Tra le due scale è situato un altro canale, il dotto cocleare o
canale endolinfatico, che corre parallelo alle scale vestibolare e tim-
panica, ma senza comunicare con esse, ed è pieno di un liquido
detto endolinfa (FIG. 4.2).
Lungo tutta la parete interna del dotto cocleare, dalla parte
della scala timpanica, si stende l'organo sensoriale vero e proprio,
detto organo del Corti, che pure è disposto parallelamente alle due
scale e al dotto cocleare stesso.
Due membrane separano la scala media dalle altre due scale:
la membrana di Reissner separa la scala media dalla scala vestibo-
lare; la membrana basilare separa la scala media dalla scala timpa-
nica. Sulla membrana basilare è poggiato l'organo del Corti.
Questo insieme di strutture parallele, formato dalle due scale,
vestibolare e timpanica, dal dotto cocleare e dall'organo del Corti,
non si presenta però disposto linearmente e disteso per tutta la
4 . FONETICA U DITIVA E PERCETTI VA

sua lunghezza, ma è arrotolato su se stesso, formando una spirale


composta da due giri e tre quarti. Questa spirale ha il tipico
aspetto di una chiocciola, da cui il nome di coclea (FIG. 4. ra).
Quando un suono raggiunge l'orecchio, le vibrazioni, attraver-
so il timpano e la catena degli ossicini, raggiungono la finestra
ovale dov'è poggiata la staffa, come abbiamo già visto sopra. La
successione dei movimenti della staffa si trasmette alla perilinfa
che riempie la scala vestibolare e crea in questa onde di pressione
e di depressione che percorrono la scala vestibolare e poi, doppia-
ta l'elicotrema, tornano indietro lungo la scala timpanica, fino a
raggiungere la finestra rotonda.
All'organo del Corti è affidato il compito forse più delicato al-
l'interno di tutta la lunga serie di passaggi che conducono dal fe-
nomeno acustico alla sensazione uditiva. Qui, infatti, la vibrazione
che si è trasmessa dal sistema fonatorio del parlante attraverso l'a-
ria, l'orecchio esterno, l'orecchio medio e la perilinfa dell'orecchio
interno, viene trasformata in impulsi nervosi che sono poi inviati
al cervello. Per comprendere bene la fisiologia dell'organo del
Corti sarà prima necessario soffermarsi sommariamente sulla sua
struttura anatomica (FIG. 4.2) .
L'organo del Corti, come abbiamo detto, si trova al di sopra
della membrana basilare, ed è esteso per tutta la lunghezza della
coclea, avvolto a spirale come tutte le altre strutture che compon-
gono la parte uditiva dell'orecchio interno. L'organo del Corti è
costituito da uno strato di cellule di cui alcune hanno una sem-
plice funzione di sostegno, e altre, ben più importanti, svolgono la
funzione sensoriale vera e propria. Queste ultime, dette cellule ci-
liate, hanno forma lunga e sottile, e alla loro estremità inferiore
sono fissate alla membrana basilare. Sono divise in una fila di cel-
lule ciliate interne, che svolgono il ruolo principale, e tre file di
cellule ciliate esterne, che hanno un ruolo attivo di controllo del-
1' ampiezza delle oscillazioni della membrana basilare, attenuando
le oscillazioni troppo ampie, che potrebbero essere dannose per le
cellule interne, e rinforzando quelle più deboli. Queste cellule
sono dette ciliate poiché presentano, all'estremità libera, un gran
numero di sottili filamenti, detti ciglia, o stereociglia. Al di sopra
delle stereociglia fluttua nell'endolinfa una lamina gelatinosa detta
membrana tectoria, nella quale vanno ad inserirsi o ad appoggiarsi
le stereociglia.

1 39
MANUALE 0 1 FONETI CA

L'estremità inferiore di ciascuna delle cellule ciliate interne è


in contatto con delle terminazioni nervose che costituiscono i pro-
lungamenti periferici delle cellule (neuroni) del nervo acustico.
Il funzionamento dell'organo del Corti è molto complesso, e
qui lo descriveremo in maniera semplificata.
I movimenti della staffa nella finestra ovale si trasmettono,
come abbiamo accennato, alla perilinfa e generano in essa delle
onde di pressione. Si vengono così a creare differenze di pressione
tra la scala vestibolare della coclea e la scala timpanica, ai due lati
dell'organo del Corti. L'effetto di tale meccanismo è una vibrazio-
ne della membrana basilare sotto forma di un'onda che viaggia
lungo tale membrana dalla sua base (cioè dalla finestra ovale) ver-
so l'apice (l'estremità opposta, in corrispondenza dell' elicotrema).
Poiché la membrana diventa più spessa e più elastica via via che ci
si sposta dalla base verso l'apice, un'onda che si propaga lungo la
membrana basilare produce oscillazioni di ampiezza diversa nei
diversi punti della membrana stessa. In particolare, i segnali di fre-
quenza più alta producono oscillazioni di massima ampiezza nella
parte della membrana più vicina alla finestra ovale, mentre le bas-
se frequenze provocano la risposta massima verso l'apice della co-
clea. In sintesi, si può dire che conoscendo la frequenza del se-
gnale ricevuto si può prevedere in quale punto la membrana basi-
lare darà una risposta massima, e viceversa, osservando la reazione
della membrana, si può dedurre la frequenza del segnale. Questa
caratteristica della coclea è detta tonotopicità (FIG . 4.3).
È ancora più interessante osservare che, quando la coclea è
raggiunta da un segnale complesso, la sua reazione equivale in
pratica ad un'analisi spettrografica eseguita con un banco di filtri,
in quanto le diverse componenti del segnale inducono risposte se-
parate nei diversi punti della coclea corrispondenti alle loro rispet-
tive frequenze, con ampiezze proporzionali alle loro rispettive
ampiezze.
I complessi movimenti di oscillazione della membrana basilare
sopra descritti si trasmettono alle cellule ciliate interne che, come
abbiamo visto sopra nei cenni anatomici, sono poggiate sulla
membrana. Lo spostamento delle cellule ciliate fa sì che le loro
ciglia vengano a contatto con la membrana tectoria che le sovra-
sta, con un conseguente spostamento delle ciglia. Questo sposta-
mento produce un'eccitazione elettrica nelle cellule ciliate stesse,
4. FONETICA UD ITI VA E PERCETTIVA

F IGUR A 4 .3
Tonotopicità della coclea: rappresentazione schematica della membrana basilare
in relazione alla frequenza

Fonte: Borden, Harris, 1984, p. 174.

che si trasmette ai neuroni del nervo acustico e si propaga infine


verso il sistema nervoso centrale.
In ogni istante, dunque, la stimolazione delle terminazioni ner-
vose riflette la struttura acustica del segnale (nelle sue componenti
udibili: cfr. PAR. 4.3.r), in quanto si generano impulsi corrispon-
denti alle parti della coclea che reagiscono alle componenti di fre-
quenza presenti nel segnale.

4.2.2. Il nervo acustico e la corteccia uditiva

Le cellule ciliate, come abbiamo visto, sono in contatto con i pro-


lungamenti periferici dei neuroni del nervo acustico. Tutte queste
MAN UAL E DI FONETI C A

fibre, provenienti dalla coclea, si uniscono e corrono insieme verso


il ganglio spirale, così chiamato perché si trova al centro della spi-
rale formata dalla coclea, dove si trovano i corpi cellulari dei neu-
roni. Dal ganglio spirale altri prolungamenti di questi stessi neuro-
ni si dirigono verso nuclei nervosi più centrali, in cui le stimola-
zioni vengono trasmesse ad altri neuroni e così via, in almeno
quattro tappe intermedie, finché l'impulso raggiunge, nel cervello,
la corteccia uditiva. È importante notare che le fibre uditive prove-
nienti rispettivamente dall'orecchio destro e dall'orecchio sinistro
si incrociano a più riprese, in modo tale che l'informazione che
raggiunge alla fine ciascuno dei due emisferi del cervello proviene
contemporaneamente dalle due coclee.
L'area del cervello che presiede alla ricezione delle sensazioni
uditive, detta appunto corteccia uditiva, costituisce una parte del
lobo temporale, cioè di quella parte del cervello che si trova a cia-
scuno dei due lati del capo. Qui l'organizzazione topografica, già
vista nella coclea con la separazione delle diverse frequenze, e
conservata poi in tutte le fasi della trasmissione lungo il nervo
acustico, si ripete ancora una volta, così che anche sulla corteccia
si possono identificare le aree corrispondenti alle diverse frequen-
ze, disposte in maniera ordinata dalle più alte alle più basse. Si
può dire dunque che tutte le parti del sistema uditivo, dalla coclea
alla corteccia, conservano l'importante caratteristica della tonoto-
picità.

4.3
Elementi di psicoacustica

Nonostante la complessità, la delicatezza e la precisione dei mec-


canismi che consentono di captare il suono, di trasformarlo in mo-
vimenti meccanici, di codificarlo in impulsi nervosi, e di trasmette-
re questi ultimi al cervello, non bisogna credere che esista una re-
lazione banale e automatica tra le caratteristiche oggettive dei suo-
ni e le sensazioni che l'ascoltatore riceve. Al contrario, il rapporto
tra l'acustica e la psicologia è estremamente complesso e viene stu-
diato da una branca della psicologia detta psicoacustica.
In particolare, la psicoacustica studia:
a) i confini tra l'insieme dei fenomeni acustici che possono essere
percepiti dall'uomo e l'insieme dei fenomeni mediamente non udi-
4. FONETI C A UDITI VA E P E RCETTI VA

bili (sia in condizioni normali, sia, eventualmente, m condizioni


patologiche) (cfr. PAR. 4.3.r);
b) la capacità dell'uomo di discriminare le differenze tra suoni di-
versi e di individuare le soglie al di sotto delle quali tali differenze
non sono percepite (PAR. 4.3.2);
e) la relazione tra le grandezze oggettive (frequenza, intensità, du-
rata) e quelle soggettive (altezza, volume, lunghezza) dei suoni, 2

determinando quali sono le scale soggettive lungo le quali si di-


spongono le sensazioni uditive (PAR. 4.3.4).

4.3 .r. Il campo uditivo

È esperienza comune che un suono il cui volume decresca pro-


gressivamente (sia perché la sorgente effettivamente si indebolisca
gradualmente o perché essa si sposti, allontanandosi dall'ascoltato-
re) da un certo momento in poi sembra sparire del tutto. È altret-
tanto comune, purtroppo, l'esperienza opposta: quando un suono
cresce di intensità, a un certo punto alla sensazione uditiva si ac-
compagna una sensazione prima di fastidio e poi di vero e proprio
dolore. Non è invece altrettanto evidente, ma è altrettanto vero,
che il nostro orecchio non percepisce suoni di frequenza inferiore
a 20 Hz (infrasuoni) e superiore al 20.000 Hz (ultrasuoni), quale
che sia la loro intensità. Il limite inferiore di intensità, al di sotto
del quale non si ha più, mediamente, alcuna percezione è detto in
psicoacustica soglia dell'udito; quello superiore, oltre il quale la
sensazione è dolorosa, è detto soglia del dolore.
L'intensità della soglia dell'udito non è la stessa per tutti i suo-
ni, ma varia in funzione della loro frequenza. In altri termini, per
ogni diversa frequenza esistono diverse soglie. La frequenza di
3.500 Hz è quella che presenta la più bassa soglia uditiva: un suo-
no di questa frequenza rimane udibile anche se la sua intensità
scende fino a -4 dB. Allo stesso livello di intensità, invece, suoni
di frequenza superiore o inferiore ai 3.500 Hz non saranno udibi-
li. Per udirli, bisognerà che la loro intensità cresca fino ad essere
uguale o maggiore della corrispondente soglia dell'udito.
La soglia del dolore ha invece un valore quasi costante per tut-
te le frequenze, di circa 140 dB.

2 . I corrispondenti inglesi dei primi due termini, molto usati, sono rispetti-
vamente pitch e loudness.

1 43
MANUALE DI FONETICA

FIGU RA 4.4
Il campo di udibilità

IO 1 40 SOGLIA DEL DOLOR


o'"'
e: 120
o
Cl)

Q)
e: ,......, 100 •,
o
'M _J
[Il o... 80 °'· ,t---,--+--t---l----+- -+- -+---11---
.U) (/)
Q)
'-- CD 60
o... 'O
'M '-'
-o 40
o
,..... SOGLIA
,..... 20
CD DELL'UDITO
> ( MAF)
o

20 50 100 200 500 lK . 2 K 5K 10K 20K

Frequenza ( Hz )
Fonte: Ferrero et al., 1979, p. 40.

Nella FIG. 4.4 presentiamo un grafico frequenza-intensità, nel qua-


le una linea inferiore indica la soglia dell'udito e una superiore in-
dica la soglia del dolore. L'insieme dei suoni udibili dall'orecchio
umano normoudente, compresi tra queste due soglie, è detto cam-
po uditivo o campo di udibilità. In situazioni patologiche o, fisiolo-
gicamente, con il crescere dell'età, il campo uditivo va riducendo-
si, con il graduale innalzamento della soglia uditiva e con l' abbas-
samento della soglia del dolore. Si perde inoltre col tempo la ca-
pacità di percepire le frequenze alte.

4.3.2. Discriminazione del suono

L'insieme dei suoni che costituiscono il campo uditivo può essere


considerato, dal punto di vista acustico, un continuum, sia per la
frequenza, sia per l'intensità. Il sistema uditivo, tuttavia, non è in

1 44
4. FO NETI C A UDITIVA E PERC ETTIVA

grado di riconoscere differenze troppo piccole di frequenza o di


intensità. Quando sentiamo suoni oggettivamente differenti, ma
molto vicini tra loro per frequenza e/o intensità, essi ci sembrano
soggettivamente uguali. La minima differenza percepibile tra due
suoni è detta soglia differenziale.
Per quanto riguarda l'intensità, la soglia differenziale varia tra
0,5 e r dB. La migliore discriminabilità, cioè la più bassa soglia
differenziale, riguarda i suoni di intensità compresa tra i 20 e i
roo dB, e di frequenza tra i r.ooo e i 3.000 Hz, cioè in pratica
tutto il settore centrale del campo uditivo. In altri termini, se un
soggetto riceve due segnali rispettivamente di 40 dB e 40, r dB,
non percepirà alcuna differenza di intensità, in quanto la differen-
za di o,r dB si trova al di sotto della soglia differenziale; se invece
sentirà due segnali, uno di 40 dB e uno di 40,5 dB, si accorgerà
che il secondo è più forte del primo.
Per la frequenza, invece, bisogna ricorrere ad una soglia diffe-
renziale percentuale, perché il fattore che agisce più significativa-
mente nel determinare la discriminabilità tra due suoni di diversa
frequenza è il rapporto tra le due frequenze e non la differenza
assoluta. Cioè, ad esempio, una differenza di r Hz viene ricono-
sciuta tra due toni di roo e ro r Hz (differenza dell' r % ) ma non
tra due toni di 2.000 e 2.oor Hz (differenza dello 0,05%). Gene-
ralizzando, si può dire che la soglia differenziale percentuale di
frequenza oscilla tra lo o, r % e lo 0,2 % , con variazioni anche no-
tevoli in relazione alla frequenza, all'intensità e anche alla durata
dello stimolo.
La soglia differenziale per la discriminazione di stimoli di di-
versa durata varia a seconda della frequenza degli stimoli stessi.
La soglia è di r-2 ms per frequenze tra 2.000 e 4.000 Hz, di 2-4
ms per frequenze intorno ai r .ooo Hz.

4.3.3. Bande critiche

Nel PAR. 4.2.r abbiamo visto che l'orecchio analizza il segnale in


maniera analoga a un banco di filtri. Possiamo ora precisare che
mentre i banchi di filtri degli analizzatori spettroacustici hanno fil-
tri a larghezza di banda costante, l'orecchio si comporta come un
banco di filtri a larghezza di banda variabile: a banda stretta per le
basse frequenze e a banda sempre più larga via via che aumentano

1 45
MANUALE DI FO N ETIC A

le frequenze. Di conseguenza piccole variazioni di frequenza han-


no rilevanza percettiva alle basse frequenze e non alle alte. Cia-
scuno dei filtri ideali che costituiscono questo banco ha una lar-
ghezza di banda detta banda critica. Se due diverse componenti
dello spettro di un segnale ricadono nella stessa banda critica esse
vengono percepite come un'unica componente.

4. 3 + Scale percettive

Prendiamo due suoni di uguale frequenza, poniamo 400 Hz, e di


diversa intensità, poniamo 30 e 40 dB rispettivamente. Questi due
suoni si situano all'interno del campo uditivo e sono quindi udibi-
li; inoltre la loro differenza di intensità supera di gran lunga la
soglia differenziale e perciò vengono percepiti da qualunque ascol-
tatore come decisamente diversi l'uno dall'altro per il volume.
Prendiamo poi altri due suoni, pure di 400 Hz, ma di intensità
rispettivamente di 70 e di 80 dB. Anche questi sono perfettamente
udibili e agevolmente discriminabili tra loro come i primi. Ogget-
tivamente la differenza di intensità tra questi ultimi due suoni è
esattamente la stessa che nel primo caso, cioè di ro dB. La psicoa-
custica ha dimostrato che un ascoltatore ha la sensazione che la
differenza tra i due suoni sia maggiore nel primo caso e minore
nel secondo, nonostante che le due distanze siano oggettivamente
uguali.
In termini più generali: la scala soggettiva lungo la quale si di-
stribuiscono le sensazioni uditive non riflette perfettamente la sca-
la oggettiva, perché la prima risulta a volte più dilatata e a volte
più compressa della seconda. La psicoacustica ha elaborato delle
scale e ha fissato specifiche unità di misura per dare conto di que-
sta diversa distribuzione delle sensazioni rispetto ai dati oggettivi.
Per quello che riguarda l'intensità, nella FIG. 4.5 è rappresenta-
to, in un grafico frequenza-ampiezza, il campo uditivo percorso da
una serie di curve dette curve di iso/onia.
Ognuna di queste curve è disegnata in modo tale che tutti i
suoi punti, benché dotati oggettivamente di intensità diversa,
producono uguali effetti soggettivi di sensazione sonora. Esiste
inoltre una convenzione per la quale, come si può notare, c'è
una perfetta corrispondenza tra il livello di sensazione sonora e
l'intensità oggettiva del segnale per tutti gli stimoli di frequenza

146
4. FONETICA UDITIVA E PERCETTIVA

FIGURA 4.5
Curve di isofonia

(fon)

---
...J
~
V,
14 0

130 ~
I~
"'-
I'----. ,__ . I,!
l I
"'
~
130"" ',,,v11 ,
0s I"-.

:----" ,__"-k
.......
r-
-- l I

I I
12~'---.. r--
,,~....._ 1.--'I /
I-- i.-' /
i.I

I/
I
L.,
..._...

r---...,,

~
--
100
10v-......_
~ r--... '-,-..._
r---
!
9~ '--... ,I ,, I'..
e: 90

~ ~ '-r---
~ ~ . ........ - ,;vj,,
~ 80
\: :---.,r---
...........
r----.... - i j
--i
I 80 "'
----..... i/ i;-
'\
'--
Q)
e:
70
(~
\~ :(' ~'
I\. ..... r---..__ - . n ; 5-
I I 70 :
r------.._ V:Y
'\

'\
'--
.Q
(/)
60

50
~~
' " l'r----.... I 5::;
['-... '-----1..., vvr \"
~ ,"-'-:--,' ----..... -L l,{ ,,r \ -
...c.
-
r....._~,._ I
40 40
I

"'~r---... ~
- :. . . /i, 1 ~
---
1, .'
30 ' 30
15 20
~"'- I
20
...........
c- "'1/ -1r--v
o ',, l'--..... ........... __.. /
J~' ;--'.,
,o
---- - - - 10 _
Q)
.::!
...J
o
I
4 ·- -
r---..
' --
__ ,
_,, ,/ , i
I
.
o o
~
g
N
000000
g~~~i2

Frequenza (Hz)
Ogni curva unisce tutti i punti del campo di udibilità che producono lo stesso livello di sensazione
sonora.
Fonte: Ferrero et ai., 1979, p. 46.

pari a r.ooo Hz. Uno stimolo che si trovi sulla curva di isofonia
contrassegnata dal valore 40, come per esempio uno stimolo di
60 Hz e 60 dB (cfr. ancora FIG. 4.5), produrrà dunque la stessa
sensazione di volume di uno stimolo di r .ooo Hz di frequenza e
di 40 dB di intensità. Si dirà anche che questo suono, qualunque
sia la sua intensità oggettiva, ha un livello di sensazione sonora di
40 /on.
Analogamente, per definire le relazioni tra la sensazione di al-
tezza indotta da un suono i~ un ascoltatore e la frequenza oggetti-
vamente misurata di questo suono, si è stabilita un'altra scala sog-
gettiva, la cui unità di misura è il mel. Per convenzione, si assegna
ad un suono di r .ooo Hz e di 40 dB un valore di r .ooo mel. Il

1 47
MANUALE or FONETIC A

FIGURA 4.6
Relazione tra frequenza e sensazione di altezza per un tono di 40 dB

3500
rl

_§ 3000 ~V
<l::
N 2500
I
I
N
w
1-
..J 2000
<l::
-rl
U 1500 •
·/
w
Z .
o 1000 ..... - - - -- - - - - I
H
N
~ 500
I ~
V:
z ~ I
V
w
(/) o
20
-- ~
50 100 200 500 lk
I
I

2k 5k 10k 20:.

FREQUENZA (Hz)
Fonte: Ferrero et al., 1979, p. ,:4.

suono di 40 dB che produce una sensazione soggettiva di altezza


doppia del primo avrà un valore di 2.000 mel. Se la scala soggetti-
va rispecchiasse esattamente le caratteristiche acustiche dei segnali,
il secondo suono dovrebbe avere una frequenza di 2 .ooo Hz. Ma,
come abbiamo detto sopra, non è così, e la sensazione di 2.000
mel viene indotta da un suono di 3 . 120 Hz, cioè di frequenza più
che triplicata rispetto al primo.
Nella FIG . 4.6 riportiamo un grafico che mostra la relazione tra
frequenza, in Hz, e sensazione di altezza, in mel, per suoni di 40
dB di intensità.
Per la valutazione della percezione delle differenti altezze si fa
ricorso anche a una scala di tipo musicale, basata sul concetto di
ottava. Un'ottava è la distanza tra due frequenze f, e f tale per 2

cui f/f, = 2 (la frequenza maggiore è il doppio di quella mino-


4. FONETIC A U DITIVA E PERCETTI VA

re). Dividendo questo intervallo in 12 sezioni si ottengono i co-


siddetti semitoni, ciascuno dei quali corrisponde a una variazione
di frequenza del 6%. Se ( = roo Hz l'intervallo del primo semi-
tono sarà tra roo e ro6 Hz, l'intervallo del secondo sarà tra ro6 e
112,36 Hz, l'intervallo del terzo sarà tra n2,36 e 119,r e così via.
L'intervallo di ciascun semitono non è dunque costante ma varia
in rapporto alla frequenza di riferimento ed è dunque una gran-
dezza relativa.
Ma le considerazioni presentate fino ad ora sono basate su
toni puri (segnali semplici), costanti, presentati isolatamente agli
ascoltatori. Come sappiamo, invece, i suoni linguistici sono se-
gnali complessi (periodici e aperiodici), dotati di grande variabili-
tà e prodotti in rapida successione con sensibili fenomeni di
coarticolazione (cfr. PAR. 4.4). Sono s~ate quindi messe a punto
scale percettive che tendono a simulare i processi soggettivi della
percezione.
Di questa la più diffusa è la scala in bark (dal nome di Bar-
khausen, studioso di psicoacustica) che corrisponde a una suddivi-
sione delle frequenze udibili (da r6ho a r6ho.ooo Hz) in 24 ban-
de di larghezza variabile, modellate sulle bande critiche del siste-
ma uditivo umano. In questo modo è possibile tenere conto anche
delle differenze dei valori in frequenza delle formanti di foni pro-
nunciati da soggetti con caratteristiche articolatorie diverse.
Per la valutazione delle variazioni di frequenza della curva del
pitch (cfr. PAR. 3-4-3), si fa ricorso alla scala in semitoni (calcolata
però in modo più complesso di quello che abbiamo ricordato
poco fa).

4.4
La percezione dei suoni linguistici

A proposito della percezione dei suoni non linguistici, abbiamo vi-


sto che i quesiti a cui la psicoacustica cerca di rispondere sono:
a) se un suono sia udibile;
b) se sia percepito come diverso da un altro suono simile ma non
identico;
e) lungo quali scale soggettive si dispongano i suoni percepiti.
Nel caso della percezione dei foni, invece, i quesiti principali
sono:

1 49
MA N UALE DI FON E TIC A

a) quaH caratteristiche ne consentano l'identificazione, cioè l'asse-


gnazione ad una determinata classe;
b) come si determinino nella nostra mente i confini che separano
tali classi (categorizzazione);
c) quale ruolo abbiano in questi processi gli altri livelli linguistici
come la morfologia, la sintassi, la semantica, e come avvenga l'in-
tegrazione tra i vari livelli;
d) in che modo interagiscano i processi della produzione e della
percezione in uno stesso parlante/ascoltatore.

4-4-r. I test

Per rispondere ai quesiti circa la categorizzazione e l'identificazio-


ne di suoni linguistici si fa ricorso a test percettivi di vario tipo.
I test di discriminazione servono a valutare la capacità degli
ascoltatori di riconoscere differenze tra suoni diversi. In questi test
si somministrano coppie di stimoli chiedendo a gruppi di ascolta-
tori di dire se sono identici o diversi. Ciò consente, valutando in
termini percentuali le risposte dei diversi soggetti, di individuare
soglie medie di discriminabilità tra suoni simili.
I test di identificazione servono a stabilire come vengano classi-
ficati i suoni da parte di gruppi di ascoltatori. In questi test si
somministrano sequenze di stimoli che variano regolarmente lungo
un continuum chiedendo ai soggetti di assegnare a ciascuno stimo-
lo l'etichetta fonetica che giudicano opportuna. Ciò consente di
individuare i confini percèttivi medi tra un fono e un altro.
Gli stimoli usati per questi tipi di test sono di norma stimoli
sintetici, cioè costruiti artificialmente in laboratorio, il che consen-
te di somministrare stimoli esattamente rispondenti alle esigenze
del test.

4-4-2. Percezione dei segmenti: vocali

Come abbiamo visto nel PAR. 3.2.2, i parametri fisici necessari e


sufficienti ad una classificazione acustica delle vocali sono le fre-
quenze di F1 e di F2. Abbiamo visto anche che un modo sintetico
per rappresentare le vocali dal punto di vista acustico è un grafico
F1-F2 (FIGG. 3.15, 3.16, 3.17). Possiamo dunque immaginare l'in-
sieme teorico di tutte le vocali possibili come un'area di forma po-
ligonale, all'interno di un grafico F1-F2.

150
4. FONETICA UDITIVA E PERCETTIVA

Questo spazio acustico vocalico è un continuum perché, all'in-


terno dei suoi confini, sono possibili tutte le frequenze formanti-
che, sia per Fr, sia per F2 e quindi, teoricamente, esso contiene
infiniti suoni vocalici acusticamente distinti l'uno dall'altro.
Dal punto di vista percettivo le cose stanno in maniera più
complessa.
I test di discriminazione servono, in questo caso, a valutare la
capacità degli ascoltatori di riconoscere differenze tra vocali. Se
dei soggetti ascoltano suoni vocalici con frequenze formantiche
molto simili (ma che comunque presentano differenze superiori a
una certa soglia di discriminabilità), essi sono in grado di percepi-
re la differenza e di confermare che si tratta di oggetti distinti. In
questo senso si dice che la discriminazione delle vocali è continua,
perché anche piccole differenze sono riconosciute e confermate
dagli ascoltatori.
I test di identificazione servono, invece, a identificare i confini
percettivi tra i suoni vocalici. Si osserva che nel continuum degli
stimoli l'assegnazione di uno stimolo a una classe cambia brusca-
mente in corrispondenza di determinati valori della variabile. Que-
sti punti critici corrispondono ai confini percettivi tra le vocali
(FIG. 4.7).

FIGURA 4.7
I risultati di un test di identificazione di stimoli vocalici

risposte

2 3 4 5 6 7 8 9 10 11 12 13
stimoli
--- a ------fil-- e --o-- e --o-- i
Gli stimoli, numerati da I a 13, variavano per i valori F, e F2 lungo un continuum compreso tra [a] e [i].
Fon /e; Cercato et al., 1994, p. 439-

15 I
MANUALE DI FONETICA

FIGURA 4.8
Sistema vocalico inglese in gruppi di uomini (linea continua), donne (linea trat-
teggiata), bambini (linea doppia) in un grafico Fr/F2

F2 (Hz)

[
Li_ __..____..____.,_____ _1_ _ __..___ _- - - ' - - - - - - - ' - - - '

Fl (Hz)
Fonte: Lieberman, Blumstein, 1988, p. 178.

Si osserva cioè che se due stimoli vocalici acusticamente molto vi-


cini si trovano a cavallo di uno di questi punti critici vengono as-
segnati a classi diverse; se invece i due stimoli si trovano lontani
da confini, vengono riconosciuti come la stessa vocale. In questo
senso si dice che l'identificazione delle vocali è discontinua , in
quanto l'assegnazione ad una categoria o all'altra awiene per salti,
lungo precisi confini percettivi.
Ciò conferma che il riconoscimento delle vocali awiene in una
maniera che dipende molto significativamente dall'esperienza lin-

152
4. FONETIC A U DITIVA E PERCETTI VA

guistica dell'ascoltatore. Ognuno di noi, in base alla propria espe-


rienza, interiorizza i confini previsti dal sistema vocalico della lin-
gua materna e categorizza secondo questo sistema tutti i suoni vo-
calici uditi (comprese le vocali di lingue straniere sconosciute, che
vengono anch'esse identificate secondo il sistema della lingua ma-
terna).
Nella percezione delle vocali va considerato il fenomeno della
normalizzazione del condotto vocale. Com'è ovvio, l'apparato fona-
torio varia, entro certi limiti, per dimensioni e forma da individuo
a individuo. Ciò è particolarmente evidente quando si confrontano
tra loro uomini, donne e bambini. Le diverse dimensioni determi-
nano caratteristiche acustiche diverse nelle vocali prodotte. In ge-
nerale, si osserva che quanto minori sono le dimensioni del con-
dotto vocale, tanto più alte sono le frequenze delle formanti delle
vocali.
Nella FIG. 4.8 sono riportate le realizzazioni delle vocali inglesi
prodotte da gruppi di uomini, donne e bambini.
Come si vede, l'intero spazio vocalico si sposta, senza però che
cambino le relazioni tra le vocali: si conserva cioè lo stesso sistema
di rapporti. Per identificare una vocale, l'ascoltatore deve tenere
conto di queste differenze. La FIG. 4.8 infatti mostra come, ad
esempio, una [a] maschile possa coincidere quasi perfettamente
con una [:-,] infantile, e così via. L'ascoltatore dovrà dunque fare
un'operazione di calcolo delle relazioni tra le diverse vocali, detta,
appunto, normalizzazione del condotto vocale. Questa operazione si
basa anche su una valutazione della frequenza fondamentale, che è
un indizio del sesso, dell'età e della corporatura del parlante. Solo
dopo questa operazione l'ascoltatore potrà assegnare con sicurezza
uno stimolo vocalico a una classe o all'altra.
Bisogna infine ricordare che anche il contesto consonantico
esercita un ruolo importante nel modificare le caratteristiche acu-
stiche delle vocali. Le consonanti palatali e velari, ad esempio, ten-
dono ad anteriorizzare l'articolazione delle vocali adiacenti, deter-
minando un innalzamento di F2, mentre viceversa le consonanti
bilabiali e labiodentali hanno l'effetto di posteriorizzarla e di ab-
bassare il valore di F2. L'ascoltatore deve quindi essere in grado
di "sottrarre" questo effetto del contesto consonantico in cui la
vocale si trova.

1 53
MA NU AL E DI FONETI C A

4.4.3. Percezione dei segmenti: consonanti

Il riconoscimento delle occlusive [p, t, k, b, d, g] è affidato alla


loro tipica struttura acustica, costituita da una fase di silenzio e da
una rapida esplosione. L'identificazione del luogo di articolazione
di una occlusiva rappresenta invece un problema particolarmente
delicato della fonetica percettiva. È vero che l'esplosione contiene
spesso sufficiente informazione per identificare il luogo di articola-
zione, poiché il suo spettro ha caratteristiche diverse per bilabiali,
alveolari e velari. Si deve tuttavia osservare che spesso il rumore
dell'esplosione è troppo debole per essere chiaramente udibile o è
coperto dal rumore di fondo, oppure è completamente assente.
Inoltre, i risultati di test di identificazione hanno dimostrato che,
cancellando artificialmente l'esplosione di un 'occlusiva, quest'ulti-
ma rimane comunque identificabile. Le transizioni formantiche
delle vocali adiacenti consentono dunque di distinguere tra occlu-
sive bilabiali, alveolari e velari, anche in assenza di qualunque in-
formazione intrinseca al segmento consonantico.
Il riconoscimento della sonorità delle occlusive è affidato alla
presenza della periodicità dovuta alla vibrazione laringea. In molte
lingue, come hanno dimostrato i risultati di numerosi test di di-
scriminazione, concorre al riconoscimento anche la diversa durata
del VOT, che risulta più lungo nelle sorde che nelle sonore.
Rispetto alle occlusive, le fricative sono percettivamente molto
più autonome, nel senso che le loro caratteristiche acustiche in-
trinseche sono generalmente sufficienti per il loro riconoscimento.
Il ruolo più importante è svolto dalle caratteristiche spettrali del
rumore di frizione e dalla sua intensità; per la sonorità è determi-
nante la presenza di periodicità. Anche le transizioni formantiche
contribuiscono all'identificazione del luogo di articolazione e della
sonorità, ma la cancellazione artificiale del rumore impedisce di
individuare il modo di articolazione e conduce alla percezione del-
l'occlusiva corrispondente: se, ad esempio, dalla sequenza ['asa]
sopprimiamo il rumore fricativo, il risultato sarà la corretta indivi-
duazione del luogo dentale e della sordità, ma il modo di articola-
zione percepito sarà quello occlusivo e la sequenza sarà ricono-
sciuta come ['ata].
Il riconoscimento delle affricate è affidato alla loro configura-
zione acustica di silenzio più rumore di frizione. L'identificazione
del luogo di articolazione e della sonorità delle affricate è affidato

1 54
4. FONETI CA UDITI VA E PERCETTI VA

tutto alla porzione fricativa e avviene secondo le modalità già de-


scritte per le fricative.
La percezione della nasalità consonantica è in gran parte affi-
data alle vocali adiacenti che, a causa di un fenomeno pressoché
generale di coarticolazione, si nasalizzano. Ad esempio, in sequen-
ze come ['vini] e ['vidi] la discriminazione tra [n] e [d] non è
affidata solo alle caratteristiche delle consonanti in sé ma anche, e
soprattutto, a quelle delle vocali adiacenti. Infatti, se una conso-
nante nasale, come ad esempio [n], viene fatta seguire artificial-
mente da una vocale non nasalizzata, il risultato percettivo tende a
essere quello di una [d]; se invece si fa seguire ad una consonante
orale come [d] una vocale nasalizzata, il risultato percettivo preva-
lente è [n]. Dunque il riconoscimento della nasalità di una conso-
nante è affidato prevalentemente alle caratteristiche delle vocali
adiacenti.
Il riconoscimento di laterali e approssimanti è affidato alla loro
struttura formantica, alla direzione e alla velocità delle transizioni.
Il riconoscimento delle vibranti, come la [r] dell'italiano e del-
lo spagnolo o come la [R] del francese e del tedesco, è affidato
alla percezione di una breve periodicità di bassissima frequenza
generata nel tratto superiore del condotto fonatorio da una rapida
successione di occlusioni e rilasci.

4.5
Cenni sulle principali teorie della percezione linguistica

Daremo ora conto, molto brevemente, di alcune tra le più impor-


tanti teorie generali che sono state proposte per spiegare global-
mente i meccanismi della percezione linguistica nell'uomo. Nessu-
no tra questi modelli ha ancora fornito risposte giudicate soddi-
sfacenti dall'intera comunità scientifica, ma tutti, in vario modo,
hanno contribuito alla discussione che da alcuni decenni si è svi-
luppata su questo problema. Classificheremo queste teorie in teo-
rie passive (o non-mediate) e teorie attive (o mediate).
Le prime descrivono la percezione come un processo in cui il
ricevente ha un ruolo passivo, di semplice decodifica del segnale,
che viene quindi considerato di per sé sufficiente per l'identifica-
zione del contenuto del messaggio, senza alcuna mediazione da
parte dell'ascoltatore.
Le seconde attribuiscono invece ali' ascoltatore un ruolo attivo,

1 55
M ANU AL E D I FONETI CA

di confronto tra le caratteristiche oggettive del segnale e le forme


immagazzinate nella memoria, in modo tale che il riconoscimento
del parlato possa awenire solo in seguito alla mediazione del ri-
cevente.

4. 5. r. Teorie passive

La più significativa è la teoria acustica di Gunnar Fant. Alla base


di questo approccio è il concetto di tratto distintivo: le strutture
sensoriali periferiche e centrali dell'ascoltatore sarebbero in grado
di riconoscere nel segnale acustico le caratteristiche fisiche che
corrispondono ai diversi tratti distintivi (per esempio: presenza di
periodicità = sonoro; presenza di antirisonanze = nasale ecc.), e
che sarebbero dunque sufficienti a trasmettere tutta l'informazione
relativa alla sequenza prodotta dal parlante.
A partire dall'individuazione delle caratteristiche distintive il
ricevente ricostruisce quindi prima i segmenti, e poi le sillabe, i
morfemi, le parole, le frasi. Il procedimento è del tipo bottom-up,
cioè dal basso verso l'alto, nel senso che dalle unità di livello infe-
riore (tratti, foni ecc.) si risale via via a quelle di livello superiore
(parole, frasi, testi) , ma soprattutto nel senso che dall'analisi peri-
ferica (uditiva) si risale ai livelli centrali, che non intervengono at-
tivamente nel processo. Percezione e produzione sono due sistemi
separati e paralleli, che hanno direzioni opposte.

4.5.2. Teorie attive

Le due pm note sono la teoria motoria di A. M. Liberman e la


teoria detta della Analysis-by-Synthesis di K. Stevens e M. Halle.
La teoria motoria è basata sull'assunto che il processo della
percezione e quello della produzione siano intimamente collegati
nel parlante/ ascoltatore. Chi riceve un segnale, secondo questo ap-
proccio, opererebbe un confronto tra le caratteristiche acustiche
del segnale stesso, individuate dal sistema uditivo, e i gesti artico-
latori necessari per produrre un segnale analogo. Solo dopo aver
ricostruito interiormente i movimenti articolatori corrispondenti al
segnale udito, l'ascoltatore sarebbe in grado di riconoscere il seg-
mento.
La ragione principale addotta dai sostenitori della teoria moto-
ria nel postulare il loro modello sta nella constatazione dell'assen-
4. FONETICA UDITJ V A E PERCETTIVA

za di invarianza acustica nel segnale. Per quale ragione e in quale


maniera, essi si chiedono, segnali fisicamente diversi, come le rea-
lizzazioni di uno stesso fono in contesti che determinano differen-
ti effetti coarticolatori, verrebbero percepiti e riconosciuti come
identici dall'ascoltatore? Secondo la teoria motoria, la risposta sta
nell'invarianza a livello motorio: se segnali oggettivamente diversi
vengono prodotti con gli stessi movimenti degli organi articolatori,
o meglio, con gli stessi comandi neuromotori da parte del sistema
nervoso centrale, solo un confronto tra il segnale ricevuto e i co-
mandi necessari per riprodurlo può risolvere positivamente il pro-
blema dell'invarianza. Questa si troverebbe dunque non nel segna-
le ma negli schemi neuromotori.
Se, dunque, la teoria acustica, e le teorie passive in genere, po-
tevano definirsi del tipo bottom-up, la teoria motoria ha invece la
caratteristica opposta, quella cioè di ipotizzare alla base della de-
codifica del segnale un processo interiore di codifica, e quindi una
direzione che va dal livello "alto" degli schemi neuromotori a
quello "basso" del riconoscimento dei segmenti e dei tratti. Que-
sto secondo tipo di modello è definito top-down, cioè dall'alto ver-
so il basso.
Nel modello detto Analysis-by-Synthesis, Stevens e Halle postu-
lano l'esistenza di un primo livello di analisi uditiva del segnale
che ne identifica la struttura acustica e consente di stabilire in pri-
ma approssimazione un'ipotesi di sequenza fonica. In base a que-
sta prima ipotesi, l'ascoltatore seleziona interiormente le sequenze
con le quali la sequenza udita potrebbe essere identificata. Infine,
un livello più alto di analisi linguistica consente di selezionare la
più soddisfacente tra le sequenze evocate. Anche questo modello è
del tipo top-down, giacché la decodifica avviene a partire dalla ge-
nerazione di ipotesi da comparare con il risultato dell'analisi uditi-
va periferica.

4.6
Percezione del parlato continuo

Nei CAPP. 2 e 3 sono stati descritti numerosi fenomeni segmentali


e soprasegmentali propri del parlato ipoarticolato, cioè del parlato
continuo spontaneo. Questi fenomeni (maggiore velocità di elo-
quio, forte aumento degli effetti di coarticolazione, presenza diffu-
sa di sostituzioni o perdite di tratti fonetici, di interi foni o anche

157
MANUA L E DI FONETICA

di parti più lunghe di una sequenza) mostrano come la percezione


di questa forma di parlato sia un processo complesso e come la
sua descrizione sia problematica.
Se si parte da una lunga porzione di parlato continuo, che ri-
sulti perfettamente comprensibile agli ascoltatori, e se ne isolano
artificialmente piccole porzioni della lunghezza, ad esempio, di
una sola parola, le stesse sequenze, che inserite nel loro contesto
risultavano perfettamente decodificabili, diventano ora in molti
casi irriconoscibili. Che cosa è accaduto? Evidentemente la parola
in questione è stata pronunciata in maniera tale da risentire in mi-
sura notevole dei fenomeni sopra elencati, ed è quindi costituita
oggettivamente da una sequenza di segmenti diversa da quella pre-
vista, per cui naturalmente chi l'ascolta isolatamente non è in gra-
do di riconoscerla. Se però essa è reinserita nel suo contesto di
discorso, allora, per quanto deteriorata, viene immediatamente ri-
conosciuta. Per di più, se si interrogano a questo riguardo gli
ascoltatori, essi affermano di non aver notato alcuna particolarità,
alcun deterioramento nella parola. L'hanno sentita cioè non per
quello che materialmente è, ma come avrebbe dovuto essere se-
condo le loro attese.
Questo fenomeno dimostra che, evidentemente, nella perce-
zione del parlato continuo subentrano meccanismi differenti da
quelli che operano nel caso di brevi sequenze isolate. Nel caso
del parlato continuo interviene in misura determinante ciò che
potremmo definire un calcolo di previsione da parte dell'ascolta-
tore: sulla base di quanto egli già conosce del discorso del suo
interlocutore, delle sue conoscenze generali sull'argomento discus-
so, della sintassi della lingua usata nella comunicazione in corso,
del suo lessico, della sua fonologia, del significato complessivo
dell'enunciato, l'ascoltatore si "aspetta" in un certo punto una
determinata parola, o una tra poche alternative possibili, e il suo
compito è quello di verificare se la sequenza che riceve corri-
sponde alla sua previsione.
Va infine sottolineato il ruolo determinante svolto dal ritmo
(alternanza di sillabe forti e sillabe deboli) e della prosodia (anda-
mento di Fo) nei processi di segmentazione e di interpretazione
del parlato continuo.
L'interazione tra l'analisi del segnale in sé da parte dell'ascolta-
tore e le informazioni esterne al segnale di cui egli dispone è rap-
presentata nel diagramma di FIG . r .2 (già presentato e commenta-
4. FONETICA U DITIVA E PERCETTIVA

to nel PAR. 1.3.2). Il ruolo di questa informazione esterna al se-


gnale è stato trascurato dalle -diverse teorie della percezione che
abbiamo esaminato nel paragrafo precedente, e pertanto queste
teorie non sembrano adeguate a rendere conto di tutti i meccani-
smi reali della comunicazione parlata. Questo aspetto è invece
preso in considerazione nella teoria cosiddetta H&H (Hyper- and
Hypo-speech) di B. Lindblom, di cui la FIG. 1.2 rappresenta una
sintesi efficace.
La decodifica del parlato, dunque, non è sempre rappresenta-
bile in questi termini: «Ho percepito questa sequenza di foni che
costituisce questa parola che ha questo significato», bensì, molto
spesso, in questi altri termini: «Credo che il mio interlocutore ab-
bia voluto dire questo, dunque presumibilmente ha prodotto que-
sta sequenza di foni».
Ma qui si è ormai usciti dalla fonetica.

1 59
Bibliografia

ABERCROMBIE o., Elements of Generai Phonetics, Edinburgh Univ. Press,


Edinburgh 1967.
ALBANO LEONI F ., MATURI P., Per una verifica pragmatica dei modelli fono-
logici, in G. Gobber (a cura di), La linguistica pragmatica, Bulzoni,
Roma 1992, pp. 39-49.
IDD., Didattica della fonetica e parlato spontaneo, in A. Giacalone Ramat,
M. Vedovelli (a cura di), Italiano lingua seconda/lingua straniera, Bul-
zoni, Roma 1994, pp. 153-64.
BERTINETTO P. M., Strutture prosodiche dell'italiano. Accento, quantità, sil-
laba, giuntura, fondamenti metrici, Accademia della Crusca, Firenze
1981.
BERTINETTO P. M., MAGNO CALDOGNETTO E., Ritmo e intonazione, in
A. M. Sobrero (a cura di), Introduzione all'itàliano contemporaneo, I,
Le strutture, Laterza, Roma-Bari 1993, pp. 141-92.
BORDEN G. J., HARRIS K. s., Speech Science Primer, Physiology, Acoustics
and Perception of Speech, Williams & Wilkins, Baltimore 1984.
BROWN G., Listening to Spoken English, Longman, London 1990.
CALOGERO B., Audiologia, Monduzzi, Bologna 1983 .
CANEPARI L., Introduzione alla fonetica, Einaudi, Torino 1979.
ID., Italiano standard e pronunce regionali, CLEUP, Padova 1987.
IO., Il IYPI. Dizionario di Pronuncia Italiana, Zanichelli, Bologna 1999.
CATFORD J. c., A Practical Introduction to Phonetics, Clarendon Press,
Oxford 1988.
CERRATO L., CUTUGNO F., FRATTINI G., SAVY R., Un'indagine sulla defini-
zione del confine percettivo tra foni vocalici, in B. Perrone (a cura di),
Atti del XXII Convegno Nazionale dell'Associazione Italiana di Acusti-
ca, Cartografica Rosato, Lecce 1994, pp. 437-42.
CROATTO L. (a cura di), Trattato di foniatria e logopedia, voli. I-III, La
Garangola, Padova 1983-86.
CRUTTENDEN A., Intonation , Cambridge Univ. Press, Cambridge 1997 2 •

DELATTRE P., Comparing the Phonetic Features of English, French, Ger-


man and Spanish, J. Groos, Heidelberg 1965.
FANT G., Acoustic Theory of Speech Production, Mouton, The Hague
1960.

161
MANUALE DI FONETICA

FERRERO F. E., Caratteristiche acustiche di fonemi consonantici italiani, in


"Parole e metodi", 3, 1972, pp. 9-31.
FERRERO F. E. et al., Some Acoustic Characteristics o/ the Italian Vowels, in
"Journal of Italian Linguistics", 3, 1978, pp. 87-96.
IDD., Nozioni di fonetica acustica, Omega, Torino 1979 .
FERRERO F. E., MAGNO CALDOGNETTO E., Elementi di fonetica acustica, in
L. Croatto (a cura di) , Trattato di foniatria e logopedia, La Garango-
la, Padova 1985, vol. 3, pp. 155-96.
FROMKIN v. A., Tane. A Linguistic Survey, Academic Press, San Diego
(cA) & London 1978.
FRY D. B. (ed.), Acoustic Phonetics, Cambridge Univ. Press, Cambridge
1976.
ID., The Physics o/ Speech, Cambridge Univ. Press, Cambridge 1979.
HAKKARAINEN H. J., Phonetik des Deutschen, Fink, Miinchen 1995.
HARDCASTLE w. J., Physiology o/ Speech Production, Academic Press, Lon-
don 1976.
HARDCASTLE w. J., LAVER J., The Handbook o/ Phonetic Sciences, Black-
well, Oxford 1997.
INTERNATIONAL PHONETTC ASSOCIATION, The Principles o/ the Internatio-
nal Phonetic Association, Univ. College, London 1949.
ID., IPA Chart, Revised to 1993, in "Journal of the International Phonetic
Association", 23, 1, 1993, pagine centrali, non numerate.
JOHNSON K., Acoustic & Auditory Phonetics, Blackwell, Cambridge (MA)
& Oxford 1997.
JONES D ., An Outline o/ English Phonetics, Heffer, Cambridge 1972.
LADD D. R., Intonational Phonology, CUP, Cambridge 1996.
LADEFOGED P., A Course in Phonetics, Harcourt Brace Jovanovich, New
York 1993 3 •
LAVER J., Principles o/ Phonetics, CUP, Cambridge 1994.
LEHISTE r., Suprasegmentals, MIT Press, Cambridge (MA) 1970.
LIBERMAN A. M., Speech: A Special Code, MIT Press, Cambridge (MA) 1996.
LIBERMAN A. M., COOPER F. S., SHANKWEILER D . P ., STUDDERT-KENNEDY M.,
Perception o/ the Speech Code, in "Psychological Review", 7 4, 1967,
pp. 431-61.
LIEBERMAN PH., BLUMSTEIN SH. E., Speech Physiology, Speech Perception,
and Acoustic Phonetics, Cambridge Univ. Press, Cambridge 1988.
LINDBLOM B., Adaptive Variability and Absolute Constancy in Speech Si-
gnals: Two Themes in the Quest /or Phonetic Invariance, in Procee-
dings x/h ICPhS, Academy of Sciences of the Estonian S.S.R., Tallinn
1987, 3, pp. 9-18.
ID., Explaining Phonetic Variation: a Sketch o/ the H & H Theory, in
W. J. Hardcastle, A. Marchal (eds.), Speech Production and Speech
Modeling, Kluwer, Dordrecht 1990, pp. 403-39.
MAGNO CALDOGNETTO E., La coarticolazione. Introduzione agli aspetti di-
namici della produzione della parola, CLESP, Padova 1980.

162
BIBLIOGRAFIA

EAD., Introduzione alla percezione dei suoni linguistici, CLESP, Padova


1 979•
MALÉCOT A., Introduction à la phonétique française, The Hague-Paris-
New York, Mouton 1977.
MALMBERG B., Manuel de phonétique générale, Picard, Paris 1974 (trad. it.
Manuale di fonetica generale, il Mulino, Bologna 1994 2 ).

MAROTTA G., Modelli e misure ritmiche: la durata vocalica in italiano, Za-


nichelli, Bologna 1985 .
MIONI A., Fonetica articolatoria: descrizione e trascrizione degli atteggia-
menti articolatori, in L. Croatto (a cura di), Trattato di foniatria e lo-
gopedia, La Garangola, Padova 1986, vol. 3, pp. 15-88.
ID., Fonetica e fonologia, in A. M. Sobrero (a cura di), Introduzione all'i-
taliano contemporaneo I, Le strutture, Laterza, Roma-Bari 1993, pp.
101-39.
MOORE B. c. J., An Introduction to the Psychology of Hearing, Academic
Press, London 1989 .
PETTORINO M., GIANNINI A., La fonetica sperimentale, Edizioni Scientifiche
Italiane, Napoli 1992.
PICKETT J. M. (ed.), The Acoustics of Speech Communication. Fundamen-
tals, Speech Perception Theory, and Technology, Allyn & Bacon,
Needham Heights (MA) 1999.
PISONI D. B., LUCE P. A., Speech Perception: Research, Theory, and the Prin-
cipal Issues, in Pattern Recognition by Humans and Machines: Speech
Perception , vol. r, Academic Press, New York 1986, pp. 1-50.
POTTER R. K., KOPP G. A., GREEN H., Visible Speech, Dover, New York
1947.
QUILIS A., Tratado de fonologia y fonética espanolas, Gredos, Madrid
1 993 ·
RYALLS J., A Basic Introduction to Speech Perception, Singular Publishing
Group, San Diego/ London 1996.
SALZA P . L., La problematica della segmentazione del segnale vocale, in E.
Magno Caldognetto, F. Ferrero (a cura di), Trattamento del segnale
vocale ed elaborazione statistica dei dati, Associazione Italiana di Acu-
stica, Roma 1991, pp. 23-48.
SAUSSURE F . DE, Cours de linguistique générale, Payot, Paris 1922 (trad. it.
Corso di linguistica generale, Introduzione, traduzione e commento di
T. De Mauro, Laterza, Bari-Roma 1997 13 ).
SCHMID s., Fonetica e fonologia dell'italiano, Paravia, Torino 1999 .
SIMONE R., VIGNUZZI u., RUGGIERO G. (a cura di) , Studi di fonetica e fono-
logia, Bulzoni, Roma 1976.
SORNICOLA R., Sul parlato, il Mulino, Bologna 1981.
VACHEK J., Written Language Revisited, John Benjamins Publishing Com-
pany, Amsterdam/Philadelphia 1989.
VOGHERA M., Sintassi e intonazione nell'italiano parlato, il Mulino, Bolo-
gna 1992 .
Indice analitico

Accentata, sillaba, cfr. tonica, sillaba atone, vocali, 70, 76-8


accento, 56, 76-8 avulsivo, 43-4
acuto, 78n
fìsso, 77
grave, 78n banda
intensivo, 76 larga, 94
libero, 77 larghezza di, 93-4
musicale, 78 stretta, 94
secondario, 77 bark, 149
acutezza, 73 barra sonora, 112
aerodinamico-mioelastica, teoria, 4rn basse, vocali, 47, 105
aerometria, 82 Bell, 90
affricate, consonanti, 54, n4, 154 bilabiali, consonanti, 56
Alfabeto Fonetico Internazionale, bisbiglio, 42
cfr. IPA bottom-up, 157
allungamento prepausale, 72, 126 brevi
alte, vocali, 47, 105 consonanti, 71, 71n
altezza, variazioni di, 73-4, 77-9,
vocali, 70
126-7
bronchi, 37
alveolari, consonanti, 57-8
alveoli, 39
ampiezza, 88-9, 89n, 97-8
Analysis-by-Synthesis, 157 cacuminali, consonanti, cfr. retroflesse
andamento melodico, 79 campionatura, 129-30
anteriori, vocali, 47-8, 105 campo
antirisonanza, 97 di udibilità, cfr. campo uditivo
aperta, sillaba, 75 uditivo, 143-4
aperte, vocali, 47n cassa di risonanza variabile, 104
API, cfr. IPA categorizzazione di suoni linguistici,
approssimanti, 55-6, 119, 155 150
aprocheile, vocali, cfr. non labializ- cavità nasali, 39
zate cellule ciliate, 139-41
armonia vocalica, 64 centrali, vocali, 47-9
armonica, 93, 98 chiusa, sillaba, 75
arrotondate, vocali, cfr. labializzate chiuse, vocali, 47n
aspirazione, 66, 112 ciglia, 139
assimilazione, 62-3, 67-8 classificazione dei suoni linguistici,
atona, sillaba, 76 150
MA N UALE DI FO ETI CA

click, 43-4 esplosione, 53, 55, 111-2


coarticolazione
progressiva, 63
regressiva, 62 F, cfr. formante
coclea, 138-9 F 0 , cfr. frequenza fondamentale
coda della sillaba, 75 faringali, consonanti, 61
condensazione, 87 faringe, 37-8
condotto uditivo esterno, 135 filtri , banco di, 93-4
configurazione articolatoria, 44-5 finestra
contenuto spettrale, 96 ovale, 137
continue, consonanti, 54-5 rotonda, 137
contoide, 43n fon, 146-7
corde vocali, cfr. pliche vocali fonazione, 2 1
corteccia uditiva, 135, 142 fono, 20
Corti, cfr. organo del Corti formante (F), 98, 101-2, 104-10,
c.p.s., 88-9 rr7-9
frequenza, 88
discriminazione della, 144
deaccentazione, 127 fondamentale (F0 ), 73 , 93, 124
decadimento, 103 curva della, 125
decibel (dB), 89-90 fricative, consonanti, 5 3-62, 113-4,
declinazione naturale, 78 1 54
dentali, consonanti, 57 frizione, 54-5
denti, 39
desonorizzazione, 65-6
diapason, 85-6 ganglio spirale, 142
digitalizzazione, 129-30 geminate, consonanti, 71n
dinamica prosodica, 79-81 glottidali, consonanti, 61
discriminazione glottide, 37
continua, 151 grafie fonetiche, 35
test di, 150-1 gruppi consonantici, semplificazione
dittongo, 52, 67 , 109-ro di, 68, 121-3
doppie, consonanti, 7 rn
dotto cocleare, 138
durata Hertz (Hz), 74, 89
consonantica, 71-2 Hyper- and Hypo-speech (H&H),
vocalica, 70 1 59
durata, discriminazione della, 145
durata, variazioni di, 70-2, 77-8, 126
iato, 52
identificazione
egressivo, 4 3 discontinua, 152
eiettivo, 44 di suoni linguistici, 150
elettroglottografia, 81 test di, 150-2
elettromiografia, 81 implosione, 5 3
elicotrema, 138 impostazione, 44-5
Elite, 83 incudine, 137
endolinfa, 138 indebolimento articolatorio, 68, 121-3
endolinfatico, canale, 138 inerzia degli organi articolatori, 63-4

166
INDICE ANALITICO

infrasuoni, 14 3 metafonesi, 64-5


ingressivo, 43 minimo di intensità, 74-5
iniettivo, 44 modo di articolazione, 53-6 , n1-9,
intensità 153-5
discriminazione della, 145 monottongazione, 67-8
variazioni di, 72-3, 123-4 monovibrante, cfr. vibranti, conso-
relativa, 7 3 nanti
curva della, 124 mormorìo, 42
totale, 124 muscoli vocali, 37, 40
intonazione, 78, 125
inviluppo spettrale, 97
IPA , 32-3 nasali
iperarticolato, iperarticolazione, 23-5 , consonanti, 54, n4-7, 155
27, 121-3 nasali[zzate], vocali, 51-2, 66, 109,
ipoarticolato, ipoarticolazione, 23-5, 120-l
121-3, 157-9 nasalizzazione, 66, 120-1
isofonia, curve di, 146-7 neuromotoria, funzione, 63-4
neuromotoria, teoria, 41n
non arrotondate, vocali, cfr. non la-
labbra, 39, 47-8 bializzate
labializzate, vocali, 48, 107-8 non labializzate, vocali, 48-51, 107-8
labializzazione, 47-8, 50-1, 66 normalizzazione del condotto vocale,
labiodentali, consonanti, 56-7 1 53
laringali, cfr. glottidali nucleo sillabico, 75
laringe, 37, 40
laringoscopia, 81
laterali, consonanti, 54 , 117, 155 occlusione intermittente, 54
lettera, 32n occlusive, consonanti, 53, 55, 111-3,
lingua, 38 1 54
livello onda sonora, 85-93
di intensità sonora (rL), 89-90 onde
di sensazione sonora, 146-7 aperiodiche, 91-2
locus, n3-4 complesse, 90-3
loudness, 14 3n periodiche 87-90
lunghe, consonanti, 71-2 semplici, 87-90, 93
lunghe, vocali, 70 orali, vocali, 5 1
lunghezza d'onda, 87, 89 orecchio
luogo di articolazione, 56-62 , 112-7 esterno, 135-7
interno, 138-41
medio, 137-8
martello, 137 organi
medio-alte, vocali, 47, 105 fissi, 39
medio-basse, vocali, 47, 105 mobili, 39
mel, 147-8 organo del Corti, 135, 138-40
melodico, cfr. andamento melodico ortografiche, forme, 35
membrana oscillazione, 85
basilare, 138 oscillogramma, 94
di Reissner, 138 ostacolo laringeo, 40- 1
tectoria, 139 ottava, 148-9
MANUALE DI FONETICA

overshoot, 63 bianco, 99-100


colorato, 100

padiglione, 135
palatali, consonanti, 59-60 scala
palatali, vocali, 47n timpanica, 13 8
palato vestibolare, 13 8
duro, 39 scale soggettive, 146-9
molle, 38 scempie, consonanti, 71n
palatografia, 82 scrittura alfabetica, 22-3
parlato, segnale, cfr. onda, onde
di laboratorio, 23- 5 codifica del, 133-4
spontaneo, 23-5 decodifica del, 133-4
perilinfa, 13 8 glottico, 102-3
periodico, 87 semiaperte, vocali, 47n
periodo, 88 semichiuse, vocali, 47n
picco di intensità, 74-6 semiconsonante, cfr. approssimante
pitch, 124, 143n semilunghe, vocali, 70
pliche vocali, 37, 37n, 40-2 semitoni, 149
plosivo, 53 semitonica, sillaba, 77
polmoni, 36-7 semivocale, cfr. approssimante
postalveolari, consonanti, 5 8-9 serie di Fourier, 93
posteriori, vocali, 47, _49-105 sillaba, 74-6
prepalatali, cfr. postalveolari sillabica, consonante, 75
pressione sinusoide, sinusoidale, 87-8
sonora, 89-90 soglia
subglottidale, 41 del dolore, 14 3
prevelari, vocali, 47n dell'udito, 143
processo comunicativo audioverbale, differenziale, 14 5
19-20 percentuale, 145
procheile, vocali, cfr. labializzate soluzione, 45
programmazione temporale, 63-4 sonagramma
prominenza, 76, 78, 127 a banda larga, 101
prosodia, 23, 68-9, 79-81, 125-9 a banda stretta, 1o 1
sonore, consonanti, 43-112
sonorità intrinseca, scala di, 73, 124
radiografia, 82 sonorizzazione, 65
rafforzamento sintattico, 71-2 sorde, consonanti, 43
rarefazione, 87 sorde, vocali, 45n
retroflesse, consonanti, 59 sorgente del suono, 85
ricezione spazio acustico vocalico, 150-1
fase centrale della, 134-5 spettro, 94-7
fase periferica della, 134-5 a righe, 97
riconoscimento del parlatore, 28 continuo, 97
riduzione dei foni, 122-3 spettrografo digitale, 130
rima glottidale, 37 spettrogramma, 94, 96-7
risonanza, spike, u2
frequenza di, 97 spirante, cfr. fricative, consonanti
rumore, 90, 90n staffa, 137

168
INDI CE ANALITICO

stereociglia, 139 stretta, 35, 50


suono, 85 trillo, cfr. vibranti, consonanti
tuba di Eustachio, 137
tubo di risonanza, 103-4, 107-8
tempo di attacco della sonorità, cfr.
VOT
tenuta, 45 ugola, 38
test percettivi, 15 0-3 ultrasuoni, 143
testa della sillaba, 75 Umlaut, cfr. metafonesi
timbro, 104 undershoot, 63
timpano, 135-7 unità tonale, 12 5 -7
cavo del, 137 uvulari, consonanti, 60- 1
secondario, 138
Tone-Unit, cfr. unità tonale
toni variabilità dei foni, 23
modulati, 78 velari
puri, 149 consonanti, 60
tonica, sillaba, 76 vocali, 47n
toniche, vocali, 70, 76 velo del palato, 38
tonotopicità 140- 1 velocità
top-down, 157 del suono, 87
trachea, 37 di eloquio, 72, 126
transizioni formantiche, 112-3 vibranti, consonanti, 54-5, rr7 , 155
trapezio vocalico, 45-7 vibrazione
trascrizione laringea, 41
descrittiva, 33-5 vocoide, 4 3n
larga, 35 Voice Onset Time, cfr. VOT
prescrittiva, 33 VOT, 65-6, 1 II