La Linguistica studia le proprietà del linguaggio umano come sistema cognitivo codificato in un’area
specifica del nostro cervello. Si occupa, inoltre, di investigare il linguaggio umano in tutti i suoi aspetti:
fonologia, morfologia, sintassi, semantica, lessico. Ci sono branche applicative come l’acquisizione della
prima e seconda lingua, la neurolinguistica, la psicolinguistica che studiano tutte il linguaggio con metodi
diversi. La linguistica è una disciplina scientifica che si pone come obiettivo descrivere e spiegare il proprio
oggetti di studio
Secondo la teoria innatista la lingua viene generata da un modulo cognitivo collocato nell'emisfero sinistro
del cervello, quindi l'apprendimento di una lingua è innato per gli esseri umani (da qui il termine innatismo),
esattamente come lo è, ad esempio, imparare a camminare con la stazione eretta.
La linguistica è quindi una scienza esatta che studia come si articola questo componente del nostro cervello,
perché la lingua così definita si configura come un possibile oggetto di studio empirico
Ci sono varie prove a favore dell'ipotesi innatista
a) Patologie del linguaggio: Nel caso di patologie del linguaggio, solo quando sono danneggiate alcune
aree specifiche insorgono problemi di linguaggio (emisfero sinistro area di Wernicke, area di Broca,
giro angolare ecc.). Inoltre, ad ogni area del cervello che viene danneggiata corrisponde un tipo (o
una serie di tipi) di afasia;
b) Tutti e solo gli esseri umani hanno sviluppato il linguaggio come lo conosciamo (e cioè con le
caratteristiche di ricorsione. Neanche i primati (che sono gli animali più vicini a noi come sviluppo
cerebrale) sono in grado di apprendere una qualsiasi linguaggio umano, neanche quello dei segni,
quindi non è un problema dovuto al tipo di apparato fonatorio. Il linguaggio è dunque una
caratteristica biologica della specie;
c) In assenza di stimoli, la capacità di imparare una lingua si atrofizza: il caso dei bambini “lupo”
cresciuti lontano dalla società umana: bambini entrati in contatto con il mondo esterno a 14 anni si
sono rivelati incapace di sviluppare una competenza linguistica pari a quella dei loro coetanei. Lo
stesso però avviene con la stazione eretta: lo stimolo è necessario per lo sviluppo del sistema
cerebrale che regola il linguaggio o il movimento, o qualsiasi altro componente;
d) Povertà dello stimolo: la produzione linguistica di un bambino è largamente sotto determinata
rispetto al corpus linguistico a cui è esposto durante la fase di acquisizione; il bambino è infatti in
grado di produrre frasi grammaticali mai sentite prima;
e) Il bambino impara la propria lingua materna senza alcun tipo di insegnamento specifico o di
istruzione indotta; Attraversano delle fasi simili nell'apprendimento ed inoltre compiono solo alcuni
tipi di errori - in genere errori di regolarizzazione di paradigmi - e mai altri; mio/mii - salo - mordato
togliato.
Esiste una fase critica in cui la capacità di acquisizione della lingua è più agevole (tra i due ed i sei
anni); comunque dopo la pubertà non è più possibile imparare una lingua come lingua materna;
Inoltre, la competenza di una lingua specifica non è ereditaria nel senso che un bambino apprende la stessa
lingua dei genitori: il bambino impara la lingua della comunità linguistica in cui vive, indipendentemente
dalla lingua madre dei genitori.
Che cos’è il linguaggio? Solo un sistema di comunicazione? Ha delle caratteristiche specifiche rispetto ad
altri sistemi di comunicazione come i linguaggi informatici, i codici (come quello stradale) o la
comunicazione animale?
Tutti i sistemi di comunicazione implicano un emittente ed un destinatario, non tutti i sistemi di
comunicazione hanno le caratteristiche che vedremo.
Il linguaggio umano è discreto, nel senso che noi percepiamo delle unità all’interno di quello che è in realtà
un flusso continuo di suoni. Tutti gli animali comunicano, ma si può dire che parlino? - Le api comunicano
tramite la loro danza distanza, qualità e quantità di polline alle compagne, i fringuelli comunicano tra loro in
“dialetti” diversi. I primati comunicano tra di loro con una serie complessa di messaggi che vanno
dall’avvertimento per la presenza di un predatore a presenza di fonti di cibo
Esempio di Koko e Washoe: un gorilla femmina che ha imparato più di 350 parole della lingua americana
dei segni (ASL) e capire più di 2000 parole di inglese corrente.
Washoe, uno scimpanzé che ha imparato nella sua vita circa 350 segni in ASL e li ha insegnati poi ai suoi
piccoli.
Se anche i delfini dal naso a bottiglia hanno i nomi propri, e le marmotte comunicano il tipo di predatore, la
sua velocità, pericolosità, colore, forma ecc., se i cani arrivano a capire più di 200 parole, che cosa distingue
le lingue umane dai linguaggi animali? Il linguaggio umano ha un lessico potenzialmente infinito, non una
serie codificata di segnali fissi. La proprietà fondamentale del linguaggio umano è la sua potenziale capacità
di creare infiniti messaggi, nota anche come ricorsione o ricorsività:
La coordinazione permette di aggiungere infiniti elementi dello stesso tipo senza limiti
Presenza di elementi funzionali
Io e lui abbiamo deciso che potremmo partire per Genova in mattinata
Gli elementi funzionali sono un fenomeno pervasivo delle lingue umane, nelle lingue dei primati non
esistono come la possibilità di riferirsi a passato, futuro, eventi non realizzati:
“Io ne ho viste cose che voi umani non potreste immaginarvi: navi da combattimento in fiamme al largo dei
bastioni di Orione, e ho visto i raggi B balenare nel buio vicino alle porte di Tannhäuser. E tutti quei
momenti andranno perduti nel tempo, come lacrime nella pioggia.”
(Rutger Hauer/Roy Bat, Blade runner)
I articolazione: possiamo identificare morfemi portatori di significato: [[industri]N ale]A
II articolazione:
CARATTERISTICHE DELL’ACQUISIZIONE
La caratteristica fondamentale del processo di acquisizione è la cosiddetta povertà dello stimolo. I parlanti
raggiungono una competenza molto più sofisticata della loro lingua di quanto non possano effettivamente
aver desunto dall’input ambientale.
L’acquisizione avviene in modo rapido, uniforme, senza sforzo, senza errori – almeno senza che appaiano
mai errori che invece ci potremmo aspettare – e soprattutto sulla base esclusivamente di evidenza positiva
(cioè non viene mai detto al bambino che una certa sequenza di parole NON appartiene alla lingua in
questione, o che un certo significato NON può essere assegnato ad una certa sequenza). Infine, un parlante
è in grado di produrre frasi che non ha mai sentito prima in vita sua.
L’input, al contrario, contiene errori, è deficitario, non contiene istruzioni esplicite, non è uniforme fra un
individuo e l’altro.
Infine: è importante tenere presente che il linguaggio si sviluppa secondo sequenze temporali che sono le
stesse fra tutti gli individui: gli stadi dell’acquisizione sono gli stessi per tutti gli individui. Naturalmente, i
tempi specifici possono variare da un individuo all’altro. Ciò che non può cambiare è la sequenza.
E’ interessante notare che, sebbene l’input contenga per la maggior parte domande e frasi imperative, il
bambino comincia da delle dichiarative.
I bambini fanno sempre lo stesso tipo di errori: ad esempio regolarizzano i paradigmi chiudato invece di
chiuso, volerò invece di vorrò, dicete invece di dite, quindi analizzano il linguaggio. In parecchie lingue i
bambini omettono i soggetti anche in lingue in cui l’omissione del soggetto non è ammessa
- I bambini producono frasi che non hanno mai sentito, quindi il tipo di processo non può essere
imitativo: sono svegliatomi io
In genere i genitori non correggono i figli, cercano di capirli, quindi non può trattarsi di un procedimento per
“rinforzo” come proposto dalla scuola skinneriana
- I bambini mostrano fasi analoghe di acquisizione: es nessun bambino comincia i lallamenti con la /ʃ/,
tutti i bambini hanno una fase in cui cancellano la posizione dei pronomi oggetti clitici: ad esempio
ha mangiata (invece che l’ha mangiata)
- In lingue diverse si vedono pattern analoghi di sviluppo: ad esempio anche in lingue in cui non è
possibile omettere il soggetto c’è una fase in cui i bambini lo fanno (anche se con condizioni diverse
da quelle che si osservano nelle lingue a soggetto nullo di parlanti adulti)
Tutti questi motivi ci portano ad escludere le seguenti ipotesi alternative:
- Il linguaggio non viene appreso per imitazione ma per regole. Infatti producono forme che non hanno
mai sentito, ma che corrispondono a forme regolari
Es: chiudato, aprito
In questo caso la forma è sbagliata perchè abbiamo a che fare con un participio forte, ma il bambino forma il
participio tramite regola
base lessicale+ suffisso at+morfema di accordo o
- rinforzando un meccanismo di stimolo-risposta (i genitori non correggono)
ACQUISIZIONE TRAMITE REGOLE
• Come si puo’ mostrare che i bambini imparano una lingua tramite regola?
• Possiamo fare degli esperimenti con bambini in età prescolare
• Prendiamo ad esempio la regola di formazione del plurale
FASI DEL LINGUAGGIO
• Esperimento di Jacques Mehler: test con un elettrodo nel succhiotto, per dimostarre che già a quattro
giorni di vita un bambino è in grado di riconoscere la lingua della madre
- Madri bilingui russo/francese
- Dopo 4 giorni vengono esposti alla madre che parla russo e reagiscono diversamente da quando la
madre parla francese
- Bambini esposti solo al francese succhiano piu’ velocemente quando sentono un’altra lingua. Il
gruppo di controllo continua a succhiare normalmente perché continua a sentire il francese
- Questo mostra che i bambini di 4 giorni sono in grado di distinguere le due lingue parlate dalla
madre
A quest’età i bambini distinguono ad esempio lo spagnolo dal giapponese o dal tedesco ma non
dall’italiano, perché?
Evidentemente ci sono delle comunanze tra lingue affini. Lingue che hanno l’ordine SOV hanno un pattern
intonativo diverso da lingue che hanno l’ordine SVO. I neonati di una lingua SOV sentono un ritmo
trocaico, i bambini di una lingua SVO sentono un ritmo giambico.
• I primi lallamenti avvengono tra i 6 e gli 8 mesi di vita: si tratta generalmente di mono o bisillabi, in
cui si ha una struttura CV (quella non marcata) e si utilizza in genere una vocale centrale o bassa e
una occlusiva sorda o sonora (vedi triangolo p,t,k)
• Il cosiddetto “baby talk” ricalca questo schema: pappa, tata, nanna, mamma,
• I neonati possono distinguere suoni che gli adulti non distinguono: esempio, un test con neonati
giapponesi ha mostrato che distinguono [l] da [r], mentre gli adulti non sono in grado di farlo. Questa
capacità si attenua dai 6 mesi in poi e sparisce completamente intorno all’anno di vita
• I primi sei mesi di vita sono importantissimi per l’acquisizione del sistema fonologico di una lingua,
in particolare per l’acquisizione dei contrasti fonematici
• Intorno all’anno di vita compaiono le prima parole con un significato (12/14 mesi)
• Intorno ai 20/24 mesi compaiono le prime combinazioni di parole
• Intorno ai tre anni di vita i bambini sono in grado di parlare la propria lingua senza nessun tipo di
addestramento specifico, sulla base di evidenza empirica finita e diversa per ogni bambino
• Ci sono strutture che vengono apprese presto ed altre tardi: es le frasi relative sul soggetto
compaiono spesso già intorno ai 24/30 mesi, quelle sull’oggetto o sugli element preposizionali dopo i
quattro anni.
EVIDENZA POSITIVA
I bambini imparano sulla base di quello che sentono, non sulla base di quello che non sentono e hanno un
loro sistema che produce il linguaggio e lo fanno sulla base delle regole che hanno interiorizzato:
Child: Nobody don’t like me.
Mother: No, say “nobody likes me.”
Child: Nobody don’t like me.
Mother: No, say “nobody likes me.”
Child: Nobody don’t like me.
Mother: No, say “nobody likes me.”
Child: Nobody don’t like me.
Mother: No, now listen carefully; say “nobody likes me”
Child: Oh! Nobody don’t likes me.
Nonostante i bambini vengano corretti, non tengono conto delle correzioni. Spesso non vengono nemmeno
corretti, anzi l’adulto si adatta alla loro lingua (es: le mamme parlano in terza persona)
CAPACITA DI RICONOSCERE PATTERN
• Esperimento (Markus 1999)
1. Bambini di 7 mesi sentono per 2 minuti ripetizioni di frasi con tre parole
ga ga ti ga ga ti ga ga ti
ni ni ta ni ni ta ni ni ta (XXY pattern)
2. Poi sentono 12 frasi nuove ( sei con pattern XXY e 6 con pattern XYY); ognuna proviene da una
fonte sonora diversa
3. Tutti i bambini si focalizzano piu’ a lungo sulla fonte sonora che produce lo stimolo nuovo (è nuovo
quindi è interessante)
• Esperimento (Santelmann & Jusczyk 1998)
Bambini di età compresa tra i 15-18 mesi riconoscono frasi possibili da frasi impossibili nella loro
grammatica ad esempio: is baking vs. can baking
IPOTESI SULL’ACQUISIZIONE
Se il bambino ha nel cervello già la competenza dell‘adulto, come mai non parla come un adulto fin dall
´inizio?
1. Ipotesi della piena competenza: La competenza è presente, ma ci sono delle limitazioni dovute al
processing, alla produzione estrinseca della lingua;
2. Ipotesi maturazionale: certe precondizioni cognitive devono prima maturare e poi il bambino può
servirsene;Ipotesi dell‘apprendimento lessicale;
3. L‘acquisizione degli elementi lessicali è il fattore che permette la costruzione delle strutture
sintattiche.
Il linguaggio umano ha delle caratteristiche particolari perché il cervello che lo produce ha delle
caratteristiche particolari rispetto agli animali. Anche se di recente è stata fatta l’ipotesi che ci sia un
continuum tra il linguaggio animale e quello umano, resta il fatto osservativo che il linguaggio umano ha
delle caratteristiche specifiche che non si riscontrano negli animali.
• I disturbi del linguaggio mostrano chiaramente che ci sono correlazioni tra alcuni tipi di danni
neurologici e la produzione del linguaggio.
Inoltre, danni diversi producono difetti del linguaggio diversi, da ciò possiamo trarre indicazione per capire
a quali processi sono collegate le varie aree. Esattamente come ci sono delle tappe nello sviluppo motorio,
anche il linguaggio mostra della chiare tappe evolutive. L’esistenza di queste tappe evolutive ha
conseguenze importanti sulla società, (ad esempio nei casi di plurilinguismo da immigrazione).
Assumiamo dunque che il linguaggio umano sia il risultato di un processo di acquisizione che si imposta
su strutture cerebrali specificamente (anche se forse non esclusivamente) deputate all’uso del linguaggio.
La grammatica non è quindi un libro da studiare, ma la descrizione (e possibilmente la spiegazione) della
competenza che un parlante nativo ha della propria lingua
Livelli linguistici sono:
- Fonologia
- Morfologia
- Sintassi
- Semantica
INTERDIPENDENZA DEI MORFEMI
Ad ogni livello di analisi gli elementi sono dipendenti uno dagli altri: ad esempio la seguente parola è una
combinazione di due morfemi, uno che può essere libero, l’altro legato
Bar-ista
TRA FONEMI
Un esempio fonologico:
La /s/ di sbaglio è diversa alla /s/ di sasso in italiano
La consonante /b/ che segue la /s/ in sbaglio è sonora, quindi anche la /s/ si assimila alla /b/ e diventa sonora
venendo pronunciata /z/.
Vediamo quindi che i vari segmenti fonologici non sono completamente indipendenti l’uno dall’ altro.
TRA PAROLE
Un esempio sintattico: tutti gli elementi di un costituente nominale sono normalmente accordati per numero
e genere con il nome
Il mio bel gatto bianco e nero
LIVELLI DI ANALISI
Possiamo quindi dire che la fonologia si occupa dei segmenti più piccoli della lingua, i foni che permettono
distinzioni di significato, ad esempio una differenza come
Lana, lama, lagna
dipende da un unico fonema: /n/, /m/ e....
- Il digramma /gn/ rappresenta un unico fonema, cioè la nasale palatale, quindi anche se la
rappresentazione grafica è doppia, il fonema è unico.
La morfologia considera gli elementi del linguaggio di un ordine di grandezza superiore rispetto alla
fonologia, si occupa di elementi più piccoli di una parola, che collegati tra loro formano parole complete.
Ad esempio:
Industrializzazione
è una parola composta da vari morfemi:
Industria da N a Agg
Industriale da Agg a V
Industrializza(re)Da V a N
[[[[industria]l]izza]zione]
La sintassi si occupa di elementi di un ordine di grandezza ancora maggiore, quello che in morfologia è
l’elemento più grande, e cioè la parola, è la base di partenza della sintassi, che si occupa dell’ordine tra le
parole:
Il mio bel gatto bianco e nero dorme sul tappeto
*Bianco e nero dorme il mio bel gatto sul tappeto
La semantica si occupa dell’interpretazione delle frasi:
Tutti amano una donna
Questa frase è ambigua e può essere disambiguata continuando in modi diversi:
... e quella donna è sua madre
...e quella donna è Angelina Jolie
Le lingue possono essere anche solo parlate, la lingua scritta ha in genere un carattere più conservativo della
lingua parlata. Ci sono tipi di alfabeti diversi, fonologici, sillabici, ideografici, che qui non tratteremo. In
genere gli alfabeti sono una rappresentazione nel migliore dei casi imperfetta del parlato.
ASTRATTO E CONCRETO
Ogni concreta realizzazione di una parola o di un fono varia da un parlante all’ altro e anche lo stesso
parlante non produce mai esattamente lo stesso suono.
Tuttavia possiamo astrarre e dire che in italiano la /a/ si oppone alla /e/ in parole come
Rana/rane
LANGUE E PAROLE
Questa dicotomia tra il dato effettivo e l’ astrazione che facciamo sul dato si ritrova in tutte le teorie
linguistiche. Ad esempio De Saussure, il padre dello strutturalismo parla di langue e parole
Qual è la differenza tra questi due concetti?
- La parole è un atto linguistico individuale e specifico, e in quanto tale variabile
- La langue è il sistema di riferimento astratto secondo cui ad una determinata sequenza di suoni viene
associato arbitrariamente un significato.
Madre: Cosa fai tesoro?
Figlio: Sto farmando
Quanti di voi sanno cosa vuol dire farmare? L’ associazione tra segno linguistico e significato viene
effettuata da una determinata comunità linguistica (alla quale la madre non appartiene ma il figlio sì)
COMPETENZA ED ESECUZIONE
Concetti analoghi a quelli di langue e parole esistono anche nella moderna teoria linguistica formale
chomskyana: la competenza di un parlante nativo è il sistema di regole iscritto nel suo cervello
L’esecuzione (performance) è l’insieme degli atti linguistici che realizzano la competenza del parlante.
Qual è la differenza tra langue/parole e competenza ed esecuzione?
- De Saussure vede la prospettiva dal punto di vista della comunità linguistica, cioè esterna;
- Chomsky dal punto di vista dell’individuo in quanto portatore di un sistema di regole interiorizzato,
cioè di una grammatica interna.
ASSE SINTAGMATICO E PARADIGMATICO
Relazioni tra elementi compresenti in una parola o enunciato sono detti sintagmatici, relazioni tra elementi
di un paradigma, quindi in alternanza in una parola o enunciato sono detti sintagmatici
Ad esempio, il caso trattato sopra di sonorizzazione della /s/ davanti a consonante sonora è un caso di un
rapporto sintagmatico;
Casi di esempi paradigmatici sono le varie voci della coniugazione di un verbo o la declinazione nominale.
SIGNIFICATO E SIGNIFICANTE
Ogni parola è un segno linguistico che viene definito sulla base del rapporto tra significato e significante.
Ogni segno «punta» verso un concetto, che a sua volta non è l’oggetto del mondo reale, ma la sua
rappresentazione mentale.
Ogni segno collega una forma con un contenuto. I segni sono arbitrari e vengono decisi sulla base di una
convenzione sociale.
L’unica eccezione all’arbitrarietà del segno è data dalle onomatopee (tintinnare, frusciare). I segni sono
lineari, cioè si estendono nel tempo. I segni sono distintivi: stella/stalla
DICOTOMIE DI DE SAUSSURE
Riassumendo, la linguistica strutturalista si basa su una serie di dicotomie
- Langue e parole
- Diacronia e sincronia
- Asse sintagmatico e paradigmatico
- Significato e significante
Facciamo un esperimento (che è stato effettuato al S. Raffaele di Milano con una tecnica di neuroimaging)
I sarchiaponi nafantavano nel gulco
Questa frase non ha senso, ma riconosciamo comunque nomi e verbi inventati sulla base della loro
morfologia e della loro posizione nella frase. Se somministriamo a dei parlanti nativi queste frasi, vediamo
che si attivano alcune aree cerebrali in cui vengono processati i fenomeni sintattici
Le lingue cambiano nel tempo e nello spazio, ad esempio l’italiano di Manzoni non è l’italiano di oggi:
“Quel ramo del lago di Como che volge a mezzogiorno”
- La variazione nel tempo di una lingua è detta variazione diacronica
- Quella nello spazio è variazione sincronica.
I due livelli di sincronia e diacronia vanno tenuti distinti, ma procedono per mutamenti dello stesso tipo,
cioè secondo regole simili.
FONETICA E FONOLOGIA
Sono due discipline strettamente correlate che studiano i suoni delle lingue umane.
Proprio perché parlare è un’attività molto più naturale che scrivere (e poiché le grammatiche sono
necessariamente opere scritte) è facile dimenticarsi della pervasività del parlato, ed anzi considerare la
lingua parlata come un riflesso di quella scritta.
In realtà la lingua è soprattutto un fenomeno del parlato (ed è la lingua scritta ad essere semmai un riflesso
di quella parlata), si consideri ad esempio che:
- esistono molte lingue che vengono parlate ma non scritte, ma non viceversa; molti adulti parlano una
lingua naturale senza saperla scrivere;
- i bambini imparano a parlare in modo naturale, senza bisogno di un addestramento esplicito, come
accade per lo scritto;
- il parlato è il sistema di comunicazione di gran lunga più efficiente usato dagli uomini: possiamo
trasmettere 25 suoni al secondo quando parliamo, ma solo 7-9 segmenti al massimo in forme di
comunicazione non parlata;
- ci consente di comunicare in moltissimi contesti in cui non possiamo comunicare per iscritto, tanto
che comunichiamo molto più spesso per via orale che per iscritto.
La linguistica tende quindi a porre l’enfasi sulla lingua parlata piuttosto che su quella scritta.
Inoltre, proprio perché viene studiata a scuola, noi siamo tutti abbastanza consapevoli di come è strutturata
l’ortografia della nostra lingua, mentre tendiamo ad essere meno consapevoli delle strutture
fonetiche/fonologiche della lingua, dato che le abbiamo acquisite in maniera inconscia.
SUONI DEL LINGUAGGIO
Le lingue utilizzano il flusso sonoro proveniente dai polmoni modulandolo attraverso il nostro apparato
fonatorio per veicolare significati.
Il flusso sonoro è continuo, anche se noi percepiamo entità discrete al suo interno. Tra tutti i suoni che il
nostro apparato fonatorio può emettere, solo alcuni vengono usati per il linguaggio. Ad esempio: nessuna
lingua usa fischi o singhiozzi come suoni linguistici.
Ogni lingua ha un insieme chiuso di foni, che sono un sottoinsieme dei foni possibili nelle lingue del mondo.
Il linguaggio umano è dunque
- composizionale, nel senso che la possibilità di combinare i suoni in vari modi
dà alle lingue la capacità di esprimere un numero altissimo di significati utilizzando un numero esiguo di
elementi costitutivi.
- economico, nel senso che nessuna lingua utilizza tutti i foni possibili ma solo un sottoinsieme di essi.
FONOLOGIA:
Un enunciato può infatti venire scomposto in una sequenza di parole che sono le unità minime di significato.
Ogni parola viene a sua volta scomposta in unità minime prive di significato, che sono segmenti sonori
indivisibili detti foni (ad es. la parola nostri può essere scomposta in n, o, s, t, r, i).
Il linguaggio umano è quindi composizionale, nel senso che la possibilità di combinare i suoni in vari modi
dà alle lingue la capacità di esprimere un numero altissimo di significati utilizzando un numero esiguo di
elementi costitutivi.
Ioni meno comuni interlinguisticamente sono anche quelli che tendono ad occorrere in un minor numero di
parole nelle lingue in cui sono presenti; per esempio, [t] e [λ] sono entrambi presenti nell’inventario
dell’italiano, però [t] è un fono presente nella grande maggioranza delle lingue, mentre [λ] è un fono raro.
- gli inventari fonologici tendono ad essere organizzati in maniera “sistematica”;
Per esempio: se una lingua ha occlusive labiali e dentali, ed ha un’opposizione tra un’occlusiva labiale sorda
e un’occlusiva labiale sonora, è probabile che abbia anche un’opposizione tra un’occlusiva dentale sorda e
un’occlusiva dentale sonora: l’italiano ha sia un’ opposizione tra una [p] e una [b], che un’opposizione tra
una [t] e una [d].
Il motivo di questa organizzazione sistematica è probabilmente dovuto al fatto che organizziamo la
percezione in patterns.
I foni che compongono una parola possono essere influenzati l' uno dall' altro: rivedete a questo proposito l'
esempio fatto alla prima lezione tra la /s/ di sbaglio e quella di strano.
La /s/ di sbaglio si sonorizza per effetto della consonante sonora /b/ che la segue. Si tratta di un processo di
assimiliazione che coinvolge elementi contigui.
La fonologia è quel settore della grammatica che studia la competenza fonologica che un parlante ha della
propria lingua materna; essa studia cioè i sistemi fonologici che vengono usati nelle lingue naturali per
trasmettere dei significati (quei sistemi che permettono di stabilire una differenza tra suoni che distinguono
significati e suoni che non li distinguono). Inoltre studia la rappresentazione mentale o psicologica dei
suoni linguistici (materiale segmentale: vocali e consonanti) e degli elementi sonori che vengono usati in
modo sistematico nelle lingue per comunicare significati (es. accento e tono).
La fonologia studia i fonemi, cioé i foni che portano distinzioni di significato e le loro relazioni, che sono
descrivibili in termini di regole formali. Non tutti i foni di una lingua portano distinzioni di significato,
quelli che lo fanno sono detti fonemi.
Non tutti i foni, o tutte le serie di foni, sono ugualmente diffusi negli inventari fonologici delle lingue del
mondo: alcuni foni, essendo difficili da percepire e/o produrre, sono più rari di altri; per esempio, le vocali
anteriori arrotondate sono meno comuni delle vocali anteriori non arrotondate (probabilmente per ragioni
legate alla percezione).
La distinzione tra lama e lana segnala una distinzione di significato.
Invece la distinzione tra la /n/ di invece e quella di anta non segnala alcuna distinzione di significato
Il nostro cervello è allenato a percepire come rilevanti solo le distinzioni che sono rilevanti per il significato
e ignorare le altre - quindi dal punto di vista della percezione di un parlante nativo, quello che importa sono i
fonemi.
La fonologia si occupa quindi di come le lingue organizzano le unità minime prive di significato - i foni -
ai fini della comunicazione linguistica; essa studia anche i vincoli che le lingue impongono su come i foni
possano venire usati con funzione distintiva:
cane vs pane rane vs Rane
1. alcuni suoni servono a distinguere significati, altri no; in italiano esiste a livello fonologico una sola
r: due pronunce diverse di r (alveolare/uvulare) non distinguono significati diversi, mentre [g] e [d]
distinguono significati diversi:
[r]emo / [R]emo va[d]o / va[g]o
Queste due parole costituiscono una coppia minima, formata da due parole che si distinguono solo per un
diverso segmento collocato nella stessa posizione.
Si definisce
fono un qualsiasi suono linguistico; si indica con un simbolo fonetico racchiuso tra parentesi quadre [ ]
Si definisce fonema la rappresentazione mentale di un fono che abbia una funzione distintiva all’interno di
un determinato sistema fonologico, che consenta cioè di ‘distinguere’ il significato di una parola da un’altra.
- I fonemi vengono rappresentati da un simbolo dell’alfabeto fonetico racchiuso tra barre diagonali / /
- I suoni linguistici sono detti foni
- Non tutti i foni sono anche fonemi, ma tutti i fonemi sono foni.
I grafemi sono unità di un sistema scritto, e sono solo parzialmente in relazione con i foni, uno stesso
grafema può rappresentare foni diversi e lo stesso fono può avere rappresentazioni grafiche diverse
La maggior parte dei foni che produciamo viene prodotta sfruttando il flusso d’aria che fuoriesce dai
polmoni durante l’espirazione (flusso polmonare egressivo, cioè diretto verso l’esterno).
Altre lingue usano anche quello ingressivo, in cui il flusso d’aria è diretto verso l’interno; l’italiano usa solo
questo tipo di flusso - il flusso d’aria polmonare egressivo sale dai polmoni ai bronchi alla trachea fino alla
laringe; nella laringe si trova la glottide, che contiene due membrane muscolari, le corde vocali, le quali
possono essere accostate/vicine o aperte/lontane.
Se sono accostate, vibrano con il passaggio dell’aria e abbiamo suoni sonori; se sono aperte, non vibrano
per il passaggio dell’aria ed abbiamo suoni sordi.
Lo spazio al di sopra delle corde vocali si chiama tratto vocale, che si divide a sua volta in orofaringe e
cavità nasale. Le parti dell’orofaringe che vengono usate per produrre suoni si chiamano articolatori.
L’ostruzione del flusso è in genere prodotta dall’ avvicinamento degli articolatori sulla superficie inferiore
dell’orofaringe a quelli collocati sulla superficie superiore dell’orofaringe.
Gli articolatori superiori comprendono:
labbro superiore denti superiori/alveoli palato (duro)
velo palatino (palato molle) ugola
faringe (area compresa tra ugola e laringe)
Gli articolatori inferiori comprendono:
labbro inferiore, diverse parti della lingua: corona (punta e lama della lingua), dorso, radice (o parte
posteriore).
La cavità nasale
Il flusso d’aria che sale oltre la glottide può essere emesso all’esterno o attraverso la cavità orale o
attraverso la cavità nasale. La direzione è determinata dalla posizione sollevata o abbassata del velo
palatino; il velo può cioè trovarsi in posizione alzata, e premere contro la parete posteriore della faringe, nel
qual caso l’aria uscirà soltanto attraverso la cavità orofaringea e si avranno foni orali (come [a] e [t]),
oppure in posizione abbassata, nel qual caso l’aria uscirà anche attraverso la cavità nasale, e si avranno foni
nasali (come [˜a] e [n]).
La possibilità di far passare l’ aria liberamente nel canale orale o meno definisce la due grandi classi di foni:
- le vocali (foni in cui l'aria passa liberamente nel canale)
- le consonanti (foni in cui l'aria non passa liberamente nel canale, che viene ristretto in vari punti e
modi
POSIZIONE DELLE CORDE VOCALI
I foni si possono classificare anche tramite altre distinzioni fisiche
- sonorità: se le corde vocali vibrano abbiamo suoni sonori, se non vibrano abbiamo suoni sordi. Tutte
le vocali dell'italiano sono sonore, e lo sono anche alcune consonanti, tuttala classe viene detta delle
sonoranti.
Il nostro alfabeto non è adatto a descrivere i foni del linguaggio con precisione perché non c'è un rapporto
uno a uno tra foni e grafemi. Dato che i nostri alfabeti non sono adatti a descrivere con esattezza i foni,
impareremo ad usare l' IPA, l' alfabeto fonetico internazionale.
y [anteriore alta arrotondata] viene prodotta con la lingua in una posizione simile a quella
che assume quando si produce [i], ma con le labbra protruse (si trova per es. in tedesco dove viene trascritta
con ü – über, e in francese dove viene trascritta con û - sûr)
ø [anteriore media arrotondata] nel tedesco schön
œ [anteriore bassa arrotondata] nel tedesco zwölf
@ [centrale media non-arrotondata] questa vocale, nota anche come schwa, è la vocale neutra, cioè
il suono che si ottiene facendo vibrare le corde vocali e tenendo la lingua in posizione di riposo
(semplificando, si potrebbe dire che lo schwa è il suono delle corde vocali che vibrano); per questa ragione,
tende spesso trovarsi in posizioni atone: ad esempio, nell’inglese about; in tedesco e in napoletano si trova in
posizione finale non accentata di parola: ted. Mitte ‘centro’, nap. jamme ‘andiamo’.
[I [anteriore alta centralizzata] simile ad [i], ma prodotta con un gesto meno estremo, è dunque
leggermente meno alta e meno anteriore: a noi italiani suona quasi come una [e] molto breve (ad es. in
inglese beat [bi:t] vs. bit [bIt]]
Vocali nasalizzate
Tipicamente le vocali sono foni orali, cioè prodotti con il velo alzato che non lascia passare l’aria attraverso
il naso; capita talvolta, però, che davanti ad una nasale, per un effetto di assimilazione, le vocali vengano
prodotte con il velo abbassato (almeno per una porzione della loro durata), e cioè come vocali nasali o
nasalizzate (rappresentate in IPA da una tilde (~) sopra il simbolo della vocale); per esempio, in un italiano
parlato con forte accento veneto, canto può diventare [k˜a:ɳto].
In un contesto di questo genere, la nasale, nel corso della storia della lingua, può perdersi, ma la vocale
precedente ne preserva la nasalità; avremo in tal caso lo sviluppo di vocali nasalizzate come fonemi
autonomi, come esistono ad esempio in francese o in portoghese.
CONSONANTI
Possiamo classificare le consonanti sulla base di tre parametri:
- modo di articolazione, cioè in base al modo in cui gli articolatori producono la chiusura parziale o
totale della cavità orofaringea;
- luogo/punto di articolazione, cioè in base a quali articolatori producono la chiusura parziale o totale
della cavità orofaringea;
- sonorità, cioè in base al fatto che le corde vocali siano separate o accostate e in vibrazione durante la
produzione del suono.
La tabella IPA delle consonanti prodotte con aria proveniente dai polmoni riflette questa tassonomia: le
righe corrispondono a diversi modi di articolazione; le colonne corrispondono a diversi luoghi di
articolazione (in un rapporto “iconico” con i tipici diagrammi dell’apparato fonatorio); all’interno di
ciascuna casella, il fono sordo è a sinistra, quello sonoro a destra.
Occlusive (orali): il modo di articolazione occlusivo orale consiste in un blocco completo dell’aria in un
punto del canale orale (per esempio, nel caso di [p], il blocco viene formato con le labbra); il velo è alzato,
così che l’aria non può passare attraverso il naso. Le occlusive sono quindi prodotte da una occlusione
completa del canale in cui passa l'aria, seguita da un'improvvisa apertura; esse sono anche dette momentanee
o esplosive proprio perché producono, nel momento in cui sono pronunciate, una sorta di esplosione d'aria.
Occlusive bilabiali, prodotte chiudendo le labbra:
sorda p padre [‘pa:dre] sonora b barca [‘barka]
opera abito
Occlusive dentali, prodotte con la corona della lingua che va contro i denti:
sorda t talpa [‘talpa] sonora d diga [‘di:ga]
etico dardo
Occlusive velari, prodotte con il dorso della lingua che va contro il velo:
sorda k canto [‘kaɳto] sonora g gara [‘ga:ra]
icona agosto
Fricative: il modo di articolazione fricativo (orale) consiste in un forte restringimento in un punto del canale
orale, cosicché l’aria, costretta a passare attraverso una stretta fessura, produce un rumore di frizione.
Fricative bilabiali, prodotte accostando il labbro superiore e quello inferiore:
sorda φape [‘a:φe]con gorgia sonora ß ewe [eße]]
Fricative labiodentali, prodotte con il labbro inferiore accostato agli incisivi superiori:
sorda f fata [‘fa:ta] sonora v vita [‘vi:ta]
tifo diva
Fricative interdentali, pronunciate con la punta della lingua che sporge tra i denti, o comunque con un
accostamento della lingua ai denti:
sorda θ think [‘θiɳk] sonora ð that [ðaet]]
Sibilanti alveolari (equivalenti fricative di [t d]) anche se nel territorio italiano si registra una notevole
variazione rispetto all’esatto luogo di articolazione:
sorda s sedia [‘sƐ:dja] sonora z isola [‘i:zola]
astro mese
Sibilanti palatoalveolari, prodotte con avvicinamento della lamina alla zona postalveolare:
sorda sciame [‘a:me] sonora garage [ga’ra]
cuscino division [di’vion]
Fricativa glottidale sorda, si tratta del suono reso dal grafema h che si trova in tedesco o inglese in haben /
have
Affricate: le affricate sono occlusive la cui fase di rilascio è così lenta che finisce per suonare come la
fricativa equivalente; sono perciò consonanti foneticamente complesse perché iniziano come occlusive e
terminano come fricative. Si può dunque pensare alle affricate come ad un’occlusiva ed una fricativa col
medesimo luogo di articolazione, prodotte in rapida sequenza, e sentite dai parlanti come un’unità fonetica
(tanto che in vari sistemi ortografici possono essere indicate con un solo grafema).
Affricate alveolari (equivalenti affricate delle occlusive [t/d] e delle fricative [s/z]); sia la resa fonetica che
la distribuzione tendono a variare molto da area ad area e perfino da parlante a parlante:
sorda ts stazione [sta’tsjo:ne] sonora dz zero [‘dzƐ:ro]
ozio azoto
razza [‘ratstsa] ‘stirpe’ razza [‘radzdza]‘tipo di pesce’
[Ricordiamo anche una monovibrante o battito (tap) alveolare, simile ad una [r] prodotta con una singola
vibrazione, o una [d] brevissima e molto debole, dove la lingua arriva appena a toccare i denti o gli alveoli;
si tratta della r breve e non iniziale di parola dello spagnolo (pe[R]o ‘però’ vs pe[r:]o ‘cane’) e anche di vari
italiani regionali); in inglese americano è un allofono di /t d/ in certi contesti (come in city [‘sIRI]) mentre in
inglese britannico è la tipica pronuncia di r tra due vocali]
(Laterali)
Il modo di articolazione laterale consiste in una chiusura nella parte mediana del cavo orale, mentre l’aria
può comunque passare da uno o ambedue i lati; come le nasali e le vibranti, le laterali tendono ad essere
sonore. In italiano distinguiamo:
- laterale alveolare l, equivalente laterale di [d], come in lana[‘la:na], velo;
- laterale palatale , suono piuttosto raro nelle lingue del mondo, come in raglio [‘rao], figlio.
Approssimanti o semivocali
Le semivocali (o approssimanti) sono prodotte con una costrizione rapida e ‘aperta’, lasciando abbastanza
spazio all’aria di passare senza creare un rumore di frizione; sono tipicamente sonore; possiamo pensare ad
esse come a segmenti “intermedi” tra consonanti e vocali.
Le semivocali sono dunque delle vocali che non si trovano nella posizione di nucleo sillabico (se sono nuclei
diventano - ovviamente - delle vocali, cioè rispettivamente i/u); possono svolgere la funzione di consonante
(womo, jena) o aggiungersi al nucleo formando la coda della sillaba (cawsa, bajta); possono anche, come
altre consonanti, essere aggiunte all'attacco della sillaba (bwono, bjanko).
Qualcuno distingue le semivocali (quelle che seguono il nucleo) dalle semiconsonanti (quelle che precedono
il nucleo, e svolgono le funzioni di consonante; foneticamente producono un più forte rumore).
- approssimante palatale j: simile ad una fricativa palatale sonora articolata molto debolmente (questi
due foni e la vocale [i] formano una sorta di continuum); si trova in italiano per es. in iodio [‘jɔ:djo]
- approssimante labiovelare w: si ottiene con una debole costrizione velare e concomitante
arrotondamento delle labbra; si può pensare a questo segmento - molto comune - come ad una specie
di versione ‘consonantica’ della vocale [u]; in italiano si trova, ad es., nella parola uomo [‘wɔ:mo].
Ostruenti e sonoranti
L’insieme di tutte le consonanti escluse le sonoranti, cioè tutte le consonanti con il tratto [- sonorante], sono
dette ostruenti.
Mentre lo stato non marcato delle sonoranti è la sonorità, lo stato non marcato delle ostruenti è la mancanza
di sonorità: la sonorità viene aggiunta alle ostruenti con un dispendio ulteriore di energia (tensione delle
corde vocali per accostarle e favorire la loro vibrazione al passaggio dell'aria); la mancanza di sonorità è
ottenuta nelle vocali e nelle consonanti sonoranti con un sovrappiù di energia che blocca la vibrazione delle
corde vocali, che sarebbe spontanea.
Distinzione in base al punto di articolazione
- bilabiali: l’ostruzione o l’occlusione è data dall’avvicinamento delle labbra: occlusive [p] [b]; continue [φ]
[ß]; sonoranti [m];
- labiodentali: l’ostruzione è data dalle labbra inferiori che si avvicinano ai denti superiori: continue [f] [v];
- dentali: l’ostruzione o l’occlusione avviene con la lingua sui denti o sugli alveoli: occlusive [t][d], continue
[s][z], affricate [ts][dz], sonoranti [l][n] [r];
- interdentali: l’ostruzione è determinata dall’inserimento della lingua fra i denti: continue [] [];
- palatali: l’occlusione o l’ostruzione è data dalla lingua sulla parte centrale del palato, detta anche palato
duro: continue [] [], occlusive /c/ affricate [t] [d], sonoranti [][ñ];
- velari: l’ostruzione o occlusione è data dalla lingua sulla parte posteriore del palato, detta ‘velo palatino’:
occlusive [k] [g], sonoranti []
Distinzione in base alla sonorità
- sonore, se c'è vibrazione delle corde vocali (es.: b, d, v, g);
- sorde, se non c'è vibrazione delle corde vocali (es.: p, t, f, k).
L’inventario fonologico delle lingue
- Non tutti i foni, o tutte le serie di foni, sono ugualmente diffusi negli inventari fonologici delle lingue
del mondo: alcuni foni, essendo difficili da percepire e/o produrre, sono più rari di altri; per esempio,
le vocali anteriori arrotondate sono meno comuni delle vocali anteriori non arrotondate;
- I foni meno comuni interlinguisticamente sono anche quelli che tendono ad occorrere in un minor
numero di parole nelle lingue in cui sono presenti; per esempio, [t] e [λ] sono entrambi presenti
nell’inventario dell’italiano, però [t] è un fono presente nella grande maggioranza delle lingue,
mentre [λ] è un fono raro;
- Gli inventari fonologici tendono ad essere organizzati in maniera “sistematica”; per esempio, se una
lingua ha occlusive labiali e dentali, ed ha un’opposizione tra un’occlusiva labiale sorda e
un’occlusiva labiale sonora, è probabile che abbia anche un’opposizione tra un’occlusiva dentale
sorda e un’occlusiva dentale sonora: l’italiano ha sia un’ opposizione tra una [p] e una [b], che
un’opposizione tra una [t] e una [d].
Probabilmente, patterns sistematici di questo genere sono comuni perché sono il risultato di sistemi
linguistici che cercano di sfruttare al massimo un numero minimo di manovre articolatorie; per esempio, per
imparare a produrre un sistema che abbia [p] e [d], un bambino deve imparare a produrre occlusive sorde e
sonore, e occlusive labiali e dentali; sarebbe allora uno ‘spreco’ se lo stesso sistema non sfruttasse le altre
possibili combinazioni, cioè [b] (labiale e sonora) e [t] (dentale e sorda).
Le lingue usano solo un sottoinsieme dei foni possibili probabilmente per due ragioni collegate:
a) semplicemente, non è necessario usare tutti i foni possibili, visto che, sfruttando la proprietà della
composizionalità fonetica, le lingue possono distinguere un numero enorme di parole con un numero
molto limitato di foni;
b) poiché la comunicazione parlata ha luogo a una grande velocità, attraverso un segnale continuo, è
meglio usare un numero ridotto di foni per ridurre le possibilità di equivoco (se la mia lingua ha solo
[u] ma non [w], non dovrò nemmeno pormi il problema se il fono che ho appena sentito fosse una [u]
o una [w])
Fono, fonema e allofono
Si definisce fono un qualsiasi suono linguistico; si indica con un simbolo fonetico racchiuso tra parentesi
quadre [ ]
Si definisce fonema la rappresentazione mentale di un fono che abbia una funzione distintiva all’interno di
un determinato sistema fonologico, che consenta cioè di ‘distinguere’ il significato di una parola da un’altra.
I fonemi vengono rappresentati da un simbolo dell’alfabeto fonetico racchiuso tra barre diagonali / /.
I fonemi non sono quindi dei suoni, ma la rappresentazione astratta di un suono; le manifestazioni fisiche di
un fonema sono i foni: ciascun fonema corrisponde infatti ad almeno un fono usato dalla lingua in questione.
I fonemi sono dunque le unità minime che vengono utilizzate da una lingua per distinguere una parola
dall’altra, cioè unità fonetiche con funzione distintiva. Tale funzione distintiva dei fonemi è testimoniata
dalla presenza di coppie minime, cioè coppie di parole che si distinguono per un unico segmento collocato
nella stessa posizione; ad esempio, i fonemi /v/ e /r/, cioè le unità distintive che ci permettono di distinguere
tra loro le parole vado e rado, corrispondono ai foni [v] e [r]; analogamente per va[d]o/va[g]o ma non per
[r]amo/[R]amo, il che dimostra che la differenza di articolazione non è rilevante.
In alcuni contesti è possibile che una opposizione distintiva tra due fonemi si annulli: ad esempio,
l’opposizione distintiva tra o chiusa e o aperta si ha in italiano solo in sillaba tonica ( [botte] vs [bɔtte] ),
mentre in sillaba atona si ha solamente la o chiusa. Questo è dovuto ad una proprietà fonetica della vocale
aperta, che essendo rilassata è più instabile; quella chiusa, essendo tesa, è invece più stabile dal punto di
vista articolatorio.
Può accadere tuttavia che uno stesso fonema abbia manifestazioni fonetiche diverse, ossia corrisponda a foni
diversi (ma foneticamente simili) in contesti diversi; tali foni vengono definiti allofoni. Gli allofoni
corrispondono allo stesso fonema, cioè alla stessa unità distintiva, poiché i parlanti della lingua in questione
non sentono tali foni come entità indipendenti, ma appunto come manifestazioni leggermente diverse della
stessa unità. Gli allofoni di uno stesso fonema non sono in opposizione distintiva, dato che hanno
distribuzione complementare, cioè la loro occorrenza è predicibile in base al contesto.
Ad esempio, la cosiddetta r moscia [R] (vibrante uvulare) non è un fonema, ma un allofono di /r/ proprio di
alcuni parlanti, perché non associamo significati diversi alla parola ramo pronunciata con la vibrante uvulare
o alveolare.
Variazione libera
Due allofoni si dicono in variazione libera quando la loro distribuzione non è sottoposta ad alcuna regola,
ma possono comparire indifferentemente senza alcun cambio di significato.
Ci sono diversi casi di varianti libere in italiano: uno è quello del fonema /r/ che può essere pronunciato in
diverse varianti da parlanti diversi (alveolare vs uvulare), ma questo non cambia il significato della parola
nella quale il fonema si trova; il fonema ha quindi varie realizzazioni che si distribuiscono liberamente senza
che per questo la nostra rappresentazione mentale di esso sia diversa.
Si possono anche dare casi di varianti libere all’interno dello stesso parlante: ad esempio alcuni parlanti
possono pronunciare la parola perla con la e aperta o chiusa indifferentemente; spesso queste distinzioni non
sono collegate a distinzioni linguistiche ma sociolinguistiche, cioè il parlante usa una forma che può
appartenere ad un livello stilistico più o meno alto.
ALLOFONI DI / N/
In italiano sembrano esistere tre fonemi nasali (m, n, gn) come rivelano le tre seguenti coppie minime:
[m]ano vs [n]ano le[n]a vs le[ñ]a ra[m]o vs ra[ñ]o
In realtà esistono anche altri due foni nasali, la nasale velare [h] e la nasale labiodentale [ɱ]; la loro
distribuzione è però predicibile, in quanto la prima si trova solo davanti a consonanti velari, la seconda solo
davanti a consonanti labiodentali:
ba[h]co fa[h]go a[ɱ]fibio i[ɱ]vidia
Questi due segmenti non hanno valore distintivo perché la loro occorrenza è predicibile dal contesto; quando
un elemento fonetico è predicibile dal contesto fonetico non è distintivo. Non abbiamo perciò a che fare con
dei fonemi nasali ma con due allofoni del fonema /n /; esse sono in distribuzione complementare con il fono
[n], in quanto la presenza di un segmento preclude la presenza dell’altro.
Quindi il fonema /n/ avrà tre diverse manifestazioni fonetiche negli allofoni [ɱ] (davanti a fricative
labiodentali), [h] (davanti ad occlusive velari), [n] (in tutti gli altri contesti).
Si noti però il seguente problema: visto che anche /m/ non può capitare davanti a /f v/ o /k g/, perché
diciamo che [ɱ] e [h] sono allofoni di /n/ e non di /m/? Per [h] si può sostenere che, siccome al nostro
orecchio suona più simile a /n/ che ad /m/, è legittimo classificarla come un allofono di /n/; ma [ɱ] suona
semmai più come una /m/ che come una /n/; bisognerebbe allora dire che [ɱ] è un allofono di /m/, e che /n/
semplicemente non capita mai davanti a /f v/?
D’altronde, in alcuni contesti osserviamo una [ɱ] dove solitamente troviamo una /n/, il che suggerisce un
legame tra questi due foni (per esempio, la /n/ di in può diventare [ɱ] davanti a una parola che comincia con
una labiodentale: i[ɱ] fretta (soprattutto se detto velocemente).
Anche se l’idea di allofonia è spesso utile a capire come è strutturato il sistema di foni di un linguaggio, si
tratta di una nozione non priva di problemi; a rigor di termini, dovremmo forse anche includere un allofono
dentale, che capita davanti alle dentali, ed un allofono postalveolare, che capita davanti alle postalveolari.
ALLOFONI DI / S/
In italiano standard settentrionale, meridionale e in gran parte delle varietà centrali, le fricative alveolari
[s]/[z] sono allofoni dello stesso fonema /s/, in distribuzione complementare.
La distribuzione dei due allofoni è diversa tra nord e centro/sud in posizione intervocalica: mentre nel nord il
fonema /s/ viene prodotto come [z] tra due vocali ([‘kaza]), nel centro/sud esso viene prodotto come [s]
([‘kasa]).
Il fonema /s/ viene prodotto invece come [z] davanti a consonante sonora ([z]baglio, [z]gomento, [z]legare]).
In tutti gli altri contesti il fonema /s/ viene prodotto come [s]: all’inizio parola [‘santo], in posizione post-
consonantca [polso], come consonante lunga [nesso], a fine parola [autobus]).
Se distinguete tra chie[s]e ‘domandò’ e chie[z]e ‘luoghi di culto’ parlate una varietà in cui i due foni
formano ancora fonemi distinti.Si noti come la distinzione tra [s] e [z] sia una distinzione tra fonemi in altre
lingue, come l’inglese (per es. ice [aIs] vs. eyes [aIz]); è tipico, per gli italiani che parlano inglese, applicare,
erroneamente, la distribuzione italiana di [s] e [z] a parole inglesi – per es. dire [z]low invece che [s]low.
TRATTI SOPRASEGMENTALI
Analizzeremo qui brevemente le caratteristiche soprasegmentali dei foni, cioè quelle proprietà dei foni che
riguardano il loro grado di prominenza rispetto ai foni circostanti, piuttosto che essere proprietà intrinseche
dei foni in questione.
Nello studio dei fenomeni soprasegmentali, è particolarmente difficile separare l’analisi fonologica (cioè
l’analisi di come le caratteristiche soprasegmentali vengono usate ai fini della comunicazione linguistica)
dall’analisi fonetica (cioè lo studio dei meccanismi articolatori e percettivi attraverso i quali le caratteristiche
soprasegmentali si manifestano).
Le tre manifestazioni fonetiche dei tratti soprasegmentali. Il livello di prominenza di un fono o di un gruppo
di foni si manifesta tramite tre meccanismi articolatori, con corrispondenti manifestazioni acustiche:
- durata: l’articolazione di un fono può essere eseguita più lentamente, così che il fono avrà
un’estensione temporale maggiore di quella che ha solitamente;
- intensità: un fono può venir prodotto con una maggiore quantità di aria espirata dai polmoni rispetto
ai foni limitrofi; la manifestazione acustica dell’intensità consiste in un aumento del volume di suono
rispetto ai foni circostanti;
- tonalità: le corde vocali possono vibrare più o meno velocemente, creando foni sonori con una
tonalità più alta o più bassa.
ACCENTO
In numerose lingue, gran parte delle parole hanno un accento, cioè un singolo fono (tipicamente, una vocale)
viene percepito come quello che ha maggiore prominenza nell’intera parola.
Per esempio, gli italiani sentono la prima [a] di papa [‘papa] come la più prominente, cioè come la vocale
accentata; viceversa, in papà [pa’pa] è la seconda vocale ad essere accentata.
L’accento può essere rappresentato o con un trattino obliquo sulla vocale accentata, o con un trattino
verticale posto immediatamente prima della sillaba o della vocale accentata; noi lo indicheremo con il
trattino prima della sillaba.
L’accento può avere una funzione demarcativa, cioè la funzione di aiutarci a identificare dove finisce una
parola e dove ne inizia un’altra nel continuum del segnale acustico (nel parlato, non ci sono pause in
corrispondenza degli spazi bianchi dello scritto); la funzione demarcativa dell’accento è particolarmente
chiara in lingue con accento fisso, cioè in lingue in cui l’accento cade sempre sulla stessa vocale (per es.,
sempre sulla prima vocale in polacco, sempre sull’ultima vocale in francese).
Per esempio, [Mattys et al. 1999] hanno mostrato sperimentalmente che i bambini inglesi di nove mesi
usano la posizione dell’accento (oltre ad altri indizi) per stabilire dove inizia una nuova parola.
Dal punto di vista fonetico, la prominenza della vocale accentata può manifestarsi in diversi modi;
l’accento non corrisponde cioè ad una unica caratteristica fisica ma all’insieme di tre caratteristiche:
- intensità: una sillaba accentata è più forte di una sillaba non accentata, cioè pronunciata con
maggiore intensità nell’emissione del flusso d’aria;
- lunghezza: una sillaba accentata dura più a lungo di una non accentata;
- altezza tonale: una sillaba accentata ha una maggiore altezza tonale, cioè le corde vocali vibrano con
maggiore frequenza.
Il modo in cui questi tre fattori contribuiscono all’accento varia entro certi limiti da lingua a lingua; in
italiano i principali correlati fisici della vocale accentata sono la lunghezza e l’intensità, mentre in altre
lingue prevale l’altezza tonale e così via. Si distinguono perciò due tipi di accento:
- accento dinamico (dell’italiano), in cui l’altezza tonale non è rilevante;
- accento musicale avente come correlato fonetico principale l’altezza tonale.
In alcune lingue, come l’italiano (o l’inglese, il tedesco, il giapponese), l’accento può avere funzione
distintiva, mentre in altre la sua posizione è predicibile e quindi non è distintiva:
méta metà àncora ancòra prìncipi princìpi pàpa papà
Tuttavia, anche in italiano i casi in cui l’accento ha funzione distintiva sono piuttosto rari, e per lo più
l’accento tende a cadere sulla penultima vocale. In una lista di 8857 parole italiane foneticamente trascritte
(gentilmente fornitami da Piero Cosi del CNR per la Fonetica di Padova) ho trovato che ben 7160 parole
(più dell’80%) hanno l’accento sulla penultima sillaba.
Dobbiamo inoltre distinguere tra accento primario e accenti secondari, cioè accenti di sillabe meno
prominenti di quelle con accento primario ma più prominenti di quelle atone:
’’mara’tona ’’trasforma’zione ’’serena’mente
In un enunciato, tra le sillabe portatrici di accento alcune sono più prominenti di altre; i diversi gradi di
accentuazione di un enunciato costituiscono il contorno ritmico:
dovéva andArci il mése prOssimo
IPA E ACCENTO
L’accento può essere rappresentato o con un trattino obliquo sulla vocale accentata, o con un trattino
verticale posto immediatamente prima della sillaba o della vocale accentata; noi lo indicheremo con il
trattino prima della sillaba.
papa [‘papa] papà [pa’pa]
I sistemi linguistici possono sfruttare la distinzione tra foni di durata “normale” e foni prodotti con una
durata maggiore, cioè l’opposizione di lunghezza tra foni brevi e foni lunghi.
La lunghezza è una caratteristica fonetica soprasegmentale che può avere valore distintivo; per esempio
l’italiano ha una distinzione tra consonanti lunghe (dette anche geminate) e consonanti brevi; la lunghezza
consonantica in italiano ha valore distintivo:
pala palla papa pappa fata fatta fato fatto fumo fummo
In italiano la lunghezza vocalica invece NON ha valore distintivo
ALLUNGAMENTO VOCALICO
In italiano non esiste una distinzione fonemica tra vocali lunghe e vocali brevi; la lunghezza vocalica non ha
valore distintivo perché è predicibile dal contesto: le vocali accentate tendono ad essere più lunghe delle
vocali non accentate; in particolare, una vocale accentata in sillaba aperta non finale di parola si
allunga:
ma’la:to se’re:no va’gi:to pa’ro:la pa’lu:de
Per esempio, la [e] di pero è più lunga della [e] di però, e si potrebbe annotare, in una trascrizione
relativamente stretta, come lunga: [‘pe:ro].
La vocale di una sillaba aperta tonica è quindi più lunga della corrispettiva vocale in sillaba chiusa o di
quella in sillaba aperta ma atona.
Il giapponese è un esempio di lingua dove c’è un chiaro contrasto fonologico sia tra vocali lunghe e vocali
brevi che tra consonanti lunghe e consonanti brevi.
Tipicamente, si rappresentano nella trascrizione solo i foni lunghi, che nella tradizione IPA vengono marcati
dal crono (consistente in due punti [:]) posto alla destra del simbolo del fono. Se un fono non è
esplicitamente marcato come lungo, vuol dire che è breve. Noi rappresentiamo le vocali lunghe con il crono,
le consonanti lunghe mediante il raddoppiamento della consonante.
TONO/INTONAZIONE
La frequenza con cui vibrano le corde vocali determina l’altezza tonale di un suono: tanto più alta la
frequenza, tanto più acuto il suono.
In molte lingue (forse tutte), la possibilità di variare l’altezza/tonalità dei foni sonori (cioè, da un punto di
vista articolatorio, la velocità di vibrazione delle corde vocali) viene sfruttata per trasmettere informazioni di
natura sintattica o pragmatica.
I parlanti hanno a propria disposizione una serie di altezze tonali; in alcune lingue, dette tonali, la variazione
ha valore distintivo all’interno della parola, cioè due elementi lessicali possono essere identici quanto a
contenuto segmentale e differire solo per il tipo di tono associato ad una sillaba. Ciò accade nel cinese
mandarino, che ha quattro toni: un tono costante (alto) e tre toni modulati (ascendente, discendente,
discendente-ascendente).
L’italiano non è una lingua tonale, ma usa l’intonazione per veicolare distinzioni complesse (come quella di
tipo di frase).
I seguenti foni consonantici non permettono un contrasto di lunghezza in italiano, nel senso che sono sempre
lunghi in posizione intervocalica [ts dz ñ gl], ma non ad esempio in inizio di parola.
La successione dei toni di un enunciato ne costituiscono il contorno intonativo o melodia.
Quindi in una trascrizione fonetica, questi foni in posizione intervocalica vanno sempre resi come lunghi, in
una trascrizione fonologica invece no:
Sbaglio [ˈzbaʎʎo] /ˈsbaʎo/
Ascensione [aʃʃen’sjo:ne] /aʃen’sjone/
FENOMENI FONOLOGICI
I segmenti non sono dei primitivi, ma possono essere scomposti e derivati da un insieme di diverse
proprietà, dette tratti;
la nostra rappresentazione mentale dei segmenti è costituita da un fascio di tratti basato su proprietà
articolatorie dei suoni. I tratti distintivi sono delle caratteristiche fisiche fondamentali e non ulteriormente
scomponibili dei foni.
Ogni segmento viene specificato con un fascio o insieme di tratti costituito da tutti i tratti necessari e
sufficienti a renderlo individuabile in modo non ambiguo.
a) funzione composizionale: specificare le caratteristiche che simultaneamente formano un singolo evento
articolatorio; descrivere ogni fono come fascio di tratti, cioè isolare una simultaneità di eventi nel continuum
del messaggio sonoro;
b) funzione classificatoria: definire classi naturali di suoni, cioè raggruppare i segmenti in classi naturali,
ossia in gruppi di segmenti che condividono uno o più tratti in comune; una classe comprenderà tutti e solo i
suoni che condividono un certo tratto.
CLASSI NATURALI
Definiamo dunque come classe naturale un insieme di foni che hanno una o più proprietà fonetiche in
comune.
Per esempio, le occlusive formano una classe naturale, perché sono tutti foni che hanno lo stesso modo di
articolazione; anche i foni sonori formano una classe naturale; le occlusive sonore formano un’altra classe
naturale (in questo caso, definita da due caratteristiche fonetiche - si tratta dunque dell’intersezione tra gli
insiemi definiti dalle due classi appena menzionate).
RESTRIZIONI FONOTATTICHE
I tratti esprimono anche le restrizioni fonotattiche dei sistemi fonologici, che stabiliscono quali segmenti
possono combinarsi tra di loro e quali no, cioè quali sono le possibili sequenze di suoni, dato un repertorio
segmentale; si tratta di restrizioni sulla distribuzione di un fono/fonema o di una classe di foni/fonemi (nel
senso che regolano le possibili combinazioni di foni/fonemi, come la sintassi regola le possibili
combinazioni di parole).
Ad esempio in italiano in fine di sillaba non si possono avere tutte le consonanti, ma solo liquide e nasali
(l/r/n/m) o consonanti geminate (tra le quali rientrano anche gl e gn); il tratto che accomuna liquide e nasali
è quello di sonorante.
E’ importante osservare che in linea di massima le restrizioni fonotattiche, seppur comuni
interlinguisticamente, non sono universali - ci sono lingue (il latino, l’inglese, il tedesco, il berbero) che
permettono almeno alcuni dei nessi di occlusive che non sono permessi dall’italiano, oppure delle occlusive
in fine di parola, ciò che non è ammesso in italiano.
I tratti ci servono anche per dare una adeguata descrizione dei fenomeni fonologici; questi possono infatti
riguardare classi naturali di segmenti, cioè segmenti che abbiamo almeno un tratto in comune.
Dato un determinato contesto segmentale, i fenomeni fonologici possono essere più o meno produttivi, nel
senso che possono manifestarsi automaticamente nell’appropriato contesto fonologico oppure attivarsi solo
in certi casi.
assimilazione / dissimilazione
cancellazione / inserzione
coalescenza
riduzione / rafforzamento
neutralizzazione
ASSIMILAZIONE
Si tratta di un processo fonologico per cui un segmento assume lo stesso valore, per uno o più tratti, di un
altro segmento, che può essere immediatamente adiacente o meno.
Questo tipo di adattamento ha una base nella fisica articolatoria, spesso secondo una strategia di minimo
sforzo.
Tipi di assimilazione
anticipatoria, perseverativa, bidirezionale.
L’assimilazione può inoltre essere parziale o totale: nel caso di assimilazione parziale si assimila solo una
parte dei tratti, nel caso di assimilazione totale si assimila tutto il segmento.
ASSIMILAZIONE ANTICIPATORIA PARZIALE
Per quanto riguarda l’assimilazione anticipatoria parziale possiamo prendere ad esempio il caso della
nasale omorganica già esaminato: gli allofoni di /n/ si assimilano per il punto di articolazione alla
consonante che segue (velare se la consonante è velare, labiodentale se la consonante è labiodentale):
antico vs [‘akora] vs [aɱ’fo:ra]
intero vs [‘igwine] vs [iɱ’fì:do]
ASSIMILAZIONE ANTICIPATORIA TOTALE
I prefissi in e con danno origine a casi di assimilazione anticipatoria totale della nasale rispetto alla
consonante iniziale della parola modificata, se questa è una sonorante:
in+resistibile > irresistibile con+regionale > corregionale
in+legale > illegale con+legare > collegare
in+mancabile > immancabile con+miserare > commiserare
L’assimilazione non ha luogo se la consonante seguente non è sonorante, ma, per esempio, una occlusiva:
in+calcolabile > incalcolabile
in+trovabile > introvabile
in+guaribile > inguaribile
ASSIMILAZIONE PERSEVERATIVA
Si verifica quando durante la produzione di un fono alcuni organi dell’apparato vocale prolungano
l’articolazione di un suono che precede.
Si consideri ad esempio il morfema del plurale dell’inglese: se la consonante che precede è [+sonora] si ha
[z], se la consonante che precede è [-sonora], cioè sorda, si ha [s]:
fad[z] vs cat[s] lab[z] lap[s]
dog[z] pack[s]
La forma sottostante corrisponde probabilmente alla fricativa alveolare sonora /z/ che compare nella
maggior parte nei contesti.
ASSIMILAZIONE BIDIREZIONALE
In alcuni casi si può anche avere assimilazione anticipatoria e perseverativa allo stesso tempo, nel senso
che il primo di due segmenti si assimila a quello che segue per certi tratti ed il secondo a quello che precede
per altri tratti.
In italiano settentrionale il fonema /s/ si sonorizza e viene realizzato come [z] in posizione intervocalica,
cioè la fricativa alveolare sorda diventa sonora quando sia il segmento che precede sia quello che segue
sono vocalici (quindi segmenti sonori):
pa[s]ta vs pe[z]o vi[s]po u[z]o
La distinzione tra [s] e [z] non è quindi distintiva nell’italiano settentrionale, essendo predicibile dal contesto
fonetico.
ASSILAZIONE TRA SEGMENTI NON ADIACENTI
Esistono anche casi di assimilazione tra segmenti apparentemente non adiacenti: questo fenomeno si verifica
però esclusivamente tra vocali o tra consonanti; si parla rispettivamente di armonia vocalica o
consonantica.
L’armonia vocalica si verifica in lingue come l’ungherese o il turco, dove tutte le vocali di una parola si
assimilano per uno o più tratti.
Possiamo quindi caratterizzare la metafonia e l’armonia vocalica come due aspetti dello stesso fenomeno
che differiscono solo rispetto alla direzione progressiva o regressiva in cui avviene il mutamento: nel caso
dell’armonia vocalica va da sinistra a destra, nel caso della metafonia da destra a sinistra.
METAFONIA
Esiste anche un tipo di assimilazione tra vocali non adiacenti che non si estende a più vocali, ma si limita a
cambiare la qualità della vocale accentata di una parola per effetto della vocale del suffisso; si consideri ad
esempio la metafonia, che consiste nella assimilazione anticipatoria della vocale accentata di una parola alla
vocale seguente di un suffisso; nel seguente esempio la vocale tonica si innalza per effetto della presenza
delle vocali alte [i] ed [u] che sono la flessione del maschile singolare e plurale rispettivamente:
frédda vs frìddu/frìddi
DISSIMILAZIONE
Nei casi di dissimilazione due segmenti aventi un tratto in comune diventano più dissimili tra loro in
alcuni contesti; la motivazione di questo tipo di processo è in genere di tipo percettivo, dato che se due
segmenti sono dissimili si individuano meglio. E’ bene ricordare che spesso il processo di tipo percettivo e
quello di tipo articolatorio possono essere in conflitto tra loro.
Ad esempio il suffisso -ale che deriva aggettivi da nomi diventa -are se la consonante immediatamente
precedente è una /l/:
cultur-ale/tradizion-ale/speriment-ale/coloni-ale ma
molecol-are, pol-are, titol-are,consol-are
CANCELLAZION ED INSERZIONE
Questi processi trovano la loro motivazione nella struttura sillabica non marcata della sillaba; cancellazione
ed inserzione sono cioè spesso determinate dalla tendenza a semplificare la sillaba in maniera da ottenere
quella universalmente meno marcata: CV.
Un nesso segmentale non ammesso può essere eliminato cancellando uno dei due segmenti o inserendo un
segmento diverso che li separi (ad esempio in un nesso vocalico si inserisce una consonante, in un nesso
consonantico si inserisce una vocale):
CCV > CV con cancellazione di una C
> CVCV con inserzione di una V
CVV > CV con cancellazione di una V
> CVCV con inserzione di una C
Esempi di cancellazioni vocaliche con due vocali adiacenti si hanno nei casi di suffissazione:
compito+ino > * compitoino ma compitino
problema+ino > * problemaino ma problemino
bicchiere+ino > * bicchiereino ma bicchierino
rumore+oso > * rumoreoso ma rumoroso
fama+oso > * famaoso ma famoso
INSERZIONE
Anche il fenomeno della inserzione (epentesi), fenomeno più raro e meno sistematico, può essere spiegato in
genere nei termini di un avvicinamento alla struttura sillabica non marcata CV.
In italiano l’inserzione di una consonante è un fenomeno sporadico; in genere si tratta di [d] inserita tra due
vocali per evitare che siano adiacenti; ciò si verifica ad esempio tra la preposizione a o le congiunzioni e ed
o ed una parola iniziante per vocale:
Andrò ad Alessandria Impara ad esprimerti meglio
Gianni ed Anna si amano Mio fratello ed io partiremo
In qualche caso viene inserita una consonante prima dell’aggiunta di un suffisso; può trattarsi di una dentale,
ma anche di liquida o ladiodentale:
citta[d]ino, amalfi[t]ano, caffe[tt]iera/caffe[tt]ino
gile[r]ino, caffe[r]ino, papa[r]ino, papa[l]ino,
forli[v]ese
RIDUZIONE E RAFFORZAMENTO
Riduzione e rafforzamento possono essere visti come due diversi aspetti complementari dello stesso
fenomeno. Tra i casi di riduzione possiamo inserire la degeminazione e la coalescenza, mentre tra i casi di
rafforzamento la geminazione e la dittongazione.
I due fenomeni di riduzione o rafforzamento seguono la seguente scala di sonorità / forza: la sonorizzazione
delle consonanti sorde intervocaliche k t p che diventano g d v (p>b>v) fino alla caduta della consonante:
urtica(m) > ortìga, urtìga capillum > cavel(o)
digitum > dido (lombardo antico) did (pavese)
> deo (veneto)
catena > cadena > caena urtica(m) > ortìga, urtìga > ortìa, urtìa
RAFFORZAMENTO
Un caso di rafforzamento di vocale è rappresentato dall’allungamento della vocale tonica finale di sillaba,
cioè in sillaba aperta:
[ma’rittimo] [‘ma:re]
[pe’na:re] [‘pe:na]
[li’bretto] [‘li:bro]
RADDOPPIAMENTO FONOSINTATTICO
Una forma di rafforzamento di consonante, o geminazione consonantica, è attestato nel fenomeno del
raddoppiamento fonosintattico nelle varietà italiane centro-meridionali; il fenomeno può verificarsi dopo la
prima e la terza persona singolare del presente indicativo del verbo avere e la terza persona singolare di
essere:
Ho vvisto tua sorella Ha bbevuto due litri di vino
E’ ppartito anche Gianni
opo i pronomi interrogativi che e chi (dove e come?)
Che ffate stasera? Che mmangi a colazione?
Chi tt’ ha ddetto che nnon è vvero?
dopo le preposizioni a e da:
Andrò a vvedere la partita Ho ttelefonato a mmio fratello
dopo l’aggettivo indefinito qualche:
Qualche vvolta potremmo invitarlo
dopo la preposizione sopra, come testimoniano forme ormai lessicalizzate come soprattutto, sopravvento,
sopralluogo, sopraggiungere:
Più generalmente, in alcune varietà si ha geminazione di una consonante iniziale di parola se la parola
precedente finisce in vocale accentata:
Non avrà ppotuto partire Lui ha già mmangiato
contesti per il raddopiamento
dopo le congiunzioni subordinanti che e se:
Luigi ha ddetto che ttorneranno presto
Il fenomeno non si verifica se la consonante iniziale della seconda parola è /s/ iniziale di un nesso
consonantico o con altri nessi irregolari dell’italiano come [ps], [ks], [pn]:
Perché scrivi tanto? Non hanno più sbagliato
Avrà staccato la corrente
Andrea è psicologo Hanno cambiato tré pneumatici
Tuttavia, se la /s/ è seguita da vocale, essa raddoppia:
Perché ssei così stanco? Non l’ho ppiù ssentito
Avrà ssicuramente risposto
COALESCENZA
Per coalescenza si intende la fusione di due segmenti distinti in un segmento unico: anche in questo caso
l’origine del processo è un procedimento di minimo sforzo che semplifica la struttura sillabica (cioè un
adeguamento alla sillaba non marcata CV). La fusione di due segmenti consonantici o vocalici o uno
consonantico ed uno vocalico in un unico segmento è un altro modo per eliminare sequenze marcate.
La coalescenza di due consonanti si verifica ad esempio nella seconda e terza persona singolare del
presente indicativo del verbo scegliere, in cui si verifica una sequenza dei seguenti foni:
laterale alveolare + occlusiva velare + vocale anteriore > laterale alveolare + affricata palatale > laterale
palatale lunga lg ldʒ λ:
scelgo qui la regola non si applica perché la vocale o non è anteriore
scegli < sce[lgi] sce[ldZi] sce[λi]
sceglie < sce[lge] sce[ldZe] sce[λe]
qui la regola si applica perché le vocali i/e sono anteriori
Come esempio di coalescenza tra due vocali abbiamo casi di monottongazione come in
aurum > oro
Un esempio di riduzione di vocale consiste nella centralizzazione delle vocali non accentate in schwa,
vocale media centrale [@]
inglese p[o]se p[@]sìtion
[ae]tom [@]tòmic
sch[u:]l sch[@]làstic
Questo processo può avere l’effetto di eliminare, in certi contesti, una distinzione tra due o più segmenti che
è presente in altri contesti; in alcune posizioni vengono cioè neutralizzate delle differenze altrimenti
distintive. Si possono citare come esempi la riduzione a [@] delle vocali atone o la chiusura/innalzamento
delle vocali [] e [ɔ] in sillaba non tonica in italiano che elimina l’opposizione tra questi suoni attestata in altri
contesti:
b[o]tte b[ɔ]tte
LA SILLABA
DEFINIZIONE
Definiamo la sillaba come una unità fonologica che consiste almeno di un elemento sillabico detto nucleo,
che corrisponde ad un picco di sonorità.
Finora abbiamo esaminato i segmenti come complessi di proprietà atomiche e combinabili secondo dei
principi generali. Esistono comunque anche delle unità maggori che raggruppano i vari foni ma che sono più
piccole della parola (vedremo inoltre che il concetto di parola fonologica non coincide con quello usuale);
tra queste la sillaba. Teniamo presente che il flusso sonoro che noi percepiamo è continuo, quindi la sillaba,
esattamente come il fonema, è un’unità mentale; dal punto di vista fonetico infatti è difficile identificare i
confini di sillaba. La sillaba è diventata una parte importante del sistema fonologico della grammatica
generativa solo dopo che si è dimostrato che il potere descrittivo ed esplicativo di un modello che usa la
sillaba è superiore a quello di un modello che non la usa.
Vi sono varie motivazioni per inserire la sillaba in un modello che intenda rappresentare la competenza del
parlante nativo:
- il concetto di sillaba fa parte della competenza di un parlante nativo; noi abbiamo cioè una intuizione
precisa di cosa sia una sillaba: molti giochi verbali o linguaggi segreti dei bambini consistono nel
rimescolamento o nel’inserzione di sillabe; i giochi linguistici in cui si creano nuove sillabe
inserendo una stessa consonante e ripetendo il nucleo dopo ogni sillaba della parola indicano che il
parlante percepisce le sillabe come unità; alfabeto farfallino: dofomafanifi peferificofolofo
- la sillaba ci serve inoltre per spiegare parecchi fenomeni che altrimenti non si potrebbero descrivere
correttamente (vedi sotto); esistono generalizzazioni relative a fenomeni fonologici che non sono
esprimibili soltanto facendo riferimento al materiale segmentale;
- la sillaba è caratterizzata da delle regolarità interne, cioè da una sua struttura.
Spesso però una sillaba contiene anche degli elementi consonantici; si è già visto che la sillaba “meno
marcata” del linguaggio umano, cioè quella più semplice e più comune, è quella con struttura CV
(consonante vocale). Essa è
- la più frequente (in italiano circa il 60% delle sillabe ha questa struttura);
- quella che i bambini acquisiscono per prima;
- l’ultima che gli afasici perdono;
- l’unica presente in tutte le lingue del mondo.
Una alternanza tra suoni con costrizione di aria e rilascio di aria è dal punto di vista percettivo quella più
facilmente udibile (e probabilmente segmentabile).
NUCLEO SILLABICO
Abbiamo già visto che in italiano solo le vocali possono essere nucleo sillabico. NON abbiamo mai più di un
nucleo in una sillaba. Questa è la prima restrizione universale, che vedremo dopo: una sillaba deve avere
almeno un nucleo, e non più di uno. Anche un dittongo ascendente, che, come si è visto, si comporta come
un unico segmento sull’asse temporale, può fungere da nucleo sillabico:
p[je].no ch[ja].ro ch[ju].so t[wo].no q[wa].le
In altre lingue (come le lingue slave o le lingue indoeuropee antiche) anche le sonoranti possono essere
nucleo di sillaba (si ricordi l’esempio di Krk, l’isola di Veglia, oppure bottle in alcune varianti dell’inglese).
ONSET O INCIPIT
Il materiale consonantico che precede il nucleo sillabico si dice incipit sillabico (o onset). In italiano
l’incipit può essere formato da una o due consonanti: CV CCV
Pa.lo, ma.le, ve.lo, pie.de
Tra.ve, pri.mo, plu.rale, cla.ra,
Incipit complesso: Se consideriamo il caso di sillabe il cui incipit è costituito da una sola consonante,
notiamo che qualsiasi consonante può comparire in tale posizione
pi.no ti.mo bu.ko di.to fu.zo se.ra
dʒe.lo dze.ro ʃi.vo.lo tʃe.na va.go
Se consideriamo invece delle sillabe con un incipit biconsonantico notiamo che la seconda consonante è
sempre una liquida:
p[l]a.ci.do g[l]a.cia.le a.t[l]e.ta p[l]i.co c[l]o.ne
b[r]e.ve p[r]i.mo f[r]a.te c[r]e.ta t[r]o.ta g[r]u.mo
LA CODA
Le sillabe possono anche avere del materiale dopo il nucleo sillabico. Il materiale consonantico che si trova
nella sillaba dopo il nucleo sillabico viene detto coda. Una sillaba che termina con una coda viene detta
chiusa; una sillaba che termina con il nucleo sillabico viene detta aperta. In italiano la coda è limitata ad un
unico segmento: Cal.do, ar.ma, pal.la
Se consideriamo ora invece non delle sillabe aperte, che finiscono in vocale, ma sillabe chiuse da una coda
consonantica, notiamo che la coda può essere o una sonorante (liquida o nasale o la approssimante di un
dittongo discendente) o la prima di un nesso di geminate:
tap.po rab.bia. gat.to rid.da pac.co leg.go baf.fo
ov.vio sas.so
Ne concludiamo che in italiano le uniche consonanti che possono formare la coda di una sillaba senza alcuna
restrizione sono le sonoranti. Se colleghiamo questo fatto alla restrizione relativa alla seconda vocale di un
incipit biconsonantico ne deduciamo che le consonanti sonoranti hanno uno statuto particolare in italiano
nel poter fiancheggiare la vocale che forma il nucleo sillabico.
Esiste quindi una restrizione relativa all’ordine in cui le consonanti possono apparire all’interno di una
sillaba: tale ordine deve rispettare la scala di sonorità nel senso che le consonanti che hanno un valore di
sonorità più alto devono stare più vicine al nucleo sillabico (cioè alla vocale) rispetto alle consonanti che
hanno una minore sonorità.
Possiamo immaginare che il valore di sonorità all’interno della sillaba definisca una curva il cui apice è
rappresentato appunto dal nucleo, che è caratterizzato dalla massima sonorità, ed ai due lati di esso si ha una
discesa graduale del valore di sonorità in entrambe le direzioni. La sillaba è quindi un costituente di analisi
fonologica che ha delle regolarità interne.
TIPI DI SILLABE
- Se la sillaba ha una coda, si dice chiusa
- Se la sillaba non ha una coda e termina con il nucleo si dice aperta
In italiano la regola di allungamento della vocale tonica si applica proprio secondo questa distinzione: se la
vocale tonica si trova in sillaba aperta, la vocale si allunga, se si trova in sillaba chiusa non si allunga.
Come procediamo per individuare una sillaba all’interno di una parola?
1) Partiamo dal nucleo (costituito in italiano da una vocale) ed applichiamo una regola definita
massimizza l’onset o regola dell’incipit massimo, secondo la quale quando una consonante mediana
può essere analizzata sia come coda di una sillaba che come onset della sillaba successiva si sceglie
sempre la seconda possibilità; avremo quindi le seguenti suddivisioni in sillabe:
ve.ro e non ver.o
pa.lo e non pal.o
Si noti che attraverso questa regola possiamo derivare il fatto che la sillaba non marcata sia CV (e non ad
esempio VC).
2) La seconda regola per la costruzione di una sillaba è costituita da una applicazione della scala di
sonorità di cui abbiamo già parlato: immaginiamo che la sillaba sia costruita come una campana in
cui il punto più alto di sonorità della campana è il nucleo; la sonorità discende poi gradualmente fino
ai limiti della sillaba. Quindi ai limiti estremi della sillaba troveremo gli elementi meno sonori e
verso il nucleo quelli via via più sonori.
Quindi se si ha una sillaba complessa del tipo seguente: C1C2VC3C4
C1 dovrà essere meno sonora di C2 e C3 sarà più sonora di C4
Ad esempio, la sillaba prarp sarà una sillaba possibile in una lingua che ammetta due consonanti nella coda;
sillabe come *rparp/*prapr non saranno invece ammesse dato che non rispettano la scala di sonorità (a meno
che la liquida non faccia sillaba a sè stante)
In italiano abbiamo sillabe non marcate del tipo CV in cui la scala di sonorità si applica vacuamente (in
quanto il nucleo vocalico è sempre più sonoro della consonante che lo precede): ve.la mu.lo
Si è visto anche che in sillabe CCV la seconda consonante è sempre una liquida, cioè una sonorante, quindi
la scala di sonorità è rispettata (si noti anche che le liquide hanno un maggior grado di sonorità rispetto alle
nasali): p[l]i.co c[l]o.ne f[r]a.te c[r]e.ta t[r]o.ta
Si è visto invece che in sillabe chiuse la coda è sempre una sonorante o una geminata, e che le uniche
consonanti che possono stare in coda senza alcuna restrizione sono le sonoranti:
fu[r].bo te[r].nofu[l].cro so[l].co bi[m].bo ti[n].ta
Ora, se nei seguenti casi applicassimo la regola che massimizza l’onset otterremmo la seguente non corretta
divisione in sillabe: * ba.[n]ca pa.[l]co a.[r]te a.[n]trope.[l]tro
La prima consonante dell’onset della seconda sillaba è una sonorante, che ha un grado di sonorità maggiore
rispetto all’occlusiva adiacente al nucleo sillabico; quindi abbiamo una violazione della scala di sonorità; in
questo caso non potremo applicare la regola che massimizza l’onset e dovremo invece mettere la sonorante
in coda alla sillaba precedente: ba[ɳ].ca pa[l].co a[r].te a[n].tro pe[l].tro
In questo modo la sonorante costituisce la coda della sillaba precedente e viene a trovarsi adiacente al nucleo
sillabico; l’occlusiva costituisce esaustivamente l’onset della sillaba successiva, cosicché la scala di sonorità
viene rispettata. Quindi, se non è possibile mettere una consonante in onset di una sillaba perché ciò provoca
una violazione della scala di sonorità, la metteremo in coda alla sillaba precedente.
Nei casi seguenti invece con la semplice applicazione di massimizza l’onset otteniamo le seguenti
sillabificazioni corrette: li.bro a.fri.ca ne.gro tri.plo a.tle.ta
In questo caso gli onset complessi br/fr/gr/pl/tl sono possibili perché rispettano la scala di sonorità, in
quanto l’occlusiva precede la sonorante, che a sua volta precede il nucleo.
Come si individua allora una sillaba?
a) si cerca il nucleo;
b) si cerca di mettere tutto il materiale possibile in onset a meno che ciò non violi la scala di sonorità;
c) il materiale rimanente va inserito nella coda della sillaba precedente.
Si noti che nel caso delle geminate una va in coda ed una in onset della sillaba successiva; nella
sillabificazione delle geminate intervocaliche è opportuno seguire la seguente modalità: a[ʃ.ʃ]a a[λ.λ]o
Si potrà trascrivere seguendo l’ortografia, quando questa coincide con la fonologia: far.ro gom.ma
La sillaba può quindi constare di tre elementi: nucleo, onset e coda; possiamo rappresentare la struttura
interna della sillaba nel modo seguente:
sillaba
/|\
incipit nucleo coda
Possiamo chiederci a questo punto se ci sono delle unità intermedie; esistono vari motivi per ipotizzare che
anche i costituenti interni della sillaba siano organizzati in una struttura gerarchica, ed in particolare che il
nucleo e la coda formino una subunità detta rima che a sua volta si unisce all’onset per dare la sillaba,
secondo il seguente schema:
sillaba
/\
onset rima
/\
nucleo coda
Vi sono diversi argomenti a favore dell’ipotesi che nucleo e coda insieme (e non piuttosto onset e nucleo)
formino un subcostituente della sillaba:
a) la rima determina il peso della sillaba: una sillaba può essere leggera o pesante; è pesante se
contiene una vocale lunga (un nucleo pesante) o se ha una coda consonantica; altrimenti è leggera:
par.to ma:.re o:.tre fal.co te:.la ca.pri.cor.no
In italiano tutte le sillabe toniche sono pesanti, sono quindi nucleo e coda a determinare la pesantezza
sillabica.
b) la rima poetica determina le caratteristiche della parte finale di un verso; i versi in rima sono identici
a partire dalla vocale dell’ultima rima accentata fino alla fine del verso:
ultima: partì morì mangiò però mar far
penultima:partire morire mangiato prato coperta avverta
terzultima: probàbile stàbile vivere scrivere
quartultima: coòperano adòperano
c) nei lapsus linguistici si tende a cambiare l’onset tenendo intatta la rima: mangio e bevo > bangio e
mevo sale e pepe > pale e sepe
La rima può quindi essere vista come una unità del sistema fonologico, ed in particolare come un
subcostituente della sillaba, perché ha una sua realtà psicologica.
Le restrizioni sulla struttura sillabica dell’italiano sono espresse dal seguente schema:
sillaba
/\
(incipit) rima
/\
nucleo (coda)
+consonantico +consonantico vocale -sillabico
+sonorante +sonorante
+continuo (o geminata)
Questo schema ci dice che:
- l’unico costituente obbligatorio è il nucleo, che può essere costituito solo da una vocale (e non da una
sonorante);
- non si può avere un onset con più di due consonanti (la s è un caso a parte che discuteremo poi); se
l’onset è complesso la seconda consonante è una liquida;
- non si possono avere due segmenti in coda;
- la coda può essere occupata solo da una sonorante o approssimante (oppure dalla prima parte di una
geminata).
Anche se la lunghezza vocalica in italiano non è distintiva, la vocale tonica è più lunga in sillaba aperta che
non in sillaba chiusa (ma se la vocale è finale non si allunga); senza il concetto di sillaba non potremmo
esprimere questa distinzione.
La sillaba deve essere sufficientemente pesante da poter portare l’accento, quindi deve ramificare. Abbiamo
osservato che una vocale in sillaba aperta non finale di parola che porti l’accento primario si allunga:
pé:ro vs però cà:lo vs calò
Ciò che è rilevante è la pesantezza sillabica: se la sillaba accentata è leggera, la vocale si allunga,
rendendola pesante. Possiamo dire che in italiano la sillaba accentata deve avere una certa pesantezza,
deve cioè avere una rima che ramifichi; se non ramifica grazie alla presenza di una coda consonantica, allora
sarà il nucleo vocalico a ramificare allungandosi e raggiungendo la pesantezza necessaria.
RADDOPPIAMENTO SINTATTICO
Un altro fenomeno che può essere spiegato facendo riferimento alla sillaba, ed in particolare alla rima, è il
raddoppiamento sintattico, che si manifesta con l’allungamento della consonante iniziale di una parola che
sia preceduta da vocale accentata.
Anche questo fenomeno è motivato dalla condizione della rima forte; infatti si è visto che l’unica vocale
accentata in sillaba aperta che non si allunga è quella finale di parola ed è proprio questa che condiziona
l’allungamento consonantico nel RS.
Il raddoppiamento sintattico è quindi un fenomeno di risillabificazione che fa sì che la consonante
allungata venga divisa tra due sillabe formando nel primo segmento la coda della prima sillaba e nel
secondo segmento l’onset (o parte di esso) della seconda sillaba; tale divisione della consonante in due
sillabe diverse è resa possibile dall’allungamento, dato che una consonante lunga, come una vocale lunga,
occupa due posizioni.
Con il raddoppiamento sintattico si ha il riempimento di una coda ‘vuota’, cioè di un segmento temporale
vuoto in posizione di coda, con i tratti della consonante che segue.
Nel caso in cui la parola con sillaba accentata finale sia seguita da vocale o chiuda la frase, il segmento
temporale rimane vuoto.
Diamo alcuni esempi di sillabificazione nei casi di raddoppiamento sintattico (che si verifica anche con e -
eppure - o - ovvero ossia oppure - ma - macché):
Pa.o.lo.eM.ma.ri.a.dor.mi.ran.no.dam.me
San.dro.sa.se.èv.ve.ra.of.fal.sa?
Mac.chév.vuo.le?