Sei sulla pagina 1di 23

Quaderni del Dipartimento di Linguistica - Universit di Firenze 13 (2003): 31-53

TRA MUSICA E LINGUAGGIO: ALLE ORIGINI DELLA PAROLA


Luciana BRANDI
Una delle questioni pi interessanti che emerge dallesame del comportamento linguistico dei bambini autistici, riguarda i processi di percezione e produzione del suono che precedono la comparsa di unit di tipo propriamente linguistico a struttura sillabica. Nei casi in cui il linguaggio ha grosse difficolt a comparire, dopo il periodo di assoluto silenzio in cui il bambino autistico sprofonda anche
per un arco di tempo che talvolta si protrae fino verso ai 5 anni, la ri-conquistata
disponibilit al linguaggio trova un preciso segnale1: riemerge, come un sopravvissuto del proprio lontano passato, la capacit di dar luogo a vocalizzazioni che si
presentano non piatte ma dotate di precisi contorni melodici, dati dalla successione
di picchi accentuali di diversa intensit al di sotto dei quali compare una produzione sonora non distinta in prospettiva linguistica. dal lungo mantenimento di
questa capacit che pu successivamente svilupparsi un tipo di produzione propriamente linguistica, fatta di sequenze sillabiche pi o meno simili a quelle del
linguaggio adulto. Tali osservazioni spingono ad interrogarsi, pi in generale, sul
rapporto fra il periodo cosiddetto prelinguistico ed il periodo linguistico nello sviluppo del linguaggio, a chiedersi quale possa essere eventualmente il rapporto fra i
differenti tipi di vocalizzazioni che compaiono nellarco del primo anno di vita
circa.
1. Musicalit comunicativa ed emozioni
Nel giro di poche ore dalla nascita il bambino dimostra una preferenza per la
voce della madre rispetto alla voce di una qualsiasi altra donna: i tratti distintivi di
tale voce erano stati appresi in utero, e da l inizia a costruirsi nellinfante il riconoscimento e la preferenza per questa compagna di comunicazione in quanto
lattaccamento emotivo tra madre e figlio/a inizia prima della nascita. Addirittura
lapprendimento intrauterino delle caratteristiche della vocalizzazione che segnalano emozioni affettuose (Trevarthen 1998: 120) possono arrivare a produrre
preferenze per particolari canzoni, o recitati, di conseguenza dobbiamo ritenere
che tale precoce capacit di ricezione dellespressivit umana sia resa possibile da
1 Qui e altrove, quando indichiamo caratteristiche precise dello sviluppo del linguaggio nei
soggetti autistici, facciamo riferimento alla ricerca descritta in Brandi 2001.

32

Luciana Brandi

strutture cerebrali innate dedicate alle emozioni e ai loro mutamenti dinamici; non
pensabile che esse siano interamente apprese. Linfante2 si dimostra capace di
discriminare accento di intensit, sonorit, intervallo armonico, e qualit della
voce, oltre a schemi di temporalit (Trehub, Tainor e Unyk 1993).
Gi a sei settimane dopo la nascita il bambino/la bambina ha progredito nella
prontezza visiva, nella stabilit posturale, ed in grado di tenere gli occhi fissi in
quelli della madre quando lei si china verso di lui/lei parlando dolcemente; a sua
volta lattenzione acuita del bambino/della bambina fa s che la madre si rivolga al
figlio/alla figlia in modo pi vivace, stia attenta ai suoi mutamenti di espressione e
quindi cerchi di rispondere in modo adeguato alle manifestazioni di sentimenti che
il bambino/la bambina in grado di esprimere. Il passaggio di espressioni emotive in entrambe le direzioni instaura e regola uno stretto contatto mentale, () ed il
gioco reciproco viene a organizzarsi in una coerente esecuzione a due (Trevarthen 1998: 121) chiamata da Bateson 1979 protoconversazione, in ragione del
fatto che genera espressioni che tendono ad alternarsi, dalla mamma al bambino e
viceversa3.
Viso, apparato vocale, mani, braccia sono coinvolte in questo scambio comunicativo sintonizzato; tanto la madre quanto linfante regolano la scansione temporale, la forma e lenergia delle loro espressioni in modo da raggiungere la sincronia degli scambi comunicativi e la complementariet delle sensazioni, delle emozioni, cos da dar luogo ad una vera e propria confluenza. Si tratta di una forma di
contatto umano dinamico, che il/la bambino/a in grado di gestire emettendo vocalizzi, movendo labbra e lingua in una sorta di pre-parlato, gesticola con le mani
2 Luso di tale voce dotta non dipende da altro se non la necesit di indicare simultaneamente
entrambi i generi di chi si trova nellinfanzia.
3 Naturalmente la posizione di Trevarthen parte da un assunto sul problema dellautocoscienza
assai diverso da quello di gran parte degli psicologi contemporanei; egli trova del tutto artificiale
lidea di una intersoggettivit che inizi solo a partire dal sesto mese di vita, dunque la capacit di distinguere tra s e laltro presente ancor prima della nascita: lintersoggettivit umana e lapprendimento, considerate in stretta relazione, sono radicate nella neurobiologia evolutiva dellinfante
(Aitken e Trevarthen 1997: 655), quindi fin dalla nascita a disposizione un meccanismo - detto
Intrinsic Motive Formation (IMF) pronto ad entrare in relazione con le emozioni espresse
dalladulto in una guida mutua dello sviluppo cerebrale infantile e dellapprendimento sociale;
appunto lIMF che genera ci che stato chiamato un altro virtuale, o il bisogno organismicamente dato per un partner in quanto ogni mente ha la necessit di una persona oggetto emotiva. Parimenti le protoconversazioni dimostrano che il bambino nasce dotato di un s perfettamente adeguato, ove la distinzione tra s e laltro non si ritiene acquisita, perch nel comportamento infantile
Trevathen non vede nessun cambiamento che possa far pensare ad un successivo sorgere di autocoscienza che renda diversa la comunicazione.
Riguardo a come debba intendersi questo altro nella prima infanzia, tanto Trevarthen quanto
gli altri autori citati al riguardo lo identificano nella madre; ma ovvio che per laltro debba intendersi qualunque persona si prenda stabilmente cura del bambino / la bambina, dunque non necessariamente la madre e non necessariamente una persona di genere femminile. Potremmo parlare pi
propriamente di figura di cura, quale punto di riferimento emotivo, cognitivo e sociale per il
bambino / la bambina.

Tra musica e linguaggio: alle origini della parola

33

in modo sincrono con le altre manifestazioni: le frasi sono cos associate a rotazioni del capo, a movimenti delle sopracciglia, e a brevi allontanamenti dello sguardo
dalla madre; dunque le protoconversazioni godono di caratteristiche paralinguistiche analoghe a quelle delle conversazioni adulte. Laspetto pi rilevante che madre e bambino/a sono uniti da un unico e identico ritmo, e si alternano su una battuta ogni 0.9 secondi (adagio), in cui luno ascolta i suoni emessi dallaltro rispondendo a turno in ragione delle caratteristiche prosodiche; la madre si riferisce alle
manifestazioni espressive del/la bambino/a come se parlasse davvero, e le espressioni vocali pi lunghe emesse dallinfante durano due o tre secondi cio lequivalente del tempo impiegato da un adulto per produrre una breve frase. Le analisi
compiute sulla scansione temporale dei cambiamenti del contatto madre-bambino/a mostrano che lo scambio comunicativo controllato da entrambi, sulla base
di dinamiche corrispondenti e transizioni simili tra gli stati danimo e le espressioni. Pertanto, possiamo concludere che le protoconversazioni sono in grado di innescare sistemi coordinati nei due individui coinvolti nello scambio comunicativo;
essi trovano sfogo espressivo attraverso il movimento simultaneo di diversi organi,
e cos generano un contatto, una sorta di regolazione reciproca che ha leffetto
ulteriore di intensificare gli stati motivazionali centrali.
La musicalit , secondo Trevarthen 1999, alla base del comportamento motorio umano, identifica limpulso ritmico a vivere, muoversi e comunicare con un
altro da s, attraverso la condivisione di ritmo, forme melodiche e armonia. In generale il movimento ha funzioni intersoggettive nelle specie sociali, in quanto pu
anticipare o regolare il comportamento dellaltro, e proprio nei processi di anticipazione percettiva del cervello ha origine la necessit bio-meccanica (come sosteneva Bernstein 1967) del ritmo, del valore ritmico dei movimenti, ma non solo,
esso anche radicato in un contesto in cui fondamentale la relazione simpatetica
con i movimenti di un altro da s. Se parliamo delle prime vocalizzazioni dellinfante nello scambio comunicativo che intrattiene con la madre (o madre di cura),
ci rendiamo conto che tali vocalizzazioni sono tessute sulla musicalit identificante i processi che connettono in un duettare emozionale madre e infante: ritmo e
melodia legano due esseri umani in una attivit motoria che simultaneamente
fenomeno inter-mentale e inter-soggettivo, ove il significato eminentemente la
condivisione emotiva di una esperienza sociale. Alla base della musicalit si trovano caratteristiche quali la temporalizzazione, lespressione di emozioni e lempatia intersoggettiva: sono questi i segni, secondo Trevarthen (1999: 174), che
spingono in modo innato ogni infante a cercare un partner e a coordinare il limitato repertorio dei propri movimenti alla musicalit delle espressioni materne, fatte
non solo di suono ma di sollecitazioni sensoriali multimodali: gli tocca le mani, la
faccia, il corpo con cura ritmata, e tiene linfante stretto a s cosicch essi possono
condividere lattenzione e gioire luno dellaltro. Il suo parlato una specie di
canto fatto di passaggi di accento e di ripetizione di espressioni vocali che spin-

34

Luciana Brandi

gono il bambino a rispondere con sorrisi, gesti, movimenti delle mani e del corpo,
e con il tipico tubare della voce4.
I dati empirici relativi alla osservazione dello scambio comunicativo tra madre
e infante entro le 6 settimane di vita (Jasnow e Feldstein 1986; Malloch 1999) mostrano che ciascun enunciato dellinfante, fatto di vocalizzazioni, movimenti delle
labbra e della lingua, movimenti delle mani, dura circa 2 o 3 secondi, giusto il
tempo per un adulto di emettere un sintagma o una frase breve; le fonazioni individuali dellinfante durano circa 0.75 secondi, un tempo comparabile a quello di
una sillaba; lalternarsi dei turni procede da una battuta ogni 900 millisecondi a
circa sei settimane di vita, per accelerare a una battuta in 700 millisecondi a circa
due mesi. Malloch 1999, in particolare, ha esaminato anche mediante analisi spettrografica la produzione vocale di infanti individuando alcune componenti cruciali
della musicalit: pulsazione, qualit e narrativit. La pulsazione, in quanto successione regolare di eventi espressivi nel tempo, evidenzia che a due mesi di et,
lunit di tempo che divide naturalmente le emissioni vocali di madre e figlio/a
un intervallo di 0.68 secondi, e lunit comunicativa di respiro, oltre la quale compare un breve spazio di silenzio, data da tre di queste unit che costituiscono un
intervallo pi ampio di 2.93 secondi. Tale misura temporale si riconferma presente
in diverse protoconversazioni esaminate, e costituisce dunque il ritmo, lintervallo temporale regolare che serve a coordinare le vocalizzazioni tra madre e bambino/a. La qualit la dimensione su cui si misurano sia laltezza delle vocalizzazioni che il loro timbro; da un lato vengono evidenziati i contorni melodici dati dal
tracciato degli accenti di intensit formati da cicli regolari di 20-25 secondi da
parte della madre e dallinserimento su questo tracciato delle vocalizzazioni
dellinfante con propri picchi accentuali che cercano di riprodurre landamento
materno, dallaltro lato il timbro (v. anche Malloch 2000) viene descritto mediante
una variet di misure acustiche quali il valore di acutezza, intensit, durezza e altezza, cos vengono calcolate le armoniche alta e media ed individuati i mutamenti
nella qualit della voce della madre dopo ogni vocalizzazione da parte dellinfante,
mutamenti che paiono volti a segnalare che la vocalizzazione da parte dellinfante
stata udita e a rendere la voce materna pi armonica possibile con quella del
bambino/ della bambina. La narrativit combina le due caratteristiche precedenti,
consentendo cos ai due attori della proto-conversazione di creare e dividere emozione ed esperienza con laltro, di formare significato attraverso il reciproco coordinarsi dellattivit vocale e gestuale. Esaminando il modo in cui linfante si pone
nella percezione di cantilene, ninne nanne, filastrocche, stata notata (Merker
1999) la comparsa di un forte senso dello spazio accentuale che le rispettive voca4 Anche Ellen Dissanayake 2000: 394 ritiene che le interazioni madre-bambino/a siano composte di elementi che sono letteralmente, e non metaforicamente, musicali, interazioni comunicative
ritmiche, modellate temporalmente, e mantenute congiuntamente. Probabilmente gli enunciati materni sono percepiti dal bambino/a come combinazioni di suoni le cui caratteristiche e relazioni salienti sono musicali e non ancora propriamente linguistiche.

Tra musica e linguaggio: alle origini della parola

35

lizzazioni coprono, nel senso che il bambino/la bambina fin dallet di 4 mesi si
dimostrano capaci di prendere parte attiva ad un gioco musicale con laltro, inserendosi nella struttura musicalmente. per questa via che si sviluppa la capacit di
sincronizzare il proprio movimento vocale e corporeo con quello dellaltro, di
partecipare ad uno scambio comunicativo in cui la riproduzione ripetuta delle
stesse dimensioni costituisce la trama su cui il/la bambino/a forma la propria capacit linguistica. Il linguaggio, nel suo primo presentarsi come ritmo e melodia, nel
suo essere preliminarmente soprattutto musicalit, si trova ad essere come incarnato negli stessi movimenti corporei, gestuali, che accompagnano lenunciazione
verbale tanto della madre quanto del bambino/della bambina. Si tratta, per Trevarthen 2001; Aitken e Trevarthen 1997, di trovare nellimpulso innato a cercare
unaltra mente con cui connettersi in un rapporto empatico, nella cooperazione con
laltro da s, nelle emozioni, la chiave per dotare di significato il mondo, e dentro
il mondo di attribuire significato ad un simbolico che pu svilupparsi come
linguaggio e come pensiero a partire da quella narrativit che, ai suoi primordi
ontogenetici, dotata di una semantica emozionale prima che referenziale. La musicalit, dunque, con il suo riproporre ripetitivamente le stesse sequenze temporalizzate di ritmo e melodia, spinge linfante sullonda dellemozione a quei giochi
verbali che sono lanticamera del linguaggio, imitazione di una sonorit adulta che
si presta e si piega ad opportune manipolazioni, per divenire tramite naturale verso
il linguaggio parlato.
Se parliamo di protoconversazioni assumiamo ovviamente che esista una sorta
di motherese intuitivo, cio un linguaggio col quale le madri si rivolgono spontaneamente al bambino in modo da facilitare il sostegno emotivo che il bambino
cerca. Si osserva che le tonalit vocali, landamento melodico, il tempo, la metrica
e la ripetitivit risultano comuni a linguaggi e culture molto diversi fra loro; ad
esempio madri cinesi e americane parlano secondo lo stesso modello di linguaggio
infantile, nonostante che il cinese e non linglese sia una lingua tonale; un numero
limitato di contorni melodici sono prodotti molte volte con differente contenuto
lessicale. In genere, le espressioni linguistiche sono molto brevi, ripetitive, con
intonazione ritmica e tono oscillante: infatti la periodicit un fattore fondamentale nel motherese; la madre articola brevi espressioni di circa mezzo secondo ogni
0,75 secondi (adagio) facendo una pausa su battute alterne; il piccolo riprende il
ritmo e a sua volta emette unespressione inserendosi nella pausa della madre.
Cos avviene il darsi il turno; via via che il bambino cresce, la gamma dei tratti
prosodici nel parlato della madre si arricchisce (in genere dopo il terzo mese); di
fatto le variazioni di tono generate dalla madre servono a segnalare i cambiamenti
del proprio contatto emotivo e lempatia che prova per le emozioni del bambino.
Naturalmente il rapporto empatico tra madre e bambino/a pu fallire: se certe
condizioni di accordo emotivo non vengono rispettate (volto privo di espressione
della madre, es. depressione; autismo da parte dellinfante). In generale, possiamo
rilevare che, se la comunicazione felice (in senso austiniano), nellinfante latto

36

Luciana Brandi

di guardare verso la madre correlato con il sorridere, inarcare le sopracciglia,


schiudere la bocca e muovere la lingua; invece, il guardare la madre priva di
espressione si accompagna allatto di aggrottare le sopracciglia e corrugare la
fronte, mentre il guardare altrove da parte della madre si correla ad unespressione
neutrale con le sopracciglia rilassate e la bocca chiusa. Da questo comprendiamo
che si tratta, tra madre e figlio/a, di un sistema emotivo integrato, dove le emozioni
della diade diventano strettamente interdipendenti. Pertanto le emozioni che si
succedono nello scambio diadico paiono essenziali per la regolazione dello sviluppo cerebrale e della crescita psicologica del bambino: le emozioni che generano
le espressioni in cervelli separati, quello della madre e quello del figlio, possono
giungere a unirsi in una confluenza di affetti che sviluppa unorganizzazione autonoma, come accade tra due musicisti esperti che improvvisano un unico brano armonizzandolo in maniera coerente e di piacevole ascolto. () Una chiara misura
della confluenza l agganciarsi reciproco di movimenti e vocalizzi aventi la
medesima frequenza (Trevarthen 1998: 134-5). La capacit di distruzione che
possono avere nella diade i disturbi emotivi fa s che il gioco della protoconversazione fallisca quando uno dei due si trovi in uno stato di turbamento o di distacco:
nel caso di un infante autistico, lanomalia dello sviluppo cerebrale embrionale
coinvolge fondamentalmente proprio i sistemi cerebrali legati allanalisi delle
emozioni e della comunicazione (Brandi 2001) e dunque influisce drasticamente
sulla qualit della relazione intersoggettiva, sulla reattivit dellinfante, in conclusione sulla capacit di agganciarsi in quel gioco reciproco di movimenti e vocalizzi su cui pare basarsi la possibilit di sviluppare in seguito la comunicazione
linguistica.
2. Tra cervello e cervelletto
Gi a livello delle prime espressivit nellinfante, sono evidenti asimmetrie
corporee tra destra e sinistra, che ovviamente richiamano il fenomeno della lateralizzazione emisferica. Osserviamo che quando il bambino si esprime, lo sguardo si
orienta prevalentemente a destra, gesticola sollevando la mano destra pi in alto
della sinistra e le vocalizzazioni si sviluppano in genere prima e in modo pi evidente sul lato destro della bocca. Analoghe asimmetrie si riscontrano anche
nellascolto del linguaggio, che tanto nelladulto quanto nel bambino coinvolge
soprattutto lorecchio destro, lo sguardo si sposta verso il lato destro quando un
adulto produce unespressione linguistica. Potremmo cio concludere che le
espressioni referenziali sono prodotte e percepite con un maggior coinvolgimento
della parte sinistra del cervello. Daltro canto, sembra altrettanto certo (da studi sui
potenziali evocati) che i bambini ascoltino lemozione impressa nella voce materna con lemisfero destro, che nella prima infanzia a uno stadio di sviluppo pi
avanzato di quello sinistro (Trevarthen 1998).
Per quanto riguarda pi in generale la specializzazione emisferica, fin dai
primi studi (Morel 1947) era apparso evidente che ascolto musicale e ascolto ver-

Tra musica e linguaggio: alle origini della parola

37

bale fossero da considerare delle funzioni giustapposte ma non coincidenti; afasia


ed amusia rivelavano situazioni interessanti in quanto se apparivano in alcuni casi
come disturbi indipendenti ad esempio un paziente sapeva cantare laria e le parole di una canzone, ma non sapeva ripetere quelle stesse parole in assenza della
melodia spesso per potevano presentarsi associati, facendo pensare che essi implicassero almeno in parte lo stesso sistema neuroanatomico.
Sono stati soprattutto gli studi di Doreen Kimura (1967; 1973), basati peculiarmente sulla tecnica dicotica mediante la quale si faceva ascoltare simultaneamente linguaggio in un orecchio e melodie in un altro, a mettere in evidenza la
dominanza dellemisfero destro per il riconoscimento delle melodie; il risultato
delle osservazioni compiute veniva confortato sia dallosservazione mediante PET,
riportando la cognizione musicale alla dominanza preferenziale dellemisfero destro, sia da dati neurochirugici in quanto a seguito di una lesione anche estesa
dellemisfero sinistro il canto rimaneva ancora possibile per il paziente, mentre i
deficit musicali si presentano quando la lesione interessava lemisfero destro. In
particolare pare che lascolto di una melodia attivi larea temporale e larea frontale destre (Zatorre, Evans, Meyer 1994), ma lessenziale dato dal considerare
che la percezione di una melodia almeno da parte di un ascoltatore non musicista
esperto avviene rispetto al profilo generale, e dunque si tratta di una percezione
olistica5. Soggetti con lesioni cerebrali sono stati esaminati in rapporto alla presentazione di una frase melodica e di sue versioni modificate, o a livello del profilo generale o riguardo a intervalli tonali successivi ma nel rispetto del profilo generale. Da questi esperimenti emerso che nei soggetti portatori di lesioni
allemisfero destro veniva ad essere colpita la percezione del profilo generale della
melodia, mentre se la lesione era a sinistra, era colpita lindividuazione della
struttura particolareggiata degli intervalli e lorganizzazione temporale della melodia. Anche Falk 2000 sottolinea come melodia e ritmo sembrano essere neurologicamente dissociati in quanto lemisfero destro elabora gli aspetti melodici della
musica, mentre lemisfero sinistro sembra maggiormente coinvolto nellelaborazione del ritmo (Peretz 1993). Lemisfero destro, come sappiamo, interpreta anche
gli aspetti melodici del linguaggio, il tono della voce, e dunque le connotazioni
emotive ed affettive del parlato.
Comunque fin dagli studi di Sperry risultava che lemisfero destro non interamente muto, ma pu formulare parole isolate, serie di parole specialmente
quelle con una forma metrica che pu essere cantata, o comporre una successione
di esclamazioni spontanee sollecitate da unemozione (Wallin 1991: 46), quindi
interiezioni come, Oh no!, buon dio, povero me, ecc, vengono dallemisfero destro, che pi in generale pu comprendere delle frasi anche senza analisi fonetica e
lessicale, il suo lessico sarebbe collegato ad una gestalt fonologica che consente
una comprensione del linguaggio sotto forma globale: lemisfero destro non pu
5 Nel musicista esperto, invece, lelaborazione di tipo analitico di un input musicale pu riguardare lemisfero sinistro.

38

Luciana Brandi

che estrapolare degli elementi globali (non analitici) senza poter seguire lordine
temporale (Buser 1999: 236). Anche nel test di Wada (uniniezione di amobarbitale nella arteria carotidea destra o sinistra che produce una inibizione temporanea
dellemisfero corrispondente) quando liniezione inibisce lemisfero destro, labilit del canto risulta assai disturbata, mentre la facolt del parlato compromessa
solo nel senso che larticolazione delle parole pi lenta e monocorde, mentre
lintonazione, la pronuncia, e labilit a partecipare ad una conversazione non ne
risentono: la memoria tonale ed il senso dello spazio melodico pare completamente scomparso, mentre il ritmo sembra meno interessato dallinibizione.
La cosa pi interessante riguardo al linguaggio il dato che lemisfero dominante il destro e non il sinistro quando le parole sono processate solo come stimoli acustici, nel senso che il percetto non il contenuto semantico del messaggio,
che ha leffetto di trasferire lelaborazione da un emisfero allaltro: Zaidel 1977 ha
mostrato che dopo commissurotomia lemisfero destro ha un vocabolario uditivo
considerevole, in quanto in grado di riconoscere comandi e di mettere in relazione parole presentate per via uditiva e la visione con rappresentazione figurativa.
Dagli esperimenti di Zaidel 1977 emerge che lemisfero destro ha difficolt ad
analizzare le categorie fonetiche, mentre la discriminazione delle vocali sembra
non costituire un problema, pertanto lemisfero destro sembrerebbe essere prevalentemente un analizzatore gestaltico di tratti acustici e non di tratti fonetici. Dagli
studi di Studdert-Kennedy e Shankweiler 1970 gi era emersa la superiorit
dellorecchio destro, e dunque dellemisfero sinistro, per sillabe formate CVC,
dunque in relazione alla combinazione consonante/vocale, mentre le vocali sono
percettivamente o bilaterali, o addirittura unilaterali sullemisfero destro: evidentemente esse vengono elaborate pi rapidamente sulla base del loro contenuto musicale. Inoltre i pazienti di Zaidel sottoposti a commissurotomia hanno un ricco
vocabolario di parole isolate a destra, corrispondente ad unet intellettuale di
circa16 anni. In generale dagli studi sullascolto dicotico emerge che i toni puri,
semplici, sembrano percepiti bilateralmente, mentre lemisfero destro mostra una
chiara preferenza per quelli complessi, producendo un incremento nellaccuratezza
dellanalisi per laccento di intensit ed un decremento per la latenza temporale;
anche se lemisfero sinistro a dominare il processing linguistico, tuttavia
lemisfero destro non completamente muto, nel senso che possiede un certo
lessico, soprattutto nomi, preferendo le parole trattate secondo lordine metrico,
pu associare parole e immagini, sillabare parole e costruire rime, categorizzare
oggetti6; nellemisfero destro sembra essere localizzato un meccanismo per riunificare la percezione dei componenti di un tono complesso in una forma unitaria
globale; infine, sembra che esista anche un meccanismo di spostamento tra i due
6 Quanto stiamo indicando va inteso come linee prevalenti, giacch vi una individuata variabilit nella plasticit cerebrale da individuo ad individuo, nel senso che in alcune persone si ha una
assoluta incapacit a gestire anche forme rudimentali di linguaggio con lemisfero destro, mentre in
altre si pu arrivare ad una vera e propria equivalenza tra destro e sinistro (Gazzaniga 2002).

Tra musica e linguaggio: alle origini della parola

39

emisferi quando viene superata una certa soglia di informazione da trattare. Solo
per alcuni studiosi (Levy, Trevarthen, Sperry 1972) dal comportamento dei soggetti commissurotomizzati si poteva trarre lidea di unazione inibitoria di un emisfero sullaltro. Per studiosi come Gazzaniga 2002, la natura della differenza emisferica data soprattutto dal fatto che lemisfero destro elabora gli aspetti percettivi dello stimolo e non cerca di interpretare lesperienza cercandovi un significato,
mentre lemisfero sinistro colloca le proprie esperienze in un contesto pi ampio,
forma ipotesi, anche falsi ricordi nel tentativo di dare uno spiegazione e costruire
un significato.
Per quanto riguarda il cervelletto, studi recenti (Heck, Sultan 2002) hanno
messo in evidenza come esso intervenga non solo nella coordinazione dei movimenti fini, ma anche probabilmente nel riconoscimento delle parole, e possa assolvere a compiti almeno dello stesso livello di complessit di quelli del cervello, per
quanto si tratti di strutture molto diverse7. Probabilmente sono le limitazioni spaziali a permettere al cervelletto di eseguire le sue specifiche funzioni, quali ad
esempio il movimento fine. Il concetto fondamentale quello dellonda di flusso
quale modalit di trasmissione dei segnali attraverso le cellule: per conseguire un
movimento fine, due granuli vicini devono eccitarsi con un intervallo di tempo
esattamente uguale a quello impiegato da un segnale per propagarsi attraverso una
fibra parallela tra luna e laltra cellula; in ci vi il vantaggio che i segnali si propagano attraverso le fibre parallele ad una velocit particolarmente bassa; solo
quando molti granuli vengono stimolati in questo modo si ha la partenza di
unonda di flusso di segnali. La corteccia cerebrale da sola non pu governare con
sufficiente rapidit i movimenti istantanei, fini, automatici; ha bisogno dellaiuto
del cervelletto. Il cervelletto riconosce in pochi millisecondi complessi specifici
formati da segnali multipli che gli giungono attraverso i granuli. Solo quando i segnali sono cadenzati nel tempo in una forma determinata, pu partire unonda di
flusso. Si tratta di segnali che provengono dai diversi organi sensoriali: apparato
motorio, occhi, orecchi, sistema dellequilibrio, ma anche dal cervello. In definitiva il cervelletto rappresenta un rivelatore di sequenze per lo schema temporale di
questi complessi di segnali. Oltre alle funzioni di regolazione del movimento, il
cervelletto esegue altri compiti di grande importanza. Un esempio sono gli esercizi
di associazione verbale. Il cervelletto mostra la propria attivit non solo nel caso
della denominazione in quanto il parlato esige una complessa coordinazione mu7 Tale diversit riguarda: la disposizione dei solchi e delle pieghe (in tutte le direzioni nel cervello, solo trasversalmente allasse longitudinale del corpo nel cervelletto); lo spessore (vari millimetri per la corteccia cerebrale, alcuni decimi di millimetro nel cervelletto); la sostanza bianca (la
sostanza bianca formata da grandi prolungamenti dei neuroni, gli assoni: gli assoni nel cervello
hanno complessivamente un grande volume, e connettono regioni diverse, il cervelletto ha sostanza
bianca in quantit minore e i suoi assoni inviano segnali quasi esclusivamente ad altre parti
dellencefalo, soprattutto al cervello); il volume (la superficie del cervelletto, una volta estesa, corrisponde circa a quella di un emisfero cerebrale); il numero dei neuroni (nel cervelletto pari a cinque
volte quelli del cervello).

40

Luciana Brandi

scolare, ma anche, e soprattutto mostra un aumento dellattivit, nel caso in cui al


sostantivo nominato precedentemente nellesperimento, ad es. cane, si chieda di
associare un verbo con esso in relazione come abbaiare. Dato che le esigenze motorie sono pressoch equivalenti, laumento dellattivit del cervelletto si ritiene
dovuto allo sforzo associativo. Lesioni al cervelletto, inoltre, non sono in grado di
provocare deficit intellettivi, tuttavia in tali casi si notato un comportamento assai interessante: i pazienti con cervelletto lesionato non erano in grado di discriminare tra determinati suoni che differivano per la durata: se nel valutare la durata di
una sillaba si deve riconoscere un intervallo con durata inferiore a 100 millisecondi, questi pazienti si trovano in difficolt. Lesempio era la differenza di durata
della vocale posteriore medioalta di boten (messaggeri) leggermente pi lunga che
in boden (pavimento): se si fa ascoltare la parola boden con un prolungamento
della pausa, la persona percepisce boten, invece il paziente con lesione al cervelletto non in grado di notare differenza tra le due emissioni.
Anche dagli studi riportati da Falk 2000: 214 si riconferma limportanza del
cervelletto come larea da cui ricevono input sia le cortecce di associazione parietale ed uditiva per la percezione e linterpretazione sia le cortecce motoria e premotoria per la produzione. I dati paleoneurologici fanno collocare a circa 2 milioni
di anni fa con laumento del volume del cervello accompagnato dal riarrangiamento delle circonvoluzioni dei lobi frontali ed unapparente espansione della
corteccia prefrontale levoluzione del linguaggio umano e contemporaneamente
della musica, e puntano alla corteccia prefrontale ed al cervelletto come aree focali
sia per compiti musicali che linguistici.
Cercando di usare i dati fino ad ora presentati per capire meglio il quadro autistico, facciamo lipotesi che nellautismo la devianza sia a carico di organi subcorticali (Brandi 2001) e dunque pu accadere che le relazioni che si instaurano
con le aree corticali possa essere di tipo diverso in quanto la relazione tra i sistemi
innati (ipotalamo, amigdala, midollo allungato) ed i sistemi che vengono definiti
per interazioni con lambiente, quali le aree corticali che a noi interessano per il
linguaggio, non appunto determinata e definita a priori8. Da questo possiamo ri8 Secondo Damasio, il genoma contribuisce a stabilire la struttura di un certo numero di circuiti
e sistemi nei settori evolutivamente pi antichi del cervello umano, quali il midollo allungato,
lipotalamo, il prosencefalo basale, e probabilmente anche lamigdala e la regione del cingolato. Gli
schemi innati di attivit di neuroni di questi circuiti non generano immagini, anche se gli effetti della
loro attivit possono essere espressi in immagini: essi regolano i meccanismi omeostatici senza dei
quali non vi sarebbe sopravvivenza (respirare, regolare il battito cardiaco, equilibrare il metabolismo,
cercare cibo e riparo, evitare i predatori, riprodurci). Ma i circuiti innati intervengono non solo nella
regolazione corporea, ma anche nello sviluppo e nellattivit adulta delle strutture cerebrali evolutivamente moderne. Il genoma contribuisce a formare un quadro generale di sistemi e circuiti per i
settori cerebrali evolutivamente pi moderni, piuttosto che uno specificato e dettagliato; questultimo
si forma sotto linfluenza di circostanze ambientali, integrate e vincolate dallinfluenza dei circuiti
innati, allestiti in modo preciso, che riguardano la regolazione biologica. In breve, lattivit dei settori cerebrali pi giovani e orientati dallesperienza (la neocorteccia ad esempio) indispensabile per
produrre una particolare classe di rappresentazioni neurali su cui si basano la mente (le immagini) e

Tra musica e linguaggio: alle origini della parola

41

tenere che J. e A.9 si trovino in due situazioni diverse, a carico dei due emisferi.
Posto che a livello di cellula neuronale abbiamo cellule che trasportano le stesse
differenti informazioni, solo che poi le differenti informazioni prendono la via di
stazioni cerebrali diverse e specifiche (Kandel), allora riguardo al processing
dellinput linguistico possiamo pensare che in J. linformazione relativa alla durata
prende la via dellemisfero sinistro che, se pure forse parzialmente o deficitariamente accessibile, tuttavia inibisce laccesso allemisfero destro dellinformazione
pertinente; dunque J. riceve materiale in modo similare a come lo riceverebbe un
bambino qualsiasi, solo che non si trova nelle condizioni cerebrali di processare
compitamente linput che riceve e di conseguenza di avere uno sviluppo del linguaggio secondo tempi e modi normali. In A., invece, probabilmente si ha
unazione inibitoria del destro sul sinistro che quindi non riceve il materiale relativo a tempo e durata; solo lemisfero destro che si fa carico inizialmente
dellelaborazione dellinformazione linguistica, e pertanto produce vere e proprie
formule globali che vivono eminentemente per via melodica ma risultano consistentemente associate a oggetti individui ed eventi. Forse successivamente, quando
A. comincia a destrutturate la frase intera in pezzi se pur globali ma meno estesi,
forse allora pu avvenire una riorganizzazione che coinvolga maggiormente
lemisfero sinistro.
3. Musilingua: nel profondo passato della specie
Da tempo emerso un interesse reciproco tra studiosi che si interrogano
sullorigine del linguaggio cercando di connettere ontogenesi e filogenesi, ed etnomusicologi10. Tanto Lieberman che Wallin, ad esempio, connettono lorigine del
sistema comunicativo umano ai sistemi dei vertebrati non umani; linterazione di
gesti e componenti vocali nei primi sistemi di comunicazione, cos come il ruolo
della madre come agente di apprendimento sociale e linterazione emotiva tra madre e bambino/a sottolineata da entrambi gli studiosi. Nondimeno vi sono delle
differenze, in primo luogo hanno a che fare con la classificazione dei sistemi primitivi di comunicazione tra gli ominidi: Lieberman ritiene che essi rappresentino
preadattamenti motori, neurali e articolatori al linguaggio, mentre Wallin sostiene
che tali sistemi vanno indietro nel tempo fino ad un sistema aperto, autonomo, che
ad un certo punto della storia evolutiva biforc in due correnti principali, una il
le azioni consce. Ma la neocorteccia non pu produrre immagini, se non sono integre e cooperanti le
parti pi antiche, sotterranee, del nostro cervello (ipotalamo, midollo allungato) (Damasio 1995:
167). Per LeDoux 2002: 93 si tratta dei geni omeotici, che producendo delle proteine controllano la
disposizione delle cellule nuerali: lautismo potrebbe essere dovuto ad una mutazione di geni omeotici che produce unorganizzazione ed una interconnessione cerebrale difettose.
9 Ricordiamo la principale differenza nel disturbo del linguaggio tra i due casi, entrambi
dellet di 9 anni circa: J. produce sillabe, sequenze di sillabe e qualche parola; A. produce frasi ben
formate di tipo stereotipato anche di una certa complessit.
10 Ringrazio Maurizio Agamennone per le sollecitazioni datemi relativamente a questo campo
di sapere.

42

Luciana Brandi

linguaggio e laltra la musica. Il linguaggio, acquisendo natura proposizionale, si


prestava a diventare il mezzo per lazione rapida e la risposta rapida: col parlato
gli esseri umani manipolavano il tempo come veicolo per una articolazione semantica veloce; codifica e decodifica tramite larticolazione linguistica richiedeva
una velocit neurale di processing pi alta per risposte motorie e percettive rispetto
ai sistemi precedenti. Nella feroce competizione per lo spazio corticale
(Gazzaniga 2002), il cervello doveva guadagnare nuove facolt senza perdere
quelle vecchie, dunque i fenomeni di lateralizzazione riscontrabili nel cervello
umano rispetto ai nostri cugini possono essere considerati non come una aggiunta evolutiva, ma piuttosto come ci che sorge da un emisfero che sta perdendo
capacit e non acquisendone. Cos il canale a bassa velocit rimase quello
dellemisfero destro per laccesso al sistema limbico e al trattamento delle emozioni: il lontano passato degli ominidi si presenta come ripetizione omologa negli
stadi limbici preconcettuali del bambino e nella comunicazione limbica degli
adulti (Wallin 1991: 504). Non tanto la novit nel tratto vocale, quanto piuttosto
la riorganizzazione cerebrale sotto la pressione di domande sociali sembra essere
stata decisiva per lorigine della comunicazione di tipo parlato, cos come una crescente abilit a formare associazioni crossmodali ed una memoria crescente.
Per questa via, andiamo allora a trovare, nella filogenesi, le tracce di ci che
Trevarthen ci propone di considerare come cruciale per il sorgere della comunicazione nellontogenesi, vale a dire un modo di comunicare fortemente forgiato dalle
emozioni e dotato di una vocalit eminentemente musicale. Innanzitutto, anche fra
gli studiosi di biomusicologia troviamo sottolineate le stesse propriet parametrali
del suono che avevamo gi visto realizzate sul concetto di musicalit. Infatti Molino 2000, se da un lato sottolinea il legame forte tra musica ed emozioni, viste soprattutto nelle manifestazioni che coinvolgono anche il corpo ed i suoi movimenti,
per cui la musica da connettere ad una semantica di tipo ritmico-affettivo (nel
senso che esprime le emozioni fondamentali che sono associate al corpo ed ai suoi
movimenti), dallaltro individua le caratteristiche di base della musica in due componenti, uno temporale, costituito da metro e ritmo, ed uno melodico, che consiste
di contorno, accento di intensit e intervallo. La stessa neuropsicologia fornisce
argomenti a sostegno dellassunzione che tali caratteristiche risalgano a moduli
differenti: lo studio delle dissociazioni a livello neurologico sembra portare ad
ipotizzare specifici moduli per i componenti temporale e melodico della musica,
essi stessi composti di distinti sottomoduli per, da un lato, metro e ritmo, e
dallaltro, contorno, accento e intervallo (Molino 2000: 170). Anche il linguaggio
presenta analoghi componenti melodici e temporali funzionalmente distinguibili,
in quanto il componente melodico sarebbe da identificare nei fenomeni di accentazione, intonazione e durata, mentre il componente temporale consisterebbe dei fenomeni ritmici e temporali essenziali per il parlato e che appaiono ad esempio
sulla sillaba quale unit fondamentale11.
11 Cfr. ad es. quanto indicato in nota 12 su VOT.

Tra musica e linguaggio: alle origini della parola

43

Ma soprattutto Brown 2000 a proporre lidea che allorigine delle capacit


comunicative degli esseri umani sia da ipotizzare uno stadio in cui semantica referenziale e semantica emotiva erano unite in ununica ed identica forma, da cui poi
si sono sviluppati da un lato la musica, avocando a s soprattutto la sfera emotiva,
e dallaltro il linguaggio, con la predominanza di una semantica referenziale. Infatti (Brown 2000: 273) musica e linguaggio condividono similarit biologiche
profonde, in particolare convergono nel trovare nella sequenza lunit sia strutturale che funzionale. Un repertorio limitato di unit discrete scelte fra infiniti elementi acustici possibili costituiscono le unit elementari combinando le quali vengono formate le sequenze di livello superiore; queste formazioni si fondano sulla
modulazione delle propriet acustiche di base delle unit cui assegnata unorganizzazione tramite combinazione, per trasmettere enfasi, stati emotivi, significato
emotivo, mediante lassegnazione di picchi accentuali di intensit. Sono proprio
tali accenti di intensit che stabiliscono le prominenze su cui converge il sistema
del processing mentale, trovando nel loro disporsi sequenziale la guida percettiva
per lattribuzione di significato.
Dunque tanto per le sequenze del parlato che per le sequenze musicali si tratta
di strutture melodicoritmiche dove ritmo e melodia hanno le seguenti tre origini:
le propriet acustiche delle unit, le regole mediante le quali si formano le sequenze, i meccanismi espressivi che modulano le propriet acustiche delle strutture per
attribuire enfasi espressiva. Lipotesi , dunque, che le similarit tra musica e linguaggio si possono spiegare solo riconducendole ad unorigine comune, nel senso
che esse sono sorte da uno stadio ancestrale, che Brown definisce della musilingua, che non era n solo linguistico n solo musicale, ma che era costituito da
caratteristiche comuni dalle quali si sarebbero poi sviluppate per specializzazioni
distintive musica e linguaggio12, certo differenziandosi progressivamente ma allo
stesso tempo mantenendo le caratteristiche comuni identificate dallo stadio primitivo da cui entrambi si sono originati. Linguaggio e musica sono essenzialmente
le specializzazioni reciproche di un precursore a-doppia-natura che usava sia
lemozione del suono che la referenza del suono nel creare suoni comunicativi
(Brown 2000: 278).
Le propriet fondamentali della musilingua definiscono pertanto un sistema
caratterizzato da percezione e produzione di vocalizzazioni dotate di gradi o accenti di intensit - il tono lessicale - aventi il ruolo di veicolare significato, nel
senso che levento fonologico viene ad essere modellato come meccanismi sequenziali tra differenti livelli accentuali che formano scale (ascendenti e discen12 Si tratta di uno spettro lungo il quale si collocano funzioni differenziate, a partire dalla posizione centrale occupata dal canto verbale, e che procedono verso i poli opposti di linguaggio da un
lato e musica dallaltro attraverso posizioni intermedie quali il discorso poetico, il recitativo verso il
linguaggio o i leitmotifs e la narrazione musicale dal lato della musica. Pi esattamente si di fronte
ad un sistema complesso sottoposto a continui cambiamenti evolutivi che si propagano allintero
sistema, e dunque investono simultaneamente musica e linguaggio, come conseguenza delle scelte/
trasformazioni avvenute.

44

Luciana Brandi

denti). In altre parole, posto che denominiamo le unit di vocalizzazione iniziali


come parola, allorigine vi sarebbe un sistema tonale unico, e la capacit di usare
i differenti livelli di toni in modo significante; su questa base si forma la capacit,
successiva, di combinare le unit elementari di vocalizzazione in sequenze
anchesse dotate di un significato di livello superiore.
Le sequenze sono dotate di una struttura non solo melodica ma anche ritmica,
e gli schemi ritmici sono derivabili in gran parte dalla disposizione temporale degli
elementi unitari; si tratta, cio, di un livello di combinazione superiore alle singole
unit che in grado di veicolare sia il significato relazionale legato alla semplice
giustapposizione degli elementi unitari combinati, sia il significato globale determinato dallintero insieme considerato globalmente, qualcosa di pi che la somma
delle parti. Ancora non si in presenza di una sintassi specifica per ciascuna modalit interessata, quanto piuttosto di una capacit generale a combinare gli elementi unitari. Il livello di significazione ancora connesso prevalentemente
allespressione di emozioni. Il significato viene assegnato in particolare tramite la
melodia relativa al livello globale, che si fonda su variazioni di modulazione relativamente a tempo, picco accentuale, volume e lunghezza. Nellidea di Brown, le
propriet fondamentali di questo livello di percezione/produzione di unit sonore
sono le differenziazioni tra unit realizzate sulla base del picco accentuale (effetti
dellonda uditiva) ritmo (relazioni tra pulsazioni) ampiezza (effetti di prominenza).
La musilingua si fonda su discretezza, combinatorialit e intonazione, e sono
queste le caratteristiche su cui si pu fondare la successiva organizzazione gerarchica di quelli che saranno due sistemi grammaticali assai differenti.
In generale levoluzione filogenetica parte da un livello di vocalizzazioni il
cui suono veicola tanto significato referenziale quanto significato emotivo (vedi le
vocalizzazione di avvertimento dei primati). Da questo livello si sviluppa la musilingua, che avviene in due stadi: il primo costituito dalluso di toni (accenti discreti) e contorni accentuali per la comunicazione referenziale; il secondo, si identifica nello sviluppo di sequenze significanti, generate da regole combinatorie per
mettere insieme le unit elementari discrete nelle sequenze che sono soggette a
quattro livelli di modulazione: regole locali per modulazione espressiva, regole
globali per il livello totale dellespressione (intensit), regole locali categoriali per
la prominenza, formule globali categoriali per generare associazioni di significato
di contorno e livello di frase (Brown 2000: 294).
Sono evidenti le sorprendenti similarit tra la musicalit quale definita da
Trevarthen e la musilingua quale prospettata da Brown: in fondo, c bisogno di
incorporare in una mente emotiva un mondo di suoni che altrimenti non potrebbe
raggiungere le specializzazioni categoriche necessarie al farsi del linguaggio.
Questo non significa negare la specificit fonetico/fonologica del linguaggio,
quanto piuttosto, proprio alla luce delle caratteristiche maturazionali del cervello
nellontogenesi che lo rendono allinizio inadeguato a controllare dispositivi neu-

Tra musica e linguaggio: alle origini della parola

45

rali oltre una certa complessit, trovare nel profondo passato cerebrale13 il nostro
sistema limbico la chiave di accesso a forme di elaborazione pi specializzate.
Non a caso lidea principale da cui parte anche Richman 2000 che il ritmo e
la melodia sono le propriet fondamentali nelle produzioni vocali fin da quelle
delle scimmie (fa specifico riferimento alle vocalizzazioni dei gelada), dove la variabilit interna si gioca sui dettagli relativi a tempo, ritmo, intervalli musicali, e
tipi di sillabe. La differenza fondamentale tra le vocalizzazioni dei gelada e quelle
umane che nei gelada non troviamo formule, cio ripetizioni della stessa esatta
successione di caratteristiche vocali di una certa estensione, tuttal pi sono in
grado di ripetere successioni di tre sillabe al massimo. Richman ritiene che la ripetizione formulaica sia una propriet fondamentale per spiegare origine a natura
del linguaggio umano. Tali formule derivano dalla capacit di raggruppare sequenze di suoni in modo che esse diventino proprio appiccicate insieme e dotate
di un significato su una base ben precisa: laspettativa di regolarit basata sulla
ripetizione e su di una battuta regolare; cio, su quelle che sono essenzialmente
dimensioni musicali (Richman 2000: 303). Allinizio, si trattava del bisogno di
avere ripetizioni costanti in quanto ci consentiva la riconoscibilit delle sequenze
udite, di conseguenza si creavano interazioni fondate sulla sincronia ritmica che
diveniva, pertanto, interattiva consentendo cos di predire e comprendere le mosse
comunicative degli altri. La crescita del bagaglio di formule comunicabili si fond,
sempre secondo Richman, sulla capacit di combinare fra loro parti di formule o
formule intere, che rimanevano sempre olistiche dal punto di vista percettivo e incastonate in una memoria limbico-emotiva, necessaria per il radicarsi di eventi e
scene emotivamente salienti lasciando perdere tutto ci che non importante.
interessante notare, inoltre, che immaginare la musica o ascoltarla realmente sembrano attivare gli stessi substrati neurologici, ed in particolare il putamen, che
attivato a sinistra, potrebbe essere coinvolto nel timing della musica immaginata.
Inoltre, la corteccia prefrontale, che come sappiamo importante per mantenere in
linea linformazione durante lesecuzione di compiti orientati su uno scopo, viene
attivata nellemisfero destro per discriminazioni di accento di intensit sia nel
parlato che nella musica (Falk 2000). Ricordando le vecchie suggestioni di Jaynes
1976, potremmo pensare che lattivit cerebrale connessa allimmaginare musica
possa essere concepita come sottostante alla ripetizione cerebrale della voce materna da parte dellinfante (qualcosa come lecheggiare della voce degli dei alla
base del cervello bicamerale di Jaynes). Potrebbe essere proprio questo supporto di
ripetitivit in absentia a consentire il fissarsi di schemi musilinguistici nella
mente del bambino.
La ripetitivit di sequenze ritmico-melodiche, dunque, sembra essere la chiave
di lettura per connettere filogenesi e ontogenesi, nella misura in cui il riarrangiamento funzionale del cervello che avviene in linea evolutiva porta a ri-organizzare
le potenziali memorie dettagliate di specifiche sequenze sonore di parole, fatte di
13 Cfr. anche quanto descritto in Brandi 1998.

46

Luciana Brandi

sottili dettagli acustico-fonetici, in forme astratte di rappresentazione, attraverso


processi di categorizzazione intesi come processi mediante i quali i sistemi percettivi selezionano e raggruppano informazioni diverse allinterno di uguali categorie
di rappresentazione o risposta. Se la ripetitivit lorigine comune, dal cui superamento sorge la creativit inesauribile del linguaggio, allora possiamo meglio capire una patologia come quella autistica.
Avevamo gi notato (Brandi 2001) come il comportamento linguistico di A.
avesse caratteristiche ben precise: il lungo periodo di stereotipie, durante il quale il
linguaggio disponibile era costituito soltanto da formule ripetute fedelmente ma
sempre con valore comunicativo in quanto esse venivano adattate strategicamente,
anche se non perfettamente, alla situazione comunicativa, aveva dato segni di venire progressivamente superato quando in A. era emersa la capacit di intervenire
allinterno delle singole formule per prendere alcune parti e riarrangiarle fra loro
diversamente, quindi producendo un ampliamento della capacit linguistica e comunicativa. Quanto Richman (2000) propone quale origine del linguaggio dal
punto di vista della filogenesi, considerando il rapporto fra essere umano e scimmia entro una continuit di tipo darwiniano e dunque cercando di colmare tramite
ipotesi il vuoto documentario che abbiamo tra il linguaggio delle scimmie ed il
linguaggio ancestrale degli esseri umani, di cui non abbiamo ovviamente traccia,
porterebbe a considerare i modi in cui si presenta il linguaggio nelle forme di autismo analoghe a quella di A. come il ri-emergere di fasi arcaiche di funzionamento
del linguaggio, favorite dalla presenza di devianze neurobiologiche nella maturazione dellorgano cerebrale in periodo fetale che impediscono laprirsi successivo di tutte le potenzialit evolutive di riorganizzazione. In sostanza una forma di
disturbo del linguaggio associata ad autismo come quella di A. mostra con estrema
evidenza come si possa arrivare ad un calco della competenza linguistica a partire dalla semplice de-composizione e ri-composizione di formule acquisite per via
melodico-ritmica. Certo, un calco che avr sempre dei limiti di creativit, ma
pur sempre uno strumento che consente ad A. di comunicare sempre pi propriamente.
Il caso di J. pi complesso; lintero comportamento linguistico evidenzia
come il linguaggio sia percepito nella sua dimensione melodico-ritmica: non solo
ha avuto un lunghissimo periodo di inflessioni vocaliche, non solo in grado di riprodurre localmente, anche anticipando, la melodia delle canzoni country che lui
ama, ma per lui pi facile imparare la numerazione da uno a dieci che dire una
qualsiasi parola isolata, in quanto tale sequenza soprattutto un canto vocale ove
gli accenti di intensit in sequenza si fanno griglia percettiva per individuare prima
e ripetere poi una vocalit globale; le singole parole, invece, danno luogo a riproduzioni apparentemente devianti, nel senso che non paiono seguire landamento
fisso prevedibile CV quanto piuttosto possono comparire anche gruppi consonantici CC se essi sono la sede della battuta di intensit accentuale. In generale, cio,
proprio in ragione forse delle difficolt di processing ipotizzate nel paragrafo pre-

Tra musica e linguaggio: alle origini della parola

47

cedente, J. mostra gli svantaggi di avere ancora a parziale disposizione, a differenza di A., le stazioni dellemisfero sinistro per tempo e durata; il riconoscimento
disturbato, il gesto articolatorio stenta a precisarsi, e J. sorprendentemente da
tempo scruta incessantemente il suo volto riflesso nello specchio per scoprire dai
movimenti della sua bocca i segreti del linguaggio. come se J. fosse potenzialmente in grado di dar luogo ad una riorganizzazione cerebrale oltre la semplice riproduzione formulaica di strutture melodico-ritmiche, ma la parziale e disturbata
maturazione neurologica dei sistemi implicati gli impedisse di farlo, deprivandolo
nello stesso tempo della possibilit di avere un linguaggio interamente a destra.
4. Verso il linguaggio
Se guardiamo al meccanismo della percezione dei segnali sonori a livello del
sistema uditivo, le oscillazioni della pressione sonora mettono in moto il timpano e
da l si trasmettono alla membrana basilare che disposta allinterno della coclea
per tutta la sua lunghezza. Tale membrana si deforma presentando un massimo in
posizione differente a seconda della frequenza del suono. Lungo la membrana basilare corrono precise terminazioni nervose, le cellule ciliate, che danno luogo ad
un segnale quando vengono stimolate dal moto della membrana. Sono tali cellule a
permettere al cervello di discriminare le frequenze del suono traducendo il dato
frequenza in un dato posizione. Nel caso di suoni complessi, come ad esempio
il suono linguistico, la membrana basilare presenta pi punti di massimo, a seconda dei contenuti di parziali dei suoni stessi. Dunque lanalisi iniziale tanto di toni
puri che di toni complessi viene fatta a livello della membrana basilare, e tale risultato viene trasmesso ai rel uditivi del cervello. I collegamenti verso i giri di
Heschl nel lobo temporale sono di natura crociata, ma esistono anche connessioni
ipsilaterali da un orecchio al giro dello stesso lato, connessioni che sono certo pi
deboli di quelle controlaterali. La prima stazione costituita dai neuroni del nucleo
cocleale: rispondono alcuni a basse e medie, altri ad alte frequenze, alcuni si specializzano nel riprodurre stimoli ripetitivi a bassa frequenza, altri a rispondere a
suoni come le vocali. La stazione successiva costituita dai nuclei olivari, che
rappresentano il luogo ove i percorsi che vengono da ciascun orecchio si incrociano, quindi mescolando linformazione; di fatto i nucleri olivari che si dispongono da entrambi i lati della linea mediana sono tonotopicamente organizzati: qui il
flusso dellinformazione neurale viene progressivamente differenziato e aspetti e
qualit dello stimolo vengono separate, enfatizzate o soppresse. In particolare il
nucleo olivare laterale superiore d linformazione sulla localizzazione del suono
relativamente allalta frequenza, mentre il nucleo mediale superiore lo fa relativamente alle differenze di fase interaurali fra stimoli a bassa frequenza, cio combina
unanalisi temporale con unanalisi di posizione.
Partendo dalla considerazione delle unit del parlato, quali fonemi o tratti,
come categorie, lidentificazione fonemica o fonetica essenzialmente un processo di categorizzazione che deve superare uno scoglio fondamentale, la mancanza

48

Luciana Brandi

di invarianza che caratterizza londa sonora dal punto di vista fisico-acustico. Pertanto, si tratta di vedere quale ipotesi pu rendere conto del fatto che lapprendente
diviene capace di trattare come equivalenti e dunque appartenenti allo stesso insieme categoriale collezioni di caratteristiche che presentano variazioni rispettive.
Naturalmente i tratti distintivi sono una rappresentazione astratta dei gesti articolatori: il tratto vocale non si sposta istantaneamente da una posizione allaltra, ed il
parlato continua ad essere prodotto mentre il tratto vocale si trova tra le posizioni
bersaglio. Questo ha il noto effetto di propagare loutput associato con un particolare tratto in un particolare fonema oltre il tempo. In ragione della coarticolazione,
ad es., le differenze di VOT sono molto meno marcate per le occlusive intervocaliche in finale di sillaba, che in occlusive ad inizio di sillaba, ed influiscono anche
altre caratteristiche acustiche quali la durata della vocale precedente. Quindi il
problema se lidentificazione delle caratteristiche fonetiche e dei fonemi basata
su questi elementi contestualmente varianti o se invece ci sono caratteristiche acustiche invarianti che sono usate nellidentificazione dei suoni individuali14.
indubbio che per un approccio di tipo innatista, il problema si risolve nei
termini di una dotazione genetica innata, che fa s che ciascun modulo o processore relativi ai diversi componenti del linguaggio possegga i contenuti mentali che
lo rendono capace di applicarsi immediatamente in modo analitico allinput che riceve. Basti vedere per semplicit Jackendoff 1998: 90, ove i processi di percezione
uditiva analizzano il segnale acustico in tre fattori separati, ma simultanei: chi sta
parlando (riconoscimento vocale), cosa il parlante sta dicendo (percezione del linguaggio), come ci viene detto (il tono di voce o lo stato emotivo del parlante); ciascuno di questi fattori identificato da un modulo distinto del cervello: il processore linguistico riguarda i segmenti linguistici, il riconoscimento vocale riguarda
la miscela di frequenze che identifica la voce di chi parla, mentre il riconoscimento emozionale riguarda le variazioni di frequenza che caratterizzano il tono di
voce.
Ma ogni volta che ci imbattiamo in un caso di autismo, ogni volta che vediamo gli occhi dolci e spauriti di J., o quelli birboni di A., scrutare il mondo per
riuscire a capire cosa tenere e cosa buttare dei suoni che percepiscono e del rumore
14 Per mezzo delle tecniche di orientamento riflesso, si dimostrato che gli infanti al di sotto
dei 6 mesi di et sono in grado di discriminare un discreto numero di indici acustici che identificano i
fonemi. Questi comprendono il tempo di attacco di sonorit (VOT) e la frequenza delle formanti relative al luogo di articolazione delle consonanti occlusive e liquide e delle vocali; non sono discriminati con altrettanta facilit invece gli indici relativi allalta frequenza delle formanti relative al luogo
di articolazione delle fricative. Inoltre linfante sembra anche pi propenso a guardare pi spesso
limmagine del volto che corrisponde allarticolazione del suono che ode. La capacit di distinguere
il VOT al limite dei 20 ms dato, secondo alcuni studiosi, da particolari caratteristiche di risposta del
sistema uditivo, in particolare le persone rispondono a stimoli acustici superiori a 50 picchi al secondo perch li percepiscono come tono acustico, mentre al di sotto li percepiscono come rumore, dunque quella la frequenza periodica che ha una qualit tonale; questo limite di 50 picchi al secondo
corrisponde al limite di 20 ms di VOT.

Tra musica e linguaggio: alle origini della parola

49

di fondo che li accompagna, la loro fatica nel cercare di produrre linguaggio,


siamo spinti a considerare la visione innatista come la metafora per quella riorganizzazione funzionale del cervello cui avevamo fatto prima riferimento, una riorganizzazione che resa possibile solo se prima accaduto qualcosa, e questo
qualcosa sembra avere a che fare allinizio pi con la musica che con la lingua.
Secondo Cutler 1996, vi sono argomenti per ritenere che lo sviluppo di una
procedura di segmentazione basata sul ritmo sia parte dello sviluppo della lingua
nativa. Si potrebbe ipotizzare che sorga da una esposizione estensiva alla lingua
input e alla conseguente acquisizione di modelli accurati sullinput. Tuttavia si
verificato che nel caso dei bilingui (nel caso inglese francese) i parlanti controllavano una sola procedura, o la segmentazione sillabica caratteristica del francese,
o la segmentazione accentuale caratteristica dellinglese. La segmentazione esplicita lega di fatto linfante e le situazioni di processing adulto, come quelle ora indicate: allinizio dellacquisizione c bisogno solo di un punto da cui partire, e
qualunque sia dato allinfante bilingue, questo quello che resta nel corso di tutta
la vita. Gli infanti sono molto sensibili al ritmo del linguaggio, basti considerare
che i bambini inglesi di 9 mesi mostrano una preferenza per le sequenze trocaiche
(forte debole) su quelle giambiche (debole forte); inoltre essi mostrano di integrare
la struttura segmentale e quella prosodica dellinput, dando sostegno allidea che a
questa et hanno acquisito un concetto di prosodia di livello lessicale (il lexical
tone di Brown 2000?).
Anche secondo Gerken 1996, lidea che i bambini scoprono gli andamenti
prosodici specifici del linguaggio durante la seconda met del primo anno di vita
consistente con i dati che mostrano che in quello stesso periodo essi perdono la
loro sensibilit a contrasti segmentali non-nativi. Forse gli infanti possono usare la
loro crescente sensibilit ai modelli prosodici della lingua nativa per cominciare a
risolvere il problema della segmentazione. Inoltre gli/le apprendenti sono in grado
di inquadrare parole individuali nel continuum parlato; un segnale prosodico
landamento sillaba forte sillaba debole esibito da molte lingue; anche questa
sensibilit manifesta a 9 mesi ma non a 6 mesi, dunque si sviluppa nella seconda
met del primo anno di vita.
Ma da Lindblom 2000 che spiegare come i bambini sviluppano la struttura
dei suoni della loro lingua nativa riceve una risposta particolare. In generale la capacit dimostrata dai bambini di dar luogo a rappresentazioni linguistiche invarianti libere dal contesto a fronte di una considerevole variabilit nella realizzazione dei suoni era assunta come argomento a favore di una ipotesi mentalista, nel
senso che la sostanza del linguaggio era considerata il livello superficiale cui sottostava un livello formale astratto di rappresentazione mentale cio scevra dalle
variazioni contestuali di realizzazione del suono linguistico che identificava le
unit fonologiche invarianti. Per Lindblom proprio losservazione del comportamento del bambino nel corso dellacquisizione porta a formulare la necessit di un
differente paradigma, che parta dalla messa in dubbio proprio della priorit della

50

Luciana Brandi

forma sulla sostanza. Viene ad essere cos elaborata una teoria di fonologia emergente, con la quale si assume che la struttura fonologica non sia prespecificata geneticamente, ma piuttosto dedotta dallesperienza sulla base di una conoscenza
iniziale ridotta allessenziale. Per quanto riguarda la percezione, la struttura fonologica si pu fondare non pi su una assunzione nativista quanto su una forma di
computazione che emerge sulla base di una esperienza cumulativa che consente il
formarsi di categorizzazioni radicate nel ripresentarsi di regolarit statistiche nel
segnale del parlato. Di fatto, la variabilit dei segnali del parlato estesa, ma
anche assai sistematica, nel senso che una variabilit che pu essere disambiguata in ragione dellinformazione che via via si accumula e che fa s che compaiano gradualmente le covariazioni sistematiche tra le dimensioni degli stimoli.
Dal punto di vista della produzione, la capacit di articolare suoni linguistici si pu
ricondurre a movimenti articolatori basilari, come aprire/chiudere la mandibola,
guidati dalla condizione del minimo costo energetico; ad es., una apertura e
chiusura della mandibola combinata con la fonazione produce una esecuzione
quasi-sillabica simile a [bababa], vale a dire qualcosa che assomiglia alla lallazione canonica iniziale. Sono, dunque, gli schemi articolatori a costituire la strategia di bootstrapping, che favorisce lemergere di movimenti articolatori che ricevono sollecitazioni anche dalla via della imitazione vocale che costituisce quel
rinforzo ambientale che porta il bambino a fissare legami percettivo-motori fondanti la categorizzazione.
Studdert-Kennedy 2000, a sua volta ritiene che i segmenti fonetici discreti
sono strutture gestuali che emergono ontogeneticamente da un processo di imitazione vocale in cui fondamentale anche il movimento corporeo, non solo quello
vocale, ed ha un ruolo anche limitazione del gesto facciale di un altro con cui
linfante sia strutturalmente e funzionalmente isomorfico (Studdert-Kennedy
2000: 279): , in fondo, il rapporto empatico identificato da Trevarthen, la consonanza corpo/mente tra madre di cura e bambino/a. Lunit linguistica iniziale la
parola olistica: anche se prodotta come una sequenza di gesti discreti, tuttavia
tali gesti ancora non sono rappresentati come elementi fonetici indipendenti che
possono essere usati liberamente in altri e differenti contesti: come una conseguenza automatica di ordinare e ammucchiare parole simili foneticamente, emergono i gesti indipendenti, e modelli ricorrenti di gesti co-occorrenti sono gradualmente integrati nei segmenti (Studdert-Kennedy 2000: 280). I gesti sono poi
indirizzati dalla salienza nel segnale uditivo dellinformazione relativa al luogo di
articolazione, mentre la temporalizzazione o lamplitudine del gesto sembrano essere occasione di maggiori errori da parte dellapprendente. Dunque il gesto come
unit indipendente di funzionamento del linguaggio nellapprendente riporta
lemergere ontogenetico del linguaggio da un lato allintersoggettivit come elemento cruciale per lacquisizione, e dallaltro, attraverso il richiamo ai neuroni
mirror di Rizzolatti, allorganizzazione somatotopica a base neuroanatomica del
meccanismo legato alla vocalit del linguaggio.

Tra musica e linguaggio: alle origini della parola

51

Il cerchio si chiude: nel soggetto autistico, uno degli ostacoli enormi, difficili
da superare trovare il ponte verso il linguaggio; il possesso del linguaggio che,
cominciando a dare nome al percetto, lo fa diventare meno pauroso perch lo pone
sotto il controllo della mente. E per quel ponte attraverso il filo della musicalit
quale storia del nostro essere corpo/mente abbiamo bisogno di una fonologia
come quella che ho qui delineato.
Luciana Brandi
Universit di Firenze
brandi@unifi.it

Riferimenti bibliografici
Aitken K., Trevarthen C. 1997 Self/other organization in human psychological
development, Development and Psychopathology 9: 653-677.
Bateson, M. C. 1979 The epigenesis of conversational interaction: a personal
account of research development, in Bullowa, M. (ed.), Before speech
the beginning of interpersonal communication, Cambridge, Cambridge
University Press: 63-77.
Bernstein, N. 1967 Coordination and regulation of movement, New York, Harper
Collins.
Brandi, L. 1998 Note sparse su musica e linguaggio, Prisma & Convivio I.1:
135-146.
Brandi, L. 2001 Per uno studio dellautismo, Quaderni del Dipartimento di Linguistica 11: 227-247.
Brown, S. 2000 The musilanguage model of music evolution, in Wallin N.,
Merker B., Brown S. (eds.), The origins of music, Cambridge, Mass., The
MIT Press: 271-300.
Buser, P. 1999 Il cervello allo specchio, Milano, Mc-Graw Hill Italia.
Cutler, A. 1996 Prosody and the word boundary problem, in Morgan J. L.,
Demuth K. (eds.), Signal to syntax, Mahwah, NJ, Lawrence Erlbaum
Assoc. Pub.: 87-99.
Damasio, A. 1995 Lerrore di Cartesio, Milano, Adelphi.
Dissanayake, E. 2000 Antecedents of the temporal arts in early mother-infant
interaction, in Wallin N., Merker B., Brown S. (eds.), The origins of
music, Cambridge, Mass., The MIT Press: 389-410.
Eimas, P. 1996 The perception ad representation of speech by infants, in
Morgan J. L., Demuth K. (eds.) Signal to syntax, Mahwah, NJ, Lawrence
Erlbaum Assoc. Pub.: 25-39.

52

Luciana Brandi

Falk, D. 2000 Hominid Brain Evolution and the Origins of Music, in Wallin N.,
Merker B., Brown S. (eds), The origins of music, Cambridge, Mass., The
MIT Press: 197-216.
Gazzaniga, M. 2002 Funzioni diverse per gli emisferi cerebrali, Le ScienzeQuaderni 127: 4-9.
Gerken, L. A. 1996 Phonological and distributional information in syntax acquisition, in Morgan J. L., Demuth K. (eds.), Signal to syntax, Mahwah, N.
J., Lawrence Erlbaum Assoc. Pub.: 411-425.
Jackendoff, R. 1998, Linguaggio e natura umana, Bologna, Il Mulino.
Jasnow M., Feldstein S. 1986 Adult-like temporal characteristics of mother-infant
vocal interactions, Child Development 57: 754-61.
Heck D., Sultan F. 2002 Il cervelletto, Le scienze. Quaderni 127: 10-17.
Kimura, D. 1967 Functional asymmetry of the brain in dichotic listening, Cortex
3: 163-178.
Kimura, D. 1973 The asymmetry of the human brain, Scientific American 228:
70-78.
LeDoux, J. 2002 Il s sinaptico, Milano, Raffaello Cortina Editore.
Lindblom, B. 2000 Developmental origins of adult phonology: the interplay
between phonetic emergents and the evolutionary adaptations of sound,
Phonetica 57: 297-314.
Malloch, S. 1999 Mothers and infants and communicative musicality, Musicae
scientiae, special Issue 1999-2000 Rythms, musical narrative, and the
origins of human communication, Liege, European Society for the Cognitive Sciences of Music: 29-57.
Malloch S., 2000 Timbre and technology: an analytical partnership, Contemporary Music Review 19, part. 2: 155-172.
Merker, B. 1999 Synchronous chorusing and the origins of music, Musicae
scientiae, special Issue Rythms, musical narrative, and the origins of
human communication, Liege, European Society for the Cognitive Sciences of music: 59-82.
Molino, J. 2000 Toward an evolutionary theory of music and language, in
Wallin N., Merker B., Brown S. (eds.), The origins of music, Cambridge,
Mass., The MIT Press: 165-176.
Morel, F. 1947 Introduction la psychiatrie neurologique, Masson, ParisLausanne.
Peretz I., Kolinsky R. 1993 Boundaries of separability between melody and
rythm in music discrimination: a neuropsychological perspective, Quarterly Journal of Experimental Psychiatry 46A: 301-325.
Richman, B. 2000 How music fixed nonsense into significant formulas: on
rythm, repetition, and meaning, in Wallin N., Merker B., Brown S. (eds.),
The origins of music, Cambridge, Mass., The MIT Press: 301-314.

Tra musica e linguaggio: alle origini della parola

53

Studdert-Kennedy M., Shankweiler D. 1970 Hemispheric specializations for


speech perception, Journal of the Acoustical Society of America 48: 579594.
Studdert-Kennedy, M. 2000 Imitation and the emergence of segments, Phonetica 57: 275-283.
Trehub S. E., Tainor L. J., Unyk A. M. 1993 Music and speech processing in the
first year of life, Advances in Child Development and Behavior 24: 1-35.
Trevarthen, C. 1979 Communication and cooperation in early infancy: a description of primary intersubjectivity, in Bullowa, M. (ed.), Before speech
the beginning of interpersonal communication, Cambridge, University
Press.
Trevarthen, C. 1998 Empatia e biologia, Milano, Raffaello Cortina Editore.
Trevarthen, C. 1999 Musicality ant the intrinsic motive pulse: evidence from
human psychobiology and infant communication, Musicae scientiae,
special Issue Rythms, musical narrative, and the origins of human communication, Liege, European Society for the Cognitive Sciences of
Music: 157-213.
Trevarthen, C. 2001 Intrinsic motives for companionship in understanding: their
origin, development and significance for infant mental heath, Infant
Mental Health Journal 22 (1-2): 95-131.
Wallin, N. 1991 Biomusicology, Stuyvesant, NY, Pendragon Press.
Zaidel, E. 1977 Lexical organization in the right hemisphere, Cerebral Correlates of Conscious Experience, Inserm Symposium 6: 177-197.
Zatorre R., Evans A., Meyer E. 1994 Neural mechanisms underlying melodic
perception and memory for pitch, Journal of Neuroscience 14: 19081919.

Abstract
Music and language are considered in their interrelations both in ontogeny and in philogeny.
W.r.t. the historical evolution of human cognitive capacities, misilanguage identifies the proto-form
of communication where language and music were not differentiated and reference and emotion were
integrated: thereafter, music become the expression of emotional semantic, language of referential
semantic. W.r.t. ontogeny, the main idea is that language develops from a period the first year of
life where musicality is the paradigm trough which the infant reaches his/her language: pitch, sequences of pitchs i.e. melody, rythm, are the cues. Musicality, as connected with emotions and body
movements, allows the rise of protoconversations between mother and infant.
Some cases of autism are considered to show that musicality could offer the way to explain various characters of language impairments in autism, in connection with the consideration of neurobiological deficits related to different areas of brain and cerebellum.
As to explain the features of language development in autistic children, the theory of emergent
phonetic and the concept of imitation for the emergence of phonetic segments are considered.