Sei sulla pagina 1di 48

PAROLE NELLA MENTE, PAROLE PER PARLARE: IL LESSICO

NELL’APPRENDIMENTO DELLE LINGUE – CARDONA, DE IACO


CAPITOLO I: Il lessico di una lingua
1.1 Cosa chiamiamo parola
Dare un nome alle cose, agli eventi, ai vissuti è un modo per farli propri, familiarizzare con essi,
renderli disponibili alla riflessione e alla rievocazione. Le parole di una lingua svolgono molteplici
funzioni poiché ci sono diversi modi in cui il nostro pensiero, per mezzo del linguaggio,
concettualizza la realtà. Le parole si legano le une alle altre formando delle unità lessicali complesse
che possono intrattenere diversi rapporti semantici con la realtà a cui rinviano: pensiamo agli usi
figurativi della lingua, ai significati traslati, metaforici, ai modi di dire, che non sono affatto
marginali nella comunicazione umana, ma fanno strutturalmente parte della relazione quotidiana tra
lingua e vita. Ma poiché la lingua è una struttura storico-sociale in divenire, l’organizzazione del
lessico di una lingua è complessa e suscettibile a continue trasformazioni.
Le parole che fanno parte di un lessico possono essere:
1. Lessemi, unità di forme variabili nelle desinenze e nei morfi grammaticali a seconda delle
esigenze del contesto;
2. Singoli morfo-lessicali invariabili congiungibili a soli morfi grammaticali (le parole radice)
o congiungibili a morfi sia grammaticali che formanti (le parole tema);
3. Unità di forma invariabile dal punto di vista grammaticale o famiglie di unità di forma
testuale riconducibili a un unico lessema.
Alla luce di ciò, si definisce lessico l’insieme aperto, indefinito, dei lessemi di una lingua. La
lessicologia si occupa dello studio dei vari aspetti del lessico, mentre la lessicografia ha il compito
di studiare metodi e tecniche per comporre vocabolari e dizionari, che sono sempre delle
rappresentazioni parziali e limitate del lessico di una lingua.
1.2. Il dizionario: una rappresentazione del lessico
Quando incontriamo una parola che non capiamo, facciamo ricorso al dizionario. Se nell’interazione
orale è molto più probabile che si chieda al nostro interlocutore cosa intenda dire con quella certa
parola a noi sconosciuta, quando si legge un testo, si potrebbe decidere di usare un dizionario in
presenza di parole oscure. Quando si legge un testo con l’obiettivo di cogliere il senso generale e si
incontra una parola dal significato ignoto che tuttavia non pregiudica la comprensione a grandi linee
di ciò che stiamo leggendo, si può tentare di ricavare approssimativamente il significato di quella
parola facendo strategicamente ricorso all’expectancy grammar, ovvero alla capacità di prevedere o
inferire i significati delle parole sulla base del contesto in cui esse ricorrono. Invece, se l’obiettivo
della lettura richiede una comprensione dettagliata delle parole che compongono il testo o la
complessità del testo non permette di ricavare in modo sufficientemente adeguato il significato di
una parola sconosciuta, non resta che cercare quest’ultima sul dizionario.Tuttavia, le parole che
compongono una lingua, le norme che ne governano i rapporti con i fatti e le cose che esse
denotano, connotano, metaforizzano, cambiano continuamente. Le stesse definizioni di un
dizionario presentano perciò dei limiti rispetto alla natura dinamica e generativa del lessico:
nonostante le numerose e continue riedizioni, i dizionari non riescono a tenere il passo mutevole
della lingua e ci restituiscono una fotografia di quest’ultima che si presenta sempre già sbiadita, già
invecchiata. Il dizionario è strutturato in modo artificiale rispetto al modo in cui il lessico si
organizza nella nostra mente. In esso le parole sono presentate in ordine alfabetico e ciò agevola le
esigenze di ricerca di una certa parola, ma non rispecchia il modo in cui il lessico si struttura nella
nostra mente. Questa incongruenza tra la struttura del lessico nel dizionario e la sua organizzazione
nella nostra mente è uno dei motivi per cui leggere la spiegazione di un significato in un dizionario
spesso non è sufficiente per memorizzare in modo duraturo un certo input linguistico.
1.3 Dizionario, vocabolario e lessico
Se il dizionario è una rappresentazione parziale del lessico, cosa si intende per lessico e
vocabolario? Consideriamo vocabolario l’insieme delle parole utilizzate in modo caratterizzante da
un singolo parlante (idioletto) o da un gruppo di parlanti e parliamo anche del vocabolario usato per
trattare un certo tema e per costruire un determinato discorso, intendendo l’insieme delle parole
usate in modo specifico per essi. Del lessico fanno invece parte: una quantità considerevole di
parole attestate, un’immensa quantità di parole potenzialmente formabili secondo le regole di
formazione delle parole, espressioni in cui le parole che le compongono hanno cambiato il proprio
singolo valore per assumere un valore globale nuovo, indipendente da quello che ciascuna parola ha
se presa singolarmente.
1.4 Parole lessicali e parole grammaticali
Tra le parole contenute in un lessico si può tracciare una prima distinzione utile sul piano didattico:
 Parole lessicali Dette anche piene, perché sono in grado di veicolare significato in
modo del tutto autonomo e talvolta anche se si presentano isolate: si tratta di nomi,
aggettivi, avverbi
 Parole grammaticali da sole non possono veicolare significato e sono perciò chiamate
parole vuote, ma sono anche definite parole funzionali; svolgono una funzione
grammaticale in associazione ad altre parole. Appartengono a questa categoria gli
articoli, le preposizioni, i pronomi, le congiunzioni
Se le parole lessicali di una lingua costituiscono una classe indubbiamente aperta, in quanto in essa
si possono aggiungere nel tempo un numero indefinito di nuove parole, la classe delle parole
grammaticali di una certa lingua è piuttosto circoscritta a un numero finito e predicibile di entità, le
quali possono variare solo nel caso in cui intervengano mutamenti linguistici radicali. Dal punto di
vista didattico è importante tenere presente che le parole grammaticali hanno una frequenza
maggiore nella lingua e la capacità di individuarle, di discernerne la funzione, nell’apprendimento
di una lingua è uno degli obiettivi principali della competenza lessicale.
1.5 Types e tokens
Per giungere alla definizione di types e tokens partiamo da uno scioglilingua:
Figlia, sfoglia la foglia; sfoglia la foglia, figlia.
Types o forme grafiche si intendono quante parole diverse ci sono in questo
componimento (figlia, sfoglia, la, foglia)
Tokens intendiamo le occorrenze e, in questo caso, vanno contate anche le parole che si
ripetono (per un totale di otto parole)
Il rapporto tra il numero di types e quello dei tokens, che si ottiene dividendo il primo per il secondo,
ci restituisce la misura della varietà lessicale di un testo. Quanto più è elevato il numero di types,
tanto più il lettore dovrà sforzarsi di comprendere un testo. Questo è un dato a cui un insegnante di
lingua può prestare attenzione al fine di stabilire la difficoltà di lettura dei testi su cui far lavorare gli
studenti.
Il rapporto tra types e tokens è legato alla lunghezza del testo, nel senso che se aumenta la lunghezza
di un testo diminuisce il valore di tale rapporto, nella misura in cui cresce il numero delle parole che
si ripetono e si abbassa quello delle parole che compaiono per la prima volta. Un basso valore del
rapporto types/tokens indica una certa ridondanza lessicale nel testo, mentre un valore alto vuol dire
che il testo si presenta poco ripetitivo dal punto di vista lessicale. Si tratta di uno dei quattro
parametri individuati da Laviosa per stabilire la varietà lessicale di un testo: insieme a esso, Laviosa
include l’indice di densità lessicale, quello della lunghezza media delle frasi e il rapporto tra parole
più frequenti e meno frequenti.
1.6. Quante parole deve conoscere chi apprende una lingua
La quantità di parole che deve apprendere uno studente di lingua straniera dipende dal livello di
competenza che si assume come riferimento, da quali mete culturali e obiettivi comunicativi lo
studente si prefigge di raggiungere. Occorre tenere presente diverse variabili:
- Livello di istruzione del parlante nativo
- Abilità di lettura
- Grado di intelligenza cristallizzata = la sua capacità di utilizzare le competenze e le
conoscenze acquisite
Si possono calcolare per ciascuna lingua un valore medio di parole apprese dai bambini in età
prescolare, che va via crescendo con la scolarizzazione fino a raggiungere un vocabolario di base
che si arricchisce sempre più fino ad arrivare a un valore medio di parole note simile a quello di un
parlante adulto altamente istruito. Per quanto riguarda il terzo quesito, misurare quante parole sono
necessarie a un parlante per soddisfare le proprie esigenze linguistiche, è chiaro che questa misura
dipende molto dagli obiettivi che l’apprendente si prefissa: essi possono essere minimi e quindi la
quantità di parole da apprendere sarà contenuta oppure possono essere più elevati e il lessico da
acquisire sarà consequenzialmente più ricco e ampio. Secondo le stime attuali, un italiano adulto
istruito arriva ad usare 47.000 parole. Il vocabolario di base della lingua italiana di De Mauro
aggiornato nel 2016 comprende 7500 parole circa suddivise in:
1. Lessico fondamentale, che comprende 2000 parole circa usate nell’86% dei discorsi e testi
(parole ad altissima frequenza);
2. Lessico ad alto uso, costituito da 3000 parole che coprono il 6% delle occorrenze (parole di
uso frequente);
3. Lessico ad alta disponibilità , che comprende 2000 parole circa usate solo in determinate
circostanze, ma considerate di facile comprensione in quanto percepite dai parlanti
ugualmente se non maggiormente disponibili rispetto alle parole d’uso frequente.
Si è soliti accettare che per acquisire una conoscenza minima del lessico di una lingua si debbano
conoscere circa 3000 parole.
1.7. Vocabolario ricettivo e vocabolario produttivo
Distinguiamo fra un vocabolario produttivo, che è quello che ciascun parlante è in grado di produrre
quando parla, scrive o pensa in una lingua e un vocabolario ricettivo, che comprende invece le
parole che riusciamo a capire durante l’ascolto o la lettura, che siamo in grado di ricevere, ma non
riusciamo a usare nelle fasi produttive della lingua, quando pensiamo, interagiamo e scriviamo. Il
vocabolario ricettivo si attiva durante il processo di riconoscimento delle parole in attività come la
lettura o l’ascolto, nel corso delle quali si recupera dalla memoria semantica il significato delle
parole che vengono riconosciute come familiari e che fanno parte del nostro sapere. Nel caso
dell’attivazione del vocabolario produttivo, invece, avviene un processo diverso: nel tentativo di
esprimere un concetto nel corso di attività produttive come parlare o scrivere si recuperano le forme
scritte o orali delle parole producendo con esse discorsi o testi sensati.
In generale, il vocabolario ricettivo è più esteso del vocabolario produttivo, per cui uno studente può
conoscere alcune parole che è in grado di riconoscere e comprendere, senza però essere riuscito a
trasferirle nel proprio vocabolario produttivo, ovvero può conoscere delle parole a cui è stato
esposto occasionalmente o che ha acquisito profondamente assorbendole, senza essere tuttavia in
grado di recuperarle e utilizzarle in fase produttiva. Cercare di trasformare il lessico ricettivo in
lessico produttivo è un obiettivo importante al fine di espandere la conoscenza linguistica. Tuttavia,
una parola può non appartenere in modo rigido ed esclusivo al vocabolario produttivo o a quello
ricettivo di uno studente, quanto piuttosto può collocarsi in uno dei gradi intermedi che sono stati
individuati tra quello della ricezione e della produzione. Studiosi come Melka hanno proposto
quattro livelli: imitazione, riproduzione, comprensione e produzione.
Al primo livello non è necessario che si attivino i significati degli input linguistici, mentre invece
nel caso della riproduzione dovrebbe esserci un processo di assimilazione, una presa di coscienza
del valore semantico di quanto si sta ripetendo. Si tratta di un processo che favorisce la
memorizzazione degli input. Senza un processo di riproduzione consapevole del senso di quel che si
sta dicendo, la riproduzione viene a coincidere con l’imitazione. Se invece la riproduzione avviene
insieme alla comprensione, allora il livello di produzione è sempre più prossimo, in quanto una
volta acquisito profondamente l’input linguistico, esso si rende disponibile a un uso creativo da
parte del soggetto che riesce a collocarlo a un livello produttivo più complesso.
In funzione di questi diversi gradi intermedi della trasformazione del vocabolario ricettivo in
vocabolario produttivo, possiamo distinguere gli obiettivi che uno studente deve raggiungere. Per
quanto riguarda le parole del vocabolario ricettivo uno studente deve acquisire la capacità di:
1. Riconoscere una parola dal punto di vista fonologico durante l’ascolto;
2. Riconoscere le parti di una parola quali radice, suffissi, affissi, flessioni, ecc.
3. Riconoscere la correttezza ortografica di una parola scritta;
4. Riconoscere il valore semantico di una parola in base al contesto in cui essa ricorre;
5. Riconoscere e distinguere il significato denotativo e quello connotativo di una parola;
6. Riconoscere le potenziali collocazioni di una parola.
Parlando di vocabolario produttivo, uno studente deve invece essere capace di:
1. Riprodurre una parola correttamente, ovvero deve essere in grado di pronunciarla prestando
la giusta attenzione ad elementi soprasegmentali come l’intonazione e l’accento;
2. Riprodurre la parola correttamente dal punto di vista della struttura morfosintattica;
3. Scrivere le parole correttamente sotto il profilo ortografico;
4. Usare la parola in modo appropriato nei contesti semanticamente pertinenti;
5. Combinare le parole secondo quanto consentito dalle regole di occorrenza e collocazione
della lingua;
6. Scegliere le parole in base al grado di adeguatezza al registro comunicativo.
Tale schema non si applica rigidamente a ciascun caso di apprendimento delle parole. La
conoscenza di una parola implica il conseguimento di diverse sotto-competenze che possono essere
presenti in grado diverso nella lingua che lo studente sviluppa man mano che accresce la propria
competenza nella lingua che sta apprendendo. La sviluppo di queste sotto-competenze avviene in
modo diversificato e dipende dalle attività didattiche che vengono proposte allo studente.
1.8 Quali parole si imparano prima
Ogni studente ha una propria sfera emotivo-affettiva che influisce sulla capacità di apprendimento
di una lingua. Ciascuno di noi ha un proprio vocabolario e, in base al proprio grado di istruzione, al
proprio stile di vita, alla propria professione, predilige certi vocaboli che magari un’altra persona
non conosce e, in ogni caso, caratterizza le proprie produzioni scritte e orali in modo personale.
Quando si apprende una lingua straniera è probabile che si tenti, in modo del tutto inconsapevole, di
ricreare il proprio vocabolario nella lingua che si sta apprendendo e, in generale, è possibile che uno
studente riesca ad acquisire più facilmente alcune parole simili a quelle che è solito usare nella
lingua madre. Tuttavia, è possibile che la trasformazione del vocabolario ricettivo in vocabolario
produttivo venga guidata, nel senso di motivata e stimolata, dal principio di utilità per cui uno
studente riuscirà a imparare prima le parole della lingua straniera utili a soddisfare le proprie
esigenze pratiche. Strategicamente, l’insegnante può far leva sul principio di utilità e favorire
l’apprendimento.
Succede anche che si riescano ad acquisire prima gli input linguistici ricevuti più frequentemente o,
ancora, quelli più facili da pronunciare o quelli meno affini alla propria lingua madre, poiché le
parole della lingua straniera fonologicamente simili a quelle della lingua madre possono generare
interferenza e confusione. È invece più facile apprendere le parole che non presentano troppa
discrepanza tra forma scritta e forma orale: quelle che si pronunciano in misura considerevolmente
diversa rispetto a come si scrivono tendono a essere memorizzate con più difficoltà. Nei primi stadi
d’apprendimento di una lingua anche la lunghezza delle parole può essere determinante: le parole
corte si memorizzano più facilmente. Non possiamo determinare in modo definitivo quali parole
verranno acquisite prima: la capacità di costituire un vocabolario ricettivo e di trasformarlo in
vocabolario produttivo dipende dalle scelte da parte dell’insegnante di metodologie e materiali
didattici adeguati all’apprendimento del lessico, ma dipende anche dalle contingenze di vita e dalle
disposizioni emotivo-affettive di ciascun studente.
1.9 Il significato
Il campo della linguistica che tratta in modo specifico del significato si chiama semantica. Nel 1883
il linguista francese Bréal propose di chiamare semantica un campo di studi focalizzato
sull’indagine del significato, con un’attenzione particolare al suo diversificarsi nelle diverse lingue e
all’interno di una stessa lingua e al mutamento del significato delle parole. Trattasi di uno studio che
si intreccia discipline come la filosofia, la semiotica, la psicologia, la linguistica e le scienze
cognitive. La semantica che ci interessa, in prospettiva glottodidattica, è quella della linguistica, la
quale si occupa dell’intera organizzazione dei rapporti di significato all’interno di una lingua storica
e di come i significati vengono usati nei concreti atti linguistici, quelli che Saussure chiamava
paroles. Gli atti linguistici sono le combinazioni linguistiche volontariamente create dai parlanti che
attivano, attualizzano e ricreano il sistema storico-sociale della lingua entro cui si collocano.
Nel considerare un segno linguistico verbale si distingue una parte materiale, ossia la forma
grafemica o fonologica, detta significante, e una parte cosiddetta immateriale, concettuale, che
veicola informazioni, chiamata significato. Il significato si configura come un punto d’unione tra i
processi mentali, la lingua e il mondo esterno ed è la parte del segno decisamente più difficile da
definire. Possiamo limitarci a sintetizzare due concezioni del significato: quella denotativa o
referenziale e quella pragmatica o contestuale. Secondo la prima concezione il significato è
un’immagine o un’operazione mentale corrispondente a oggetti, qualità e azioni concrete nel
mondo esterno o a
un’idea quando si tratta di un riferimento a qualcosa di astratto esterno alla lingua. Invece, nella
prospettiva della concezione pragmatista il significato viene descritto come l’uso che si fa di un
segno all’interno di un certo contesto secondo determinate regole: si tratta quindi di una visione
funzionale, detta anche contestuale, del significato.
Consideriamo la distinzione usata in linguistica tra:
Significato denotativo → si intende ciò che in senso oggettivo il segno rappresenta, ossia
la relazione oggettiva di un significante con un referente della realtà esterna
Significato connotativo → ci riferiamo a una relazione semantica soggettiva, a un significato
inferito, connesso alle sensazioni del soggetto parlante e alle associazioni generate dal segno. Il
significato denotativo della parola cane è: animale domestico dall’olfatto finissimo, con dimensioni,
aspetto, attitudini variabili. Un significato connotativo potrebbe essere: animale fedele, molto
socievole, giocherellone. Tra i significati connotativi includiamo tutte le associazioni al cane che ci
sovvengono, le valutazioni personali su questo animale, le sensazioni legate a nostri vissuti
personali con i cani.
Gli aspetti del segno che, rispetto al significato, dobbiamo tenere a mente in quanto rilevanti nella
didattica delle lingue sono:
1. Il carattere arbitrario del legame tra significante e significato, per cui è del tutto
convenzionale, privo di aggancio naturale e frutto di un’abitudine sociale, che in italiano
alla sequenza di suoni /s-o-r-e-l-l-a/ corrisponda il significato di sorella inteso come colei
che è parente di primo grado, in quanto figlia dei miei stessi genitori.
2. La lingua è un sistema organizzato di segni in cui ciascun segno deve la propria esistenza
all’esistenza di altri segni, ovvero ogni segno assume il proprio significato secondo
relazioni sintagmatiche e paradigmatiche (quali polisemia, sinonimia, antonimia, iperonimia
e iponimia) con altri segni della stessa struttura linguistica.
1.9.1 Le collocazioni
Le collocazioni sono relazioni sintagmatiche particolarmente interessanti nella didattica del lessico.
Ogni parola tende a stabilire dei rapporti privilegiati, a volte esclusivi, con le parole che la seguono
e la precedono, formando così dei chunks, delle unità informative in cui una parola richiama
un’altra. Si tratta di rapporti che possono variare nelle diverse lingue e questa variabilità è ciò che
rende impossibile eseguire una traduzione letterale di una lingua in un’altra.
Forte pioggia ≠ Strong rain
Forte pioggia = Heavy rain
In ogni lingua si costituiscono delle co-occorrenze socialmente accettate e abitualmente
riattualizzate dai parlanti che si configurano come sintagmi lessicali piuttosto fissi che devono
essere correttamente appresi dai parlanti stranieri in modo da raggiungere una buona fluenza
linguistica.
1.9.2 Omonimia e polisemia
Fra le relazioni di significato che possiamo riscontrare tra uno o più lessemi c’è quella di omonimia
nel caso di lessemi che hanno lo stesso significante, ma diverso significato. Sono ad esempio
omonime le parole porta, terza persona singolare dell’indicativo presente del verbo portare, e porta,
apertura che consente un passaggio. Nella lingua italiana gli omonimi si distinguono in omografi e
omofoni: gli omografi sono le parole che si scrivono allo stesso modo, ma si pronunciano
diversamente; parliamo, invece, di omofoni nel caso di parole che si pronunciano anche allo stesso
modo. Dall’omonimia deve essere distinta la polisemia: nel caso dell’omonimia non ci sono rapporti
di parentela e derivazione fra i significati rappresentati dallo stesso significante, mentre nella
polisemia i diversi significati che sono stati associati nel tempo allo stesso significante sono
imparentati tra loro e intrattengono o possono intrattenere rapporti di derivazione. Nel caso della
polisemia si tratta di una stessa parola che ha più significati in qualche modo correlati tra loro. I
diversi significati associati a una parola polisemica variano quando si passa da una lingua a un’altra
e la polisemia può costituire un fattore di difficoltà nell’apprendimento del lessico, soprattutto se si
tenta di apprendere il lessico della lingua straniera traducendo quello della propria lingua madre.
1.9.3 Sinonimia
Quando fra due parole sussiste un rapporto di somiglianza semantica parliamo di sinonimia. Si tratta
di parole con significante diverso, ma significato simile (bello/affascinante) o uguale (padre/
babbo). La sostituzione di una parola simile con un’altra comporta spesso un cambio di sfumatura
del significato e può non risultare sempre appropriata. La sostituzione di una parola con un suo
sinonimo può aggiungere valori connotativi e può non essere appropriata in certi contesti
comunicativi. Se il registro di una conversazione formale non è appropriato parlare di casino in
presenza di confusione. Raffreddore e rinite sono sinonimi, ma mentre parliamo comunemente di
raffreddore, in campo medico si parla più tecnicamente di rinite e può succedere che persone con
un’istruzione elevata sostituiscano la parola rinite con raffreddore a seconda dell’interlocutore con
cui parlano e dunque anche del tipo di registro comunicativo. Una sinonimia perfetta o assoluta è
estremamente rara. Nella maggior pare dei casi abbiamo a che fare con una sinonima relativa o
contestuale e quindi funzionale a ciò che in una certa situazione sociopragmatica si vuole
esprimere.
Dal punto di vista glottodidattico dobbiamo dedurre che è importante introdurre il lessico agli
studenti sempre in specifici contesti d’uso, in modo da stimolare la riflessione sulla sinonimia tanto
per arricchire il lessico dell’apprendente, quanto per sviluppare la sua abilità metalinguistica in
funzione della scelta appropriata di una parola, a discapito di un suo sinonimo in base allo specifico
contesto comunicativo in cui egli si trova a interagire.
1.9.4 Antonimia
Quando fra due parole sussiste un rapporto di incompatibilità semantica parliamo di antonimia. Si
considerano antonimi due lessemi che hanno un significato contrario, ovvero uno ha un significato
opposto a quello dell’altro. I rapporti di antonimia si differenziano in base alla loro appartenenza a
categorie che esprimono proprietà fisiche (alto/basso, sottile/grosso), qualitative (buono/cattivo,
generoso/tirchio), spaziali (sopra/sotto, destra/sinistra), estetiche (bello/brutto) o proprietà che si
escludono l’un l’altra (pieno/vuoto, chiaro/scuro, giorno/notte). Fra gli antonimi ci sono poi diversi
gradi che possono essere lessicalizzati ricorrendo a poco, abbastanza, molto, per cui possiamo dire:
un po’ freddo o un po’ caldo, abbastanza freddo o abbastanza caldo, né caldo né freddo, molto
freddo o molto caldo. I rapporti semantici oppositivi possono essere usati in modo strategico nella
didattica del lessico di una lingua, in quanto presentare una coppia di opposti agli studenti può
favorire la memorizzazione delle due parole.
1.9.5 Iperonimi e iponimi
Iperonimi e iponimi si definiscono reciprocamente. Un iperonimo appartiene a una categoria semantica più
estesa entro la quale si iscrive un iponimo che rispetto all’iperonimo ha un significato più specifico. Per cui
animale è iperonimo di cane, che è quindi un iponimo. Ma fra animale e cane possiamo indicare un iponimo
intermedio che è mammifero così come possiamo continuare ad estendere la catena degli iponimi, ad
esempio, con la parola bassotto. All’interno di una certa categoria semantica (iperonimo) troviamo un ordine
gerarchico rispetto agli iponimi e a rete tra gli iponimi nella misura in cui aumentano i tratti semantici di
ciascun iponimo e fra di essi si stabiliscono degli incroci: alcuni tratti appartengono ad alcuni iponimi, ma
non ad altri e così via. Il rapporto tra iperonimi e iponimi permette di rilevare una struttura organizzativa di
tipo associativo tra gli elementi del lessico di una lingua.
1.10 La competenza lessicale
La competenza lessicale si struttura in una serie di sotto-competenze che devono essere sviluppate
attraverso tecniche e strategie didattiche che tengano conto del contesto educativo e delle specifiche
condizioni emotivo-affettive degli studenti. Sintetizziamo l’insieme delle sotto-competenze della
competenza lessicale:

CAPITOLO II: Le parole nella mente


2.1 Il lessico mentale
Quante parole impariamo e il modo in cui impariamo a usarle non è rigidamente prestabilito dalle
strutture cognitive che ciascuno di noi possiede, ma dipende dall’ambiente socio-culturale in cui
nasciamo, cresciamo e apprendiamo, dagli stimoli che riceviamo dall’ambiente in cui viviamo, dalle
specifiche condizioni emotivo-affettive, dalle possibilità che ciascuno di noi ha di interagire con le
altre persone senza l’aiuto delle quali non sarebbe in grado di imparare a parlare né a leggere e
scrivere né potrebbe apprendere una lingua straniera. Gli esseri umani nascono dotati delle basi
naturali per acquisire una lingua, posseggono alla nascita quella che viene chiamata la facoltà di
linguaggio, ma è solo all’interno di un contesto comunicativo pragmatico-sociale, interazionale,
funzionale alle prassi di vita, un contesto affettivo e relazionale, che riescono ad acquisire una o più
lingue storiche.
Apprendere il lessico di una lingua implica, quindi, che ci siano condizioni socioaffettive,
favorevoli all’apprendimento, coordinate a funzioni cognitive e a capacità linguistiche e
percettive. Si tratta di un processo complesso e l’organizzazione del lessico mentale che ne risulta
si configura in modo altrettanto complesso. Ma cosa chiamiamo lessico mentale? Jarema e Libben
hanno proposto una definizione aperta che non lo incapsula come un’entità con precisi confini
strutturali e funzionali, ma lo inquadra come un’attività che può essere esercitata consciamente o
inconsciamente e che riguarda non solo qualcosa con cui gli uomini hanno a che fare, ma anche ciò
che gli uomini possono fare, non concerne dunque solo le parole che gli uomini ricevono, ma anche
quelle che gli uomini creano.
In termini psicolinguistici, possiamo definire il lessico mentale come «un insieme di
rappresentazioni, cioè di oggetti mentali che corrispondono a elementi della realtà», dei quali
«riflettono certe caratteristiche rilevanti, e di processi che si applicano a queste rappresentazioni,
operando su di esse, trasformandole o mettendole in relazione fra loro». Secondo questa definizione,
esso contiene le rappresentazioni mentali delle parole che abbiamo acquisito e include i
processi che permettono di operare su queste rappresentazioni modificandole, ponendole in
relazione, operando con esse. Siamo in grado di comprendere una parola che leggiamo e ascoltiamo
perché essa è rappresentata nel nostro lessico mentale, così come siamo in grado di produrre testi e
discorsi perché troviamo in esso tutte le informazioni necessarie per produrre con le parole.
Quando riconosciamo una parola come appartenente al lessico di una lingua che abbiamo imparato
o che stiamo apprendendo, si attivano una serie di competenze come quella che ci permette di
riconoscere la forma della parola o quella che ci consente di riconoscerne gli aspetti morfosintattici,
siamo in grado di categorizzarla dal punto di vista grammaticale e possiamo attribuirle un
significato sulla base di quelle che sono le nostre conoscenze del mondo. La memoria semantica è
la parte della memoria a lungo termine che raccoglie tutto il sapere che accumuliamo, tutta
l’enciclopedia delle nostre conoscenze. Quando riconosciamo un input si avvia un processo di
elaborazione concettuale attraverso il quale l’input viene confrontato e integrato con altri input
presenti nella memoria, si attiva l’intera enciclopedia delle conoscenze accumulate in base alle
nostre esperienze e a ciò che abbiamo acquisito nel corso della vita.

Possiamo pensare al lessico mentale come al nostro database di parole e di informazioni su di esse
attraverso il quale processiamo gli input linguistici nel momento in cui comprendiamo o parliamo una lingua
acquisita. Nel lessico mentale sono depositate informazioni sulle parole non solo di carattere semantico,
bensì anche di carattere formale (informazioni ortografiche e fonologiche) e di carattere sintattico, disposte
non in rigidi schemi ordinati, ma interconnesse in modo complesso. Sono stati elaborati diversi modelli che
descrivono la struttura e il funzionamento del lessico mentale. Quest’ultimo, di certo, si attiva
immediatamente quando riceviamo input linguistici o produciamo output linguistici. Esso è in grado sia di
conservare a lungo, per anni, anche per tutta la vita di una persona, le informazioni sulle parole che raccoglie
sia di riorganizzarsi di volta in volta in base ai nuovi input che fanno ingresso nella nostra mente.
Quando si apprende una lingua straniera si vengono a creare nuove rappresentazioni lessicali nella
nostra mente, con dei collegamenti in parte o totalmente diversi tra forma grafemica e fonemica e
significati, pensiamo allo studio di una lingua orientale. L’obiettivo della didattica delle lingue sarà
quello di permettere allo studente di archiviare il lessico della lingua straniera nella memoria a
lungo termine, dove esso entrerà in relazione con le conoscenze già acquisite e queste connessioni
consentiranno alle nuove rappresentazioni lessicali di essere disponibili al momento dell’interazione
orale o della produzione scritta. Alcuni studi hanno dimostrato che l’architettura del lessico mentale,
almeno per lingue dello stesso ceppo, è la stessa e le differenze rilevate nei meccanismi di
attivazione del lessico sono riconducibili alle diverse modalità con cui il lessico viene appreso.
2.2 Come si organizzano le parole nella mente
Come si pone la situazione dell’immagazzinamento e del deposito del lessico di una lingua straniera?
Quest’ultimo si deposita insieme al lessico della L1 o separatamente? Che tipo di relazioni mentali si
instaurano tra il lessico della L1 e quello di una L2? Quando le lingue acquisite sono anche più di due il
deposito delle parole e l’interazione tra i vari lessici è ancora differente? Una risposta alla gestione separata
del lessico mentale della L1 e di quello della L2 è stata data in diversi studi: è possibile, come sintetizza
Singleton, che i due lessici vengano immagazzinati in due sistemi differenti che però sono in grado di
relazionarsi tra. Il modo e la misura in cui questi due sistemi entrano in contatto dipendono molto da fattori
quali le modalità d’apprendimento del lessico della L2 e il livello di competenza lessicale raggiunto nella
L2. È stato dimostrato che il lessico della L1 viene generalmente emorizzato in base a rapporti semantici di
tipo paradigmatico; nel caso infatti di esperimenti condotti con esercizi di libera associazione è emerso che
le parole venivano associate in base ai tratti salienti emergenti. Le associazioni di tipo sintagmatico vengono
preferite per memorizzare il lessico a bassa frequenza d’uso. Per memorizzare il lessico della L2, invece, la
tipologia di associazioni appare molto più variabile e tende a basarsi su rapporti semantici di carattere
contestuale, ovvero si tendono ad associare parole usate nella stessa situazione comunicativa o in situazioni
simili.
2.3 I modelli di rappresentazione
Per la rappresentazione dell’associazione degli aspetti formali delle parole con quelli semantici,
dell’organizzazione dei rapporti delle parole nella mente e delle modalità d’accesso e d’uscita del
lessico, sono stati elaborati dalle scienze cognitive diversi modelli volti a descrivere il
funzionamento del lessico mentale. Alcuni di questi, come il modello di Forster (1976), si basano
sull’idea che l’accesso delle parole nel lessico mentale avvenga in modo seriale, ovvero secondo
un’elaborazione sequenziale e lineare, stadio dopo stadio, degli input, mentre altri sostengono che
abbia luogo un’attivazione in parallelo, ossia che più processi di elaborazione dell’input linguistico
si attivino simultaneamente. Il secondo modello logogen di Morton (1978) sintetizza in qualche
modo le due impostazioni prevedendo un’attivazione di tipo seriale, ma una processazione in
parallelo.
2.3.1 Il secondo modello logogen di Morton
Il modello logogen di Morton prevede un’elaborazione in parallelo dell’input. Esso è costituito da
un sistema cognitivo che include informazioni di tipo semantico e sintattico ed è collegato a due
sistemi detti logogen, i quali sono separati: uno è deputato all’analisi degli aspetti uditivi dell’input
e l’altro a quella degli aspetti visivi. L’esistenza di due sistemi separati è fondata su alcune ricerche
condotte attraverso il paradigma di priming, le quali hanno dimostrato che il riconoscimento visivo
di una parola è facilitato dalla precedente presentazione di esso nella stessa modalità, invece, questo
effetto positivo di facilitazione del riconoscimento lessicale non si verifica quando lo stimolo è
presentato in forma uditiva. I due sistemi logogen del modello Marton accumulano le informazioni
su ogni stimolo che ricevono e le rimettono al sistema cognitivo; da quest’ultimo attingono le
informazioni necessarie per riconoscere un input quando questo è fra quelli che sono già stati
archiviati.
I logogen operano in parallelo e sono poi connessi con un sistema d’uscita degli input che si attiva
quando si producono le parole in modo scritto o orale. Il riconoscimento di una parola da parte del
logogen avviene secondo variabili quali la frequenza d’uso d’una parola, la sua lunghezza, la sua
concretezza, ecc. Secondo Morton le parole più ricercate, ovvero quelle con maggiore frequenza
d’uso, sarebbero quelle più attive e dunque maggiormente disponibili nelle ricerche successive. Ciò
suggerisce che occorre favorire il più possibile l’esposizione alle parole di una lingua, perché quanto
più alta è la frequenza di esposizione a esse, tanto più basso sarà il livello di soglia per l’attivazione
dei sistemi logogen. Sarà quindi più facile riconoscere e produrre le parole a cui si viene esposti
maggiormente. Il modello Morton è un modello globale, perché prevede che il riconoscimento di
una parola avvenga attraverso l’attivazione di un’unità d’accesso riferita all’intero input linguistico
da cui si è ricavata l’informazione. Ad esempio, nel caso in cui si riconosca la parola inglese cat si
attiverà in modo specifico il logogen di cat, ma si attiveranno anche altri logogen contenenti gli
stessi attributi riferibili alla parola cat come parole di tre lettere, c iniziale, t finale e così via.

2.3.2. Il modello di ricerca seriale di Forster


Secondo il modello elaborato da Forster negli anni Settanta, il lessico consiste in un unico grande
archivio centrale che raccoglie tutte le informazioni necessarie per comprendere e produrre le
parole. Le operazioni di processazione degli input lessicali avvengono attraverso una serie ordinata
di operazioni che permettono il passaggio sequenziale a diversi gradi di elaborazione. L’ordine di
elaborazione seriale resta costante. L’accesso all’archivio centrale avviene attraverso tre archivi
periferici: ortografico, fonologico e sintattico/semantico. Le informazioni ricevute dal magazzino
centrale vengono trasmesse al magazzino delle conoscenze che ciascun individuo accumula nel
corso della propria vita. L’attivazione degli archivi periferici dipende dal tipo di input che la mente
riceve. Durante un compito di lettura si attiva certamente l’archivio ortografico, mentre invece se
ascoltiamo parlare qualcuno durante una conversazione si attivano le informazioni contenute
nell’archivio fonologico. L’archivio sintattico/semantico mette a disposizione le sue informazioni
tutte le volte che produciamo un discorso o un testo.
Nel modello Forster ciascun archivio d’accesso così rappresentato opera autonomamente, non c’è
dunque alcuna forma di interconnessione fra gli archivi descritti. Abbiamo differenti accessi, ma
un’unica confluenza, nel senso che indipendentemente dalla forma (ortografica o fonologica) in cui
si presenta un input le informazioni confluiranno tutte insieme nell’archivio centrale dove si
depositerà un’unica rappresentazione dell’input. Ogni ingresso attraverso un archivio periferico
associato a un ingresso nell’archivio centrale è organizzato in bin, dei raggruppamenti di parole,
delle aree lessicali basate su relazioni di somiglianza tra le parole o sul loro grado di frequenza.
Pertanto, nel caso in cui si stia leggendo una parola si attiva l’archivio ortografico e il bin di
riferimento nel quale viene cercata fra le parole d’uso più frequente la corrispondenza con la parola
letta, secondo un processo che è stato assimilato a quello dello scorrere le parole di un dizionario
durante la ricerca di un certo lemma. Se la parola viene individuata si accede allora all’archivio
centrale e in tal modo si ottengono tutte le informazioni relative a essa contenute nel lessico
mentale.
Come evidenziato da Baldi, il modello Forster prevede una scomposizione morfemica nel caso in
cui ci si confronti con parole complesse: attraverso questa ricerca della struttura morfemica
primitiva viene isolata la radice di una parola rispetto ai suoi eventuali prefissi e suffissi e si facilita
l’accesso al lessico mentale. La centralità assegnata da questo modello all’analisi morfemica
suggerisce che, nella didattica L2, occorrerebbe insistere sull’acquisizione di una competenza sulla
forma delle parole prestando molta attenzione all’insegnamento degli aspetti morfo-lessicali delle
parole di una lingua.
2.3.3 Il modello di Levelt
Il modello psicolinguistico di Levelt è stato elaborato nel 1989. Levelt era particolarmente
interessato ai processi linguistici orali e voleva spiegare i meccanismi della comprensione delle
parole attraverso l’ascolto. È giunto a concepire un modello complesso e articolato che non si limita
a illustrare i processi di comprensione, bensì anche quelli di produzione.
Si tratta di un modello strutturato secondo un percorso discendente (produzione/riconoscimento) e
uno ascendente (comprensione/ ricostruzione), nei quali sono inclusi:
1. Elementi dichiarativi (cosa conoscere) – quelli rappresentati nelle ellissi – che riguardano la
conoscenza del mondo, la cosiddetta enciclopedia del parlante, e le conoscenze lessicali di
natura fonologica e morfologica nonché di tipo grammaticale e semantico; essi
comprendono anche informazioni sulle tipologie discorsuali, sui contesti comunicativi e sui
loro registri;
2. Elementi procedurali (come conoscere), racchiusi negli spazi rettangolari; si riferiscono ai
diversi livelli di codifica ed elaborazione dell’input.
A livello del concettualizzatore si genera il messaggio preverbale, il quale, passando al
formulatore, viene codificato sul piano grammaticale e su quello fonologico: entrambe queste
codifiche, secondo Levelt, sono su base lessicale, come su base lessicale è l’operazione parallela
corrispondente nel percorso ascendente. Fra i due percorsi è presente una corrispondenza parallela:
entrambi presentano due fasi di elaborazione che includono la fonologia (struttura segmentale di
suoni), la prosodia (stress e intonazione della frase), la struttura lessicale, la sintassi e il “livello del
messaggio” relativo alla struttura del discorso e al sistema concettuale.
Il sistema di articolazione si occupa della produzione di quanto predisposto sul piano fonetico
interno, mentre il sistema di codifica uditivo del percorso ascendente di comprensione del
messaggio, corrispondente al sistema di articolazione del percorso discendente, è deputato
all’analisi delle stringhe fonetiche. Il sistema di comprensione riceve le stringhe fonetiche e assegna
loro un valore semantico e grammaticale grazie a un’elaborazione di tipo lessicale degli elementi
dell’enunciato. Il risultato dell’analisi viene inviato al concettualizzatore attraverso il monitor. Il
modello di Levelt è strutturato in modo sequenziale e in esso la rappresentazione lessicale avviene
simultaneamente all’assegnazione della struttura grammaticale. Nel percorso di produzione vi è la
costruzione sintattica seguita dall’attribuzione fonologica del lemma e dall’assimilazione della
struttura formale del lemma all’interno della struttura enunciativa e prosodica: il percorso
discendente termina nella sequenza di articolazione. Mentre, nel percorso ascendente di
comprensione di un enunciato, la forma lessicale viene assimilata alla struttura frasale, a sua volta
definita coerentemente attraverso le caratteristiche prosodiche. La forma lessicale viene assegnata in
base alle proprietà formali del lemma. Nel modello di Levelt il lessico assume una collocazione
centrale: il processo di codifica ed elaborazione grammaticale e fonologica, sia nel flusso di
produzione che in quello di comprensione, avviene grazie all’attivazione delle conoscenze lessicali
di carattere morfologico, fonologico, grammaticale e semantico.
2.3.4 Il modello neuropsicologico del lessico
Semenza ha presentato un modello cognitivo del lessico più recente rispetto a quelli descritti fino ad
ora. Si tratta di un modello del 1996 nel quale la differenziazione tra un sistema d’entrata e uno
d’uscita lessicale è basata su assunzioni neuropsicologiche frutto di riscontri su pazienti che
presentavano, per esempio, problemi di lettura di parole irregolari, ma non di scrittura sotto
dettatura di quello stesso genere di parole e pazienti che non commettevano errori nel comprendere
e denominare, ma commettevano errori di natura semantica in fase di ripetizione. Questo modello
del lessico pone al centro il sistema concettuale semantico, che corrisponde alla memoria semantica
e al quale si connettono un lessico fonologico d’entrata, prodotto dalla codifica dello stimolo
acustico e un lessico ortografico d’entrata prodotto dalla codifica dello stimolo verbale visivo
nonché un lessico fonologico d’uscita che viene poi articolato e un lessico ortografico d’uscita che
viene elaborato in scrittura. Tutte le componenti di questo modello fanno parte della memoria a
lungo termine.

Nella parte sinistra dello schema è raffigurato il processo di comprensione dell’input uditivo e
quello di produzione dell’output vocale; nella parte destra, troviamo il processo di comprensione
dello stimolo visivo e quello della produzione scritta. Il buffer fonologico è una componente
intermedia che si colloca tra la ricezione dello stimolo acustico e l’elaborazione lessicale in quanto è
un’area di immagazzinamento d’ingresso dei dati che attendono di essere elaborati, proprio come il
buffer ortografico è un’area di immagazzinamento degli stimoli visivi in ingresso. Il buffer
fonologico e quello ortografico d’uscita, invece, sono l’area in cui si attiva la rappresentazione
fonologica del lessico da articolare e quella in cui si attiva la rappresentazione ortografica del
lessico da produrre in forma scritta. Il funzionamento di questo buffer è assimilabile a quello
presente nel meccanismo di funzionamento della memoria a breve termine. Questo modello include
anche una via extraverbale, indispensabile nella processazione di immagini, oggetti, figure. Nella
memoria strutturale canonica vengono raccolte le rappresentazioni visive degli stimoli
configurazionali processati.

2.3.5 La teoria modulare


In merito alla rappresentazione del lessico mentale, nelle scienze cognitive si sono affermate due
linee teoriche: la teoria modulare fondata da Fodor (1983) e il connessionismo formulato da
Hopfield (1982). Sulla base della teoria modulare sono stati creati i cosiddetti modelli computer
style, mentre sulla base del connessionismo sono stati avanzati i modelli brain style. La teoria
modulare prevede che i processi mentali umani si costituiscano in moduli, ovvero in componenti
distinte, e ritiene che ci sia un isomorfismo tra l’organizzazione funzionale della mente e la
struttura neurologica del cervello. In questa prospettiva il lessico mentale si configurerebbe come un
modulo mentale specifico a cui corrispondono precise connessioni neurali.
Negli anni Sessanta Chomsky, contrapponendosi alla teoria comportamentista elabora una teoria
che assume i processi mentali alla base del linguaggio. Argomenta una predisposizione innata
dell’uomo al linguaggio sostenendo che gli uomini siano universalmente dotati di una struttura
psicologica innata che li rende in grado di sviluppare il linguaggio. La struttura innata (LAD:
Language Acquisition Device) è composta da un insieme finito di regole che permette di creare
infinite forme linguistiche. Fodor, nel 1983, estremizzando la posizione innatista di Chomsky,
considera le strutture mentali del sistema cognitivo umano come meccanismi psicologici puri che
svolgono precise funzioni cognitive. Secondo la teoria modulare elaborata da Fodor, la mente
sarebbe strutturata in sistemi di input che processano in modo meccanico, a prescindere dalla
coscienza del soggetto, gli stimoli sensoriali e anche il linguaggio, e in sistemi centrali che ricevono
le rappresentazioni trasmesse dai sistemi di input e ne dispongono per svolgere funzioni cognitive
superiori.
2.3.6 Il connessionismo
Il connessionismo si contrappone al modularismo. Mette in discussione l’idea che ci sia
isomorfismo tra funzione cognitiva e struttura neurale, sostenendo piuttosto che più comparti
neurologici corrispondano a un modulo cognitivo dando vita a una rete a funzionalità distribuita. Il
paradigma connessionista si è affermato con vigore a discapito di quello modulare: ci sono aree che
intervengono in più funzioni cognitive con differenti livelli di attivazione e partecipazione alla
funzione. Più che strutturarsi in moduli e in diversi lessici, la mente si struttura in reti di connessioni
con differenti profili d’attivazione in base alla funzione cognitiva da svolgere.
I moduli evidenziati nei modelli descritti, sia che si attivino in modo sequenziale e lineare sia che si
attivino in parallelo, sono disconnessi tra loro. Invece, secondo il paradigma connessionista, la
struttura cognitiva è caratterizzata da un’interconnessione neurale degli elementi che si attivano e
operano in parallelo secondo diversi gradi di attivazione e partecipazione alla funzione cognitiva. Le
reti neurali connessioniste si modificano in base all’esperienza e all’apprendimento. Esse
processano uno stimolo secondo modelli di funzionamento acquisiti, ma qualora questi modelli si
rivelino inadeguati o insufficienti, le connessioni neurali si aggiustano e si riconfigurano per fornire
risposte
adeguate ai nuovi stimoli e archiviano nella memoria la traccia della nuova esperienza. Per cui le
reti connessioniste riflettono le esperienze e il sapere accumulati da un individuo.
2.4 Modelli del lessico mentale bilingue
Il connessionismo tiene conto della capacità delle reti neurali di rimodellarsi in base alle conoscenze
acquisite e alle esperienze accumulate da ciascun individuo. Ciò suggerisce che quando si apprende
una lingua straniera avvengono degli aggiustamenti delle reti neurali e questi aggiustamenti sono
favoriti dalla frequenza con cui gli apprendenti vengono esposti agli input linguistici e dalle
modalità con cui avviene l’esposizione. Un’esposizione multimodale garantisce un’elaborazione
maggiore e favorisce un’acquisizione profonda del lessico. Come ha sottolineato Pavlenko, diversi
studi hanno dimostrato che tra le categorie linguistiche delle diverse lingue esistono delle differenze
graduali che possono andare da un’equivalenza concettuale a una non equivalenza parziale o
completa. Ciò vuol dire che chi apprende una nuova lingua può avere bisogno di sviluppare
categorie parzialmente differenti o comunque di aggiustare quelle della sua lingua madre. Per cui al
centro dell’apprendimento del lessico di una nuova lingua c’è una ristrutturazione concettuale,
ovvero
«un riaggiustamento della struttura e dei confini delle categorie conformemente ai vincoli delle
categorie linguistiche di destinazione» e uno sviluppo concettuale, ovvero lo sviluppo di nuove
rappresentazioni multimodali che consentono ai parlanti apprendenti di mappare nuove parole sul
mondo reale in modo simile alla mappatura dei parlanti della lingua di destinazione.
La discussione circa i modelli di rappresentazione del lessico mentale bilingue è principalmente
incentrata su due modelli: il Revised Hierachical Model e il Distributed Feature Model. Il primo
modello si basa su due assunti concernenti le connessioni interlinguistiche, ovvero quello secondo
cui la traduzione dalla L1 alla L2 è più veloce del denominare immagini nella L2 e quello in base al
quale la traduzione dalla L2 alla L1 è più veloce di quella dalla L1 alla L2 specie nei principianti,
per i quali l’accesso concettuale avviene attraverso gli equivalenti nella L1. Con lo sviluppo della
competenza in L2 i legami tra le parole di L2 e i concetti si fanno più stretti e gli studenti
cominciano a fare affidamento a collegamenti diretti che prescindono dalla mediazione concettuale
nella L1. Il Revised Hierarchical Model riesce proprio a rappresentare il cambiamento nello
sviluppo del collegamento tra la forma delle parole L1 e L2 e i concetti lessicali.

Questo modello ha il limite di tenere conto solo dell’equivalenza concettuale e non delle differenze
graduali che possono sussistere tra le categorie linguistiche delle diverse lingue. Il Distributed
Feature Model, invece, rappresenta le differenze tra le lingue basandosi sulla rilevazione di una
rapidità maggiore dei bilingui nel tradurre parole concrete e affini rispetto alla traduzione delle
parole astratte. Ciò dimostrerebbe che la rappresentazione delle parole concrete e affini è
maggiormente condivisa dalle diverse lingue rispetto a quella delle parole astratte.
Questo modello, tuttavia, ignora l’apprendimento di equivalenti parziali predicibili ed è sbilanciato
verso una concezione basata su caratteristiche prestabilite delle parole piuttosto che sugli effetti
della loro prototicipità e della loro dipendenza dal contesto: elementi, questi, importanti
nell’apprendimento del lessico in L2. Inoltre, ci sono chiare evidenze che contrastano con
l’assunzione di un’equivalenza interlinguistica tra i concetti delle parole concrete i cui significati
sarebbero condivisi tra le diverse lingue a differenza dei significati delle parole astratte.
Il Modified Hierarchical Model, una versione aggiornata del modello gerarchico, pur mantenendo il
progressivo sviluppo dalla mediazione lessicale a quella concettuale nell’apprendimento L2,
presenta importanti cambiamenti:
1. L’archivio concettuale è costituito da rappresentazioni distinte in rappresentazioni
concettuali completamente condivise, parzialmente sovrapposte o specifiche di una lingua
che vengono riconosciute attraverso l’attivazione di processi che prevedono l’interazione tra
la mente e l’ambiente;
2. Tiene conto del fenomeno del transfer concettuale basato sulla differenziazione tra livelli
semantici riferiti a conoscenze implicite e livelli concettuali di rappresentazione. La
differenziazione tra livelli di rappresentazione semantici e concettuali consente di
distinguere tra le fonti di trasferimento, fonte concettuale o semantica, e di considerare
quale tipo di rappresentazione sia coinvolto in ogni caso di acquisizione di L2;
3. Considera la ristrutturazione concettuale e lo sviluppo delle categorie linguistiche della
lingua target come gli obiettivi principali nell’apprendimento del lessico L2.
Entro la prospettiva di questo modello l’apprendimento del lessico L2 viene visto come un processo graduale che
avviene nella memoria implicita e che conduce alla produzione linguistica spontanea, non mediata da processi
metalinguistici di conoscenza esplicita. I modelli illustrati nelle loro potenzialità e nei loro limiti ci permettono di
ricavare, dal punto di vista glottodidattico, deduzioni utili come la necessità di differenziare le metodologie di
insegnamento del lessico in base ai livelli degli apprendenti e l’esigenza di favorire l’acquisizione implicita degli
input linguistici. Inoltre, essi forniscono parametri importanti per la valutazione degli errori lessicali negli
apprendenti L2.
CAPITOLO V: I corpora
5.1 Cosa sono i corpora
I corpora sono delle raccolte, considerevolmente ampie, di testi o porzioni di testi archiviati in
formato elettronico, alle quali vengono correlati degli strumenti informatici che ne permettono la
consultazione in base a specifiche funzioni di ricerca linguistica. La linguistica dei corpora è il
settore della linguistica computazionale che persegue l’obiettivo di ricavare più informazioni
possibili e di svariata natura da grandi quantità di testi archiviati in un formato leggibile dal
computer. Le informazioni che si possono ricavare usando la ricerca computerizzata, cioè
interrogando i corpora attraverso un’interfaccia, sono potenzialmente utili a molteplici tipologie di
utenti: linguisti, docenti, studenti, politologi, lessicografici, scrittori, ecc.
Cosa distingue i corpora da un semplice archivio di testi? Inizialmente, negli anni Sessanta i corpora
furono progettati e creati per studiare il lessico dal punto di vista quantitativo utilizzando
l’elaborazione automatica dei dati. Lo sviluppo dei software a essi correlati ha reso poi disponibile
un’elaborazione qualitativa, rapida, sempre più articolata e sofisticata, delle porzioni di lingua in cui
sono prodotti i testi archiviati. È ormai diffuso inoltre trovare i corpora annotati, i quali contengono
parole annotate per categoria (nomi, verbi, soggetti, avverbi; attraverso questi è possibile cercare le
parole distinguendo la funzione che esse svolgono nel discorso, dunque, è possibile cercare “fatto”
come sostantivo o come verbo. I corpora annotati includono le parole lemmatizzate, quindi se si
interroga il corpus di riferimento a proposito dell’infinito di un verbo, si ottengono tutte le forme
flesse di quel determinato verbo. Infine, i corpora annotati forniscono una serie di metadata, cioè
informazioni sull’intero corpus (quanti lemmi e quante parole comprendere, la provenienza dei testi,
ecc.) e informazioni specifiche relative a ciascun esito della nostra ricerca, riguardante la parte di
testo in cui occorre la parola che abbiamo cercato (contesto).
Chiaramente, un semplice database di testi, per quanto possa essere vasto non assolve da sé il
compito di fornire informazioni sulla lingua o dati sulla frequenza d’uso delle parole, sulla struttura,
ecc. Questo tipo di analisi è possibile grazie ai software che permettono di effettuare ricerche
linguistiche attraverso i corpora e, pertanto, questi strumenti sono diventati un’area innovativa e
significativa per lo studio del lessico di una lingua.
I corpora, rinviando a chunks lessicali, a unità linguistiche composite (lexical items), e a frasi
lessicali (lexical phrases) si presentano come un valido supporto alla didattica delle lingue, poiché
favoriscono l’acquisizione di patterns linguistici in contesti d’uso appropriati. Permettono di
apprendere l’uso delle parole superando la separazione tra lessico e grammatica, ovvero
oltrepassando la concezione che prevede lo studio dei significati da una parte, e quello delle regole
per l’uso delle parole dall’altra. È necessario, infatti, che gli studenti acquisiscano l’abilità
pragmatica, la competenza metalinguistica e quella metacognitiva necessaria per riconoscere e usare
correttamente e in modo fluente i chunks lessicali. Questi, nel caso della lingua madre, vengono
archiviati nella memoria a lungo termine attraverso l’esposizione inconscia e ripetuta nel tempo
all’uso della lingua e vanno a costruire un corpus interno che costituisce un priming che può
influenzare negativamente l’apprendimento di una lingua straniera, nella misura in cui può
suggerire all’apprendente scelte linguistiche non appropriate nella lingua target.
Per ovviare a questo problema occorre che l’apprendimento del lessico di una lingua straniera
avvenga attraverso l’esposizione intensa e ripetuta all’interazione linguistica e attraverso il ricorso a
materiale testuale autentico, basato su contesti d’uso effettivi delle parole. Da questo punto di vista,
i corpora si candidano come uno strumento utile a:
1. Sviluppare le competenze metalinguistiche necessarie per affrontare le specificità lessicale di
una lingua, in quanto mettono in evidenza come si comportano le parole nell’uso della lingua;
2. Facilitare la memorizzazione del lessico grazie alla presentazione di esso negli aspetti
compositi, fraseologici e idiomatici che lo costituiscono, ovvero secondo le possibili
collocazioni e le co-occorrenze delle parole di una lingua.
I dati che si ricavano dall’analisi dei corpora, sono tuttavia dati da elaborare, dati che possono essere
utilizzati poi nella didattica delle lingue e per risolvere problemi legati all’uso delle parole, ma sono
comunque dati che non bastano da sé per apprendere il lessico di una lingua, sono dati che vanno
contestualizzati nell’interazione orale: essi provengono da materiale linguistico autentico, ma
grezzo, e devono quindi essere adattati dagli insegnanti alle esigenze didattiche specifiche di ogni
contesto d’insegnamento. Gli studenti devono essere in grado di interpretare i risultati che ottengono
dalla ricerca linguistica attraverso i corpora, devono saperli leggere, contestualizzare in base ai
propri obiettivi e quindi, per poter sfruttare i vantaggi che offrono, devono allenarsi all’uso dei
corpora con il supporto degli insegnanti e devono calibrare il ricorso a questo strumento in base alla
competenza linguistica già acquisita, oltre che in funzione agli obiettivi da conseguire.
5.2 Cosa si può fare con i corpora
I corpora forniscono descrizioni dell’uso effettivo di una lingua, rivelando tendenze generali su basi
statistiche. Essi sono un osservatorio attrezzato per fornire un quadro della lingua autenticamente
usata da parlanti reali e per godere dell’illimitata e piena fruibilità di tali contesti. Più un corpus è
vario, più aspetti di quella determinata lingua permette di rilevare. I corpora vengono utilizzati
nell’ambito delle tecnologie linguistiche sia per le traduzioni automatiche che per il riconoscimento
vocale automatico e possono essere proficuamente usati nella didattica delle lingue per ricavare
materiali didattici che permettono lo studio del lessico a partire dai fatti della lingua.
Gli strumenti di consultazione standard permettono di ricercare le parole per sequenze di lettere, a
volte sostituendo per esempio le desinenze con un carattere jolly (o wildcard) in modo da poter
trovare tutte le occorrenze riferite alla radice di una parola primitiva (esempio: se cerco “color*”, i
risultati della ricerca includeranno le occorrenze del sostantivo “colore”, “colorato”, “colorare”,
ecc.). le informazioni che riceviamo in risposta alla ricerca linguistica attraverso i corpora
concernono la frequenza di occorrenza delle parole cercate, le concordanze delle parole con contesti
d’uso trovati nel corpus e le co-occorrenze, ovvero le altre parole che statisticamente, sulla base del
corpus di riferimento, occorrono insieme ad una certa parola ricercata. I corpora sono in grado di
fornire materiale efficace, esempi di lingua vivente, con cui insegnare come si comporta una parola
all’interno di una lingua, quali rapporti interesse con altre parole, che tipo di relazioni semantiche è
in grado di instaurare. È uno strumento da mettere anche direttamente a disposizione degli studenti
di lingua per consentire loro di risolvere dubbi lessicali o sintattici ricorrendo ad una banca dati
dove la lingua si manifesta nelle sue forme d’uso.
Sassi e Ceccotti hanno indagato le occorrenze del verbo statisticamente più ricorrente in lingua
italiana dopo l’ausiliare “essere”, ossia il verbo “fare”, utilizzando più corpora disponibili alla
consultazione presso l’Istituto di Linguistica Computazionale del CNR di Pisa: il Corpus di
Riferimento dell’Italiano basato sugli articoli dei quotidiani italiani di maggiore tiratura, il Corpus
di quaderni di alunni delle scuole elementari di Padova e Pisa degli anni 1983-1985, l’archivio
elettronico delle opere di Gadda, il Corpus dell’Italiano Parlato. Questo è un progetto che ha
previsto l’elaborazione di milioni di parole al fine di costituire una banca dati di corpora utile, per
esempio, per studiare la frequenza d’uso delle parole inglesi, le loro occorrenze e co-occorrenze,
nonché le frasi idiomatiche, ecc. Chiaramente, una lingua è così ricca che anche un database
ambizioso come questo può risultare insufficiente per coglierne la varietà. Per ovviare a queste
carenze e cercare di ricavare una rappresentazione più perspicua possibile di una lingua si tende a
studiare anche i corpus specialistici che si focalizzano su testi di ambito tecnico o di un certo
periodo storico o su registrazioni di lingua parlata.
5.3 Le diverse tipologie di corpora
Per ciascuna lingua sono ormai disponibili raccolte di diverse tipologie testuali, si va da database
testuali di carattere piuttosto generale, e quindi abbastanza ampi, a database più specialistici che
comprendono una quantità di teti più limitata. Una distinzione tra le diverse tipologie di corpora ci
aiuta a comprendere quanto sia opportuno scegliere i corpora su cui lavorare in base alle specifiche
esigenze didattiche o di studio.
5.3.1 Corpus di riferimento di una lingua
Si tratta di un corpus che si propone come campione rappresentativo di una lingua nei suoi diversi
aspetti, e pertanto raccoglie testi di vario genere e tipologie, testi scritti o trascrizioni di lingua
parlata, testi con parole di registro formale e di registro informale, testi letterari e testi giornalistici.
Quanto più varie sono le tipologie testuali incluse nel corpus, tanto più esso sarà in grado di offrirsi
come osservatorio generale di una certa lingua.
Da questo genere di corpora possiamo quindi ricavare dati generali circa il comportamento delle
parole di una lingua. Consultando questi corpora uno studente può misurare la propria competenza,
verificando se possiede la conoscenza delle parole indispensabili nell’interazione quotidiana nella
lingua che sta apprendendo. Questo genere di corpora viene anche usato con la funzione di
referenza nella comparazione con i corpora di tipo specialistico.
5.3.2 Corpora specialistici
I corpora specialistici includono solo testi di un certo tipo. Possono essere i testi di un settore
specifico (linguaggio medico, economico, ecc.). Possono anche raccogliere esclusivamente i testi di
un autore o quelli di un certo periodo storico. Possono essere corpora basati solo sulla lingua
parlata. Data la loro specificità, risultano particolarmente utili per indagare gli aspetti
microlinguistici, gli aspetti linguistici caratterizzanti un lessico di settore, per ricavare il lessico di
base di una lingua di riferimento a un certo campo specialistico, come il lessico inglese
maggiormente utilizzato in ambito giuridico che, per esempio un avvocato italiano che apprende
l’inglese ha bisogno di acquisire se vuole esercitare la professione in paesi anglofoni o, per
esigenze di tipo internazionale legate alla sua professione. I corpora specialistici forniscono
indicazioni specifiche sul lessico di una lingua usata in un certo settore.
5.3.3 Corpora di apprendimento
Si tratta di corpora che raccolgono materiale proveniente da apprendenti o da contesti di
apprendimento linguistico. Essi si distinguono in learner corpora e teacher corpora. I learner
corpora sono costituiti da materiale testuale scritto e/o orale prodotto dagli apprendenti di lingue
seconde o straniera. I corpora di apprendimento si offrono a linguisti, docenti e studenti. I linguisti
possono ricorrere a questo tipo di corpora per studiare la varietà di una lingua e per rilevare le
difficoltà reali incontrate nella produzione degli apprendenti L2 o LS. Attraverso i dati ricavati
dall’analisi corpus-based di queste difficoltà, i linguisti sono in grado di creare un elenco di errori
più frequentemente commessi dagli apprendenti di una certa lingua appresa come lingua straniera.
Questi dati possono essere inclusi in sezioni dedicate dei dizionari o manuali di lingua sottoforma di
sezioni di avvertenza.
I learner corpora sono poi importanti per i docenti in quanto permettono a quelli meno esperti di
formarsi sulle varietà di apprendimento linguistico, mentre a quelli esperti forniscono materiale da
cui attingere informazioni in funzione didattica, ad esempio, per la preparazione di esercitazioni e
test. Infine, i learner corpora sono uno strumento utile anche per gli studenti che possono ricorrere
a essi per osservare gli errori più comuni commessi dagli apprendenti della lingua che stanno
acquisendo, sviluppando così una competenza metalinguistica che permetterà loro di
autocorreggersi e di evitare di incorrere in quel genere di errore di cui hanno preso coscienza.
I teacher corpora, invece contengono testi usati come materiale didattico dagli insegnanti di lingua
straniera, ovvero manuali, letture varie, trascrizioni di testi orali fatti ascoltare agli studenti nel
corso delle lezioni, esercizi somministrati agli studenti. Si tratta quindi di materiale a cui lo studente
è stato esposto che può essere riutilizzato da altri studenti per affinare lo sviluppo della competenza
metalinguistica, oppure può servire agli insegnanti come base per i programmi dei corsi di lingua,
per strutturare altri libri di testo, per creare esercizi per gli studenti
5.3.4 Confronto tra corpora
In funzione delle esigenze didattiche o di studio i diversi corpora possono essere comparati. I
corpora di due o più lingue, per esempio, possono essere messi a confronto se includono la stessa
quantità di materiale testuale strutturata secondo criteri affini. In tal modo si può condurre
un’indagine linguistica oppositiva rilevando differenze nelle collocazioni e nelle co-occorrenze,
divergenze semantiche e sintattiche o, al contrario, effettuare un’analisi linguistica sulle
corrispondenze e convergenze tra le lingue dei corpora comparati. Si possono confrontare i corpora
di diversi apprendenti per studiare le differenze fra l’interlingua sviluppata da ciascun studente in
fase di apprendimento di una lingua straniera oppure per rilevare l’influenza esercitata dalla L1
degli studenti apprendenti sulla scrittura nella L2. Una comparazione tra learner corpora e teacher
corpora riferiti all’apprendimento di una certa lingua può fornire dati utili per misurare
l’adeguatezza del materiale didattico a cui viene esposto lo studente rispetto ai risultati
d’apprendimento osservati nella sua produzione scritta e orale. Ciò può portare a un miglioramento
delle tecniche e dei materiali didattici.
A proposito del confronto tra corpora, si parla di corpora paralleli quando si comparano corpora
allineati e sincronici, cioè dello stesso periodo storico, di lingue diverse. Questo confronto è utile
nelle attività di traduzione poiché permette di osservare le diverse traduzioni di una certa stringa di
parole o di una frase all’interno di contesti effettivi d’uso delle lingue dei corpora allineati. In tal
caso di può infatti disporre di un corpus formato da una serie di testi originali in una determinata
lingua di origine, la cosiddetta source language, e dalle relative traduzioni in un’altra lingua (o altre
lingue) di destinazione, la target language. La comparazione tra corpora può essere effettuata anche
tra corpora diacronici, ovvero tra raccolte di testi appartenenti a diversi periodi storici.
5.4 I corpora della lingua italiana
Il primo corpus di riferimento della lingua italiana è quello su cui è basato il LIF (Lessico di
frequenza della lingua italiana contemporanea) pubblicato nel 1971. Si tratta di un corpus
composto da testi di romanzi, testi teatrali, testi tratti dalle sceneggiature dei film, articoli di giornali
e stralci di sussidiari; esso comprende circa 500000 parole ed è stato utilizzato da De Mauro per
stilare la lista dei lemmi del suo Vocabolario di base della lingua italiana del 1987.
I corpus più rappresentativi della lingua italiana attualmente disponibili online sono il Corpus e
Lessico di Frequenza dell’Italiano scritto (CoLFIS) e il Corpus di Italiano Scritto Contemporaneo
(CORIS). Il CoLFIS è un corpus lemmatizzato e annotato di oltre 3 milioni di parole la cui
composizione si basa sui dati ISTAT sulle tendenze di lettura degli italiani: i testi che contiene
provengono perciò da periodici, quotidiani e libri di diverso genere. Il CORIS, invece, è un corpus
più ampio che include circa 100 milioni di parole ed è un corpus piuttosto variegato costituito per lo
più da testi giornalistici e narrativi, ma anche accademici e giuridico-amministrativi, considerati
rappresentativi dell’italiano contemporaneo. Una versione del CORIS viene periodicamente
aggiornata in modo da monitorare l’evoluzione della lingua: si chiama CODIS, ed è una versione
dinamica e adattiva che permette di selezionare a seconda delle esigenze dell’utente, uno o più
sotto- corpora attraverso i quali eseguire la ricerca. Tuttavia, le interfaccia del CORIS/CODIS e del
CoLFIS non sono molto user-friendly: per quanto entrambi abbiano il vantaggio di essere ricchi di
informazioni e di essere disponibili online gratuitamente, non sono affatto d’uso immediato e senza
limiti; le modalità di interrogazione si presentano in un linguaggio troppo tecnico e prevedono la
selezione di opzioni che non sono facilmente comprensibili. Data la mole e la natura del materiale
testuale che questi raccolgono, ci possono essere, dal punto glottodidattico, circostanze nelle quali
vale la pena familiarizzare con questi strumenti. Nel caso del CoLFIS sono disponibili sul sito
d’accesso al corpus alcuni video tutorial differenziati per funzioni di ricerca, così da aiutare gli
utenti a consultare i corpora.
Il corpus del quotidiano La Repubblica non nasce come corpus di riferimento della lingua italiana,
in quanto raccoglie esclusivamente i testi di Repubblica (dal 1985 al 2000), ma viste le dimensioni
che lo caratterizzano (circa 380 milioni di tokens) ed essendo un corpus annotato, che permette la
ricerca avanzata attraverso metadati, lemmi, parti del discorso, si pone comunque come un
campione rappresentativo della lingua italiana. Inoltre, si presenta con un’interfaccia abbastanza
chiara e intuitiva, e ha quindi il vantaggio di risultare accessibile ad un vasto pubblico. Attualmente
è incluso fra i corpora selezionabili sulla piattaforma ad accesso libero NoSketchEngine; su questa
piattaforma sono disponili anche corpora di tipo accademico che derivano dal web (acWaC), ma
anche corpus generici tratti dal web (WaCky), lo European Parliament Interpreting Corpus e il
Bulletin Corpus in lingua tedesca.
Il corpus della lingua italiana attualmente più ampio è itWAC, il quale, frutto di una raccolta
automatica di testi dal web, a cura di Marco Baroni, include circa un miliardo e mezzo di parole. È
un corpus annotato e consultabile sulla piattaforma Sketch Engine dove sono fornite anche
informazioni dettagliate su di esso.
L’applicazione Sketch Engine offre l’analisi di corpora di numerose lingue oltre a quella italiana e
include corpora di diverso tipo, anche di carattere specialistico. Ad esempio, contiene corpora solo
di lingua parlata come il British Academic Spoken English Corpus. Questo è un software che
permette di ottenere word sketches, ovvero riassunti che mostrano, attraverso esempi d’uso, il
comportamento grammaticale delle parole in termini di collocazioni e combinazioni delle parole
cercate; consente anche di ricavare liste di frequenza e indagare i sinonimi di una parola
visualizzando le differenze d’uso delle parole simili selezionando la funzione Thesaurus.
L’interfaccia è intuitiva e molto semplice da usare. Sketch Engine può essere utilizzato
gratuitamente, in tutte le sue funzioni per un mese. Una volta scaduto il mese di prova gratuito
occorre acquistare la licenza per continuare a consultare i diversi corpora che esso include. Possono,
invece, fruire gratuitamente della piattaforma gli studenti, i ricercatori e i docenti che possiedono
l’account istituzionale di una delle università incluse nella lista delle istituzioni con accesso Elexis-
funded a Sketch Engine.
Sul sito BADIP (Banca Dati dell’Italiano Parlato, 2003-2019) è consultabile liberamente il corpus
su cui si basa il Lessico di Frequenza dell’Italiano Parlato (LIP). Questo corpus fu creato nel 1990-
1992 da un gruppo di linguisti diretto da Tullio De Mauro. Questo è un corpus annotato che
contiene trascrizioni di registrazioni provenienti da quattro diverse città italiane (Milano, Firenze,
Roma e Napoli), include circa 500000 parole ed è uno dei corpus più utilizzati per la ricerca
linguistica. Ha un’interfaccia user-friendly, la ricerca è guidata da una finestra che fornisce
istruzioni semplici e chiare; si possono esportare facilmente i dati ottenuti con l’interrogazione ed è
possibile formulare una ricerca selezionando i testi sia sulla base della provenienza, sia secondo il
genere testuale, mostrando concretamente le peculiarità del registro informale e colloquiale di
parlanti nativi.
Considerando la forte variabilità linguistica che si manifesta soprattutto nel parlato, l’importanza di
disporre di strumenti che permettono l’analisi della dimensione parlata della lingua è stata ormai
acquisita. Alla luce di tale acquisizione i corpora di lingua parlata, come il LIP, consentono di
osservare e apprendere il funzionamento della lingua parlata nelle diverse circostanze d’uso e di
predisporre strumenti per il riconoscimento del parlato e per la produzione di voce sintetica di buona
qualità, con particolare riferimento all’intonazione.
Il corpus italiano parlato CLIPS è caratterizzato da una duplice stratificazione diatopica e diafasica.
La variazione diatopica, ovvero quella su base geografica, è stata campionata attraverso un’indagine
sociolinguistica preliminare che ha interessato l’intero territorio nazionale dall0Università di Lecce,
attraverso dei punti di raccolta dei materiali rappresentativi tanto dal punto di vista della varietà di
italiano, quanto da quello della significatività demografica e socioeconomica della località (località
prescelte: Bari, Bergamo, Bologna, Cagliari, Catanzaro, Firenze, Genova, Lecce, Milano, Napoli,
Palermo, Parma, Perugia, Roma e Venezia). Mentre la variazione diafasica, ossia la variazione di
stile e registro legata al variare delle situazioni comunicative dei parlanti, è stata rappresentata
ricorrendo a diversi tipi di materiale (parlato radiotelevisivo, notiziari, interviste, talk shows,
dialoghi raccolti sul campo, parlato letto, parlato telefonico, ecc.). Questo corpus è diviso in 5
cartelle corrispondenti ai sotto-corpora: radiotelevisivo, dialogico, letto, telefonico, ortofonico e
ciascun sotto-corpus è a sua volta in 15 cartelle corrispondenti alle 15 località in cui è stata eseguita
la raccolta del materiale.
Tra i corpora specialistici in lingua italiana accessibili online abbiamo il Corpus dell’italiano antico
dell’Opera del Vocabolario Italiano, questo è un corpus che raccoglie testi italiani antichi in volgare
e comprende circa 22 milioni di parole. Si può consultare gratuitamente e liberamente, senza
registrazione sul sito.
Tra i corpora specialistici e comparabili c’è la raccolta dei corpora dei bambini che forniscono dati
per osservare lo sviluppo linguistico dei bambini italiani. Il CHILDES Italian Corpus fa parte della
grande raccolta di corpora CHILDES che include appunto corpora di bambini di diverse lingue, per
lo più costituiti da trascrizioni di registrazioni di conversazioni spontanee. Essi sono inclusi nella
piattaforma Sketch Engine e sono quindi consultabili.
Per quanto riguarda i corpora di apprendimento in lingua italiana il portale VALICO.org (Varietà di
apprendimento della lingua italian: corpus online) offre un corpus annotato per parte del discorso e
tipo di testo, ad accesso libero e gratuito, che raccoglie testi di apprendenti di italiano come lingua
seconda e comprende circa 570000 parole. Si tratta di un portale che si propone come uno strumento
per la ricerca linguistica e glottodidattica. L’interrogazione del corpus è in grado di mostrare le
variazioni di scrittura tra apprendenti con età e lingua madre differenti; offrire spunti metodologici e
didattici agli insegnanti sulla base dell’analisi del materiale prodotto dagli studenti; fornire materiale
grezzo da elaborare in funzione di esercizi e verifiche da destinare agli apprendenti di italiano L2 o
LS; rendere visibili dati sui comportamenti delle parole nei contesti d’uso della lingua e
informazioni sugli errori comuni degli apprendenti, utili per sviluppare la competenza
metalinguistica; proporre ai linguisti un osservatorio per lo studio della variazione dell’italiano e
delle problematiche di apprendimento dell’italiano come lingua straniera. VALICO.org contiene
anche un corpus appaiato di testi di italofoni: VINCA. Quest’ultimo era stato inizialmente pensato
come un corpus di controllo per VALICO, ma poi è diventato un vero e proprio supporto per gli
studi sulla didattica e per la didattica applicata.
Sulla piattaforma PAISÀ (Piattaforma per l’Apprendimento dell’Italiano Su corpora Annotati)
troviamo un corpus completamente annotato di testi autentici tratti dal web dal 2010 creato da
Marco Baroni. SI tratta di un corpus abbastanza ampio (circa 250 milioni di tokens), che trascende
le finalità glottodidattiche per cui si dichiara nato. I testi collezionati sono riutilizzabili e possono
essere interrogati attraverso un’interfaccia molto amichevole studiata per agevolare gli apprendenti.
Il CEXIS, invece, è un corpus parallelo che raccoglie testi originali in italiano e inglese, bilingue e
bidirezionale. Contiene traduzioni dall’inglese all’italiano e dall’italiano all’inglese pubblicate tra il
1957 e il 2000. È stato realizzato presso la Scuola per interpreti e traduttori di Forlì e contiene una
collezione di testi di fiction suddivisi in due sub-corpora: fiction per adulti e fiction per bambini;
purtroppo non è ad accesso pubblico.
5.5 Perché usare i corpora nell’insegnamento del lessico di una lingua straniera
Le parole di una lingua non sono egualmente importanti in ogni fase dell’apprendimento di una
lingua straniera. Perciò Nation divide il lessico in quattro livelli: parole d’alta frequenza, lessico
intellettuale, lessico tecnico e parole a bassa frequenza. L’importanza del lessico varia anche a
seconda degli obiettivi specifici dell’apprendimento. Per quanto riguarda la lingua inglese, se
l’insegnante vuole sapere quali sono le parole più usate in inglese e quindi quali parole è necessario
insegnare per prime, può ricavare questi dati consultando il Cambridge International Corpus (CIC),
il British International Corpus (BIC) o la Bank of English Corpus (COBUILD). Se invece
l’insegnante vuole focalizzarsi maggiormente sulla lingua parlata, allora può accedere al
CANCODE (Cambridge and Nottingham Corpus of Discourse English), un corpus di circa cinque
milioni di parole, basato sulle frequenze d’uso dell’inglese parlato. Chiaramente, se invece ci si
vuole focalizzare su un lessico di tipo specialistico, allora si ricorre a corpora specialistici, che sono
raccolte di dimensioni più ristrette che includono parole appartenenti a un certo settore linguistico
tecnico-specialistico. I dati forniti dai corpora possono essere utilissimi, costituiscono materiale
linguistico autentico, ma alla luce delle diverse e specifiche esigenze dei contesti di apprendimento,
essi devono sempre essere elaborati in modo funzionale e critico.
L’accesso al lessico di un determinato settore attraverso i corpora specialistici di riferimento è un
supporto certamente utile nel predisporre adeguatamente i contenuti e i materiali di questi corsi
tenendo conto delle competenze lessicali necessarie per affrontare quello specifico apprendimento.
Se consideriamo i corpora di apprendimento, è interessante evidenziare le possibilità che essi
offrono di studiare gli errori commessi dagli apprendenti di lingua straniera. La riflessione sugli
errori più frequenti degli apprendenti è vantaggiosa sia per l’autoapprendimento degli studenti che
per l’autoformazione degli insegnanti e permette a questi ultimi di costruire dei test basati su
problemi reali e specifici degli apprendenti di una certa lingua madre.
Come già visto, uno dei dati principali che possiamo ricavare dall’analisi dei corpora è la frequenza
d’uso di un certo lemma nei vari contesti linguistici. Nell’insegnamento di una lingua straniera
disporre di dati statistici circa la frequenza d’uso delle parole permette di dedurre informazioni
importanti circa quali parole è necessario che siano insegnate prima in modo da far acquisire un
lessico di base agli apprendenti. Dato che i dati sulla frequenza d’uso delle parole ricavati dai
corpora non saranno solo di tipo quantitativo ma anche di tipo qualitativo, acquisiremo informazioni
quali, ad esempio, il grado di polisemia di queste parole ad alta frequenza d’uso. Tali informazioni
potranno essere sottoposte dall’insegnante all’analisi degli studenti in modo da sviluppare in loro la
competenza metalinguistica necessaria ad usare le parole in modo appropriato nei diversi contesti.
Sulla base dei dati sulla frequenza d’uso delle parole raccolti attraverso i corpora, un insegnante di
lingua straniera può inoltre predisporre il materiale didattico in modo adeguato al livello di
competenza linguistica degli apprendenti, controllando la densità lessicale dei testi da usare in
classe. Per cui, a seconda degli obiettivi didattici, si sceglierà la tipologia di testo più appropriata.
Ad esempio, una lista di frequenza dei verbi italiani permette di assumere che il verbo “fare” è il
verbo statisticamente più frequente nella lingua italiana dopo l’ausiliare “essere”. Una volta assunto
che il verbo “fare” è il verbo più frequentemente usato dopo il verbo “essere”, dalla ricerca
attraverso i corpora possiamo ricevere altre informazioni importanti concernenti aspetti qualitativi.
Nello studio di Sassi e Ceccotti, il verbo “fare” è stato analizzato attraverso corpora di tipo
giornalistico, pedagogico e letterario. I dati emersi permettono di osservare una serie di co-
occorrenze in cui “fare” assume di volta in volta significati diversi che vanno dal generico “fare” nel
significato di compiere una qualsiasi azione, differenziata poi dal complemento oggetto con cui il
verbo co-occorre (“fare ginnastica”, “fare chiarezza”, “fare shopping”, “fare i conti”), al più
specifico significato di “costruire” o “fabbricare”, passando per significati idiomatici come “far
quadrare”, “fare miracoli”, “non fare una piega”.
Quindi tra le altre informazioni importanti dal punto di vista glottodidattico che posiamo ottenere
con la ricerca attraverso i corpora, vi sono quelle sulle collocazioni e sulle concordanze. Le
collocazioni sono un fenomeno diffuso nella lingua e difficile da inquadrare e trasmettere agli
studenti attraverso una regola precisa, soprattutto perché sono spesso di natura paradigmatica e
dipendono dall’uso. Esse possono assumere forme diverse, ad esempio, se pensiamo a “carta
d’imbarco” abbiamo [sostantivo
+ sostantivo], mentre “vicolo cieco” [sostantivo + aggettivo], o “persona a modo” [sostantivo +
preposizione + sostantivo], o infine “essere in tempo” [verbo + preposizione + sostantivo]. I corpora
permettono di visualizzare le collocazioni e di memorizzarle nei diversi contesti d’uso in cui
occorrono, e anche di prendere coscienza della loro frequenza. Le liste di concordanza permettono
di ricavare molti esempi e regolarità d’uso della parola, della stringa di parole o frase ricercate.
Consentono inoltre, di osservare la tendenza degli elementi lessicali a legarsi in strutture tipiche che
possono essere, per esempio, frasi idiomatiche, il cui senso è difficile da spiegare attraverso una
regola. L’occorrenza delle parole in specifiche sequenze ha orientato i linguisti a descrivere la
lingua in termini fraseologici per cui noi cogliamo il senso di alcune espressioni solo in quanto
queste sono parte di una frase. Basti pensare alla difficoltà di cogliere il senso di espressioni
polirematiche come “tagliare corto” o “vuotare il sacco”, o ancora “alzare il gomito”. La lingua,
come evidenzia Sinclair, si configura come un insieme di espressioni lessicalizzate, e non come una
somma di unità lessicali separate da unità grammaticali, e il significato risiete nell’interezza di una
frase.
5.6 Come usare i corpora nell’educazione linguistica
Nonostante i corpora siano ormai studiati e apprezzati come metodologia didattica da alcuni
decenni, non vengono ancora usati in modo diffuso nell’insegnamento delle lingue. Il motivo
principale per cui né studenti né insegnanti non ricorrono ad essi, è il pregiudizio che l’uso dei
corpora richieda complesse conoscenze tecniche, poiché si tratta di strumenti creati dalla linguistica
computazionale.
Per ovviare tale problema, Zanca ha suggerito che sarebbe effettivamente utile introdurre i corpora
utilizzandoli per risolvere problemi linguistici concreti, mostrandone così le potenzialità, a tal fine,
Zanca ha proposto prima di tutto di far familiarizzare gli studenti con i corpora attraverso strumenti
più conosciuti come dizionari online (Reverso Context) e motori di ricerca, per poi passare ai
software e quindi ad una dimensione più tecnica di impego dei corpora. Il passaggio ai software che
permettono l’accesso a corpora composti da materiale autentico e annotato è un’occasione
importante per avvertire gli studenti del rischio insito nell’assunzione del web come corpus: il
materiale con cui si entra in contatto sul web presenta spesso errori grammaticali e ortografici che
un apprendente, specie ai primi livelli di apprendimento linguistico, non è in grado di riconoscere.
Egli rischia così di acquisire forme linguistiche sbagliate.
Gli studi sull’uso dei corpora come metodologia didattica sono soliti distinguere tra un uso diretto e
indiretto dei corpora. Si parla di uso indiretto quando insegnanti e studiosi ricavano dai corpora
materiali quali testi ed esercitazioni da utilizzare in classe (costruzione dei test a scelta multipla
attraverso i testi VALICO), e dati sulla base dei quali elaborare dizionari, sussidi didattici, studi
teorici e metodologici. Quando sono invece gli studenti a ricorrere ai corpora si parla di uso diretto:
si tratta di un uso aperto, non prestabilito, personalizzabile di ciascun studente secondo esigenze
d’apprendimento personali e contingenti. L’uso diretto dei corpora da parte degli apprendenti
implica però che venga insegnato agli studenti come usare i corpora e che vengano insegnati loro
aspetti tecnici in modo che essi siano in grado di esplorare correttamente le risorse. È inoltre
necessario che gli studenti abbiano già sviluppato una competenza linguistica di livello medio per
essere in grado di interpretare correttamente i dati ottenuti dalla ricerca e di riutilizzare quanto
ricavato in modo appropriato. I corpora, tuttavia, possono anche essere usati in classe dagli
insegnanti per estrarre modelli di lingua a partire da liste di concordanze o liste di frequenze, in
modo da osservare e confermare regole oppure per inferire delle regole, per fare ipotesi sui
comportamenti delle parole, e per trarre conclusioni dai fatti di lingua. Il docente si pone così nel
suolo di facilitatore di apprendimento, piuttosto che in quello di detentore indiscusso di conoscenza
e le lezioni di lingua assumono una forma laboratoriale che rende meno ansiogeno e più motivante
l’apprendimento.
5.6.1 Esempi di ricerca attraverso i corpora a scopo didattico
I vantaggi e le potenzialità dell’uso dei corpora per l’apprendimento del lessico non sono
trascurabili. Occorre tuttavia tenere presente che il materiale ricavato con l’interrogazione dei
corpora se proviene dal web può presentare errori che certamente non giovano agli studenti. Se si
tratta di materiale di provenienza più controllata, per poter svolgere funzioni efficaci
nell’apprendimento della lingua, esso deve essere elaborato dagli insegnanti ed interpretato dagli
studenti attraverso la guida del docente. Egli deve cercare di allenare gli studenti all’uso dei corpora
in modo che possano nel tempo ricorrere a essi in modo autonomo, consapevoli delle potenzialità di
questi strumenti, ma anche dei loro limiti. I corpora, insomma, non bastano da sé per apprendere il
lessico di una lingua, ma si prestano certamente a un approccio didattico di tipo comunicativo e
offrono una metodologia didattica in grado di favorire l’apprendimento del lessico direttamente nei
contesti socio-pragmatici in cui esso compare, crea, si ricrea e muta.
CAPITOLO VI: Idioms e metafore nella linguistica cognitiva
6.1. Gli idioms e la competenza lessicale
A partire dagli anni Ottanta, la riflessione linguistica supera la dicotomia tra lessico e grammatica e
gli idioms e le metafore diventano oggetto di ricerca in ambito glottodidattico grazie alle nuove
teorie nell’ambito della linguistica cognitiva. Tuttavia, spesso, ancora oggi le espressioni
idiomatiche vengono considerate come qualcosa da affrontare solo ai livelli più avanzati del
percorso di apprendimento piuttosto che come aspetto importante del lessico. Ciò dipende da due
fattori interdipendenti:
- Lo scarso interesse rivolto al lessico nella didattica delle lingue
- L’interesse degli studiosi orientatosi prevalentemente verso la sintassi a causa dell’imporsi della
linguistica chomskiana
Eppure, numerosi studi degli ultimi decenni in ambito psicolinguistico confermano l’enorme grado
di pervasività del linguaggio figurato nella comunicazione quotidiana e non soltanto in ambiti
specifici.
Alcuni dati ★
 Pollio (1977) in un minuto di conversazione si producono mediamente cinque/sei
espressioni figurate
 Hoffmann (1984) in una settimana si usano circa 7.000 forme idiomatiche
 Graesser (1989) presenza di una metafora ogni venticinque parole nei dibattiti televisivi
Nelle interazioni tra parlanti della stessa comunità linguistica, il ricorso frequente a metafore o
idioms non costituisce un problema, in quanto i soggetti coinvolti nell’interazione condividono gli
elementi morfosintattici della lingua, ma anche gli aspetti culturali pragmatici e sociolinguistici su
cui si fonda gran parte della competenza lessicale. Diversamente, quando ci si trova ad interagire in
lingue altre dalla propria lingua madre, l’abilità di comprendere e produrre enunciati di carattere
figurato rappresenta una sfida difficile.
6.2. Una definizione di idiom
Diverse scuole di pensiero presentano una visione più o meno restrittiva del concetto di idiom:
Definizioni ampie e generali
1. Sono espressioni il cui significato non dipende dalla somma dei significati dei loro
componenti. Un’espressione idiomatica si connota come un’unità lessicale e come tale viene
riconosciuta, recuperata e memorizzata nel lessico mentale di un individuo (Cacciari)
2. Tutte le espressioni fisse e cristallizzate di una lingua (locuzioni, clichés, proverbi, unità
polisemiche, espressioni formulaiche, metafore morte e collocazioni vengono
automaticamente inclusi all’interno della definizione)
Definizioni più restrittive
3. Solo un tipo di espressione fissa semanticamente opaca per Weinrich (1969) non tutte
le locuzioni possono essere definite idioms. Egli distingue tra forma idiomatica
[idiomaticity of expression] e collocazione [stability of collocation]. Entrambe
contengono al loro interno delle co-occorrenze, ma l’elemento che le differenzia risiede
nel rapporto di opacità che si instaura tra i componenti dell’unità fraseologica: “A
phraseological unit involving at least two polysemous constituents, and in which there is a
reciprocal contextual selection of subsenses will be called an idiom”.
Definizione funzionale a scopi glottodidattici
4. Una locuzione polilessicale il cui significato non deriva dalla somma dei significati dei suoi
componenti e la cui struttura possiede un certo grado di flessibilità o cristallizzazione
6.3. La comprensione delle forme idiomatiche in L1
È necessario partire dalla definizione di figurative competence di Levorato, ovvero:
L ’abilità di comprensione e produzione di metafore e forme idiomatiche; l'uso figurato e traslato
del linguaggio supportato dallo sviluppo di una consapevolezza metalinguistica, che consente di
comprendere quale sia la vera intenzione comunicativa dell’interlocutore
Secondo Levorato, la competenza per il linguaggio figurato è il frutto di una serie di abilità
linguistiche gradualmente acquisite ed è un processo che ha inizio verso i 4-5 anni e che si sviluppa
successivamente attraverso un percorso articolato in cinque livelli:
 Livello 0 l’oggetto e la parola che lo definisce costituiscono un’entità unica
 Fase 1 (4-5 anni) Sviluppo della funzione simbolica del linguaggio, dove le strategie
di comprensione dell'enunciato sono ancora limitate all'analisi letterale
 Fase 2 (7-8 anni) il bambino abbandona la suspended literalness (l'analisi
strettamente referenziale e letterale del testo) e sviluppa un’abilità di comprensione a
livello semantico
 Fase 3 (9-10 anni) il linguaggio figurato diviene un’opzione:
scoperta/consapevolezza di una frase possa avere o non avere necessariamente un
significato letterale
 Fase 4 forme idiomatiche come unità lessicali: il bambino è in grado di riconoscere ed
utilizzare espressioni idiomatiche con un certo grado di familiarità senza però riflettere
sulle singole parti che le compongono
 Fase 5 raggiungimento della consapevolezza metalinguistica (analisi dell’espressione
idiomatica per sé stessa + analisi delle indicazioni contestuali)
I livelli descritti non devono però intendersi in modo rigido, poiché possono esistere variabili
soggettive di tipo cognitivo e/o variabili riconducibili agli aspetti morfosintattici degli idioms in
oggetto. I bambini sembrano tuttavia comprendere più facilmente espressioni idiomatiche che si
riferiscono ad azioni concrete piuttosto che a stati d'animo o ad emozioni, e tra queste ultime, è più
facile l'acquisizione di espressioni che si riferiscono a emozioni primarie (rabbia, gioia, disgusto,
paura) che a emozioni legate a stati d’animo complessi (vergogna, tristezza ecc). Sotto il profilo
glottodidattico, le modalità di apprendimento delle espressioni idiomatiche nella lingua madre
suggeriscono alcune riflessioni:
 Nell'ambito dell'insegnamento delle lingue straniere a bambini, è opportuno evitare di
presentare forme idiomatiche in età in cui non si è ancora consolidata la competenza
metalinguistica
 Sarebbe opportuno far diventare tali espressioni patrimonio del lessico produttivo e non solo
ricettivo, ad esempio presentando tali espressioni in contesti significativi
6.4. Livelli di idiomaticità

 Le espressioni idiomatiche (alto grado di idiomaticità) A diverse tipologie di unità


lessicali più o meno fisse corrisponde un diverso grado di idiomaticità. Espressioni come
essere al verde o essere in gamba non significherebbero nulla al di fuori della comunità
linguistica italiana.
 Le collocazioni Anche le collocazioni sono caratterizzate da un certo grado di
idiomaticità, ma le restrizioni lessicali presenti in esse non sono poi così strette e consentono
un certo grado di sostituzione: Patire la fame soffrire la fame; è possibile sostituire il
verbo senza alterare il significato della frase. Diversamente dalle espressioni idiomatiche,
inoltre, i termini che costituiscono una collocazione mantengono lo stesso significato
anche quando essi vengono assunti al di fuori dalla collocazione stessa.
 Istitutionalised utterances e sentence frames [or heads] Si tratta in sostanza di: «all
those chunks of language that are recalled as wholes and of which much conversation is
made» (v. capitolo sui chunks lessicali). A queste si potrebbero aggiungere tutte le
routine linguistiche corrispondenti alle espressioni sociali che esprimono
ringraziamento, scuse, rifiuto, accettazione, consiglio, ecc.
6.5. Aspetti psicolinguistici delle espressioni idiomatiche
 Cristallizzazione e flessibilità
Esistono espressioni idiomatiche assolutamente congelate, che non accettano alcun tipo di
modificazione al loro interno, ed altre più elastiche che in diverso grado consentono alcune
variazioni:
Esempi:
Francesca si è tolta un grande peso dallo stomaco oppure Francesca si è tolta un peso dallo stomaco  a
volte è possibile l'inserimento all'interno della frase di avverbi o aggettivi
Tirare la pesante carretta l’eliminazione dell’aggettivo in questo caso priverebbe la frase
della
sua idiomaticità
Fare quattro passi / Fare due passi  sono possibili entrambe le varianti ma non è accettabile sostituire
due e quattro con altri numeri
Fraser, analizzando le possibili modificazioni sintattiche delle espressioni idiomatiche, propone una
suddivisione in sei livelli, da un grado zero ad un livello dove non sono presenti restrizioni:
1. Completely frozen
2. Adjunction
3. Insertion
4. Permutation
5. Extraction
6. Reconstitution
7. Unrestricted

 Opacità e trasparenza
Le espressioni letterali sono semanticamente trasparenti, mentre le espressioni idiomatiche sono
caratterizzate da diversi gradi di opacità semantica (ciò che determina il grado di idiomaticità):
Espressioni parzialmente opache
- Binomi irreversibili presto detto, sotto sopra, ecc.
- Locuzioni complesse suo malgrado
Espressioni totalmente opache
Essere al verde, essere in gamba
Il grado di opacità o trasparenza, unito a quello di cristallizzazione o flessibilità, dà luogo ad un
continuum in cui si dispongono le varie espressioni. Le espressioni con il maggior grado di opacità
sono anche le meno modificabili. Secondo Cutler, inoltre, la flessibilità sintattica tende a
scomparire con il tempo, rendendo l'espressione idiomatica sempre più cristallizzata.
6.6. La rappresentazione mentale delle espressioni idiomatiche
Il modo in cui le espressioni idiomatiche vengono rappresentate nella mente è strettamente correlato
al modo di comprenderle e codificarle sulla base delle informazioni contestuali che le
accompagnano. La psicolinguistica ha elaborato diverse ipotesi di rappresentazione delle forme
idiomatiche, tra cui le 4 più importanti sono:
- La lista idiomatica
- La codifica simultanea
- L’accesso diretto
- La configurazione
La lista idiomatica
Secondo la teoria di Bobrow e Bell (1973), le espressioni idiomatiche sono processate come unità
lessicali [singoli item] depositati nel lessico mentale in modo indipendente, in una lista di
espressioni separate dal resto del lessico. In base a questa teoria, dal momento che molte parole
avrebbero una “doppia entrata” sia nel lessico normale che nella lista, l'elaborazione del significato
delle espressioni idiomatiche richiederebbe più tempo di quelle letterali. L'ipotesi della lista
idiomatica è stata in seguito messa in discussione, ma ha costituito un modello di base per le
successive ricerche.
La codifica simultanea
L'ipotesi della codifica simultanea o rappresentazione lessicale di Swinney e Cutler (1979) propone
una processazione parallela dell'analisi letterale e idiomatica. Contrariamente all'ipotesi della lista
idiomatica, la codifica delle espressioni idiomatiche non richiederebbe maggior tempo di quelle
letterali, in quanto avrebbe luogo una elaborazione parallela. La disambiguazione avverrebbe
esclusivamente in base al contesto.
L’accesso diretto
Secondo Gibbs (1980), il significato idiomatico non soltanto è codificato più rapidamente di quello
letterale, ma si imporrebbe anche sull’altro sin da subito. Questo modello rappresenta in sostanza il
rovesciamento dell'ipotesi della lista idiomatica.
La configurazione (ipotesi maggiormente tenuta in considerazione)
Secondo questo modello di Cacciari, Tabossi e Glucksberg, le forme idiomatiche vengono
codificate con le stesse modalità di elaborazione linguistica delle altre configurazioni di parole, pur
possedendo un loro elemento centrale, chiamato idiomatic key, costituito da un tratto semantico
particolare o anche da alcune specificità grammaticali. Esse vengono inizialmente analizzate
attraverso un processo di analisi letterale, ma quando compare l'elemento caratterizzante, la
idiomatic key, emerge la configurazione completa e si attiva il significato idiomatico, che si impone
su quello letterale. Il tempo di elaborazione della frase idiomatica rispetto a quella letterale varia
quindi esclusivamente in base alla collocazione della idiomatic key all'interno della frase:
Gianni dice di essere al verde  idiomatic key = verde, fine della frase
Pietro ha preso baracca e burattini e se n'è andato  idiomatic key = assenza degli articoli
determinativi “la” e “i” (se fosse stato la baracca e i burattini, l’articolo avrebbe cancellato la
valenza idiomatica)
Nella lingua madre, la conoscenza del contesto e la familiarità con le forme idiomatiche possono
consentire una loro rapida e corretta interpretazione, mentre in una lingua straniera i tempi si
allungano.
6.7. Tipologie di forme idiomatiche
Glucksberg (1993) individua due diverse categorie di forme idiomatiche:
- Quelle appartenenti al modello del direct look-up espressioni il cui significato è stabilito
arbitrariamente: attaccare bottone, essere in gamba ecc assunte nella memoria semantica come
singole unità lessicale e come tali recuperate
- Quelle appartenenti al modello composizionale [compositional model] traggono origine
dafatti storicamente accaduti, in seguito divenuti esemplari di determinate situazioni es: una
vittoria di Pirro o venire a Canossa; queste espressioni non differiscono nelle caratteristiche
composizionali, morfosintattiche e pragmatiche da quelle non idiomatiche
Le due tipologie comportano difficoltà di natura diversa dal punto di vista glottodidattico:
1. Nel caso di espressioni come essere in gamba, è impossibile per l’alunno desumere il significato
dalla somma dei significati delle singole parole che la compongono, quindi l’unica possibilità è che
l’allievo abbia avuto modo di memorizzarne il significato
2. Nel secondo caso, espressioni come una vittoria di Pirro o venire a Canossa possono essere
chiare da un punto di vista composizionale, ma rimanere opache in mancanza della conoscenza del
loro significato etimologico e di conseguenza del loro uso pragmatico
3. Espressioni idiomatiche come prendere la porta o rompere il ghiaccio possiedono un significato
traslato desumibile solo in base al contesto e un significato letterale altrettanto accettabile; tuttavia,
mentre nell'uso letterale di tali espressioni è possibile sostituire alcune delle parole con sinonimi
(sollevare/spostare la porta, frantumare il ghiaccio), nell'uso idiomatico non sono consentiti
cambiamenti nella composizione della frase
Un altro tipo di classificazione delle espressioni idiomatiche è stato proposto da Moon (1996) che
descrive sei categorie sulla base del contenuto semantico:
- Azioni parlare a vanvera, prendere la porta, levare le tende
- avvenimenti crollo in borsa, euforia delle borse, lancio sul mercato, un tempo da
lupi,una pioggia battente
- situazioni essere nei pasticci/in cattive acque, non avere lacrime per piangere
- persone essere un casanova, un saltimbanco, un voltagabbana, un pagliaccio
- paragoni essere brutto come un debito, essere bianco come un cencio, essere curioso
comeuna scimmia
- emozioni verde dalla rabbia, vedere i sorci verdi, rosso dalla vergogna ecc
6.8. Strategie per l’apprendimento delle liste idiomatiche
Le espressioni idiomatiche hanno raramente traduzioni corrispondenti nelle varie lingue e spesso il
significato è reso da locuzioni molto diverse che non hanno nulla in comune con i loro significati
letterali:
- Mi prendi in giroyou are pulling my leg [Lett: “mi stai tirando la gamba”]
- Mi ha attaccato un bottone il m’a tenu une jambe [molto simile nella forma letterale
all’inglese,
ma con un significato idiomatico completamente diverso]
L'insegnamento delle espressioni idiomatiche deve avvenire tenendo presenti le caratteristiche delle
varie tipologie di idioms, la loro frequenza ed il loro uso pragmatico nella comunità linguistica di
riferimento. Uno dei motivi per cui la glottodidattica ha scarsamente riflettuto sulla natura,
l'apprendimento e la metodologia d'insegnamento degli idioms è certamente legato al fatto che le
espressioni idiomatiche trascendono la struttura logica del linguaggio, che è sempre stata il centro
d'interesse degli approcci tradizionali, basati sull'acquisizione della competenza linguistica anziché
di quella comunicativa. Johnson-Laird afferma che "Idioms are the poetry of daily discourse" e
anche per questa ragione la competenza lessicale non può prescindere dagli aspetti idiomatici.
Durante le attività in classe, gli idioms vengono presentati di solito solo attraverso la tecnica di
matching tra la forma idiomatica e la possibile definizione accanto. Altre volte, i testi didattici
presentano direttamente una lista di idioms da memorizzare. Queste attività, utili in contesto
scolastico, finiscono tuttavia per scoraggiare l’utilizzo attivo di tali espressioni (es: lo studente non
conosce la probabile reazione del suo interlocutore di fronte all’utilizzo di una forma idiomatica in
un contesto reale) e stimolano solo la ricezione passiva dell’alunno.
6.9. Criteri di scelta delle forme idiomatiche
I criteri di scelta delle forme idiomatiche da insegnare e utilizzare in classe, dal momento che alcune
espressioni sono meno utili di altre, possono basarsi sui seguenti aspetti:
- Frequenza d'uso In italiano, ad esempio, menare il can per l'aia o saltare/far saltare la
mosca al naso sono meno frequenti di essere in gamba, avere l'acqua alla gola, ecc; in questo
caso sarà sufficiente una scelta soggettiva dell’insegnante
- Difficoltà del vocabolario interno è importante considerare se la frase idiomatica possiede
al suo interno vocaboli di bassa o rara frequenza; menare il can per l’aia (contiene il verbo
menare di bassa frequenza); al contrario, cadere dalle nuvole presenta lessico di alta frequenza
- Grado di trasparenza alcune espressioni sono semanticamente trasparenti, mentre altre
possono essere capite solo se se ne conosce il significato figurato; essere in gamba o prendere in
giro non sono trasparenti, mentre aprire le orecchie sì
- Similarità nella lingua madre a volte questo può creare confusione, quindi è utile predisporre
una griglia di corrispondenze in cui inserire alcune osservazioni ★

È necessario individuare delle strategie sulla base delle quale gli studenti ricorrono con maggiore o
minore frequenza alle espressioni idiomatiche:
Sulla base di alcuni esperimenti, l'inferenza del significato dal contesto sembra essere la strategia
favorita dagli studenti (28%), seguita dall'analisi dell'espressione idiomatica e del contesto in cui
compare (24%). Infine, un 19% degli studenti cerca di inferire il significato figurato dal significato
letterale. Solo l’8% ricorre invece alla richiesta di informazioni per facilitare la comprensione. La
ripetizione e la parafrasi vengono impiegate entrambe con un'incidenza del 7%.
6.10. La metafora: premesse storiche & 6.11 la competenza metaforica
La riflessione sulla natura e la funzione delle metafore è stata oggetto di un interesse
interdisciplinare forse unico nella storia della scienza. Nel corso dei secoli, filosofi, poeti, letterati e
linguisti hanno scritto su di essa, ora apprezzandola, ora denigrandola, dandone di volta in volta
diverse interpretazioni e attribuendovi diverso valore.
 Aristotele Fu il primo a parlare della metafora come sostituzione di un nome con un altro;
egli la presentò come uno degli strumenti attraverso cui si realizza la conoscenza. La
metafora, per via della sua concisione (diversamente dalla similitudine che necessita del
“come”), favorisce un apprendimento rapido, facile e piacevole; è una forma di paragone
basato su un rapporto metonimico, per il quale ad una cosa si attribuisce il nome che
appartiene a qualcos’altro. La concezione aristotelica rimane ancora oggi un punto di
partenza per molti trattati sulla metafora. Il trasferimento di significato può avvenire da
specie a specie, da genere a specie o viceversa, per analogia, similitudine o sineddoche.
 Quintiliano Metafora come processo di sostituzione di un significato letterale; nel
mondo classico quindi la metafora era del tutto priva di un valore cognitivo ed aveva
soprattutto una funzione retorico-stilistica di pertinenza di poeti e oratori.
 RicoeurMetafora come principio vitale del linguaggio; a differenza
di Aristotele, eglinon intende la metafora come semplice sostituzione, ma è l’instaurarsi di
una tensione tra due interpretazioni di un enunciato. È un’innovazione semantica che ha a
che fare con la costitutiva creatività del linguaggio. Non riguarda una singola parola, ma
l’intera frase e la tensione che si viene a creare è una tensione tra interpretazioni
contraddittorie. L’interpretazione metaforica presuppone un’interpretazione che si
autodistrugge. L’operazione metaforica consiste nel trasformare una contraddizione che si
autodistrugge in una contraddizione piena di significato.
 Richards (1936) Richards ha il merito di aver denominato le parti che costituiscono
l’espressione metaforica; Il significato di una metafora è il risultato dell'interazione tra due
elementi chiamati topic [tenore] e vehicle [veicolo], in cui le proprietà di uno si estendono
sull’altro. Affinché un’espressione funzioni e sia comprensibile, è ovviamente necessario
conoscere all’interno di una cultura i significati simbolici attribuiti ad una determinata
parola. Es: per comprendere l’espressione quel dentista è un cane, è necessario sapere quali
significati simbolici dell’animale possono essere attribuiti ad un essere umano. Teoria del
“commercio di pensieri” = la metafora non è più intesa come fenomeno strettamente
linguistico, ma come una specificità del pensiero umano.

Quando adoperiamo una metafora abbiamo due pensieri di cose differenti contemporaneamente attivi
e sorretti da una singola parola o frase, il cui significato risulta dalla loro interazione

La relazione tra tenore e veicolo, definito ground, contiene, inoltre, l’elemento di tensione
(tension) che si produce nella metafora in conseguenza alla relazione che si stabilisce tra i
domini concettuali assunti nel loro significato letterale.
 Coseriu (1956) Anche lui ha argomentato a favore della metaforizzazione come
principio di formazione del linguaggio: ha evidenziato come l’attività poetica dell’uomo sia
costitutiva del linguaggio in generale e non solo di quello letterario.
 Black (1983) Metafora definita come strumento cognitivo; da elemento stilistico la
metafora diviene un aspetto del pensiero, presenza costante nel linguaggio quotidiano.
Essa diviene elemento costitutivo del processo di organizzazione concettuale del mondo.
Riprende in qualche modo i concetti di Richards ed è il padre della teoria interattiva: la
metafora è il frutto di una tensione tra due elementi chiamati focus e frame [cornice]
l’elemento focale della metafora si inserisce all'interno di un determinato contesto,
che assume dunque un’importanza rilevante.

Quando utilizziamo una metafora, la cornice e il focus metaforico interagiscono tra loro, così da comportare
un'estensione del significato del secondo; il lettore/ascoltatore è portato a trovare connessioni tra le due idee
rappresentate da cornice e focus. […] Come opera questa connessione? Facendo riferimento all'asserzione
metaforica «L'uomo è un lupo», Black identifica due soggetti, il soggetto principale (l'uomo) e il soggetto
secondario (il lupo), che trascinano con sé una sistema di luoghi comuni associati (non importa se giusti o
sbagliati) cui il lettore/ascoltatore fa riferimento. Es: cos’è un lupo? È un animale che vive in branco, caccia gli
altri animali, è carnivoro, ecc. Questo sistema di luoghi comuni è legato al concetto di cultura, poiché tutte le
scelte che facciamo sono scelte culturali.

Black preferisce basare, infatti, la sua analisi su esempi di metafora semplici, tratti dal
linguaggio quotidiano, in cui non compaiano le difficoltà specifiche delle metafore poetiche
e letterarie. Egli apre alla metafora come espressione di luoghi comuni: ogni volta che
facciamo esperienza di qualcosa, nascono nuovi luoghi comuni associati e quindi anche
nuove metafore. Uno degli elementi chiave della sua teoria è la concezione interattiva,
poiché è l’interazione che ha la funzione di creare la similarità, piuttosto che rappresentarne
di già esistenti.
 Eco (1984) Teoria della “semantica a enciclopedia”: «si ha metafora quando sulla base di
una identità di metonimie (due proprietà uguali in due sememi diversi) si sostituisce un
semema per l’altro»; la riuscita della metafora dipende dal formato socioculturale
dell’enciclopedia dei parlanti che la interpretano. La metafora ci consente quindi di
conoscere meglio il codice (l’enciclopedia) dei parlanti di una certa comunità favorendo
anche il dialogo interculturale. Secondo Eco, (a) per sua natura il linguaggio è metaforico e
(b) la lingua è un meccanismo retto da regole, una macchina, pertanto la metafora è “il
guasto al motore”.
 Manetti (2005) la concezione contemporanea giunge a inquadrare la metafora come «un
fenomeno essenzialmente cognitivo» in grado di produrre «una diversa categorizzazione del
mondo». La metafora viene piuttosto oggi intesa come un fatto di pensiero e azione in grado
di creare similarità. Essa non è dunque diffusa solo nel linguaggio, bensì anche nei nostri
modi di vivere e pensare. Il nostro sistema concettuale è largamente metaforico (Lakoff e
Johnson).
La centralità della metafora nella formazione del linguaggio e del pensiero
Quello che Lakoff e Johnson sviluppano, entro la prospettiva di una linguistica cognitiva, si iscrive
in un percorso che aveva già intuito la centralità della metafora nella formazione del linguaggio e
del pensiero. Eccone alcuni passaggi cruciali:
 Vico → Il linguaggio non scaturisce da ragioni, bensì da intuizioni e fantasia. La logica
che è a fondamento del linguaggio non è una logica razionale, ma è la stessa logica creativa
alla base del mito e della poesia: una logica poetica, ovvero, l’abilità innata di
rappresentare l’esperienza del mondo attraverso la fantasia di cui la metafora ne è il
prodotto. Nella Scienza Nuova, Vico la descrive come anche come “la più luminosa dei
tropi”.
 Nietzsche → “ogni concetto non è che «il residuo di una metafora»”; dietro la parvenza
di un’identità, si nascondono sempre trasposizioni, immagini, intuitive e particolari. Il
nostro pensiero si articola in schemi che scaturiscono, tuttavia, sempre da un metaforizzare
per cui non sono mai rigidi, con confini fissi. Un aspetto importante evidenziato da
Nietzsche è la centralità della metafora nella formazione del linguaggio: la verità, per
Nietzsche, è una metafora logorata che, dopo largo uso, è diventata assunzione
salda, vincolante, convenzionale, perdendo la sua presa sensibile. Anche la parola è
metafora poiché le parole non contengono le essenze delle cose, ma le nominano attraverso
immagini e facendo ciò le traspongono già e le trasformano (parola albero, colore, neve,
fiore ≠ dall’essenza di queste stesse cose).
 Humboldt → La conoscenza umana, per Humboldt, si fonda sull’analogia: l’uomo coglie
somiglianze ovunque rivolga lo sguardo. Gli elementi che costituiscono una lingua sono
collegati gli uni agli altri e si configurano essi stessi metaforicamente come gli elementi di
un organismo. Le parole non offrono mai gli oggetti, bensì sempre le interpretazioni di
questi. La funzione poetico-metaforica essenziale al linguaggio e costitutiva del modo di
vivere
dell’uomo, permette di acquisire input, ovvero immagazzinare, organizzare e rievocare
conoscenze, attraverso reti di somiglianza tra i concetti.
 Gramsci → ha il merito di intravedere una pervasività generativa della metafora: egli
scrive
infatti “è impossibile «togliere al linguaggio i suoi significati metaforici ed estensivi»”.
Definire la metafora
Definire la metafora non è mai stato un compito semplice (esempio di Ray Gibbs all’aeroporto di Tel
Aviv, appunti) e non si è mai pervenuti ad una teoria unica:
 Classicismo: metafora come forma di comparazione
 Ambito generativo-transformazionale: metafora come anomalia
 Teoria interattiva di Black: metafora come interazione
 Anni Ottanta → concettualizzatore metaforico alla base del nostro agire
6.12 La metafora è un viaggio
Metaforicamente parlando, potremmo dire che la metafora è un viaggio nella mente. Un significato
(il viaggiatore) sale su una parola (il mezzo di trasporto) e lascia il suo dominio semantico (il luogo
di appartenenza) per recarsi (il trasferimento) presso un altro dominio semantico (la meta di arrivo).
Definizione: la metafora è l’esito di un viaggio che un significato intraprende dalla propria sfera
semantico-concettuale verso un altro dominio, arricchendolo, nell’incontro, di un nuovo significato
e di nuove possibili interpretazioni.
Etimologia di metafora: dal greco classico “metaferein”, “meta” (dopo, oltre” e “ferein”
(trasportare). Ancora oggi, in greco moderno, mezzo di trasporto si dice metaforicò mezo.
6.13. La dimensione cognitiva & 6.14. Vivere e agire metaforicamente
- Andrew Ortony → Metaphor and Thought (1979), la ricerca sulla metafora viene
affrontata con un approccio multidisciplinare.
- Seconda edizione di Metaphor and Thought (1993) → la ricerca inizia a comprendere
ulteriori campi disciplinari come la linguistica e la neuropsicolinguistica.
Una delle pietre miliari per le attuali teorie sulla metafora è sicuramente il volume Metaphors we
live by (Metafora e vita quotidiana) di George Lakoff e Mark Johnson pubblicato nel 1980:
L’essenza della metafora è comprendere e vivere un tipo di cosa nei termini di un altro
Gli autori propongono un ulteriore sviluppo dello statuto della metafora, asserendo che l’intero
nostro sistema concettuale è organizzato su base metaforica: non solo comprendiamo, ma viviamo e
agiamo metaforicamente. La struttura profonda del linguaggio è di natura metaforica e le
espressioni che utilizziamo nell’interagire quotidiano sono coerenti all’organizzazione metaforica
che struttura concettualmente il nostro pensiero [metafore concettuali]. La concezione di un
sistema metaforico organizzato e sistematico in base al quale si struttura il nostro universo
concettuale porta a riconsiderare la tradizionale distinzione tra significato letterale e figurato.
Metafora concettuale #1: L’AMORE È UN VIAGGIO
 il nostro amore va a gonfie vele
 il nostro rapporto è naufragato (oppure è andato a picco)
 non andiamo da nessuna parte
 non possiamo più tornare indietro, ecc.
6.15. Metafora e concetti astratti [“la sistematicità dei concetti astratti”]
Grazie alla metafora possiamo comprendere concetti astratti attraverso una rete di concetti concreti
che, in quanto tali, proiettano sui primi le basi fisiche dell’esperienza cognitiva.
Metafora concettuale #2: IL TEMPO È DENARO
Il tempo è un concetto astratto, difficile da definire, tuttavia è possibile individuare una serie di
metafore che ci permettano di rappresentarlo come concetti più vicini alla nostra esperienza
personale. Nella società occidentale, il tempo è una risorsa limitata con cui raggiungere
determinati obiettivi e, come tale, è una merce preziosa:
 Risparmiare tempo
 Investire il proprio tempo
 Non sprecare tempo
 Non avere tempo da buttare/perdere
 Il tempo è esaurito
 Il tempo disponibile
 Concedere tempo
Metafore ontologiche e personificazione
Le metafore ontologiche sono modi di considerare eventi, azioni, emozioni, idee come entità o
sostanze (es: LA MENTE È UNA MACCHINA). Esistono, pertanto, anche altre metafore
attraverso le quali è possibile concettualizzare il tempo; per esempio, una tra queste è il processo di
personificazione come estensione di metafore ontologiche attraverso il quale una determinata entità
o sostanza assume caratteristiche e comportamenti umani:
Metafora ontologica [Personificazione] #1 IL TEMPO…
 È signore
 È tiranno
Metafora ontologica [Personificazione] #2 IL TEMPO È UN OGGETTO CHE SI MUOVE
 Il tempo scorre
 Tempus fugit
Metafora ontologica [Personificazione] #3 VITA COME CONTENITORE
Possiamo rappresentare il tempo come un’entità che si sposta verso una certa direzione:
 Avanziamo negli anni
 Hic e nunc
 Ci portiamo le primavere sulle spalle
Queste metafore si basano sia sull’esperienza fisica che su una serie di presupposizioni culturali
specifiche. L’esperienza fisica davanti/dietro implica una distinzione probabilmente presente in
tutte le culture del mondo. Tuttavia, la sua concettualizzazione può esprimersi con rappresentazioni
diverse. Per le culture quechua e aymara, l passato è concepito davanti a noi in quanto è noto,
mentre il futuro è dietro le spalle perché è sconosciuto, le metafore utilizzate come esempi non
avrebbero per loro lo stesso significato o addirittura non potrebbero esistere.
 essere in crisi o uscire dalla crisi
 uscire da un brutto periodo
 entrare in una fase di difficoltà
 essere in salute
 uscire da una malattia
 entrare in coma
 essere fuori tempo o essere in tempo
Metafore di orientamento
Un altro esempio delle proprietà interazionali tra esperienza percettiva, sistema concettuale e
comprensione della metafora è offerto da quelle che Lakoff e Johnson definiscono metafore di
orientamento. Ogni soggetto possiede consapevolezza del proprio corpo nello spazio:
Metafora di orientamento #1 IL CORPO È UN CONTENITORE: interagiamo nell'ambiente fisico
attraverso categorie non arbitrarie come SU-GIÙ, DENTRO-FUORI, DAVANTI-DIETRO,
PROFONDO SUPERFICIALE, CENTRALE-PERIFERICO ecc. Tali categorie si radicano
nell'esperienza fisica e servono da base per un gran numero di metafore:
 FELICE È SU
 TRISTE È GIU (Essere giù di morale, cadere in depressione ecc)
Siccome quando siamo gravemente ammalati siamo costretti a stenderci, mentre quando siamo
pienamente in salute siamo attivi, in movimento e pieni di energie, rappresentiamo concettualmente
la salute orientandola verso l’alto, la malattia e la morte orientandole verso il basso.
Quando siamo tristi tendiamo ad avere la testa e lo sguardo abbassati e da questo orientamento
verso il basso derivano espressioni metaforiche come “mi sento giù”, “ho il morale a terra”. Quando
siamo felici manteniamo la testa alta e lo sguardo rivolto verso l’alto: un orientamento che
ritroviamo nelle frasi “mi sento al settimo cielo”, “ho il morale alle stelle”. E ancora: la
consapevolezza è su, mentre l’incoscienza è giù.
Su/giù + contenitore → entità come fluidi che salgono e
scendono #1 IL DENARO È UN FLUIDO
 Un fiume di denaro
 Versare del denaro
 Congelare i risparmi
Il concetto di embodiment in relazione alla metafora
La ragione nasce dal corpo, non lo trascende e la sua natura è metaforica e immaginativa.
6.16. Tradurre le metafore concettuali di Metaphors we live by
L’opera di Lakoff e Johnson, da quando è stata pubblicata fino a oggi, ha conosciuto certamente
molta fortuna ed è stata tradotta in molte lingue. Per scopi didattici, è stata compiuta in questa sede
un’analisi comparativa della traduzione in quattro lingue europee: italiano, francese, spagnolo e
tedesco.
- Traduzione francese (1985); è stata la prima in ordine d’uscita e non è stata più riedita. Si configura
come una traduzione target-oriented; non sempre l’adattamento corrisponde alla traduzione delle metafore
inglesi in espressioni francesi effettivamente in uso; non include, tuttavia, alcuna introduzione né note
critiche o esplicative rispetto alle scelte traduttive.
- Traduzione spagnola (1986); è stata ripubblicata diverse volte, l’ultima volta nel 2017. Utilizza un
approccio source-oriented; le metafore sono state tradotte talvolta con espressioni poco
convenzionali in lingua spagnola, ma presenta una ricca introduzione, nonché un apparato di note
esplicative per sopperire ad eventuali lacune traduttive.
- Traduzione tedesca (1998); è stata ripubblicata nel 2018. Include un’introduzione di Michael B.
Buchholz, uno psicanalista che ha lavorato sul coinvolgimento delle metafore nelle emozioni.
L’edizione tedesca presenta un numero davvero esiguo di note della traduttrice, utili per spiegare
concetti prettamente legati alla cultura americana; è una traduzione target-oriented; presenta
esattamente lo stesso numero di metafore dell’edizione originale, per cui per ciascuna di esse indica
sempre un’espressione metaforica tedesca, anche perché le due lingue fanno parte dello stesso
ceppo linguistico.
- Traduzione italiana (1998); non è mai stata riedita. È stato scelto un approccio source-oriented, motivato
dalla traduttrice Patrizia Violi come “necessario al fine di non riscrivere completamente il libro”. È stato
conservato il senso americano di molte metafore e sono state eliminate soltanto quelle metafore ritenute
assolutamente incomprensibili. La traduzione italiana risulta piuttosto letterale e non del tutto
convenzionale.
La metafora nel titolo

 “Metaphors we live by” è una metafora che restituisce l’immagine di una vita quotidiana
calata nella metafora. Fra le diverse traduzioni, solo quella tedesca trasmette l’idea centrale
espressa dagli autori nel titolo originale: Leben in Metaphern significa infatti vivere nelle
metafore. Il sottotitolo “costruzione e uso delle immagini del linguaggio” è chiamato a
svolgere una funzione esplicativa.
 Il titolo francese elimina il pronome personale “noi” (we), mettendo da parte la nostra
collocazione rispetto alla metafora.
 Nella versione spagnola, il complemento di luogo della versione francese si trasforma in
complemento di specificazione. Così facendo viene trasmessa l’idea della metafora come
elemento che appartiene alla vita quotidiana, ma si perde il senso del contatto con la vita
quotidiana. Da un lato, si rafforza così l’idea di appartenenza della metafora alla vita
quotidiana, dall’altro, in questo titolo noi non ci siamo.
 Il titolo italiano si distacca notevolmente dall’originale e dall’idea che Lakoff e Johnson
volevano trasmettere. La versione italiana, arrivata dopo quella francese e spagnola, ha
risentito in qualche modo dell’influenza di queste ultime e si pone quasi come una
traduzione della traduzione.
Uno sguardo attraverso le traduzioni di alcune metafore indicate da Lakoff e Johnson
1. La discussione è una guerra
Nella nostra cultura, siamo soliti vivere e pensare una discussione in tali termini e ciò si riflette
nei nostri modi di parlare. Osservando le traduzioni delle diverse espressioni metaforiche
elencate da Lakoff e Johnson, ritroviamo una generale equivalenza linguistica e culturale tra le
lingue comparate: “vincere”, “difendere”, “distruggere”, “adottare strategie”, “attaccare i
punti deboli dell’avversario”, “sparare”, “colpire”, “annientare”, “fare fuori”, “respingere
l’avversario”, sono tutte azioni che appartengono al concetto di guerra. Per quanto riguarda la
frase His criticisms were right on target la traduzione italiana trova un equivalente completo
nell’espressione “Le sue critiche hanno colpito nel segno”. L’espressione francese suona più
come “le sue critiche mirarono dritte al punto”, una frase che funziona anche in italiano, essa
assume però una sfumatura di senso diversa: mirare non vuole dire riuscire poi effettivamente a
fare centro. A proposito invece della frase I demolished his argument, la traduzione italiana e
quella francese usano l’equivalente “ho demolito”, mentre quella spagnola e quella tedesca no.
[…] Nella penultima frase I f you use that strategy, he’ll wipe you out, la parola strategy,
appartenente al vocabolario bellico, attraversa tutte e quattro le traduzioni e mantiene lo stesso
valore.
2. Il tempo è denaro
L’idea che il tempo sia una merce con un valore di scambio, preziosa e che non può essere
spiegata è parte costitutiva del nostro modo di rapportarci al tempo. Quest’idea è culturalmente
radicata in Occidente ed è figlia dell’avvento del capitalismo che ha associato il lavoro alla
quantificazione del tempo che esso richiede: lavoro pagato a ore, a giornata, a settimana,
mensilmente, lavoro a tempo determinato, contratto di lavoro annuale, lavoro stagionale. Che il
tempo sia un bene prezioso emerge dal fatto che lo dedichiamo (cfr. trad. it. e sp.), lo doniamo
(trad. fr.) o lo regaliamo. (cfr. trad. ted.) e che quando siamo i destinatari di questo dono
ringraziamo chi ce l’ha concesso. Il tempo è poi qualcosa da spendere (spend, gastar),
impiegare, gestire (gèrer, umgehen), proprio come si fa con i soldi. Come accade con i soldi
esso può essere perso, disperso, sprecato, ma può essere anche investito: la traduzione italiana
sceglie “sprecare” al posto di “investire” mascherando il senso e oscurando l’uso italiano di
espressioni in cui si dichiara di aver investito molto tempo in attività, persone, progetti. He’s
living on borrowed time che vuol dire “Sta vivendo di tempo prestato” nel senso che sta
usufruendo di qualcosa che non è suo, che gli è stato concesso e che deve usare in modo
rispettoso. In italiano non è un’espressione frequente.

3. Metafora del canale


Come si evince dalla precedente tabella, tre delle espressioni indicate da Lakoff e Johnson non
sono state tradotte in italiano: “ It’s hard to get that idea across to him”. In italiano potrebbe
essere tradotto in modo più impersonale con la frase, abbastanza usuale, “è difficile far passare
quest’idea” – che corrisponde alla frase scelta dal traduttore francese – e in modo più personale
può essere reso con un’espressione come “è difficile fare in modo che gli arrivi quest’idea” o “è
difficile trasmettergli quest’idea”. “Your reasons came through to us” . In italiano può forse
essere considerata un’espressione metaforica lessicalizzata o comunque non è tra le metafore più
usuali, ma si può dire qualcosa come “Le tue ragioni mi sono giunte” per poter esprimere la
frase inglese in senso metaforico. […]. “ You can’t simply stuff ideas into a sentence any old
way”. É davvero difficile rendere in italiano questa frase in modo funzionale, rispettando il
senso dell’originale, senza ridurla a una mera traduzione letterale. Se per conservare in qualche
misura il suo senso, la traducessimo con l’espressione “non puoi limitarti a parlare per frasi
fatte” la metafora concettuale del canale non risulterebbe forse subito visibile. Ma l’idea che sta
dietro espressioni come “parli per frasi fatte”, “non dovresti parlare per frasi fatte” è che le idee
che si intendono veicolare, trasmettere devono essere collocate in contenitori adatti e non
devono servirsi in maniera meccanica.
4. Metafore di orientamento
La traduzione italiana ha tagliato completamente fuori la metafora concettuale di orientamento
“futuro in avanti/davanti” (what’s up?, coming up events ecc) […]. È vero che non si trovano
espressioni metaforiche italiane equivalenti a quelle indicate da Lakoff e Johnson, ma ce ne sono
altre lessicalizzate che si basano sul concetto del futuro orientato in avanti/davanti che potevano
essere segnalate in modo da non lasciare intendere che in italiano non esistono espressioni
derivanti dalla metafora concettuale di orientamento del futuro.
Una riflessione può essere fatta anche sull’uso di “attendere”. In francese lo ritroviamo nella
traduzione J’ai peur de ce qui nous attend: attendiamo sempre qualcosa che arriva, qualcosa che
si muove in avanti e che ci raggiunge e in questo senso il futuro inteso come ciò che avanza, che
sta in avanti, è qualcosa che anche in italiano associamo all’attesa, qualcosa che arriva e che
temiamo in quanto non conosciamo: “attendiamo” eventi che non sappiamo di che natura
saranno. Diciamo infatti “non so che mi aspetta” per esprimere l’incertezza degli eventi futuri,
dei giorni “a venire”.
6.17. Metafore e educazione linguistica
La metafora è un efficace strumento per comunicare e trasmettere i valori del singolo e di
un’intera comunità e, in quanto tale, è in grado di influenzare il punto di vista del nostro
interlocutore. Se consideriamo che le metafore possono essere diverse da una comunità
linguistica a un’altra, ci rendiamo conto che nel contesto di apprendimento di una lingua
straniera occorre fare in modo che esse non diventino un ostacolo per la comunicazione
interculturale. La capacità di comprendere le metafore è strettamente legata al livello di
competenza linguistica dell’apprendente di lingua straniera: tanto più il livello sarà elementare
tanto meno lessico egli avrà a disposizione per comprendere la metaforizzazione. Tuttavia,
alcuni studi hanno mostrato come lo sviluppo di una competenza metaforica, intesa come
capacità di interpretare i riferimenti culturali e i modi di dire, sia necessaria per l’apprendimento
di una L2. La comprensione della metaforizzazione non favorisce, infatti, soltanto l’acquisizione
di nuovo lessico, ma permette anche di connettere lingue e culture diverse, di stabilire dei veri e
propri ponti tra lingue e culture. Occorre però divenire sensibili circa la possibilità che una
metafora non valga nella cultura di una lingua straniera e che possa addirittura trasgredire i
valori di quella cultura e il ricorso a esso potrebbe creare spiacevoli situazioni di imbarazzo e
incomprensione (es: in lingua italiana, siamo soliti attribuire caratteristiche di alcuni animali a
delle persone in espressioni come sei un verme, sei una lumaca, sei una volpe, sei una capra…,
ma in lingua indiana bisognerebbe tenere conto che la mucca è un animale sacro e quindi
trascende qualsiasi caratteristica fisica o materiale).

Potrebbero piacerti anche