Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
net/publication/324866192
CITATIONS READS
0 86
1 author:
Isabella Chiari
Sapienza University of Rome
68 PUBLICATIONS 135 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Isabella Chiari on 01 May 2018.
7.1. Introduzione
69
parole comuni verso una singola accezione monoreferenziale e non ambigua.
Dove invece il lessico, condizionato pragmaticamente dai bisogni espressivi
della varietà funzionale, non si costituisce a nomenclatura esso rimane più
fortemente intriso di lingua comune, come nel caso del linguaggio dei
giornali, della giurisprudenza e dell’economia ed evidentemente della politica
(Beccaria et al. 1973; Sobrero 1993; Cortelazzo 1994).
L’obiettivo di questo contributo è quello di indagare le caratteristiche del
lessico dei leader politici italiani in relazione al nucleo più profondo del
vocabolario italiano, ossia la fascia del lessico che è più conosciuta e più usata
dalla grande maggioranza della popolazione italiana contemporanea.
In particolare si tenterà di collocare il lessico del discorso parlamentare
entro il continuum delle varietà diafasiche e dei generi testuali dell’italiano
usando come indicatore quantitativo la distribuzione del lessico di base usato
dai leader entro il corpus analizzato.
Il discorso parlamentare e in generale il discorso politico e quello
istituzionale si nutrono con modalità diverse e diversi obiettivi del linguaggio
comune. Il lessico della politica risulta infatti per molti versi poco
specializzato rispetto a linguaggi settoriali e lingue speciali ove è p iù tipica
una certa tecnicizzazione lessicale (e semantica) e m eccanismi molto
riconoscibili e produttivi di formazione delle parole. L’intenso interscambio
tra linguaggio politico, in tutti i suoi registri e varietà, è dovuto
indiscutibilmente a un do ppio ordine di fattori. Da una parte i temi e le
questioni discusse sono della natura più diversa e dall’altra la presentazione
dei contenuti oggi non è so lamente indirizzata alla camera parlamentare nel
suo interno, ma è sempre più indirizzata a un pubblico più ampio di non
specialisti che accedono e fruiscono ai materiali parlamentari attraverso le
dirette e differite tv, i servizi televisivi, i rapporti e le sintesi giornalistiche sui
diversi mezzi di comunicazione (vecchi e nuovi media).
È certamente molto difficile distinguere l’effetto esercitato dai mutamenti
generalmente intercorsi negli ultimi trent’anni nella lingua italiana dagli
effetti che nel linguaggio parlamentare ha avuto l’apertura ai media e l a
presenza sempre maggiore di ‘frammenti’ di discorso parlamentare trasmessi
e discussi nel dibattito politico pubblico. Dunque l’esame e la registrazione di
un eventuale cambiamento negli usi delle parole più frequenti non può essere
che un riflesso di mutamenti e tendenze propri della lingua italiana in generale
nei suoi registri e varietà.
70
comunque di registro medio-alto. Se ne sono sottolineati ad esempio in questa
direzione gli aspetti legati alla presentazione di un registro elevato e d alla
presenza di tecnicismi collaterali e latinismi (Piemontese & Villani 2007) .
Bisogna inoltre notare come il discorso parlamentare e il suo lessico si
collochino in un’area intermedia nella quale è spesso difficile determinare se
ci si trovi di fronte a testi di natura ‘primaria’, elaborati con certezza
esclusivamente da chi li pronunzia, oppure a testi di natura ‘secondaria’ nei
quali vi è un doppio livello di rielaborazione (o elaborazione), l’uno a opera
degli autori dei resoconti 14 l’altro a opera di collaboratori ed estensori dei
discorsi dei leader. Le prassi, quasi mai esplicitamente documentate, relative
al grado di rielaborazione e ricomposizione, variano inoltre notevolmente da
parlante a p arlante in relazione a d iversi fattori molto spesso noti solo alla
cerchia dei collaboratori di ciascun leader e agli addetti alla resocontazione.
Questo spinge ad adottare una forte cautela nell’interpretazione dei testi e
delle loro caratteristiche linguistiche, tenendo sempre ben presente la
‘potenziale’ natura ibrida del prodotto testuale finale che compare pubblicato
nei resoconti.
La rappresentazione del lessico parlamentare come spostata verso il polo
delle varietà alte farebbe dunque presumere un pos izionamento rispetto a
diversi tipi e domini testuali verso la specializzazione e dunque la presenza di
un tasso relativamente basso di incidenza del cosiddetto vocabolario di base e
comune (De Mauro 1980; De Mauro 2005). Il linguaggio politico tuttavia, nel
suo complesso inteso dunque come varietà funzionale che presenta una
relativamente vasta gamma di variazioni anche verticali, registra da alcuni
anni una pressione molto forte verso l’adeguamento alla lingua comune.
Aspetto che emerge con particolare evidenza nel dibattito pubblico trasmesso
e riferito nella stampa.
In questo scritto si tenteranno di osservare e discutere alcuni dati che ci
permettono di dare una collocazione del lessico parlamentare entro il
continuum delle varietà dell’italiano, utilizzando come indicatore non
l’incidenza del lessico ‘tecnicizzato’ bensì del lessico di base, cercando di
mettere in luce se vi siano stati cambiamenti nel tempo e se gli stili dei leader
politici rappresentati nel corpus differiscano per uso relativamente alle parole
che costituiscono il nucleo più antico e più diffuso e compreso della nostra
lingua. Si tenterà dunque di osservare se (e/o quanto) le sotto-varietà del
linguaggio politico più spostate verso un pubblico indifferenziato e soprattutto
critico dal punto di vista elettorale incidano nei fatti a spostare la tradizionale
formalità del lessico parlamentare verso un us o più largo uso del lessico di
base.
Inoltre come rilevano Cortelazzo (1985) e successivamente Piemontese e
Villani (2007: 50) il linguaggio parlamentare si colloca per alcuni aspetti in
una posizione intermedia tra scritto e parlato. Se ciò è vero anche tale
posizione può essere riflessa e rilevata attraverso un confronto del vocabolario
14
Al riguardo si veda il contributo di Paola Villani in questo volume.
71
di base nel continuum dei generi individuati in Chiari e De Mauro (in stampa).
Il vocabolario fondamentale (FO) e quello di alto uso (AU) infatti pur essendo,
per definizione, le fasce del lessico più usate in tutti i generi testuali,
esibiscono in questi una diversa distribuzione e relativa incidenza. I dati
disponibili consentono dunque di posizionare il lessico di un particolare
corpus rispetto all’uso dei lessemi FO e AU mostrandone vicinanza e
lontananza.
Il vocabolario di base infatti rappresenta il nucleo più centrale del lessico
italiano e comprende, nelle sue due fasce basate sull’uso produttivo le 5.000
parole più usate nei testi e comprese da parlanti che abbiano completato la
scuola secondaria inferiore (FO – prime 2.000 parole in ordine di frequenza e
AU - ulteriori 3.000). Si tratta di un nucleo lessicale che tende anche a u na
certa stabilità diacronica e che, in testi di dimensioni ampie, registra stabilità
di occorrenza. Tuttavia tale stabilità non è assoluta: si manifesta entro un
range che va da un minimo a un massimo a seconda dei generi e tipi testuali
(e muta in modo relativamente apprezzabile anche con la lunghezza del testo
analizzato).
Per capire come interpretare i dati relativi al “Corpus del linguaggio
parlamentare dei leader della Prima e S econda Repubblica” (corpus LP), è
necessario illustrare rapidamente come è fatto il lessico di riferimento che sarà
usato per i confronti. Il nuovo vocabolario di base (NVdB) conserva le
tradizionali tre fasce (fondamentale, alto uso e alta disponibilità) ed è costruito
a partire da un corpus di riferimento appositamente progettato dell’estensione
di circa 18 milioni di parole. Il corpus e i dati da esso estratti sono suddivisi in
sei sottocorpora bilanciati di circa tre milioni di occorrenze ciascuno (stampa,
saggistica, letteratura, spettacolo, comunicazione mediata dal computer,
parlato) 15.
Dei moltissimi dati che si possono estrarre da un ordinamento statistico dei
lessemi del corpus, un indicatore relativamente semplice da interpretare è
quello del tasso di copertura. La copertura infatti ci dà una indicazione
generale di quante delle parole di un testo appartengano all’una o all’altra
fascia del vocabolario di base. La copertura è dunque un indicatore
macroscopico di quanto un testo nel suo complesso si avvicini all’essere
compreso e, indirettamente, di quanto lessico invece esca dall’uso ordinario
per farsi più tecnico o più accessibile a strati della popolazione cui è richiesta
una formazione scolastica superiore.
La copertura può essere rappresentata come una percentuale di quante ogni
100 parole del testo (escludendo i nomi propri, le sigle, acronimi e i numeri in
cifra) 16 fanno parte del vocabolario fondamentale e di alto uso. Come si è
15
Per maggiori dettagli si vedano per gli aspetti di metodo (Chiari & De Mauro 2012)
e per una anteprima dei risultati (De Mauro 2012) e il volume in uscita (Chiari & De
Mauro, in stampa).
16
Seguendo i c riteri adottati dalla letteratura più recente sulla copertura (Chujo &
Utiyama 2005). I criteri di valutazione della copertura nella letteratura scientifica
relativa ai corpora di riferimento è n otevolmente cambiata. Ad esempio il LIF
72
detto la copertura è una spia che però varia a seconda delle tipologie testuali e
dei generi a parità di lunghezza dei testi. Dunque osservando i macrogeneri
del corpus del NVdB il vocabolario fondamentale copre in media l’86,3%
delle occorrenze, con punte più basse nella saggistica (81%) e più alte nel
parlato (91%), con uno scarto dunque di ben dieci punti percentuali tra i due
estremi. Se si considera invece la fascia successiva, l’alto uso, che comprende
i successivi 3.000 lessemi in ordine di rango, si osserva una media di 6,4% di
copertura che varia da un minimo di 4% del parlato a un massimo 8,7% della
saggistica. Qui il divario è minore (4,5% di scarto), la direzione di crescita è
invertita rispetto alla fascia FO.
Complessivamente, sommando le coperture del FO e dell’AU, i diversi
generi testuali del corpus del NVdB variano, nell’incidenza del vocabolario di
base, da un minimo di 90% di copertura per la saggistica fino a un massimo di
95% nel parlato. Singoli testi, di breve respiro, violano queste regolarità e
possono avere coperture anche molto più alte. 17
Poiché si verifica una notevole regolarità entro i generi e si nota una
progressione che aumenta nel tasso di copertura del FO dallo scritto-scritto al
parlato, e ch e diminuisce per l’AU, è ipotizzabile usare questo metro per
valutare la collocazione del lessico parlamentare rispetto ai generi individuati
per la stima del NVdB.
Un lavoro di Sergio Bolasco (1996: 200-2) aveva presentato alcuni dati
relativi a un corpus costituito da 46 discorsi programmatici di governo (corpus
Tpg, 406.145 occorrenze) e al suo tasso di VdB. I dati di Bolasco divergono
significativamente da quelli che presenteremo qui sotto. 18 Bolasco nota infatti
73
che in termini di occorrenze l’incidenza del FO nel corpus Tpg è del 63,3% e
del VdB intero (tutte e tre le fasce) raggiunge il 75,4%. Lungi dall’essere
‘rilevante’ tale copertura totale è p aragonabile a quella dei manuali
specialistici più tecnici.
Vediamo ora che quadro emerge dal confronto sul corpus LP della
copertura del VdB e del NVdB relativamente alle sole fasce FO e AU e
osserviamo più in dettaglio come si possono interpretare i dati non in termini
assoluti, ma relativamente a coperture misurate con metodi analoghi per altri
generi testuali dell’italiano.
Gli obiettivi della nostra analisi sono dunque duplici: da una parte
osservare come il corpus LP nel suo complesso si collochi dal punto di vista
della distribuzione, uso e frequenza dei lemmi di base, rispetto ai generi
testuali del NVdB, dall’altra osservare l’incidenza del VdB (1980) e del
NVdB (in stampa) nel corpus e nei sottocorpora relativi alla Prima e Seconda
Repubblica e agli interventi di singoli leader.
L’analisi è stata condotta lemmatizzando l’intero corpus LP con un
lemmatizzatore probabilistico (Tree Tagger) 19 e correggendo gli errori
macroscopici secondo principi simili a quelli che hanno guidato il trattamento
del NVdB 20. A partire dai lemmi identificati si è proceduto a osservare quanti
di questi appartenessero alle due fasce FO e AU del NVdB. Ci si concentrerà
qui per ragioni di spazio sulla sola presentazione dei dati relativi cumulativi
delle due fasce.
Il posizionamento del corpus LP complessivo dal punto di vista della
copertura del NVdB per le fasce FO (83,81%) e AU (7,67%) raggiunge un
totale di 91,48%. 21 Sia il comportamento della fascia fondamentale sia quello
74
della fascia di alto uso sembrano collocare in modo deciso il linguaggio
parlamentare come intermedio tra saggistica e stampa, più vicino al polo della
stampa.
In Figura 7.1 è possibile visualizzare la collocazione complessiva del tasso
di copertura delle fasce FO e AU del corpus LP.
Fig. 7.1 - La copertura di FO+AU nel corpus LP e nei generi del NVdB
75
7.3. Un cambiamento tra Prima e Seconda Repubblica?
76
Tuttavia già il corpus LP completo si collocava, come abbiamo visto, già
molto vicino a STAMPA, e bisogna tenere conto che la quantità di materiale
relativa alla Prima Repubblica è più di quattro volte più estesa di quella
relativa alla Seconda.
77
Mentre il vocabolario fondamentale risulta una spia registrabile dello
slittamento verso l’alto, il vocabolario di alto uso rimane sostanzialmente
stabile a coprire intorno al 7,5% dei due sottocorpora (Tabella 7.1 22). Dunque
se qualcosa è a ccaduto nel passaggio dalla prima fascia temporale alla
seconda è a ccaduto in misura generalizzata solamente per la fascia più
frequente in assoluto del lessico (FO), e per contro nelle fasce che si trovano al
di fuori del NVdB (che registrano di conseguenza una riduzione d’uso). Ci
sono quindi alcune parole frequenti che sono diventate ancora più frequenti e
parole relativamente rare o tecniche vengono usate meno che in passato. La
fascia intermedia, l’alto uso, spesso distinta per astrattezza e g eneralità,
rimane relativamente salda complessivamente in termini di capacità di
copertura.
Legittimamente ci si può chiedere se questo non dipenda dal fatto che il
NVdB è tarato su testi più recenti, soprattutto degli ultimi anni. Una ulteriore
cartina di tornasole può essere quella di verificare come stanno le cose non
prendendo a confronto i lessemi del NVdB, ma quelli del VdB (De Mauro
1980).
Il VdB fotografa meglio l’epoca che va dalla fine degli anni Cinquanta ai
primi anni Settanta (poiché i testi del LIF, sua principale fonte erano raccolti in
quell’epoca), con poche correzioni dovute all’inserimento di dati del LIP
relativi ai primissimi anni Novanta del Novecento. Fino a oggi il VdB era
l’unico strumento di riferimento esistente per misurare l’uso dei lessemi
frequenti. Ci si può domandare se fosse capace già di discriminare le
differenze esibite nel corpus LP tra Prima e Seconda Repubblica.
I dati, riportati in Tabella 7.2, sembrano andare tuttavia in una direzione
diversa.
22
Le colonne con l’indicazione copertura lessicale indicano la copertura secondo il
modello NVdB, ossia escludendo numeri in cifra, nomi e acronimi; le colonne con
l’indicazione copertura grezza invece ci danno il dato totale considerando anche le
occorrenze delle classi prima escluse. Il dato è fornito per permettere la comparazione
con altre misure di copertura che non tengano conto del ruolo funzionale diverso
svolto da questi elementi testuali. Si può notare che in media la differenza sta tra il 3-
4%. La copertura lessicale ci permette di valutare, da un punto di vista
esclusivamente linguistico, gli usi lessicali, escludendo porzioni testuali che invece
poggiano primariamente su competenze matematiche e numeriche o su conoscenze
enciclopediche.
78
Tab. 7.2 - Coperture di FO e AU del VdB tra Prima e Seconda Repubblica
Il tasso di copertura del VdB (1980) non solo non registra una differenza
apprezzabile tra le due epoche cronologiche in esame, ma si assesta a un tasso
di copertura significativamente più basso per entrambi i sottocorpora rispetto
al NVdB (circa 78,% per il solo FO – che con il NVdB sta tra 84-85%; e 85%
per FO + AU, che nel NVdB si colloca tra 91-92%). 23
Questo dato in isolamento è di difficile interpretazione. Da una parte
potrebbe sembrare che il VdB per il suo arco cronologico di riferimento sia
lontano dal rappresentare in modo perspicuo perfino il lessico della Prima
Repubblica (da notare che il NVdB ha una copertura di più di 7 punt i
percentuali più alta del VdB per la Prima Repubblica, segno – nell’ipotesi più
cauta - che nei venti anni 1970-93 il vocabolario fondamentale era mutato
significativamente, o che il riferimento dell’epoca per ragioni qualitative e
quantitative – il LIF, rappresentasse in modo parziale il tipo testuale del
discorso parlamentare).
Ma è possibile dare una interpretazione ancora diversa. La spiegazione
della maggiore copertura data anche per la Prima Repubblica dal NVdB
rispetto al VdB potrebbe dipendere dal fatto che una parte dei lessemi non
fondamentali che caratterizzano il lessico parlamentare dell’epoca siano con il
tempo effettivamente aumentati d’uso in maniera generalizzata in tutti i generi
e tipi testuali dell’italiano tanto da emergere e ridefinire la fascia
fondamentale come registrata nel NVdB. Tale ipotesi potrebbe essere
23
A ulteriore conferma della maggiore stabilità nell’uso del NVdB basti segnalare il
valore di deviazione standard delle percentuali di copertura delle fasce nei diversi
campioni esaminati per la Prima Repubblica. Mentre per il N VdB i v alori sono
comunque sotto lo 0,5% (per il fondamentale e l’alto uso), 0,3% per il comportamento
globale delle due fasce unite, nel caso del VdB il fondamentale arriva a una
variazione di 1% e le fasce unite a 0,7%. Solo l’AU rimane più stabile con un valore
simile a quello della nuova lista di riferimento ossia 0,4%. Chujo & Utiyama (2005)
sostengono che sia da ritenersi accettabile una variazione standard del 2% per la
valutazione dei campioni da usare per la copertura testuale relativa ai primi 3.000
lessemi di una lingua, propendendo però per un valore più saldo come l’1%. Dal
nostro punto di vista tuttavia l’1% è da ritenersi già un valore relativamente alto,
soprattutto considerando l’ampiezza dei campioni, che nel nostro caso erano ciascuno
di più di 900.000 occorrenze.
79
suffragata dalla comparsa nel nuovo fondamentale di lessemi più astratti,
metalinguistici, cognitivi, relativi alla dimensione all’organizzazione di
attività e operazioni di natura meno legata al concreto. Si vedrà qualche dato
qualitativo in proposito nel prossimo paragrafo.
La questione è certamente molto complessa e ci sarà modo in futuro per
esaminarne le criticità metodologiche e le possibili interpretazioni integrando
il mero indicatore di copertura con dati qualitativi e quantitativi capaci di
cogliere aspetti diversi in modo meno macroscopico.
24
Si veda la nota etimologica sull’uso di parlamentare, parlamento nel contributo di
Paola Villani in questo volume.
80
lira, che tuttavia permane nella lingua comune nei modi di dire e locuzioni
cristallizzate attestate anche nel corpus LP – neanche una lira, non può
spendere una lira, le vecchie lire).
Parole tipiche del linguaggio parlamentare della Seconda Repubblica che
nella lingua comune registrano un passaggio di fascia dal FO all’AU,
rimanendo dunque anche nel NVdB, sono ad esempio: patto, consenso,
approvare, Mezzogiorno, occupazione, eleggere, civiltà, esercitare,
rappresentante, divisione, misurare. Mentre alcune parole che escono dal
nuovo vocabolario fondamentale parallelamente subiscono riduzione forte
anche nell’uso nel lessico parlamentare della Seconda Repubblica:
delinquente, rancore, provvidenza, supplicare, benedire, vigliacco.
Altri passaggi di rilievo sono quelli dalle vecchie fasce AD e AU oggi usciti
dal NVdB, ma rappresentanti parole ancora tipiche del linguaggio
parlamentare, ma di uso circoscritto e dunque oggi non di sperso nelle
tipologie diverse da stampa o saggistica. Dall’AD escono sfiducia, dissenso,
autorevole, serietà, progressista, rafforzamento, lealtà, repressione, votazione
ma anche, a braccetto, ancora usati nel linguaggio parlamentare ma meno
nelle altre tipologie, escono dal NVdB le parole israeliano e palestinese.
Dall’AU escono inoltre ancora alcune parole ancora tipiche del linguaggio
parlamentare: schieramento, tregua, compimento, sottosegretario, imposta,
leale, profugo, riformare, fronteggiare, onestà, fermezza, ipocrisia, vigilanza.
Mentre al di fuori del vecchio e nuovo VdB si confermano tipicamente
legate alla vita parlamentare parole come: onorevole, legislatura, coalizione,
federalismo, emendamento, finanziaria, mozione, bipolarismo, bicamerale,
programmatico, maggioritario, riformatore, liberalizzazione,
modernizzazione, legittimazione, comunitario, privatizzazione, legislazione,
legittimità, presidenzialismo, bipolare, governabilità, concertazione, varare,
garante, ammortizzatore, propagandistico, assistenzialismo, centralismo,
proporzionale, assistenziale, previdenziale, governativo, salvaguardare,
trasformismo, pluralismo, abolizione, liberista, ribaltone, monopolio,
contribuente, tributario, presidenziale, valorizzazione.
Occorre certo usare tutte le cautele nell’interpretare un indicatore così
macroscopico come quello della copertura delle fasce del NVdB. Tale
indicatore è infatti complessivo e nasconde al suo interno una moltitudine di
fattori diversi che concorrono a determinarne il valore (tra cui sono da citare
la tendenza alla ripetizione e la ricchezza lessicale, ma anche la qualità delle
fasce che, restando fuori dal vocabolario di base, configurano a volte con
maggiore vividezza il vocabolario di un oratore rispetto ad altri.
Tale indicatore è inoltre solo un riflesso a sua volta della complessità degli
usi lessicali di un parlante e va comunque integrato con analisi qualitative e
quantitative che tengano conto della dimensione sintattica e testuale e d ella
pragmatica comunicativa.
81