Sei sulla pagina 1di 7

Linguistica

Italiana 2 Mod. B
Relazione di fine corso
Stefano Costanzo

ANALISI PROPOSTA
Analisi sullutilizzo della costruzione: verbo modale (o servile) + infinito su un
corpus di apprendenti con L1 Polacca

1. Proposta di analisi e introduzione


Lanalisi proposta riguarda lutilizzo di un tratto linguistico dellitaliano da parte di
apprendenti con L1 polacca. La costruzione dinteresse il seguente sintagma verbale: verbo
modale (o servile) combinato con linfinito.

1.1. Specifiche grammaticali sullanalisi

I verbi modali (detti anche verbi servili) potere, volere, dovere, appartengono alla pi ampia
classe dei verbi ausiliari, i quali collegandosi direttamente a un verbo danno luogo a forme
composte che conferiscono allazione espressa dal predicato una specifica modalit. La stessa
denominazione di servili pone laccento sulla funzione di servizio che essi assolvono nei
confronti del verbo allinfinito, dove il modale costituisce lelemento reggente mentre linfinito
pur esprimendo il significato principale del predicato verbale costituisce lelemento retto.
Si utilizzano in composizione con linfinito, ad esempio: posso venire, voglio uscire, devo
lavorare. Tali verbi prendono solitamente lausiliare avere (es. ho dovuto uscire), anche se
tradizionalmente considerata buona norma utilizzare lausiliare proprio dellinfinito retto
dal verbo modale (es. sono dovuto uscire).
Importante precisare che sul numero dei verbi modali esistenti, anche a proposito dei risultati
ottenuti dal Treetagger discussi in 3.1, non vi pieno accordo. Prenderemo quindi come
riferimento quanto affermato nella grammatica consultata, fissando linsieme dei verbi in
esame a tre: potere, per quel che riguarda la modalit della possibilit; volere, per quel che
riguarda la modalit della volont e dovere per quel che riguarda la modalit della necessit.
Con questaffermazione, giustifichiamo lesclusione di alcune occorrenze identificate come
appartenenti alla categoria dei verbi modali dal tagger.
Per contestualizzare al meglio la situazione, possibile fare unosservazione riguardo al
sistema verbale Polacco. Confrontato con quello germanico e romanzo, si distingue per una
categoria dellaspetto pi sviluppata dal punto di vista morfologico che flessivo, compensando
una struttura di tempi verbali abbastanza modesta. Lutilizzo di prefissi e suffissi che
modificano laspetto del verbo, caratteristici di questa lingua, una caratteristica importante
che pu influenzare la competenza degli apprendenti di Italiano riguardo lutilizzo dei verbi.

1.2. Indicazioni sulla competenza degli apprendenti


Secondo gli studi di Giacalone Ramat, i verbi modali, e in generale la modalizzazione,
compaiono molto presto allinterno delle produzioni di apprendenti; al tempo stesso
sviluppata precocemente anche la competenza di far reggere linfinito da un verbo modale.
Questo avviene perch tali mezzi sono importati per avere successo in una conversazione.
Sempre lo stesso studio, fornisce informazioni sullordine in cui i tre verbi sono appresi:
Volere ! Potere ! Dovere
Analogamente ai bambini di madrelingua italiana, gli apprendenti utilizzano potere e dovere
con valore deontico, che riguarda lobbligo o il permesso per compiere qualcosa da parte di un
terzo agente (posso uscire stasera?). Pi avanti nellapprendimento riescono a utilizzarli anche
in maniera pi complessa dal valore epistemico, riguardante: opinioni, conoscenze dirette o
supposizioni (stasera potrei uscire). Almeno nelle fasi iniziali dellapprendimento e specie per
questa seconda modalit, il costrutto accompagnato da avverbi (forse) o verbi di opinione
(penso, mi sembra) che esprimono giudizio su una determinata situazione.

1.3. Materiali utilizzati

Per lanalisi proposta, sono stati analizzati 19 elaborati tratti da prove desame del consorzio
ICoN (Italian Culture on the Net, http://www.italicon.it/) con apprendenti, anonimi, di L1
polacca; sono state svolte tra il 2008 e il 2014. Ogni elaborato composto da 30 domande
(non prese in considerazione ai fini dellanalisi) e da una prova scritta di 2200 caratteri su una
traccia attinente ai moduli studiati che costituisce il vero e proprio testo da analizzare. I
materiali a disposizione, riassumendo, sono:

19 file (.txt) contenenti i testi da analizzare prodotti dagli apprendenti;


1 file (.ods) contente informazioni riguardo gli elaborati;
1 file (.xhtml) contenente le tracce degli elaborati e il relativo codice;

1.4. Considerazioni e obiettivi iniziali

Secondo le indicazioni viste in 1.2, la costruzione indicata appresa facilmente dagli


apprendenti stranieri. Lanalisi che seguir, ha quindi lobiettivo di confermare questa tesi
nellambito degli apprendenti di lingua polacca e analizzare eventuali tratti discordanti da
essa. Possono, inoltre, essere integrate delle osservazioni riguardanti la distribuzione del tipo
di verbo (essendo questi appresi in ordine diverso), sul tipo di ausiliare eventualmente
utilizzato (avere o quello retto dallinfinito) e sulleventuale utilizzo di avverbi o verbi
dopinione che accompagnano la modalit epistemica.

2. Analisi computazionale

Il primo passo per lanalisi del testo quello computazionale, in altre parole: elaborare i
materiali di studio per renderli analizzabili con le risorse software a disposizione. Il punto
cruciale di questa fase lelaborazione del testo attraverso il tagger, che permette di
tokenizzare il testo, di POS-taggarlo e lemmatizzarlo del tutto automaticamente.

2.1. Il TreeTagger
Un tagger uno strumento software che si occupa di arricchire il testo del corpus (input) con
dei metadati. Per il nostro tipo di analisi, questi metadati, saranno di tipo linguistico. Il
TreeTagger (http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/) un tipo di
tagger molto noto e ampiamente utilizzato anche per lanalisi di corpora molto importanti;
soprattutto: diffuso in ambiente linguistico. Il prodotto finale del software (output), dato
linput, un file contenente informazioni riguardanti la parte del discorso ed il lemma
appartenenti ad ogni token. Per funzionare, il TreeTagger richiede un file di parametri cui far
riferimento. Per quanto riguarda lanalisi proposta e, pi in generale, la lingua italiana, il file di
parametri scelto e la relativa documentazione quello sviluppato da Marco Baroni,
reperibile dallo stesso sito web del TreeTagger. Occorre precisare che non vi sono software
direttamente addestrati su corpora ditaliano L2, di conseguenza: il margine di errore
caratteristico di questo tipo di strumenti per lanalisi automatica aumenta notevolmente.
Questa considerazione impone un maggiore controllo dei risultati e, come vedremo in 3.1, si
presentano casi di ambiguit influenti per lanalisi.

2.2. Il procedimento

Attraverso il terminale del sistema operativo utilizzato sul quale il TreeTagger opera, stato
possibile passare in input ogni singolo file txt, contenente gli elaborati, ottenendo in output un
nuovo file txt ma tokenizzato, POS-taggato e lemmatizzato. Il processo del tutto automatico e
si svolge attraverso un semplice comando (sistema Unix su Mac OS X 10.9.3):
cmd/tree-tagger-italian [nome-origine].txt > [nome-destinazione].txt

Lanalisi stata eseguita su ogni singolo file, il nome di destinazione la copia di quello di
origine con laggiunta del suffisso _POS.txt. Particolarit di questa fase la difficolt del
TreeTagger almeno per quanto riguarda il sistema sul quale stato utilizzato a gestire il
primo token presente allinterno dei file: in prevalenza non riconosciuto, ma trattandosi di
articoli, sostantivi e verbi che non interessano la costruzione in analisi non stato necessario
correggere questo errore, poich non influente per lanalisi.
In seguito, i risultati sono stati importati in dei fogli di lavoro di un file Excel per praticit di
visualizzazione e utilizzo. Di fatto, in ogni singolo foglio, possibile eseguire metodi di
selezione delle occorrenze attraverso i filtri. Nel particolare sono due gli elementi che
compongono la costituzione a interessarci, pi uno generale per il conteggio dei verbi. Sono
identificabili attraverso il relativo POS-tag indicato nella documentazione di Baroni:

VER2:* - identifica i verbi modali nelle varie forme, non interessandoci una forma in
particolare loperatore di Kleene utilizzato per identificare tutte le occorrenze
indipendentemente dal modo e dal tempo;
VER:infi* - identifica i verbi di forma infinita, in questo caso loperatore di Kleene
utile per identificare anche i clitici, annotati in maniera differente;
VER* - identifica tutti i verbi presenti;

I risultati numerici sono riportati nella sezione successiva. Essendovi pochi testi da analizzare,
stato possibile gestirli singolarmente per poi sommare semplicemente i risultati. In tal
modo, si potuto tener traccia dellanalisi per ogni singolo testo a fini statistici.

3. Analisi del tratto linguistico


Ottenuti i file tokenizzati, POS-taggati e lemmatizzati possibile procedere con lanalisi.
Attraverso i filtri di Excel possiamo isolare le occorrenze dinteresse e valutare se formano la
coppia ricercata. Su un totale di 5218 sono stati identificati 479 verbi, mentre sono 22 i casi in
cui presente un verbo di tipo modale. Importante precisare che, in questa fase, il conteggio
riguarda tutti i verbi identificati come modali dal tagger, compresi gli eventuali errori. In tutti
i casi in cui presente un verbo modale vengono a formarsi costruzioni con linfinito, tuttavia
vi sono casi particolari che andranno presi in considerazione.
I risultati dellanalisi computazionale completi, senza scarti di analisi che saranno
eventualmente effettuati in seguito sono riportati in forma tabellare, per semplicit di
consultazione e per esprimere i dettagli di conteggio rispetto ai singoli elaborati e il totale
risultante dellintero corpus in analisi.

Elaborato Token Verbi 1 mod+inf 2 Potere Volere Dovere Note


Infinito utilizzato come ausiliare
20
218
2
2
0
0
058695-01
-
22
260
1
0
1
0
058695-02
-
24
311
0
0
0
0
058695-03
-
33
337
2
1
0
1
058695-04
-
11
181
0
0
0
0
058695-05
-
22
196
2
0
0
2
058695-06
-
16
100
1
1
0
0
058695-07
-
21
218
0
0
0
0
058695-08
-
20
177
0
0
0
0
063704-01
-
32
361
1
1
0
0
063704-02
-
38
352
1
1
0
0
063704-03
-
25
310
0
0
0
0
063704-04
fare identificato come VER2:fin
26
295
1
0
0
0
063704-05
-
34
358
6
3
3
0
063704-06
-
26
353
0
0
0
0
063704-07
-
25
261
0
0
0
0
063704-08
-
28
324
0
0
0
0
063704-09
fare identificato come VER2:fin
40
418
2
1
0
0
063704-10
Infinito utilizzato come ausiliare
16
188
3
3
0
0
089568-01
Totale Totale
Totale
Totale Totale Totale

5218
479
22
13
4
3

Essendo soltanto 22 i casi di studio riguardanti la costruzione modale+infinito, stato


possibile analizzarli uno ad uno per ricavare i dati finali. Sono presenti 2 costruzioni estranee
allanalisi, che saranno analizzate in 3.1, il che fa scendere il numero dei casi effettivi a 20.
Ognuno di questi casi rimanenti non presenta errori. Il conteggio stato anche del tipo di
verbo modale utilizzato, identificando un maggiore uso di potere, rispetto a volere e dovere.

3.1. Casi particolari

Si sono verificati tre tipi di casi particolari che hanno, in parte, influenzato lanalisi finale: a) la
presenza di forme del verbo fare identificate come VER2 dal software, b) il modale seguito
da forme dellausiliare essere che a sua volta seguito da un verbo e c) laccentazione di
verbi che non sono stati identificati come modali.
a) Il Treetagger ha identificato 2 casi in cui le forme del verbo fare sono identificate con il
tag VER2:fin, lo stesso che distingue i verbi modali. In entrambi i casi, sono accompagnate da
un verbo allinfinito ma sono estranee allanalisi per le ragioni grammaticali discusse in 1.1,
le due occorrenze sono:

Limmagine stessa del dittatore, il quale si faceva nominare Duce, [063704-05];


le difficolt nel trovare un relatore della sua tesi, a fargli affrontare il tema della
propria appartenenza culturale [063704-10];

b) In 2 casi il modale correttamente identificato ma seguito da forme dellausiliare essere,


tuttavia consideriamo questa forma come appartenente al costrutto di base, quindi, pur
essendo un caso particolare verr incluso nellanalisi. Nello specifico:

1 Per il conteggio dei verbi, sono stati escluse molte delle occorrenze il cui lemma identificato come <unknown>

dal Treetagger. Lassociazione errata a forme verbali causata da errori di battitura (typos) nel testo. In alcuni
casi vi uneffettiva corrispondenza a un verbo per cui la verifica stata fatta manualmente.
2 La costruzione occorre in tutti i casi dove presente un verbo modale, per cui il numero di costruzioni
corrisponde alla totalit dei verbi modali presenti.

in cui entrambe le varieta possono essere impiegate nella conversazione


quotidiana [058695-01];
Anche programmi di alfabetizzazione possono essere considerati. [089568-10];

c) Gli ultimi casi particolari sono 6 e riguardano soprattutto laccentazione dei verbi, nel
particolare: le forme del verbo potere. Per forme come pu o potr realizzato laccento
attraverso lapice, di conseguenza il verbo identificato, ma non come modale. Questi sei casi,
hanno richiesto attenzione, poich non risultanti modali dallanalisi computazionale. Ecco
quali sono i casi:

di sicuro solo una pratica costante potra portare lo studente a comprenderlo bene.
[058095-07];
se "gestita" bene dall'insegnante, pu facilitare l'apprendimento di vari aspetti della
lingua d'arrivo. [063704-06];
ma se non guidato da un'insegnante esperto nell'insegnamento dell'italiano come L2,
pu diventare pi un'ostacolo che un aiuto. [063704-06];
l'autore sottolinea la ciecit della sorte che puo annientare un uomo [063704-10];
Si puo' esplicare in provvedimenti vertenti sui caratteri [089568-01];
Puo' andare dalla scelta e imposizione di una lingua nazionle [089568-01];

3.2. Considerazioni e confronti

Le costruzioni risultanti, da 22 in cui sono presenti verbi modali, si riducono a 20 escludendo i


casi particolari di tipo a. I risultati possono essere confrontati con quelli di un corpus
nazionale come CORIS (CORpus di Italiano Scritto, 130 Milioni di parole), su un campione
ridotto di occorrenze (il numero dei risultati limitato dallinterfaccia), naturalmente in
percentuale visto lenorme differenza tra le grandezze dei due corpus.
Le occorrenze totali subiscono quindi la seguente variazione di conteggio totale:
Token Verbi mod+inf Potere Volere Dovere
5218
479
20
13
4
3

La prima osservazione ci conferma direttamente la tesi iniziale: la costruzione utilizzata in


maniera corretta dagli apprendenti e non sono presenti errori. Escludendo i typos presenti,
che pure hanno influito nelle metodologie di raccolta dei dati, il sintagma verbale utilizzato
allinterno delle frasi senza alterazioni grammaticali evidenti e con regolarit: in media quasi
una volta per elaborato.
Gli stessi apprendenti dimostrano anche di aver compreso lutilizzo della costruzione dalle
alte variet di verbi allinfinito che accompagnano i modali: su 20 casi, vengono utilizzati 18
verbi infiniti diversi. In un singolo elaborato (063704-06) vi una doppia ripetizione dei verbi
allinfinito, sono utilizzati due volte i verbi imparare e dire, questo costituisce anche il caso
in cui utilizzato il maggior numero di costruzioni modale+infinito in un singolo elaborato:
quattro. Di fatto, lutilizzo dei verbi modali (20 effettivi) costituisce il 4,2% rispetto al totale
dei verbi presenti (479) nel corpus in analisi. In CORIS la percentuale di modali (circa
830.000) presenti rispetto al totale dei verbi (circa 16 milioni) del 5,2%, non molto distante
dai risultati ottenuti sul piccolo corpus di apprendenti in analisi.
Potere rimane il verbo modale pi utilizzato allinterno dei testi analizzati, e si tratta di un
risultato interessante. Secondo quanto espresso in 1.2. i modali sono appresi dagli
apprendenti nellordine volere>potere>dovere, ci si sarebbe aspettato che anche le
proporzioni di utilizzo rispecchiassero questa tendenza. Invece, il 65% dei modali
corrisponde alle forme di potere, il 20% a quelle di volere, mentre il 15% utilizzano il

verbo dovere. Volendo mettere questi risultati a confronto con un campione del corpus
CORIS di 30 occorrenze, sono utilizzate: 46,4% forme di potere, 32,1% forme di dovere,
mentre il rimanente 21,5% sono le forme di volere. Confermiamo quindi lalto utilizzo del
verbo potere per questo tipo di costruzione, mentre per gli altri due vi un utilizzo pi
distribuito e paritario.
Seppur il modale venga utilizzato sia in modalit deontica che epistemica, non molto
presente lutilizzo degli avverbi o dei verbi di opinione da parte degli apprendenti, presente
un unico caso di avverbio e nessuno di verbo che accompagna il sintagma verbale
(058095-04). Questo perch, come affermato in 1.2, il loro utilizzo concerne una prima fase
di apprendimento che gli autori dei testi in analisi hanno gi superato.
I modali sono utilizzati in maniera abbastanza omogenea allinterno dei testi, sono quasi
totalmente nella forma finita, non sono utilizzate altre forme particolari come quelle del
gerundio o del participio passato (che sarebbero state comunque identificate dal Treetagger);
si presenta solo un caso di verbo modale allinfinito. Nel dettaglio, i verbi modali sono stati
taggati come:

VER2:fin
17 casi su 20 rappresentano la maggioranza delle forme utilizzate (ad esempio:
possono, vorrei, devono);
VER2:infi
1 caso su 20 (ad esempio: poter);
VER:fin
2 casi su 20 corrispondenti a due casi particolari del gruppo c indicati in 3.1;

In conclusione, lanalisi ha confermato la tendenza degli apprendenti in questo caso di lingua


Polacca nellutilizzare correttamente la costruzione modale+infinito, non sono inoltre
presenti tratti devianti da essa. Lutilizzo del tipo di modale in linea con quello risultante da
un corpus come CORIS e rispecchia un uso comune, seppur non lineare con lordine nel quale i
tre verbi sono appresi. Altra osservazione importante il mancato utilizzo dellausiliare
davanti alla costruzione, per cui risulta impossibile analizzare se il suo eventuale utilizzo
sarebbe stato come forma di avere o come verbo retto dallinfinito.

4. Bibliografia
Andorno, C. (2003). La grammatica italiana. Milano: Paravia Bruno Mondadori Editori.
Bonomi, I., Masini, A., Morgana, S., & Piotti, M. (2003). Elementi di linguistica italiana. Roma:
Carocci Editore S.p.A.
Giacalone Ramat, A. (2003). Verso lItaliano. Percorsi e strategie di acquisizione. Roma: Carocci
Editore.
Graffi, G., & Scalise, S. (2002). Le lingue e il linguaggio, introduzione alla linguistica. Bologna: Il
Mulino.
Pisarek, W. (2007). La lingua polacca. (M. Jaskot, Trad.) Varsavia: The Council for the Polish
Language .