Sei sulla pagina 1di 6

ANALISI DI PROVE DI ASCOLTO IN ESAMI DI

Tema CERTIFICAZIONE ITALIANI (LIVELLO B2)


Italien weist bezüglich Sprachzertifizierung eine Besonderheit auf: Gleich vier Zerti-
fikatsprüfungen sind vom italienischen Bildungsministerium anerkannt: CELI, CILS,
PLIDA und .IT. Diese Vielfalt bietet Gelegenheit, die Prüfungen zu vergleichen und die
einzelnen Items auf ihre Validität hin zu überprüfen.
161 Maturanden aus Schweizer und Südtiroler Gymnasien haben die vier Hörver-
ständnisübungen auf dem Niveau B2 durchgeführt und zudem die Prüfungen bezüg-
lich ihrer Attraktivität bewertet. Die folgende, eigens für Babylonia durchgeführte
Untersuchung legt die Resultate der vier Prüfungen dar und zeigt die Schwachstellen
der jeweiligen Prüfungen auf. Die Lektüre dieses Beitrags empfiehlt sich besonders
für jeden, der selbst Multiple-Choice-Prüfungen durchführt und um angemessene
und unmissverständliche Fragestellungen und Distraktoren ringt.
Die Prüfungen sind auf der Babylonia-Homepage abrufbar:
babylonia.ch > Nummer 2/2016 > Artikel Torresan

Paolo Torresan | Venezia 1. Il sistema plurale delle Alla prima domanda non siamo in grado
certificazioni italiane1 di rispondere, visto che comporta uno
I proficiency test nell’ambito dell’italiano sguardo di tipo storico e sociologico
Paolo Torresan ha svol- come lingua straniera riconosciuti dal esterno alle nostre competenze. Alla
to attività di insegna- Ministero degli Affari Esteri italiano seconda rispondiamo che non esistono
mento presso l’Univer- sono rappresentati dalle 4 certificazioni studi comparativi in termini di risulta-
sità dello Stato di Rio ufficiali: ti, quanto descrizioni, alcune delle quali
de Janeiro (Visiting Pro- ›› CELI, Università per Stranieri di Pe- molto raffinate (Novello, 2014). C’è da
fessor), il Santa Monica College (Fulbright rugia riconoscere, ad ogni modo, che una com-
Visiting Scholar) e l’Università di Catania ›› CILS, Università per Stranieri di Siena parazione in termini di risultati tra le 4
(sede di Ragusa). Ha svolto attività di ›› PLIDA, Società Dante Alighieri certificazioni non è praticabile in sé e
ricerca presso l’Università Ca’ Foscari di ›› .IT, Università degli Studi Roma Tre di per sé. Si dovrebbe supporre che uno
Venezia e la Lancaster University. Altre certificazioni, come gli esami AIL stesso campione si sottoponga alle varie
dell’Accademia di Firenze2, o gli esami prove; i tempi di gestione di una impresa
CLIDA3 del Centro Linguistico Italiano del genere sono enormi (almeno un gior-
Dante Alighieri (con sedi a Firenze e Ro- no per certificazione); inoltre esiste un
ma), pur essendo implementate in alcuni ‘effetto-accumulo’, tale per cui, passando
contesti (es. in Svizzera nel primo caso; dalle prove della prima certificazione alle
in vari paesi, nel secondo), ricadono fuori prove della quarta, il candidato acquisi-
dal riconoscimento ministeriale. rebbe maggiore competenza (o perlomeno
Dinanzi a questa pluralità di proposte, guadagnerebbe in expertise nello svolgi-
domande ricorrenti sono: mento di esercizi simili) e tale fattore
›› Perché quattro certificazioni e non inciderebbe a favore della certificazione
una, per una lingua, qual è l’italiano, somministrata per ultima.
che non riscuote un interesse interna- In luogo di una comparazione ‘in bloc-
PIÙ ARTICOLI SU QUESTO TEMA: zionale al pari dell’inglese? co’, esiste però la possibilità di un’analisi
> WWW.BABYLONIA.CH > ›› Esistono dei confronti tra una certi- parallela di singole prove omologhe. Tale
ARCHIVIO TEMATICO > SCHEDA 6 ficazione e l’altra? indagine ci risulta non essere mai sta-

24 | BABYLONIA tema 2|2016


ta eseguita nell’ambito dell’italiano ed è 1 Ringraziamo Erika Saccuti e Maria Simona
l’oggetto del nostro saggio. Morosin per la lettura e il confronto. Ringra-
ziamo i colleghi che ci hanno aiutato nella
2. Item Analysis parallelo: ghe (ascolto, livello B2, quesiti a scelta raccolta dei dati.
presentazione della ricerca multipla)4, tratte dalle 4 certificazioni di
In seno a tre corsi di formazione, svol- italiano, liberamente consultabili online5. 2 Gli esami AIL, nell’ambito della valutazione
tisi in tempi assai ravvicinati (dicembre Il lettore può scaricare le prove dai siti delle abilità di comprensione, constano
2015-gennaio 2016), tra la provincia di riportati nella sitografia. Ai candidati è soprattutto di prove di vero/falso, senza
Bolzano (corso promosso dall’Ispettorato stato inoltre somministrato un questio- peraltro provvedere ad alcuna misura che
delle scuole di lingua tedesca) e la Sviz- nario attraverso il quale, oltre a segnare le consenta di arginare l’arbitrarietà che il
zera (corsi tenuti rispettivamente presso preferenze per le singole prove attraverso vero/falso comporta. Si tratta, quindi, di un
l’Università di Friburgo e l’Alta Scuola una scala Likert, ciascuno era libero di esame che presenta margini di criticità sin
Pedagogica di Zurigo), abbiamo raccol- esprimere i propri giudizi in merito alla dalla scelta dei format.
to, grazie alla disponibilità di colleghi, sperimentazione (§ 2.4).
le risposte di un campione omogeneo Nella tab. 1 rappresentiamo le caratteri- 3 Gli esami CLIDA, nell’ambito della valu-
(studenti maturandi) a prove omolo- stiche delle prove. tazione delle abilità di comprensione, pre-
sentano soprattutto domande aperte, con
numerose ingenuità nella confezione degli
item, come l’interdipendenza, tale per cui si
può rispondere a una domanda leggendo
una successiva (es. prova CLIDA P3 2014:
Tab. 1. Caratteristiche generali delle prove domanda 1 – “Dove è stato il Campionato
Mondiale di Ciclismo 2013?”; Domanda 4 –
CELI CILS PLIDA .IT “Quanti «fan» sono stati presenti lungo le
Sessione estiva 2007 estiva 2012 non dich. non dich. strade tra Firenze e Fiesole?”) o domande
a cui è facile rispondere grazie a precono-
Minutaggio soundfile,
9’12’’-12’46’’ 10’56’’-14’09’’ 28’03’’-31’42” 1’05’’-3’45 scenze (es. prova CLIDA P3 2011: domanda
senza istruzioni
3 – “Dov’è nato il melodramma?”).
Durata 3’34’’ 2’13’’ 3’45’’ 2’50’’

Numero di ascolti 2 2 2 2 4 Una leggera differenza è data dal fatto che la


prova CILS consta di 7 item anziché 5, come
Tipologia intervista intervista monologo intervista
le altre; ma ciò non crea difficoltà in termini
un’offerta storia dell’urba- un’attività di comparazione.
Dominio sport
formativa nistica commerciale

Numero item 5 7 5 5 5 La prova tratta dal PLIDA corrisponde al


vecchio formato; il centro certificatore sta
Introduzione al tema √
rivedendo l’impianto della certificazione;
Item-esempio √ √ per ora sono uscite le specifiche del nuovo
6
formato del B1 (Cardillo, Vecchio & Men-
Layout chiaro √ √
zinger, 2015), nel corso del 2016 usciranno
Testo autentico7 √ √ √ quelle relative al B2 e al C1.

Citazione della fonte √ √


6 Si tratta di un giudizio soggettivo. Nel caso
Ortoepia naturale √ √ √ √ del PLIDA, la distribuzione della prova su
Testo interessante √ √ √ due fogli (fronte/retro) rende poco agevole,
secondo noi, l’esecuzione. Nel caso di .IT
Testo chiaro √ √ √
l’item-esempio è stato inteso, da una buona
Punteggio solo parte del campione, come facente parte
√ non dich.
positivo della prova.
Trascrizione √
7 Anche questo è un nostro giudizio: il testo
Soluzioni √ √ √ √
pare essere studiato a tavolino.

2|2016 tema BABYLONIA | 25


Nella tab. 2 riportiamo il tempo a dispo- 2.1. Variazione tra le prove
sizione per leggere i quesiti secondo le Da un’analisi degli istogrammi alla fig. 1.
indicazioni fornite nei file. si evince che i risultati variano significa-
Le research question che ci siamo posti tivamente da prova a prova.
sono state: Agli estremi abbiamo due prove:
›› I risultati del campione variano signi- ›› .IT, la più facile, con un profilo for-
ficativamente da prova a prova? temente disallineato a destra
›› Esistono casi evidenti di sotto- e/o ›› CELI, con un profilo compatibile con
sovracalibrazione? una distribuzione normale.
›› Esistono casi di cattiva scrittura degli La relativa facilità della prova .IT è evi-
item? dente se si considera la percentuale degli
›› Qual è il feedback dei candidati? studenti che hanno raggiunto l’eccellenza,
e cioè che hanno risposto correttamente
Tab. 2. Tempi di lettura dichiarati nei soundfile Consideriamo ciascuna nei paragrafi a a 5 item su 5: 45,3%, cifra ben superiore
prima, tra e dopo gli ascolti seguire. rispetto a quelle relative a quanti hanno
raggiunto l’eccellenza nelle altre prove
(tab. 3).
prima del primo tra il primo e il dopo il secondo
tot. La relativa difficoltà della prova CELI,
ascolto secondo ascolto ascolto
come dicevamo, è immediatamente in-
20’’ feribile considerato il profilo della curva
CELI (60’’ per tutte e tre 25’’ 35’’ 1’20’’ che presenta una distribuzione pressoché
le prove di ascolto) normale (con un leggerissimo disalline-
amento a destra). Si tratta di un profilo
CILS - 60’’ 120’’ 3’
che non ci si attende con un campione
PLIDA 60’’ - 60’’ 2’ rappresentativo come il nostro, cioè con
.IT indicazioni non presenti nell’audio studenti che si stanno preparando siste-
maticamente ad affrontare una prova di
questo livello.
Il profilo della prova CILS è simile a quel-
Fig. 1. Frequenza dei punteggi lo della prova .IT, salvo presentare una
percentuale molto bassa in riferimento
CELI PLIDA (vecchio formato) all’eccellenza (solo 13 candidati hanno ri-
sposto a tutti gli item: 8,1%). Ciò si spiega
con la forte sovracalibrazione di un item
(#3), come avremo modo di vedere nel
paragrafo successivo.
Nel complesso pare che alla prova PLI-
DA corrisponda il profilo più armonico
e atteso.

2.2. La calibrazione degli item


Nella tab. 3 rappresentiamo le percentuali
CILS .IT
di studenti che hanno risposto corret-
tamente ai singoli item (Facility Value,
d’ora in poi FV).
A quali valori attenerci, sotto i quali o
oltre i quali si danno, rispettivamente, ca-
si di sotto- e di sovracalibrazione? Nella
letteratura i pareri sono discordanti, con
oscillazioni significative (per un prospetto:
Green, 2013). A nostro giudizio, un ente
certificatore, nella più flessibile delle ipo-

26 | BABYLONIA tema 2|2016


Tab. 3. Facility Value
n=161

tesi, si può orientare attorno all’intervallo 1 2 3 4 5 6 7


35-90, e cioè ritenere che con un FV≤35 vi
CELI 55,9 27,3 72,7 37,9 82,6
sia evidente sovracalibrazione (vale a dire
che se solo un candidato su 3 indovina la CILS 75,8 76,4 37,9 71,4 83,9 93,2 72
risposta, l’item è evidentemente difficile per PLIDA 88,2 54,7 60,9 73,9 70,2
il livello target), così come, al contrario, con
un FV≥90 vi è evidente sottocalibrazione .IT 90,1 88,8 71,4 67,2 87,6
(se oltre 9 studenti su 10 indovinano la
chiave, l’item è evidentemente facile in ri- Tab. 4. Item di cattiva fattura
ferimento al livello target). In termini di n=161
ricerca, sempre nell’ottica di un contesto
certificatorio, suggeriamo valori più ri- 1 2 3 4 5 6 7
stretti: 40-85; e cioè con item con
CELI 55,9** 27,3** 72,7 37,9** 82,6
›› FV≤40 abbiamo una sovracalibrazio-
ne che merita di essere indagata CILS 75,8** 76,4** 37,9** 71,4 83,9 93,2** 72**
›› FV≥85 abbiamo una sottocalibrazio- PLIDA 88,2 54,7** 60,9 73,9 70,2
ne che, al pari, costringe a un’analisi
accurata. .IT 90,1** 88,8** 71,4** 67,2 87,6
Alla domanda, dunque, se si diano item
sotto- o sovracalibrati, la risposta è af- Tab. 5. Mappa della criticità.
fermativa. Abbiamo, in effetti:
›› due item sovracalibrati nella prova CELI CILS PLIDA .IT
CELI Distrattore parzialmente vero 1, 2, 4
›› due item orientati in maniera oppo-
Assenza di una chiave 3 3
sta nella prova CILS, uno sotto- e uno
sovracalibrato Ambiguità della chiave 2
›› un item sottocalibrato nella prova Ambiguità del testo di riferimento 1
PLIDA
Risalto dalla chiave 6
›› tre item sottocalibrati nella prova .IT
Dipendenza tra gli item 2 2
In alcuni casi, come avremo modo di ap- Inadeguata distribuzione tra gli item 7 1
purare, i casi di sotto- e sovradimensio-
namento si spiegano per via di problemi
legati alla confezione degli item stessi.
Ancora una volta, la prova PLIDA pare
2.3. La qualità degli item essere la meno approssimativa, mentre la
La tab. 4 riprende la tab. 3: riportiamo prova CILS comporta il numero maggiore
ancora una volta gli FV dei singoli item. di criticità.
In aggiunta, rappresentiamo con un dop- Nella tab. 5 illustriamo i tipi di criticità.
pio asterisco ed evidenziati in grassetto I numeri riportati fanno riferimento ai
i casi di cattiva fattura degli item. Come singoli item delle prove (es. il numero
anticipato, in alcuni frangenti, l’errato 3 riferito alla prova CILS rappresenta il
dimensionamento è attribuibile a una terzo item dell’esercizio).
scrittura poco sorvegliata dei quesiti. Illustriamo a seguire la natura delle cri-
In sintesi, più casi richiederebbero una ticità:
riformulazione dei quesiti e un conse- ›› Distrattore parzialmente vero: si tratta
guente riadattamento delle prove: di un distrattore che, per via inferenzia-
›› CELI, tre casi: item ## 1,2,4 le, può essere colto come possibile – non
›› CILS, cinque casi: item ## 1,2,3,6,7 è cioè totalmente smentito dal testo.
›› PLIDA, un caso: item # 2 ›› Assenza di una chiave: nessuna tra le
›› .IT, tre casi: item ## 1,2,3 opzioni presentate dal certificatore è

2|2016 tema BABYLONIA | 27


perfettamente sovrapponibile alle in- facile la sua individuazione da parte
formazioni veicolate dal testo; di con- del candidato.
seguenza non vi è una risposta corretta. ›› Dipendenza tra gli item: si può rispon-
›› Ambiguità della chiave: la chiave è for- dere a un item attraverso la presa vi-
mulata in maniera tale da ammettere sione di un item precedente o di uno
margini di interpretazione. successivo.
›› Ambiguità del testo di riferimento: il te- ›› Inadeguata distribuzione degli item: gli
sto presenta aspetti di incoerenza logica item rimandano a informazioni troppo
(contraddizioni) o tematica (annuncia ravvicinate tra loro, se non addirittura
tratterà un certo argomento, ma passa ‘incastrate’ l’una nell’altra; oppure l’or-
a trattare tutt’altro). dine degli item non rispetta la progres-
›› Risalto della chiave: la chiave si distin- sione delle informazioni presenti nel
gue graficamente dai distrattori perché testo, o infine gli item si riferiscono a
Fig. 2. Osservazioni critiche più lunga e/o più elaborata; è quindi informazioni trasmesse nei primi se-
di una parte del campione

28 | BABYLONIA tema 2|2016


Per la prova .IT:
›› La difficoltà a capire il parlato di una
condi del brano, sicché l’ascoltatore fa delle donne intervistate
fatica a individuarle. ›› L’incomprensione della parola-chiave
“bambole”
Per il lettore interessato a una disamina ›› La predittività delle risposte (“rispo-
attenta, caso per caso, rimandiamo alla ste troppo logiche”), anch’esso fattore di
versione estesa online di questo nostro invalidità, in quanto a variabile esterna
articolo, sul sito della rivista. ›› Difetti di layout (non è chiaro che
l’item 0 costituisca un esempio). Bibliografia
2.4. Il feedback del campione
Mentre i dati ottenuti tramite la scala 3. Conclusioni Cardillo, G., Menzinger, C. & Vecchio, P.
Likert circa il grado di preferenza non Nel nostro studio abbiamo analizzato pro- (ed.) (2015). Livello B1 PLIDA. Quaderno delle
risultano significativi, data la dispersione ve di ascolto di livello B2 (nella forma del specifiche. Roma: Società Dante Alighieri.
delle risposte, i commenti critici alle pro- quesito a scelta multipla), tratte dalle cer- http://plida.it/certificazione-plida/documenti.
ve (fig. 2) ci illuminano su aspetti sfuggiti tificazioni di italiano LS. Sono emerse dif- html (consultazione: 18.01.2016)
all’indagine, oltre a ribadire questioni già ficoltà di vario tipo, legate in particolare
trattate durante l’analisi degli item. In alla confezione degli item. Le differenze Douglas, D. (2011). Understanding Language
particolare, quali punti finora non trattati, in merito sono abbastanza rilevanti; ciò Teaching. Londra: Hodden.
rileviamo: significa che gli esiti che un candidato
ipotetico avrebbe potuto raggiungere – Green, R. (2013). Statistical analyses for
Per la prova CELI nell’ambito della valutazione dell’abilità language teachers. Basingtoke: Palgrave
›› Il disagio provocato dalla musica di di ascolto, a un livello B2 – sarebbero MacMillan.
sottofondo, che, oltre ad essere presente potuti variare se costui si fosse sottoposto
negli stacchi si sovrappone spesso al alla prova di una certificazione piuttosto Novello, A. (2014). La valutazione delle lingue
parlato; per alcuni, la musica catalizza che a quella di un’altra. straniere e seconde nella scuola. Dalla teoria
l’attenzione (“se sento la musica non mi Lo scopo di questo contributo non è, co- alla pratica. Venezia: Edizioni Ca’ Foscari.
concentro più sulle parole”) munque, quelli di auspicare prove ‘perfet-
te’, dall’oggettività assoluta, assodato del Sitografia
Per la prova CILS resto che ogni misurazione delle abilità
›› La generale complessità del testo linguistiche equivale pur sempre a un’i- Prova ascolto B2 CELI
(denso, lungo, intricato, con velocità di stantanea sfocata e parziale (Douglas, http://www.cvcl.it/categorie/categoria-104
eloquio eccessiva) 2011); piuttosto è quello di stimolare a (consultazione: 18.01.2016)
›› La lunghezza degli item e la com- un maggiore impegno, affinché i margini
plessità, in particolare, di alcuni. Ciò di approssimazione si possano ridurre. Prova ascolto B2 CILS
costituisce un fattore di invalidità, data Va precisato, in ogni caso, che poiché http://cils.unistrasi.it/89/198/Prove_Liv._
la presenza di una variabile esterna ri- l’analisi è limitata a una singola prova e B2.htm (consultazione: 18.01.2016)
spetto al costrutto (construct-irrelevant dato il numero ristretto di item, lo studio
variance): la lettura, cioè, rispetto all’a- non è rappresentativo, non consente cioè Prova ascolto B2 PLIDA (vecchio formato)
scolto di formulare un giudizio in generale sul http://plida.it/certificazione-plida/che-cos-
›› L’incomprensione della parola-chiave modo con cui le singole certificazioni va- e-la-certificazione-plida/esempi-di-prove-
“sostenibile” lutano la comprensione orale a livello B2. d-esame/esempi-sessioni-esame-plida.html
Ciò che emerge ha, altrimenti, un valore (consultazione: 18.01.2016)
Per la prova PLIDA: circoscrivibile ai soli dati a disposizione.
›› La lentezza del monologo L’impianto metodologico dell’indagine Prova ascolto B2 .IT
›› La qualità della voce può valere comunque da riferimento per http://www.certificazioneitaliano.uniroma3.it/
›› La densità delle informazioni analisi più estese. B2-intIT.aspx (consultazione: 18.01.2016)

2|2016 tema BABYLONIA | 29

Potrebbero piacerti anche