Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Jacques Lautrey
I test di intelligenza
Il Mulino
Universale Paperbacks
M ICLIEL UTEAU
JACQUES LAUTREY
I TEST DI INTELLIGENZA
http://www.mulino.it
IL MULINO
Conclusioni
Letture consigliate
Riferimenti bibliografici
p. 111
PRESENTAZIONE
119
193
La definizione e la conseguente misurazione dell'intelligenza sono stati certamente tra i temi della psicologia che
hanno suscitato maggiore dibattito, in ambito sia nazionale sia
internazionale. Tra le ragioni di tale dibattito vi senza dubbio la difficolt a fornire dell'intelligenza una definizione univoca e condivisa e a sviluppare modelli teorici stilla sua natura
e sul suo funzionamento; questa confusione a livello teorico ha
fatto s clic per lungo tempo le pratiche di misurazione dell'intelligenza abbiano tratto sostegno e fondamento da validazioni empiriche, quale ad esempio l'efficacia con cui possibile discriminare soggetti normali da soggetti mentali deboli.
Il successo dei test di intelligenza e il loro contributo all'analisi psicologica comunque indiscutibile. I test di intelligenza
sono oggi impiegati, anche in Italia, nell'ambito clinico (soprattutto a fini diagnostici), ma anche in quelli scolastico o educativo (a scopo di orientamento o per valutare l'opportunit di
un insegnamento di sostegno) e del lavoro (ad esempio, nella
selezione del personale). Le implicazioni sociali e politiche del
loro impiego sono quindi particolarmente profonde e riguardano aspetti quali, ad esempio, la realizzazione professionale
del singolo individuo, l'efficienza del sistema scolastico o la
produttivit di un'azienda.
Una delle ragioni che ci ha indotto a proporre al lettore italiano questo libro, opportunamente adattato, il presente testo
che esso offre informazioni puntuali sui test di intelligenza
pi frequentemente utilizzati: ne esemplifica le domande pi
significative, le caratteristiche psicometriche, ne discute l'interpretazione dei risultati e ne analizza le implicazioni. Non si
limita comunque solo a questo arduo e meticoloso compito.
Vengono infatti anche riportati i principali riferimenti storici
alla nascita e all'evoluzione degli strumenti di misura dell'intelligenza. Il lettore viene cos condotto attraverso le fasi: 1) di
7
costruzione dei test come risposte alle necessit sociali, educative e cliniche di un'epoca, 2) di critica e loro successiva revisione, 3) cli analisi e sviluppo delle implicazioni etiche e deontologiche relative al loro utilizzo. La prospettiva da cui questi
argomenti vengono presentati quella di due eminenti studiosi
francesi che da diversi anni si occupano di misure dell'intelligenza e delle problematiche connesse, e che intrattengono significative collaborazioni scientifiche con il nostro gruppo di
ricerca. 11 loro interesse e la loro sensibilit a questi temi sono
per natura molto vicini a quelli sviluppatisi nel nostro paese e
se vogliamo, pi in generale, in Europa e si differenziano dall'approccio americano che di gran lunga pi interessato ad
aspetti numerici e psicometrici del testing.
CESARE CORNOEDI - PAOLA PALLADINO
PREFAZIONE
CAPITOLO PRIMO
ligenza nella specie umana. E questa la ragione per cui approfitt della Mostra internazionale della salute a Londra, nel
1884, per fondare un laboratorio antropometrico n cui i visitatori potevano farsi misurare, sia in relazione a variabili
antropometriche (misure del corpo umano e delle sue diverse
parti) sia rispetto alle piccole prove che Cattell qualificher pi
tardi come mental test. Galton misurava genitori e figli con l'obiettivo di mostrare che le differenze individuali sono ereditate
da una generazione all'altra; questo lo indurr a introdurre il
principio del coefficiente di correlazione per quantificare la relazione che lega le misure effettuate sui genitori a quelle effettuate sui figli.
1/ sviluppo dell'intel-
ligenza
e uno psicologo francese, Al fred Binet (1857-1911), che
trover la soluzione del problema. Binet era uno spirito curioso
che aveva tra i suoi molteplici interessi la misura dell'intelli13
genza. Una delle piste che egli esplor fu la ricerca di una relazione tra le misure del cranio, considerate misure indirette
della dimensione del cervello, e l'intelligenza. L'insuccesso dei
primi tentativi gli diede l'idea di rovesciare il problema e confrontare bambini normali a bambini ritardati. Egli chiese
quindi a Thodore Simon, che in quel periodo, 1899, lavorava
in un istituto per bambini ritardati a Perray-Vaucluse, di estendere le misure del cranio a bambini diagnosticati appunto
come ritardati mentali. Ma, una volta ancora, la ricerca si scontr con l'assenza di mezzi di valutazione obiettivi e affidabili
del grado di ritardo mentale dei soggetti esaminati. Binet e Simon cominciarono allora a sottoporre i bambini ad un esame
sistematico per valutare le loro capacit intellettive.
Binet conosceva l'esistenza dei mentai tests messi a punto
da Cattell, ma aveva espresso gi da diversi anni il suo disaccordo con questa modalit di affrontare il problema. Egli riteneva che le differenze individuali nei processi sensoriali elementari avessero scarsa influenza sui processi mentali complessi
e che le differenze nella capacit intellettiva dovessero essere
cercate nelle abilit di memoria, di immaginazione, di ragionamento, di giudizio. Questa convinzione, che ha giocato un ruolo
determinante, andava contro le tesi associazioniste, e -lo condusse ad abbandonare le caratteristiche individuali, che si era
in grado di misurare, per rivolgersi a caratteristiche pi complesse, ma anche pi problematiche, che non si sapeva misurare.
Invece di paragonare le soglie di discriminazione sensoriale
dei bambini ritardati con quelle dei bambini normali, Binet e
Simon sottoposero loro piccoli problemi di memoria, di giudizio scegliendo poi quegli item che separavano pi nettamente
i soggetti dei due gruppi (si chiamano item le diverse domande
o i diversi piccoli problemi, in genere di difficolt graduata, che
compongono un test e nei quali il soggetto pu riuscire o fallire).
La spinta a procedere in questo lavoro verr dalla domanda
sociale. Nel 1904, una commissione ministeriale chiese a Binet
di studiare il problema della diaemosi del ritardo mentale. Bine': e Simon proposero allora nelle
b scuole le prove che avevano
cominciato a mettere a punto. Si accorsero che alcuni item che
ben discriminano i bambini ritardati da quelli normali avevano
anche un buon potere di discriminazione all'interno del
14
FIG. L Una delle tre fotografie mostrate ai bambini nella scala (li 13inedSimon.
sti adattamenti quello fatto da Termali all'Universit di Statiford nel 1916. Da allora, la Stanford-13inet stata pi volte
rivista ed tuttora utilizzata negli Stati Uniti. In Francia, invece, fu solo nel. 1966 che la scala metrica di Binet e Simon
venne revisionata sotto la direzione di Ren Zazzo per diventare la nuova scala metrica dell'intelligenza.
1.1 primo aspetto di novit che ha permesso a Binet di far
uscire il problema dell'intelligenza dall'Impasse in cui si trovava
alla fine del XIX secolo stato di aver capito che la valutazione
doveva riguardare processi mentali complessi. Questa prima
idea, tuttavia, non era ancora sufficiente, poich a quell'epoca
si era in grado di valutare solamente i processi sensoriali elementari. Un ulteriore apporto originale di. Binet stato di aver
compreso clic la possibilit di ordinare gli itero in funzione dell'et in cui questi ultimi vengano superati poteva costituire un
primo livello di misura della loro complessit cognitiva. Da
questa possibilit di ordinare gli itero discendeva la possibilit
di ordinare allo stesso modo anche i soggetti, compresi quelli
della stessa et cronologica, in funzione del loro livello di riuscita al test. Spesso, nella ricerca, non basta avere delle idee
nuove, ma bisogna anche saper abbandonare le vecchie che
non funzionano. Si pu notare che, da quando Binet si avvi sulla strada della scala metrica dell'intelligenza, egli abbandon quella della misura del cranio che non aveva prodotto
nulla di interessante fino a quel momento e che neanche in seguito si rivel produttiva.
fattoriale
I\RYIA. al.
LAPITOLO PRIMO
Teniamo a precisare che non siamo esperti in quest'ambito e c i tiest'anlisi a priori dei fattori in gioco in prove di atletica forse scorretta. ll solo
interesse di questo eseinpio nelle sue ipotizzare virt pedagogiche.
CAPITOLO SECONDO
CI IE COSt UN TEST?
77
23
la
1
q ri
111
24
25
Si passa poi alla seconda serie di item. Le istruzioni precisano che si tratta del test vero e proprio, che i problemi da
risolvere sono simili a quelli della prima serie, che la loro difficolt cresce pi lentamente, e che preferibile affrontarli
nell'ordine con cui vengono proposti. Se la prova applicata
con un tempo limitato, il soggetto ha a disposizione quaranta
minuti (vedi fig. 4, item 19 della versione del 1962 che un
item di difficolt media). Il punteggio del soggetto al test
(punteggio grezzo) dato dal numero di problemi superati.
19
9 6
pu ritenere che la situazione e le consegne siano standardizzate. Ma la correzione generalmente non lo (uno sforzo comunque viene compiuto n questo senso con l'introduzione di
una scala di punteggio di riferimento). Le differenze tra studenti sono quindi ambigue. I lavori di docimologia hanno regolarmente mostrato da pi di sessant'anni [cfr. de Landsheere
1992] che queste differenze sono attribuibili in parte a variabili che ancora oggi si sottostimano, quali la severit dei correttori, l'utilizzo vario che si fa delle scale di valutazione (alcuni, ad esempio, danno voti compresi tra 2 e 10, mentre altri
tra 4 e 8), o ancora al fatto che non c' unanimit nel definire
l'importanza degli obiettivi educativi e la loro gerarchia.
Se la standardizzazione consente una valutazione oggettiva,
bisogna tuttavia notare che conduce spesso ad un impoverimento del campo di osservazione: facile da applicare alla valutazione delle prestazioni ma non sempre un indice di pertinenza odi validit. La standardizzazione della situazione e
delle consegne non riduce necessariamente il repertorio comportamentale dei soggetti. Se la situazione debolmente strutturata e la condotta poco finalizzata, i soggetti sono spinti a
produrre risposte diversificate. Succede questo, ad esempio,
nei test detti di creativit in cui si richiede di immaginare tutti
i possibili utilizzi di un oggetto come un mattone o una scatola.
Ma, molto spesso, la standardizzazione tale da consentire al
soggetto di manifestare solo un numero limitato di comportamenti (risposte), e precisamente quelli che la valutazione
prende in considerazione. Ma ritorniamo al test di Raven. La
situazione tale da richiedere essenzialmente di osservare la
scelta di una delle Otto figure proposte. In effetti, sono possibili altre osservazioni: tra i fallimenti si possono distinguere gli
errori dalle omissioni, ci si pu domandare come si collocano
i fallimenti sulla base del grado di difficolt degli item, interrogarsi sulla natura degli errori, ecc. Ma ci non toglie che la
situazione poco favorevole alla comparsa di comportarnenti.
differenziati.
In teoria, ogni fenomeno psichico che si manifesta attraverso un comportamento pu essere l'oggetto di un'osservazione standardizzata. Questa osservazione pu essere provocata e assumere delle forme complesse. Si sono cos messe a
punto delle procedure standardizzate d indagine che consentono eventualmente di far emergere certi comportamenti che
28
Il test deve consentire di differenziare gli individui, sia separandoli in classi differenti non ordinate, sia, quello che pi
spesso accade, collocandoli gli uni in relazione agli altri su un
C0116171111171 (una dimensione). Noi ci interesseremo al caso in
cui ci si propone di collocarli su un continuum. Al fine di differenziare sensibilmente gli individui, opportuno avere a disposizione item di livelli diversi di difficolt. L'itero tanto pi
difficile, per i soggetti di un gruppo, quanto pi la sua probabilit di essere superato in questo gruppo debole. Gli item
troppo facili (superati da quasi tutti) o troppo difficili (quasi
tutti falliscono) non contribuiscono alla differenziazione degli
individui. Ecco alcuni dati sul livello di difficolt degli item del
test di Raven: sono stati raccolti su un campione di pi di un
migliaio di adolescenti tedeschi di 15 anni, scolarizzati. Nella
serie I, la percentuale di successo agli item varia dal 93% (item
29
La correlazione item-test
Una volta che il test stato applicato, ogni soggetto caratterizzato da un punteggio per ogni item (1 o 0) e da un punteggio totale (al massimo 12 punti per la serie I e 36 per la serie II). Se un item richiede la stessa abilit dell'insieme degli altri item, il punteggio a quell'item dovr essere in correlazione
con quello del test. In altre parole, il successo nell'acni dovr
essere pi frequente per quelli che hanno punteggi elevati al
test. Il grafico di correlazione per un item della serie I presentato nella tabella 1. Vediamo, per il test di Raven, le correlazioni item-test calcolate sul campione di adolescenti tedeschi.
Per la serie I, i coefficienti di correlazione item-test variano da
30
AB.
Diagnnumd ch correlazione
A latrici Progressive (serie I)
0
Punteggio
all'iterar (r)
l
1
5 6
3 5
12
9 10 11 12
12 16 12 .5
4
2 60
40
0,41 a 0,60 1 . Per la serie Il variano da 0,11 a 0,61. Si pu notare che tutti i coefficienti di correlazione item-test sono positivi e che quelli deboli sono poco numerosi (su 36 coefficienti
della serie 7 sono inferiori a 0,30). Per l'item n. 10 della serie I (fig. 3), la correlazione item-test 0,51 e per l'item n. 19
della serie II (fig. 4) di 0,43.
Le distribuzioni di frequenza dei punteggi agli itero forniscono nello stesso tempo informazioni sul grado di difficolt
degli item e sulla loro relazione con il punteggio della scala. Per
costruire queste curve si riporta il punteggio della scala in
ascissa e, in ordinata, per ogni valore della scala, la percentuale
di soggetti che hanno superato l'item. Nella figura 5 si possono
vedere le curve corrispondenti ai 12 item della serie. .L'itero numero 10, ad esempio (rappresentato dalla curva numero 1.0),
stato superato da circa il 30% dei soggetti che hanno avuto al
test un punteggio globale di 6 e da circa il 75% di coloro che
hanno avuto un punteggio globale di 8. Le curve pi soddisfacenti sono quelle per cui si pu osservare una progressione
regolare passando da punteggi della scala bassi a punteggi via
via pi alti. 'Esse mostrano che l'acni contribuisce alla differenziazione dei soggetti e che l'abilit valutata dall'i tem prossima a quella valutata dall'intero test. Al momento della costruzione del test e della sua revisione del 1962, gli acni sono
31
3.1. I quantili
100
75 Percentuale
di successo
per
0
5
ogni item
25
O
Pinteggio totale
FIG. 5. Distribuzioni di frequenza dei 12 item della serie l delle Matrici Progressive.
stati selezionati sulla base dell'esame delle distribuzioni di frequenza dei punteggi.
Ci sono altri modi per valutare l'unidimensionalit della
scala: ad esempio, verificare che tutte le intercorrelazioni tra gli
item siano forti o verificare che il superamento di un item di un
certo livello di difficolt implichi il superamento degli item di
difficolt inferiore.
3.
Scale di punteggio
TAB. 2 Divtrikinzione in ceratili della serie TI (1962) delle Matrici Progres5ive (Id'ella
23
24
25
Percentile
3
4
6
7
il
14
18
24
29
37
Punteggio
grezzo
Perenni ile
26
27
28
29
30
31
43
52
'57
65
71
81
86
89
93
98
100
32
33
34
35
36
L' l% degli studenti ha un punteggio grezzo minore o uguale a 13. 113 % degli studenti ha un punteggio grezzo minore o uguale a 15, ecc. Questa distribuzione consente di collocare un soggetto qualsiasi in rapporto agli studenti americani dell'Universit di Berkeley Supponiamo che nn soggetto abbia ottenuto un punteggio di 25.
1:8%, degli studenti americani ha ottenuto questo punteggio (37-29), il 299 lin avum
punteggi inferiori e il 6.30 (100-37) ponteggi superiori. Questo soggetto si situa
quindi in prossimit dei due terzi della distribuzione degli studenti americani.
33
38,)%
24,2%
24,2%
6,7%
-3/2
38,2%
24,2%
6, 7 %
Nella tabella 3 si pu osservare un esempio di scala in 5 categorie normalizzate della serie II (versione del 1947) del test
di Raven somministrato con un tempo massimo di quaranta minuti ad un campione francese con alto livello di scolarit.
- La scelta di un tipo di scala guidata da ragioni di comodit. Se si vogliono differenziare i soggetti con precisione, si
sceglier una scala composta di numerose categorie. General-
6,7
-1/2
1/2
3 '2
Categorie
normalizzate
24,2%
Punteggi
grezzi
4 I e oltre
36.10
3
32-35
27-3
26 e meno
35
mente, si considera pi facile distinguere i soggetti alle estremit della distribuzione piuttosto che verso il suo centro dove
essi sono prossimi alla media. Ci induce a preferire a quantili le distribuzioni normalizzate nelle quali le frequenze sono
pi numerose nelle classi centrali che in quelle estreme. A fini
pratici, sempre utile disporre di scale relative a diversi gruppi
di riferimento.
Le scale di punteggio consentono anche confronti intraindividuali. Se un soggetto si mostra migliore in una prova verbale piuttosto che in una prova di ragionamento, si pu dire
che la sua capacit verbale superiore alla sua capacit di ragionamento. I confronti intraindividuali sono facilitati dalla costruzione di profili. Un esempio di profilo presentato nella figura 8.
2
Test verbale
'l'est numerico
Test spaziale
FIG. 8. Profilo psicologico di un soggetto a partire dai punteggi standardizzati (scala
normalizzata in cinque categorie) ai tre test.
c ceni/li
(:ertili
130
125
120
115
110
105
100
25
37
50
95
63
90
-75
85
80
84
91
75
95
70
98
.38
4. (71i errori di
verr considerata stabile, minimamente influenzata dal momento di osservazione. In caso contrario, se l coefficiente di
correlazione debole, la misura poco stabile e non ci consente di classificare il soggetto in modo affidabile. La tabella 5
mostra una tavola di correlazione che corrisponde ad un coefficiente di fedelt di 0,61.
I coefficienti di fedelt dei test di intelligenza, calcolati ad
intervalli di diverse settimane o di diversi mesi, sono sempre
elevati. Le Matrici :Progressive di Raven, applicate ad adolescenti o ad adulti, ha una stabilit di 0,90. Un tale coefficiente
indica che i soggetti si collocano praticamente a livelli identici
ad ognuna delle somministrazioni e dunque che l'errore attribuibile al momento dell'applicazione irrilevante.
TAB. 5. Tavola di correlazione Ira la prima e la seconda somministrazione di un lesi
Seconda
Sommi.
Prima somministrazione
80-8,1
85-89
70-74
75-79
105-109
1(10-104
92-99
C)
90.94
60-64
65-69
90-94
95-99
120-124
115-119
110-114
85-89
80-84
4
1
85 soggetti hanno fatto un test in due momenti. Dei 3 soggetti che hanno ottenuto
un punteggio compreso tra 60 e 64 alla prima somministrazione, uno ha ottenuto un
punteggio compreso tra 85 e 89 alla seconda, un altro un punteggio compreso tra 90
e 94 e un terzo un punteggio compreso tra 95 e 99. Coloro clic hanno ottenuto un
punteggio elevato alla prima somministrazione hanno tendenza a ottenere un punteggio elevato anche alla seconda. La correlazione positiva e moderata (0,61). Si
nota un effetto di apprendimento: il punteggio medio alla seconda pi elevato che
alla prima.
4.2.
L'equivalenza e l'omogeneit
gionamento induttivo, Raven ha scelto innanzitutto dei problemi con matrici da completare e poi ha dato loro una forma
particolare. Questi due tipi di scelta non hanno lo stesso valore. La scelta di una categoria d situazioni in relazione con
il grado di generalit della dimensione lungo la quale si ordinano i soggetti. Esiste una dimensione generale di ragionamento induttivo, ovvero una capacit che opererebbe non
soltanto nei test di matrici, ma anche, ad esempio, nella ricerca di leggi di trasformazione in serie di lettere o di cifre,
o su contenuti significativi? O, al contrario, bisogna distinguere dimensioni diverse, ad esempio, una che riguarda l'abilit di ragionamento induttivo con problemi di matrici, e
l'altra che riguarda la capacit di ragionamento induttivo su
serie di cifre? Riprenderemo questi quesiti nella discussione
sulla validit teorica. Una volta scelta una categoria di situazioni, rimane da dare un contenuto ad ogni problema. La lista dei contenuti possibili quasi infinita e la scelta di certuni invece di altri sempre molto arbitraria. Problemi differenti da quelli scelti da Raven sarebbero apparentemente
andati bene, anche se non del tutto certo. Ci si deve quindi
domandare in che misura il punteggio di un soggetto non
influenzato dal carattere specifico delle situazioni problema
propostegli.
Per valutare il peso di questi errori rispetto alla situazione,
si possono costruire delle forme parallele dello stesso test, ovvero diversi test destinati a valutare la stessa abilit e relativi
allo stesso tipo di situazioni, ma realizzati in modo diverso. Se
si intende, ad esempio, valutare l'estensione del vocabolario in
situazioni di produzione di definizioni, si possono costituire
diverse liste di parole da definire, simili per alcuni aspetti (la
frequenza d'uso, il carattere pi o meno astratto, ecc.) ma diverse per altri. Il coefficiente di correlazione tra due forme
parallele, o coefficiente di equivalenza, ci indicher in che misura le osservazioni sono fedeli rispetto alla scelta delle situazioni. Un coefficiente elevato indica che i soggetti si classificano allo stesso modo n ogni prova, e quindi che gli errori riferibili alla scelta della situazione sono trascurabili. Un coefficiente debole indicher che la classificazione dei soggetti varia al variare del contenuto delle situazioni. Poich questa variazione non n prevedibile n spiegabile, il significato delle
due prove quindi ambiguo.
41
A fini pratici, i test sono utilizzati come strumenti diagnostici o prognostici e sono validi se contribuiscono effettivamente a diagnosi che si riveleranno esatte o a buoni pronostici.
In quanto strumenti di diagnosi, essi possono favorire, ad
esempio, una migliore c
omprensione dell'origine di certe difficolt scolastiche o di certi disturbi del c
omportamento, e
quindi dei rimedi pi adeguati. Si dir ad esempio che
un test
di tipo spaziale valido se, essendo in correlazione con delle
42
al criterio. Lo scarto medio tra questo punteggio medio e i punteggi effettivamente osservati una misura della precisione del
pronostico (vedi tab. 6).
TAB. 6. Tavola di correlazione Ira test e criterio
Punteggi
al criterio
Punteggi al test
0-2
3-5
6-8
9-11
12-11
15-1.7
18-20
21-23
7
5
li
10
8
3
7
6
4
2
113 soggetti sono caratterizzati dal loro punteggio al test e dal loro punteggio al criterio, ad esempio il voto ad un esame. (Di 6 soggetti che hanno avuto un pun teggio conipreso tra 0 e 2 al test, 3 hanno avuto un punteggio di 2 al criterio, 1 un punteggio di 3
e 2 un punteggio di 4.) La correlazione tra il test e il criterio di 0,65. Quale voto, ad
esempio, si pu predire al criterio per i 25 soggetti che hanno un punteggio compreso
tra 12 e 14 al test? Si porrebbe predire il voto ottenuto pii) frequentemente nel corso
degli studi in questione (qui il voto 5 ottenuto da 9 soggetti). Si mostra clic, in generale,
con distribuzioni dei voti al criterio, per un voto dato al predittore, la predizione della
media di queste distribuzioni quella che minimizza gli errori di pronostico. Nell'esempio scelto cos il voto 5. Pcr misurare l'importanza dell'errore di previsione, si pu
calcolare lo scarto medio tra il punteggio pronosticato e il punteggio ottenuto nel corso
degli studi. Nell'esempio scelto lo scarto medio diI,1 pomi.
5.2.
21,9
Scienze
25,1
Ingegneria
Giurisprudenza
25,6
20,8
Medicina
24,1
Odontoiatria
22,1
Agraria
Economia e commercio
24,1
22,3
La validit teorica
test e quelle descritte dai modelli di funzionamento del soggetto. Illustriamo queste nozioni riprendendo la prova delle
matrici progressive.
Abbiamo gi fatto riferimento nel primo capitolo alla teoria dell'organizzazione delle differenze individuali nell'ambito
verbo-concettuale di Horn e Cattell 11966; cfr. L'ideati 19901.
Questa teoria individua alcune grandi abilit o fattori: l'intelligenza cristallizzata, data dalle conoscenze di cui dispongono i soggetti e dalla loro organizzazione (si manifesta particolarmente con la comprensione verbale); l'intelligenza fluida,
che la capacit di mettere in atto i meccanismi di base del
ragionamento in situazioni in cui le conoscenze di base sono
poco importanti; la visualizzazione, che la capacit di rappresentarsi e di trasformare visivamen t e gli oggetti; la creativit o capacit di produrre associazioni di parole o idee originali; e, infine, una capacit a reagire velocemente (velocit di
reazione). Queste differenti abilit non sono poi completamente indipendenti, poich, a partire dalle loro intercorrelazioni, possibile definire una capacit cognitiva generale (o
un fattore generale) vicino all'intelligenza fluida. Quando Raven ha messo a punto il suo test, voleva espressamente costruire una prova di capacit generale e, come Spearman, pensava che il miglior mezzo per raggiungere questo obiettivo
fosse di scegliere delle situazioni che consentissero di distinguere gli individui sulla base della loro abilit a scoprire e applicare delle relazioni (cio, utilizzando un vocabolario successivo alla costruzione del test, sulla base della loro intelligenza fluida). Ci si deve allora domandare se le Matrici Progressive siano appunto un test di capacit generale e di intelligenza fluida. Dato che i soggetti si classificano praticamente
allo stesso modo al test di Raven e all'insieme dei test di intelligenza fortemente saturati dal fattore generale, si pu rispondere affermativamente a questa domanda.
Per giudicare la validit teorica al test di Raven in una prospettiva funzionale, ci si deve riferire alle teorie sul ragionamento induttivo. Consideriamo la teoria proposta da Sternberg 11977; Sternberg e Gardner 1982; cfr. Huteau 1985;
1995; Lautrey 19951 Questa teoria scompone il ragionamento
induttivo in una sequenza di operazioni intellettive o di componenti elementari che si articolano all'interno di componenti
cli livello gerarchico superordinato o metacomponenti. Tra
46
le componenti elementari troviamo la costruzione di una rappresentazione analitica degli elementi di una situazione (codifica), la definizione di relazioni tra gli elementi (inferenza), la
generalizzazione di queste relazioni (analogia) e la loro utilizzazione per generare nuovi elementi (applicazione).
Nell'item delle Matrici Progressive riportato nella figura
4, ad esempio, la componente di codifica l'operazione con
cui i diversi attributi delle figure vengono identificati e fissati
in memoria (grande quadrato, piccolo quadrato, croce, cerchio...). La componente di inferenza l'operazione con cui la
regola di trasformazione delle figure viene scoperta confrontando tra loro gli attributi di ognuna; nella prima colonna questa operazione di confronto porta a scoprire che la terza figura
si ottiene sommando la croce della seconda nel piccolo quadrato della prima; nella seconda colonna l'inferenza consente
di cogliere che la terza figura ottenuta aggiungendo il cerchio della seconda alla croce della prima. La componente di
analogia quella che viene messa in gioco nel confronto tra la
trasformazione della prima colonna e quella della seconda;
essa porta ad astrarre le caratteristiche comuni alle due regole
e a comprendere che le prime due figure si sommano per generare la terza. L'applicazione l'operazione con la quale la
regola che stata astratta con l'inferenza e l'analogia viene applicata alla terza colonna per scoprire la figura mancante. Qui,
la somma delle prime due figure porta ad anticipare la figura
mancante aggiungendo la croce con il piccolo cerchio della seconda figura nel piccolo quadrato della prima (senza che la
croce appaia nel quadrato grande). L'ultima operazione, la
scelta della risposta, consiste nel cercare, tra le differenti figure proposte al di sotto dell'item, quella che corrisponde alla
risposta gi anticipata. Le metacomponenti sono le operazioni
con le quali queste differenti componenti elementari sono ordinate e controllate. Una di queste metacomponenti, ad esempio, ha la funzione di modificare la distribuzione delle risorse
cognitive (attenzione, tempo) tra le diverse componenti elementari in funzione degli ostacoli incontrati. Una strategia, ad
esempio, pu essere quella di passare all'inferenza non appena
viene individuata una differenza tra le figure della prima colonna; un'altra potrebbe essere di dedicare pi tempo e risorse
ad una codifica esaustiva prima di passare all'inferenza. La
messa in atto efficace di queste componenti elementari e me47
di soluzione. A partire dai principi di soluzione messi n evidenza da queste analisi, gli autori hanno elaborato un programma informatico che simula in modo soddisfacente i comportamenti osservati nei soggetti reali. Ad esempio, l'ordine di
complessit degli item, cos come definito dalla simulazione,
coincide con l'ordine di difficolt determinato dalle frequenze
d successo degli item reali. Essi mostrano inoltre clic quest'analisi dei processi di soluzione si applica a tutta una classe
di processi di ragionamento.
In sintesi, un test una situazione di valutazione codificata. Innanzitutto, questa situazione standardizzata per migliorare l'oggettivit dell'osservazione effettuata: le risposte e
in generale i comportamenti dei soggetti non potranno essere
adeguatamente confrontati, a meno che non vengano ottenuti
in situazioni il pi possibile somiglianti e la loro valutazione
sia la stessa indipendentemente dall'osservatore. Questa situazione di valutazione classificata anche in modo da collocare il soggetto osservato all'interno della popolazione d riferimento a cui appartiene. L'affidabilit della valutazione effettuata pu essere espressa con differenti coefficienti di fedelt. Infine, indagini sulla validit sono state condotte per appurare che si valuti proprio ci che il test intende valutare.
Queste propriet dei test sono state presentate riguardo ai
test di intelligenza, ma esse caratterizzano anche i test di personalit (sia che s tratti d autodescrizioni o di osservazioni
del comportamento), i test sulle abilit scolastiche e i test di
attitudine professionale.
49
' Questi valori sono convenzionali, ma mini sono scelti del tutto u caso:
100 per definizione il QI medio di un gruppo di et quando il Q1 definito dal quoziente dell'et mentale e dell'et cronologica, e 15 approssimativamente il valore osservato dalle deviazioni standard delle scale di QIStem (con le fluttuazioni di cui si discusso in precedenza). Scegliendo questi valori piuttosto che altri ci si assicura una certa corrispondenza tra il Q1
individuato con una scala di tipo Wechsler e il QI rilevato con una scala di
tipo Stern. l per questo motivo, del resto criticabile, che si utilizza l termine QI per indicare il punteggio standard totale ottenuto con una scala di
tipo Wechsler.
(AMIDI TERZO
51
o
o
2.3.
L'adattamento della scala alla popolazione italiana ha richiesto nn solo la traduzione del manuale, ma anche l'individuazione, nei subtest pi dipendenti dalla cultura, degli
item equivalenti. Alcune delle domande del subtest di informazioni della versione americana, ad esempio, non sono
adatte alla cultura italiana e sono state sostituite. Inoltre,
stato necessario standardizzare la scala per la popolazione
italiana. L'ultima standardizzazione della versione italiana
della WAIS-R stata fatta su un campione di 11.630 soggetti
adulti rappresentativi della popolazione italiana, suddivisi in
6 gruppi di et da 16 a 64 anni, ogni gruppo composto per
met di maschi e per met di femmine. Questa standardz56
o
oo
.9
'e*
(.5
58
una correlazione tra il punteggio ottenuto al test e questo criterio. IL in questo modo che si sono ottenute correlazioni di
0,40 e 0,50 tra il QI della WAIS-R e il successo scolastico, in
studenti di liceo, di universit o di politecnici. Ma ci si pu comunque domandare se il successo scolastico sia un buon criterio di intelligenza. A rigore, si pu soltanto concludere che
la WAIS-R valuta degli aspetti di intelligenza utili per riuscire
negli studi. Nella ricerca sul ritardo mentale, il QI ottenuto alla
WAIS-R si rivelato un buon predittore della rapidit con la
quale i soggetti potrebbero concludere gli studi e del loro successivo inserimento nel mondo del lavoro.
La validazione teorica consiste nel verificare se i risultati
del test corrispondano alle predizioni fatte sulla base della teoria che ha ispirato la sua costruzione. Abbiamo gi osservato
che Wechsler non aveva una vera e propria teoria dell'intelligenza nel momento in cui mise a punto questa scala, il che limita effettivamente le possibilit di validazione teorica. Egli
riteneva che i differenti subtest mettessero in evidenza una
stessa capacit globale. Se quest'idea corretta, si dovrebbero
ottenere buone correlazioni tra le scale e l'analisi fattoriale di
queste correlazioni dovrebbe consentire di estrarre un fattore
generale di successo. Le analisi fattoriali della WAIS-R hanno
chiaramente mostrato l'esistenza del fattore generale atteso,
che spiega circa il 50% della varianza totale. Esse hanno anche mostrato che una volta estratta la varianza di questo fattore generale, di gran lunga il pi importante, si ottenevano
tre fattori. Il primo raggruppa i subtest di informazioni, di
comprensione, eli vocabolario e di somiglianze; ci significa
che queste quattro prove hanno pi delle altre la tendenza ad
essere superate insieme. Questo primo fattore generalmente
interpretato come un fattore di comprensione verbale. Un secondo fattore che raggruppa le prove di completamento di figure, riordinamento di storie figurate, cubi e ricostruzione di
oggetti, generalmente interpretato come un fattore d organizzazione visuospaziale. Infine, un terzo fattore raggruppa la
prova eli memoria di cifre, quella eli ragionamento aritmetico
e quella del cifrario e viene interpretato come un fattore di resistenza alla distrazione o eli attenzione. L'esistenza di questi
tre fattori relativizza la nozione di capacit generale e legittima
in parte la distinzione che Wechsler aveva introdotto a priori
tra una scala verbale e una scala di performance.
59
TABELLA RIASSUNTIVA
Punteggio Punteggio
grezzo standard
TEST VERBALI
Informazioni
q-1
44-
Memoria
di cifre
Vocabolario
44'
/10
Aritmetica
Comprensione
Somiglianze
Punteggio verbale
TEST DI PERFORMANCE
Completamento
di figure
Riordinamento di
storie figurate
Cubi
Ricostruzionee
di oggetti
Cifrario
9
6
q7
.f5
48
-14
11
49
40
9.1
41
SCALA VERBALE
SCALA iotAil
6'-
402
97
95
99
I punteggi grezzi ai differenti subtest appaiono nella colonna di sinistra. Una tavola di conversione consente (li trasformare questi punteggi grezzi in punteggi standard, che sono
riportati nella colonna di destra. Al punteggio grezzo di 21
nella prova di informazioni, ad esempio, corrisponde un punteggio standard di 12.1 punteggi standard vanno, per ogni subtest, da 1 a 19. Corrispondono ad una suddivisione in 19 categorie della distribuzione normalizzata dei punteggi grezzi osservati nel campione di adulti utilizzato per la standardizzazione del test (sulla nozione di distribuzione normalizzata, cfr.
cap. 2, p. 34). Per ogni subtest la media dei punteggi standard
60
un'inferiorit relativa del Qi verbale rispetto al QI performance pi frequente nei bambini cresciuti n un ambiente socioculturale sfavorevole e anche in coloro che esercitano una
professione che fa poco appello alla comunicazione verbale,
ecc. Il significato di tale risultato pu dunque essere interpretato solo se messo in relazione con altri elementi informativi
ricavati dalla storia del soggetto o da test pi specifici destinati a confermare o sconfermare l'una ci l'altra di queste interpretazioni. L'approccio diagnostico che viene qui descritto
simile a quello del medico che cerca di interpretare un sintomo; la garanzia della diagnosi poggia sulla coerenza che l'interpretazione pu dare ad un insieme di risultati: questo ci
che noi abbiamo definito in precedenza il significato teorico.
La stessa logica pu essere seguita nel confrontare i punteggi ponderati dei differenti subtest. Poich tutti questi punteggi ponderati hanno la stessa media e la stessa deviazione
standard, essi possono essere direttamente confrontati ed
possibile tracciarne un profilo da cui emergano i punti deboli
e i punti di forza dell'efficienza intellettiva del soggetto. Di
nuovo, bisogna innanzitutto assicurarsi che gli scarti che si
cerca di interpretare siano significativi. Nel protocollo del nostro soggetto si nota (vedi fig. 10) un punteggio ponderato particolarmente basso alla prova dei cubi. Nella relativa tavola del
manuale, si pu osservare che con una soglia di rischio del
15% (15% di probabilit di sbagliare), una differenza tra due
punteggi ponderati pu essere considerata significativa a partire da 2,5 punti. C' allora un senso nel cercare un significato
alla scarsa prestazione nella prova dei cubi, in relazione all'efficienza osservata nella maggior parte delle altre prove di
performance. E a questo punto che possono intervenire le osservazioni pi qualitative fatte dallo psicologo durante la somministrazione, relative al modo in cui il soggetto procede nella
prova, il suo metodo, il suo atteggiamento di fronte alle difficolt, ecc., cos come le conoscenze cliniche sul significato di
un deficit specifico in tale prova o in tale gruppo di prove.
Questi aspetti dell'interpretazione dei risultati fanno ampiamente appello all'esperienza clinica e alla competenza professionale dello psicologo. Fanno chiaramente emergere che
un risultato considerato isolatamente, un QI, uno scarto tra
due subtest, non ha di per s alcun significato, ma deve essere
interpretato in funzione di un insieme di altri elementi di in63
Per identificare i fattori comuni ad alcuni dei compiti cognitivi, fattori corrispondenti secondo lui alle abilit mentali
primarie (Primary Mental Abilities, o PMA), Thurstone ha
messo a punto una batteria di una sessantina di test differenti.
Cos come la costruzione delle scale eli intelligenza, la messa
a punto di questa batteria di test stata piuttosto empirica.
64
Qui di seguito sono presentati i cinque test che compongono la batteria intermedia, il cui livello di difficolt adattato
ad un'et compresa tra 11 e 17 anni. Ogni test denominato
sulla base del fattore di cui rappresentativo.
Fattore V significato verbale. Questo test valuta la competenza e la finezza di discriminazione dei significati verbali.
Consiste di 50 item cli difficolt crescente: si propongono una
parola bersaglio e, alla sua destra, 5 parole tra le quali ri65
chiesto di individuare quella con lo stesso significato della parola target. Ad esempio:
Rilucere a) crepitare b) cesellare e) brillare d) dipingere
e) arrugginirsi.
Il tempo concesso di 4 minuti e il punteggio dato dal
numero di risposte corrette realizzate in questo lasso di
tempo.
nel produrre, in un tempo limitato, il maggior numero di parole che cominciano con una lettera data, ad esempio, nello
scrivere in 5 minuti tutte le parole che cominciano per p
che vengono in mente. Il punteggio dato dal numero di parole diverse trovate.
nel verificare che, introducendo il test insieme ad altri in un'analisi fattoriale, esso ben saturato dal fattore atteso. A titolo
esemplificativo, la prova di significato verbale della batteria
PMA, che consiste nel trovare un sinonimo, fortemente saturata dal fattore verbale (0,68) e per nulla dal fattore di fluidit
verbale (0,01). Thurstone ha costruito una nuova prova di fluidir verbale nella quale si chiede al soggetto di trovare tre sinonimi per ogni parola data. Egli faceva l'ipotesi che nonostante
la somiglianza di questa prova con quella di significato verbale
(trovare un sinonimo), il test mettesse in gioco la fluidit verbale poich richiede che il soggetto fornisca pi parole di una
categoria data. Nell'analisi fattoriale in cui questa nuova prova
stata introdotta, essa aveva effettivamente una saturazione di
0,51 con il fattore fluidit verbale e una saturazione nulla con il
fattore significato verbale', il che validava l'ipotesi di Thurstone
sulla natura di questo nuovo test.
3.4. 1,Intepretazirme dei risultati
(interpretazione dei risultati si fonda sulla standardizzazione che consente di collocare il punteggio del soggetto in ciascuno dei test in rapporto ai punteggi osservati nella popola' zione di riferimento. L'interesse delle batterie fattoriali di
permettere di stabilire un profilo d abilit che si pu esprimere graficamente su un asse cartesiano (vedi fig. 8). Il profilo
permette di osservare con un colpo d'occhio se le diverse abilit sono omogenee o no, dove sono i punti forti e i punti deboli, ecc. Abbiamo visto a proposito della WAIS che l'analisi
dei profili di punteggio fatta anche con le scale di intelligenza.
La differenza che le batterie fattoriali sono state costruite per
mettere in evidenza delle dimensioni differenti dell'intelligenza, mentre questo non il caso dei subtest delle scale di intelligenza. La conseguenza che le interpretazioni basate sui
profili dei punteggi hanno maggior fondamento con le batterie fattoriali.
4. I test ispirati da teorie pi recenti
Nei loro principi teorici, i test presentati nei paragrafi precedenti sono stati concepiti ormai circa mezzo secolo fa. Da al69
QUADRO 1.
Una delle ragioni della resistenza al tempo da parte dei vecchi test riguarda soprattutto l'approccio molto pragmatico dei
loro autori. Binet, Wechsler e Thurstone hanno utilizzato situazioni di valutazione che si sono rivelate buoni indicatori del
70
le trasformazioni degli oggetti lasciano alcune delle loro propriet invariate: date due palline di pasta da modellare A e B del
tutto simili, il cambiamento della pallina B (appiattimento, trasformazione in rotolo, trasformazione in pezzetti) modifica il suo
peso in relazione a quello della pallina A? E queste trasformazioni modificano il suo volume in relazione a quello della pallina A? L'EDPL stata concepita per il periodo di et dagli 8-9
anni ai 15-16 anni, cio per il periodo di sviluppo che va dallo
stadio delle operazioni concrete a quello delle operazioni formali.
In relazione ai test di intelligenza classici, i test piagetiani
hanno varie componenti di originalit:
1. il livello di sviluppo cognitivo del soggetto non pi definito dal suo rango nella distribuzione dei punteggi della popolazione di riferimento, ma in riferimento ad un criterio teorico: lo stadio di sviluppo al quale il suo modo di ragionare corrisponde;
2. il comportamento del soggetto nelle prove pu essere interpretato in riferimento ad una teoria esplicita dello sviluppo
cognitivo;
3. il livello di sviluppo cognitivo del soggetto valutato attraverso una caratteristica, il suo stadio, che transitoria. In questo, lo stadio comparabile all'et mentale, ma s distingue dal
QI che caratterizza il soggetto in modo relativamente stabile;
4. l'esistenza di una sottostante teoria sufficientemente precisa evita di dover definire la standardizzazione della somministrazione del test in modo rigido, come con le prove di ori.
gine pi empirica. minore qui la necessit di comportarsi allo
stesso modo con ogni soggetto, mentre importante dare i
suggerimenti appropriati per vedere fin dove il soggetto pu
arrivare con il suo ragionamento. Questo metodo critico di indagine quello che utilizzava Piaget e il principio stato conservato nei test piagetiani a somministrazione individuale;
5. la validazione teorica del test si appoggia principalmente
sul metodo di analisi gerarchica. Gl item corrispondenti ai differenti stadi di ragionamento devono essere superati nell'ordine previsto dalla teoria. Questa coerenza con l'ordine teoricamente atteso pu essere valutata da un indice che va da 0,
quando l'ordine di successo degli item non diverso da quello
atteso sulla base del caso, a 1 quando l'ordine osservato corrisponde esattamente all'ordine atteso. Nell'EDPL, la scala di
73
Longeot, gli indici gerarchici delle diverse prove sono tutti superiori a 0,90, il che indica che gli item corrispondenti ai differemi stadi si ordinano praticamente come atteso sulla base della
teoria. Nelle prove collettive, invece, questi indici sono dell'ordine di 0,70, che meno soddisfacente.
Tenuto conto della loro originalit, che dipende in buona
parte dal loro ancoraggio teorico, si sarebbe potuto credere che
i test piagetiani avrebbero soppiantato i test di intelligenza classici, di concezione pi empirica. Non stato cos. Ci sono numerose ragioni che possono spiegare questo fatto ma noi qui ne
presenteremo solo una. L'utilizzo di questo tipo di test ha fatto
emergere velocemente che un soggetto poteva essere caratterizzato da stadi di sviluppo diversi nelle differenti prove che
compongono il test [cfr. Lautrey 1980b]. Non era dunque possibile caratterizzare un soggetto sulla base del suo stadio di sviluppo cognitivo, al singolare. Si quindi giunti a calcolare un
punteggio globale che, per convenzione, collocava il soggetto
ad uno stadio; lo stadio cos definito non pi comunque molto
diverso da un Qi. Tanto pi che la correlazione tra il punteggio totale dei test piagetiani e il QI ottenuto alle scale di intelligenza classiche si mostrata molto forte: varia da 0,70 a 0,80
a seconda delle ricerche, il che fa pensare che l'abilit valutata
da questi due test non sia poi molto diversa. Nella stessa logica,
se si sottopongono gli item di test piagetiani ad un'analisi fattoriale si trovano all'incirca gli stessi fattori che con i test fattoriali [Lautrey, Rieben e de Ribaupierre 1986]. Di conseguenza,
bench elaborati a partire da una teoria dello sviluppo cognitivo nuova, i test piagetiani non hanno rinnovato profondamente i test di intelligenza. Si sono rivelati particolarmente appropriati nella valutazione dello sviluppo del pensiero logico,
ma non hanno detronizzato le scale di sviluppo a pi largo spettro.
4.2. Il .K-A BC
Il K-ABC (Kaufman-Assessment Battery for Children) una
scala di valutazione dello sviluppo dell'intelligenza concepita per
il periodo dai 2 anni e mezzo ai 12 anni, che stata pubblicata
negli Stati Uniti da Alan e Nadeen Kaufman nel 1983 e adattata
in Francia nel 1993 [Kaufman e Kaufman 1983], mentre in Italia stata solo proposta in via sperimentale presso alcuni centri,
74
I tre movimenti di base da riprodurre nelle diverse sequenze sono la Man() piatta
(M), di lato (C) e il pugno (P). Il soggetto deve qui riprodurre i cinque movimenti
(M, P, C, M, C). Il numero dei movimenti presentati varia da 2 a 6 a seconda dell'et
del soggetto.
FIC..1. 12. Esempio di item analogo a quello della prova di movimento della mano
nel K-ABC.
76
78
CAPITOLO QUARTO
79
locabile su una dimensione ristretta)? Se si considera che il comportamento degli individui s esprime principalmente attraverso
le propriet delle situazioni in cui essi sono inseriti e per gli apprendimenti specifici che hanno avuto l'occasione di realizzare,
li si potr distinguere solo relativamente a queste situazioni e
apprendimenti specifici. S potr parlare allora di differenze di
intelligenza, ma soltanto per una situazione data o un gruppo
di situazioni simili. I test d'intelligenza intendono invece spesso
caratterizzare i soggetti in maniera generale. Si pu quindi, in
questa prospettiva, ritenerli delle generalizzazioni improprie.
Nell'ambito di questa critica generale, stato talvolta sottolineato il carattere scolastico delle situazioni test, particolarmente
evidente con i test carta e matita. L'intelligenza misurata dai test
sarebbe allora un'intelligenza scolastica, messa in atto da individui isolati in situazioni artificiali.
La critica pu anche riguardare il significato delle performance osservate. Questo tipo di critica sottolinea le ambiguit delle performance individuali rilevate alla somministrazione di un test. vero che i test classici ci forniscono soltanto
informazioni sulla performance del soggetto (l'abbiamo visto
nel cap. 2 con il test delle Matrici Progressive). Una stessa performance non avr necessariamente lo stesso significato se ottenuta mettendo in atto processi mentali diversi. Di conseguenza, l'informazione fornita dai test perder parte del suo interesse,
Q ueste critiche, diversamente da quelle filosofiche, sono
interne al campo della psicologia. L cos possibile tenerne
conto nella costruzione dei test. Nel capitolo precedente abbiamo riferito di due sostanziali evoluzioni in materia d misurazione dell'intelligenza: il passaggio da concezioni unidimensionali a concezioni pluridimensionali e la considerazione dei,
processi cognitivi responsabili dell'elaborazione della risposta.
Quest'ultima tendenza stata evocata a proposito della valutazione dei processi sequenziali e simultanei nel K-ABC. Essa
ancora pi sviluppata all'interno di un filone di ricerca che
tenta di costruire modelli dei processi cognitivi che il soggetto
mette in atto nella risoluzione degli item del test. Un esempio
di lavoro realizzato in questo ambito di ricerca stato descritto
alla fine del capitolo 2 a proposito delle componenti del processo di soluzione degli item delle Matrici Progressive di Raven.
81
Il terzo tipo di problema riguarda le funzioni che i test possono rivestire nella nostra societ e concerne principalmente le
questioni relative all'inserimento sociale degli individui e le
conclusioni sull'organizzazione della vita sociale che si possono
trarre dalle osservazioni fatte per mezzo dei test. Il problema
stato sollevato principalmente da valutazioni che si pongono
nel campo delle politiche educative (come interpretare le diseguaglianze in materia di educazione? come organizzare il sistema di formazione?) e secondariamente da problemi di lavoro o di impiego. Queste domande conducono ad alcune osservazioni politiche. Due temi ritornano costantemente: quello
dell'equit delle differenziazioni operate dai test e quello delle
origini delle differenze individuali, tra cui la questione del
ruolo dell'eredit. Dopo aver richiamato qualche dato storico,
esamineremo la forma assunta dal dibattito e dalle polemiche
sulla funzione sociopolitica dell'impiego dei test negli Stati
Uniti, nell'ex Unione sovietica e in Francia.
1.2. La nascita dei test e la loro diffusione
I test sono nati dall'incontro tra una domanda sociale e una
necessit della psicologia scientifica. Fin dalla loro origine ci si
pu quindi interrogare sulle loro funzioni sociali e sui loro fondamenti scientifici. Alla fine del XIX secolo e all'inizio del XX,
la necessit di disporre di procedure di valutazione dell'efficienza cognitiva degli individui si manifesta in numerosi settori
della vita sociale. Questa domanda apparsa dapprima, all'inizio del XIX secolo, in alcuni asili che accoglievano i ritardati
mentali gravi, dove si cominciava a nutrire preoccupazione riguardo-alla loro educazione. La richiesta diagnostica era motivata dal desiderio di ottenere delle stime dei livelli di deficit, al
fine di affinare i metodi di riabilitazione e di costituire gruppi
omogenei. Apparve pi tardi anche nelle scuole con l'estensione dell'insegnamento primario. Un po' pi tardi, l'esigenza
di misure di questo tipo si manifest nelle fabbriche. Si trattava di migliorare le procedure di reclutamento degli operai,
non soltanto al fine di aumentare la produzione ma anche la sicurezza (le prime indagini riguardarono conducenti dei tram).
L'orientamento professionale apparir sulla scia dei primi tentativi di selezione professionale al fine di poter disporre di valutazioni delle abilit che consentivano un buon adattamento
82
alla professione. Tra queste abilit ce ne sono alcune che contribuiscono a determinare l'intelligenza.
Con Binet, il lavoro sui test resta circoscritto a finalit educative essenzialmente legate all'educazione speciale e -all'insegnamento primario. La partecipazione degli psicologi alla preparazione dell'esercito americano, in seguito al coinvolgimento
degli Stati Uniti nella prima guerra mondiale nel 1917, avrebbe
stimolato una considerevole estensione del lavoro sui test. Test
collettivi furono costruiti e proposti a pi di tre milioni di reclute che furono di conseguenza, sulla base dei risultati ottenuti ai test, destinati a funzioni diverse nell'esercito. Vennero
messe a punto procedure speciali per il reclutamento di piloti
e di personale necessario al buon funzionamento dell'esercito.
Il fatto che gli americani si fossero trovati tra i vincitori del conflitto fu considerato di conseguenza una sufficiente validazione
dei test! All'indomani della guerra, i test cominciarono ad essere utilizzati in quasi tutti i settori della societ: nelle scuole
secondarie e nelle universit, nelle imprese e nelle amministrazioni, nel mondo giudiziario, e naturalmente si continu ad utilizzarli nell'esercito. Bench con minore ampiezza che negli
Stati Uniti, il lavoro e l'interesse per i test (si parla di psicotecniche) si svilupp anche nella maggior parte dei paesi industrializzati [Zurfluh 19761. In Europa, l'Inghilterra il paese
che mostr il maggior interesse (i test cominciarono ad essere
utilizzati negli anni Venti). Ma questo sviluppo e i dibattiti che
lo accompagnarono assunsero forme differenti a seconda dei
paesi.
1.3. I dibattiti sui test di intelligenza negli Stati Uniti: eredit e
influenze culturali
Nel periodo tra le due guerre, i dibattiti sui test riguardarono le conclusioni da trarre dai risultati osservati nel gigantesco testing del 1917 (i risultati furono pubblicati nel 1921). Le
differenze tra gruppi, osservate come noto tra neri e bianchi,
furono sistematicamente interpretate come delle differenze
ereditarie. La superiorit media ai test de neri del nord rispetto
a quelli del sud, ad esempio, non venne interpretata in relazione a fattori ambientali piuttosto evidenti come il tasso di
scolarizzazione. Si prefer inventare la tesi delle migrazioni selettive secondo la quale i neri pi intelligenti del sud sarebbero
83
emigrati al nord. L'applicazione di norme per lo meno discutibili conduceva a concludere che il 37% della popolazione
aveva un ritardo mentale! Queste affermazioni erano ben lontane dall'essere irrilevanti, ma diedero argomentazioni agli eugenisti, che raccomandavano restrizioni della vita sessuale dei
ritardati mentali nonch la loro sterilizzazione, agli xenofobi,
partigiani di una politica di immigrazione selettiva, e ai razzisti. Se il punto di vista ereditarista era maggioritario, non
c'era tuttavia unanimit tra gli psicologi, da cui derivarono una
serie di controversie. La pi viva oppose, nel 1922-1923, Terman, adattatore del test di Binet e partigiano delle tesi ereditari te che abbandoner qualche anno pi tardi, e Lippman.
Lippman non metteva in discussione l'interesse dei test di intelligenza, ma criticava severamente la soglia scelta per definire
il ritardo mentale e, soprattutto, affermava che l'intelligenza
non poteva essere valutata indipendentemente dagli apprendimenti e rifiutava perci l'idea di un'intelligenza pura, una
sorta di sostanza misteriosa impermeabile alle influenze educative. Molte delle polemiche e dei dibattiti successivi non
hanno fatto che riprodurre questo contrasto iniziale [Cronbach 1975; Gould 1983; Paicheler 19921. Si pu notare che
tutte queste discussioni riguardano i test di intelligenza, e pi
in particolare i test collettivi, indipendentemente dalla standardizzazione utilizzata che diventa del tutto secondaria. Ora,
dato che i risultati a test sono nella maggior parte dei casi
espressi in quoziente intellettivo, si arrivati a credere, soprattutto attraverso i media, che il QI a dover essere criticato,
anche nel momento in cui i problemi sono gli stessi che si utilizzi o meno la nozione di QI.
Le critiche di Lippman non riguardavano test, ma soltanto l'interpretazione delle osservazioni fatte per mezzo (lei
test. All'indomani della seconda guerra mondiale, si svilupparono invece critiche che riguardavano i test stessi. Eels e colleghi [1951], sociologi di Chicago, misero in discussione l'imparzialit apparente dei test. Essi sostenevano che i bambini
degli ambienti popolari non sono necessariamente meno intelligenti dei bambini delle classi agiate ed piuttosto evidente
che i test, per il loro contenuto familiare ai bambini delle classi
agiate, favoriscono questi bambini a svantaggio di quelli delle
classi popolari. Eels e colleghi, per validare la loro tesi, esaminarono i test allora in uso e tentarono di costruire un test so84
All'indomani della rivoluzione d'ottobre il governo sovietico incoraggi lo sviluppo delle psicotecniche, considerate
come una disciplina scientificamente fondata e del tutto adatta
a contribuire alla costruzione del socialismo. Nel 1931 si tenne
a Mosca il settimo congresso di psicotecnica e i congressisti occidentali rimasero impressionati dagli strumenti di cui vennero
a conoscenza e invidiarono i mezzi di cui disponevano i loro
colleghi sovietici che operavano in completo accordo Con il governo del loro paese avendo coscienza di partecipare alla costruzione di una psicologia, marxista.
Ma questa bella armonia non sarebbe durata. Dall'inizio
degli anni Trenta cominciarono a nascere critiche contro i test
e diventarono via via sempre pi vive. Nel 1936 una risoluzione
del comitato centrale del partito comunista relativa ai cambiamenti nei commissariati dell'educazione viet molto semplicemente i test. Vennero forniti due tipi di giustificazione. Le
86
prime riguardavano quelli che s potrebbero chiamare gli effetti perversi dei test nel sistema educativo. Si rimproverava infatti agli psicologi dell'et evolutiva clic utilizzavano test di essere responsabili del moltiplicarsi delle classi speciali e di aver
preso il potere nelle scuole a danno degli insegnanti. Le seconde, di gran lunga le pi importanti, erano esclusivamente
d ordine ideologico. Le ricerche sui test e la pratica psicotecnica furono giudicate incompatibili con il marxismo e di conseguenza borghesi e antiscientifiche (come la genetica
mendeliana, la fisica quantistica e la psicoanalisi). La legislazione che organizzava il lavoro degli psicologi venne soppressa,
l'insegnamento dei test abolito e i libri sull'argomento distrutti.
Gli animatori del movimento dei test scomparvero dalla scena.
Interi filoni della psicologia sovietica furono infatti liquidati e
non rimase che un pavlovismo ufficiale che riduceva lo studio
del comportamento alla possibilit d evidenziarne il condizionamento. I test riapparvero in Unione Sovietica negli anni Settanta. Questa critica ideologica dei test sarebbe stata ripresa
anche in Francia da numerosi intellettuali, particolarmente psicologi appartenenti al movimento comunista.
1.5. .11 dibattito sui test in Francia: la giusta selezione e la legittimazione delle diseguaglianze.'
TI movimento dei test in Francia fu influenzato da due forti
personalit: Alfred Binet ed Edouard Toulouse. L'influenza di
Binet, scomparso prematuramente nel 1911, si essenzialmente esercitata attraverso il suo test. Quella di Toulouse, bench egli fosse meno conosciuto, stata ben pi profonda. Toulouse (1865-1947) era uno psichiatra che nel corso della sua
vita condusse ricerche fondamentali (particolarmente sul rapporto tra il genio e la neuropatia) e cre numerosi laboratori,
proponendo soluzioni ai problemi sociali (in particolare nell'ambito della salute mentale). Toulouse era un appassionato
sostenitore dei metodi oggettivi, quindi dei test. Preoccupato
di spiegare i comportamenti a partire dai fenomeni psicologici
elementari e dalla fisiologia, egli ader alle posizioni riduzioniste adottate dalla maggior parte degli psicologi all'inizio del secolo (ad eccezione di Binet). I primi test elaborati da Toulouse
e dai suoi collaboratori nel 1904, che assomigliavano molto alle
situazioni che si incontravano nei laboratori di psicologia spe-
87
louse e i suoi allievi non riuscirono se non parzialmente ad imporre il proprio punto di vista. Certamente i test furono sempre pi utilizzati nella selezione e soprattutto nell'orientamento
professionale, ma la selezione scolastica continu ad avvenire
precocemente e su una base sociale. Il progetto psicotecnico
rimase un'utopia.
All'indomani della seconda guerra mondiale, il paesaggio
cambi radicalmente: le critiche pi vive rivolte ai test non vennero pi dai settori conservatori dell'opinione pubblica ma dagli intellettuali e dagli psicologi membri o simpatizzanti del
partito comunista, che trovavano perfettamente giustificate le
misure prese in Unione Sovietica nel 1936 (gli echi e le influenze di questo dibattito si sarebbero fatti sentire anche in
Italia). I test vennero presentati come un mezzo per confermare, per legittimare, e anche per far accettare le disegnaglianze dell'ordine sociale (La Raison, 1952, n. 4). Mettendo in primo piano la funzione ideologica attribuita ai test,
non si insisteva sul fatto che lo scarto tra bambini cresciuti in
ambienti favorevoli o sfavorevoli fosse minore con i test che
con i voti scolastici. Gli psicologi degli anni Trenta che pensavano di contribuire al progresso sociale promuovendo l'uso dei
test vennero considerati degli idealisti ingenui. Intorno al 1.968
numerose opere avrebbero ripreso queste tesi, attenuandole o
radicalizzandole [Salvat 1969; 'fon 19741.
Come negli Stati Uniti, n Gran Bretagna questi dibattiti e
polemiche riguardarono soprattutto la scuola e la selezione
scolastica. Ma a differenza di ci che si visto in questi due
paesi, in Francia e in Italia essi hanno mantenuto un carattere
accademico e astratto che deriva dall'assenza di un vero scopo
sociale. Si trattava cio di mettere in gioco delle questioni ideologiche piuttosto che delle pratiche sociali. In effetti, in Francia i test non sono mai stati utilizzati come mezzo di selezione
scolastica (ad eccezione dell'insegnamento speciale per i
portatori di handicap). I test sono stati massicciamente utilizzati nell'insegnamento secondario dalla fine degli anni Cinquanta all'inizio degli anni Ottanta, ma gli orientamenti sono
sempre stati basati sulla valutazione scolastica.
I dibattiti pi vivaci sui test, quelli condotti da un punto di
vista sociopolitico, non riguardavano i test come metodi di osservazione, bens l'origine delle differenze individuali e l'equit
delle procedure di inserimento sociale. Queste domande non
89
ebbero risposte scientifiche soddisfacenti, primo perch ]e conoscenze scientifiche non erano sufficienti, e secondo perch
la questione riguardava una scelta di valori, che ha suscitato dibattiti con una forte componente ideologica, opponendo concezioni globali dell'uomo e della societ [Lemaine e Matalon
1985]. Da allora, non sorprendente che questi dibattiti non
si siano conclusi e che a seconda del contesto sociostorico abbiano preso forme diverse.
1.6. 11 dibattito sui test in Italia
La discussione sui test di intelligenza notoriamente stata
associata a dibattiti sulle differenze in razze diverse, in uomini
e donne, in individui di ambienti differenti, e anche in Italia
stata condotta, sia pur in maniera meno massiva che in altri
paesi, sul fondamento dell'uso dei test.
Soprattutto negli anni successivi al 1968, i test di intelligenza venivano messi in discussione in quanto strumenti utilizzati dalla societ borghese, e venivano attaccati proprio
per questa ragione. In quegli anni, per esempio, il sistema echicativo italiano si era organizzato in modo sistematico. prevedendo classi diverse non solo per bambini con gravi difficolt,
ma anche per bambini con difficolt pi lievi che tuttavia sembravano abbisognare cli un percorso educativo particolare. Si,
parlava nel primo caso di classi speciali e nel secondo caso di
classi differenziali.
Per le classi speciali era prevista una diagnosi basata sostanzialmente sui test di intelligenza; per le classi differenziali
questo uso era meno diffuso, ma poteva comunque essere
presente. E noto che le classi speciali e le classi differenziali
costituivano una modalit di isolamento e di ghettizzazione
di certi bambini. In Italia si era infatti sviluppato un movimento pionieristico contro questa segregazione, e quindi
contro uno degli strumenti cli questa segregazione, il test di
intelligenza.
Tra l'altro a quell'epoca si rilevava come esistesse una
chiara relazione tra svantaggio socioculturale e basso punteggio ai test di intelligenza. Questo tipo di rapporto era stato trovato non solo in altri paesi del mondo ma anche n e
aveva appunto portato alla sottolineatura dei test culture fair
per i quali la valenza socioculturale era meno presente. Un par90
ticolare caso, localizzato ma estremamente interessante, di questa attivit di segregazione svolta usando il nome di prestigio
di una cosiddetta scienza, rappresentato dalla discriminazione operata sulle comunit culturali.
Se questo pu essere avvenuto in Italia su bambini particolarmente svantaggiati o su bambini di minoranze culturali e
linguistiche, la discriminazione pi clamorosa riguard invece
i bambini figli d italiani che erano all'estero. Alcuni studiosi
italiani rilevavano come i figli di italiani in Germania finissero
quasi tutti in classi che avevano le caratteristiche simili alle
classi speciali o differenziali italiane proprio in base al fatto che
avevano ottenuto punteggi bassi ai test di intelligenza.
Emerse in modo evidente che i test di intelligenza erano
fortemente caratterizzati dal punto di vista linguistico e i bambini che non conoscevano bene la lingua tedesca chiaramente
fallivano. Era molto amaro constatare che uno strumento nato
per fini di sviluppo di conoscenze offrisse una modalit per
emarginare minoranze non gradite. In seguito a questi eventi
ci furono molte iniziative in Italia contro i test di intelligenza,
comparvero diversi lavori sia in libri sia in riviste scientifiche
non solo riferite alla comunit strettamente psicologica, ma anche a comunit p ampie. Per esempio la rivista Sapere pubblic interventi contro questo uso dei test di intelligenza. Cadi,
Padovani e Trentini riconoscono due correnti di pensiero relative ai test di intelligenza all'interno della psicologia sociale,
l'una contraria, dei clinici, e l'altra favorevole, degli psicometristi [Cadi 1972].
La critica ai test, che partiva da fondamenti giusti ma chiaramente faceva riferimento solo a questi cattivi usi degli strumenti, si allarg a tal punto che in quegli anni l'uso degli strumenti divenne sempre pi raro e per parecchio tempo fu considerato scientificamente inappropriato e anche politicamente
reazionario fare riferimento al concetto di intelligenza associato all'uso di strumenti.
Oggigiorno le posizioni non sono pi cos estreme e la critica molto meno aspra. Il test ha acquistato di nuovo una valenza priva di connotazioni ideologiche che lo definisce come
strumento di diagnosi pi o meno apprezzato nel campo della
psicologia. Il problema a cui si pi sensibili non tanto la
bont o meno dell'utilizzo del test, ma l'uso corretto delle
informazioni che fornisce.
91
2. Le pratiche attuali
In diversi paesi del mondo i test di intelligenza sono utilizzati con obiettivi abbastanza differenti nei tre grandi settori di
applicazione della psicologia: ambito educativo, sanit e lavoro.
2.1.
Quando l'importanza dei problemi lo giustifica, lo psicologo pu fare un esame psicologico del bambino, chiedendo
naturalmente l'autorizzazione ai genitori.
L'esame psicologico comporta in generale numerosi elementi, variabili secondo la natura del problema posto: colloqui con i genitori, colloqui con il bambino, test di conoscenza
scolastica, prove di personalit, ecc. Tra questi elementi, i test
di intelligenza occupano un posto preponderante, specialmente per l'uso di scale a somministrazione individuale.
In ambito scolastico in Italia i test di intelligenza veri e propri non sono largamente utilizzati, soprattutto quando vengono presentati come tali, per la diffidenza che esiste in relazione alla misurazione dell'intelligenza e anche per l'indicazione spesso presente di evitare di pervenire a misure che riguardano la sfera pi personale dello studente.
Questa situazione per cambier con l'introduzione dello
psicologo scolastico che potrebbe essere incaricato di mansioni
pi strettamente psicologiche e anche impegnato ad esami approfonditi dello studente.
D'altra parte gi adesso nell'ambito della scuola figure
quali lo psicopedagogista o lo psicologo in convenzione possono collaborare nella raccolta di informazioni relative ad abilit cognitive specifiche che in qualche modo costituiscono
componenti dell'intelligenza.
Per esempio in alcuni casi stato usato il test di intelligenza
PMA che offre informazioni relative a componenti distinte, faitorialmente isolate, dell'intelligenza quali il ragionamento, le
abilit visuospaziali, le competenze semantiche, ecc.
Inoltre i Servizi che collaborano con la scuola sono spesso
chiamati a esami dei bambini che coinvolgono la misurazione
dell'intelligenza.
Per esempio per la diagnosi cli handicap mentale si procede
di routine a una valutazione dell'intelligenza per vedere se ef
92
per venire incontro a scopi specifici. Si, gi menzionato, in relazione all'ambito scolastico, come i Servizi sociosanitari possano essere impegnati in una valutazione dell'intelligenza che
permetta di meglio riconoscere le caratteristiche sottostanti ad
una difficolt di apprendimento.
Per quanto concerne l'ambito dell'adulto, in tutti i casi in
cui il funzionamento cognitivo di un individuo pone delle problematiche, pu essere opportuno associare una valutazione intellettiva, e questo pu per esempio riguardare le difficolt che
presentano certi anziani, per meglio comprendere la natura di
un eventuale deterioramento senile. In questo caso ai classici
test di intelligenza si associano test pi semplici e direttamente
finalizzati all'esame dell'anziano. Per esempio, una procedura
rapida che permette di riconoscere la permanenza di certe funzionalit cognitive, anche in presenza di un indubbio deterioramento, rappresentata dal Mini-Mental State che offre una
informazione complessiva sullo stato dell'anziano e viene utilizzato di frequente nella realt psichiatrica italiana, proprio per
le sue caratteristiche di semplicit d'uso e rapidit. Obiettivi ed
esigenze analoghe possono presentarsi infatti in ambito psichiatrico ove spesso si ricorso, e si ricorre tuttora, alla raccolta di informazioni sullo stato generale del paziente, valendosi anche del test di intelligenza.
Anche in questo caso lo strumento conseguente alle procedure ideate da Wechsler, si tratta allora del WAIS, pu essere
di ampia utilizzazione.
In ambito pi strettamente neo ropsicologico esiste una
marcata preferenza per una diagnosi che si riferisca alla specifica lacuna del soggetto, che spesso ben localizzabile o comunque dissociabile da altre componenti intellettive che invece
hanno un buon funzionamento. Tuttavia anche in questo caso
un esame di fondo pu prevedere l'uso di un test di intelligenza.
In Italia e in Francia si contano diverse migliaia di psicologi attivi in ambito sanitario. Hanno una specializzazione in
psicologia clinica e intervengono in vari quadri istituzionali:
ospedali psichiatrici, ospedali generali, associazioni, collettivit
territoriali (ad esempio, circoscrizioni sanitarie e sociali), case
di cura private, istituzioni giudiziarie, ecc.
Nel settore psichiatrico, le consulenze a livello dell'et
evolutiva hanno spesso origine da problemi di adattamento
scolastico. L'impiego di test di intelligenza nell'esame psico96
logico assume allora le stesse funzioni che per gli psicologi scolastici. Nelle consulenze con adulti, l'esame psicologico avviene in ambito psichiatrico. L'inclusione di test di intelligenza
nell'esame psicologico pu essere motivata dal problema diagnostico incontrato. Si pu ad esempio operare una distinzione tra turbe psichiche e ritardo mentale generale, definire
un ipotetico deterioramento mentale in una persona anziana,
conoscere la misura in cui l'evoluzione di un disturbo psichiatrico ha colpito la funzionalit intellettiva, ecc. Lo psicologo che compie l'esame pu ricorrere a un test di intelligenza
per avere un'idea generale di come il soggetto si comporta di
fronte a un compito da risolvere, del modo con cui Io affronta,
del suo atteggiamento di fronte alle difficolt, delle sue reazioni emotive.
Nell'ambito non psichiatrico, i test di intelligenza vengono
utilizzati nelle consultazioni di neuropsicologia, tra i diversi
strumenti impiegati per fare il bilancio dei danni neurologici
conseguenti a lesioni cerebrali. Nei servizi di medicina generale, essi possono essere utilizzati nel caso in cui si tratti di valutare le eventuali ripercussioni di un disturbo somatico sullo
sviluppo intellettivo (se ad esempio un disturbo della crescita
fisica ha o meno delle ripercussioni sullo sviluppo intellettivo
del bambino). Un test di intelligenza pu anche aiutare a precisare la parte di realt e la parte di sofferenza psicosomatica
nel caso in cui un paziente lamenti che le sue capacit intellettive non sono pi come prima (e la diagnosi in questi casi pu
diventare terapeutica). Nell'ambito giudiziario, un esempio di
impiego dei test di intelligenza quello volto ad apprezzare la
credibilit di una testimonianza.
La variet dei casi in cui i test di intelligenza possono apportare informazioni utili nell'esame psicologico lascia pensare
che il loro impiego sia abbastanza frequente in ambito sanitario. Un'indagine recente condotta in Francia lo conferma [Castro, Meljac e Joubert 19961. Tra gli psicologi clinici interrogati, l'88% considera l'utilizzo dei test indissociabile dalla loro
pratica. Tra i dieci test pi usati cinque sono test di intelligenza
(la WISC, la WAIS, la WPPSI, il K-ABC e la scala di BrunetLzine, che una scala di sviluppo per la prima infanzia). Questa situazione del tutto simile a quella che si potuta osservare su scala mondiale in una ricerca riguardante i test pi utilizzati in 44 paesi [Oakland e Hu 1992], dove emerso che fra
97
QUADRO 2.
tizzazione quello di evitare alcune delle costrizioni della somministrazione collettiva, permettendo ad ognuno di procedere
secondo il suo ritmo sulla sua postazione di lavoro. Un secondo
vantaggio non trascurabile
quello di automatizzare la correzione: possibile avere alla fine
della somministrazione il listato
L'utilizzo dei test tradizionale e sistematico anche nell'esercito, nelle procedure di selezione delle giovani reclute. Per
selezionare e orientare le 400.000 reclute che l'esercito chiama
ogni anno, in Francia stata messa a punto una procedura in
cui i test di intelligenza hanno un ruolo importante. I test utilizzati sono dei test fattoriali di abilit del tipo eli quelli del
PMA e dei test psicomotori. Come in tutti i casi in cui si debba
101
ritto di analizzare le proprie competenze professionali e personali ed anche le attitudini e le motivazioni al fine di definire
un progetto di formazione e/o un progetto professionale.
Chiunque lo desideri pu chiedere di beneficiare di un bilancio di competenze, il cui costo pu essere addebitato alla voce
piano di formazione sia della sua ditta, sia di un organismo
simile. Non raro che le persone che chiedono di beneficiare
di questo servizio esprimano, agli psicologi che lavorano in
questo centro e li aiutano a fare il bilancio delle loro competenze, il desiderio di includere test di intelligenza tra gli elementi di valutazione.
Riassumendo, questa presentazione dei principali impieghi
dei test di intelligenza, soprattutto in Francia, mostra che, nell'ambito dell'educazione e della sanit, i test sono principalmente utilizzati per l'aiuto diagnostico, mentre, nell'ambito del
lavoro, essi sono impiegati soprattutto per l'inserimento sociale. Nel primo caso sono utilizzate soprattutto le scale di intelligenza a somministrazione individuale, mentre nel secondo
caso i test fattoriali a somministrazione collettiva, con un interesse marcato per l'analisi del profilo di abilit. In questo secondo caso, l'informatizzazione dei test e la somministrazione
individuale su di un terminale video tendono a rimpiazzare la
somministrazione in gruppo nella forma carta e matita.
Etica e deontologia
3.
intelligenza ma anche, naturalmente, i test di conoscenza scolastica e i questionari di personalit) e le pratiche che li riguardano. Tutti gli studiosi e gli utilizzatori dei test sono invitati a
conoscerle. Alcune di queste norme sono molto dettagliate.
Quelle pubblicate negli Stati Uniti e adattate regolarmente dal
19.54, gli Standards for Educational and Psycbological Testing, ch
gran lunga le pi complete, riempiono un buon centinaio di pagine. Per quanto riguarda la costruzione dei test, le norme richiamano le esigenze della metodologia psicometrica. Si insiste
naturalmente sulla necessit di disporre di informazioni riguardanti la validit delle prove (validit teorica e validit empirica
in relazione agli obiettivi proposti) e la loro fedelt. Si raccomanda anche di procedere a periodiche revisioni dei test. Que ste devono infatti poter beneficiare delle ricerche condotte sulla
versione precedente ed necessario dunque verificare periodicamente che siano sempre adeguate agli obiettivi preposti. Si
sottolinea infine che assolutamente necessario disporre di
punteggi standardizzati il pi possibile attuali e rispettare procedure precise nel momento in cui si confrontano punteggi ottenuti con prove diverse o in condizioni diverse. Le norme riguardano anche le modalit di utilizzo dei test distinguendo diversi settori di applicazione: la pratica clinica, la psicologia scolastica, l'orientamento, la selezione, l'utilizzo dei test per la certificazione professionale (non si tratta pi in questo caso di test
d'intelligenza in senso stretto) e per la valutazione di programmi
educativi e sociali. Si insiste sulle competenze richieste a chi
vuole impiegarli e sulla natura delle informazioni di cui devono
disporre (fornite dai manuali che accompagnano le prove) al
fine di fare dei test il miglior uso. Infine, le norme trattano problemi particolari posti dal testing delle minoranze linguistiche
e dei gruppi che vivono in condizioni piuttosto difficili, il che
ci pone la questione dei biases culturali.
Questa questione stata sollevata, l'abbiamo visto, fin dall'inizio degli anni Cinquanta da Eels e collaboratori. Essa ha
forti implicazioni pratiche nella misura in cui i test, se distorti,
sottostimano il merito di alcuni gruppi rispetto ad altri. Queste implicazioni sono forti in tutti i paesi in cui si utilizzano test
a fini di selezione poich ovunque si incontrano differenze sociali, di natura etnica, socioeconomica o sessuale, che possono
dare origine a biases. Negli Stati Uniti, giuristi e psicologi
hanno dato a questa questione un'attenzione particolare, in se105
guito alla legge sui diritti civili, nel 1964, il cui obiettivo era di
eliminare tutte le forme di discriminazione.
Dalla fine degli anni Sessanta, i tribunali hanno avuto a che
fare con numerose lamentele di persone e di gruppi che si ritenevano lesi dalle procedure di valutazione attraverso i test.
Alcuni processi sono stati ampiamente commentati dalla
stampa e sono divenuti celebri. Alcuni genitori hanno contestato il fondamento dell'inserimento dei loro bambini in classi
per ritardati, alcuni candidati all'iscrizione all'universit hanno
ritenuto la loro non-ammissione del tutto ingiustificata, professionisti alla ricerca di un impiego hanno creduto di essere
stati ingiustamente scartati. Bench le norme giuridiche non
siano perfettamente coerenti, in numerosi casi i test sono stati
messi sotto accusa e i loro autori ingiunti a produrre modalit
di valutazione non distorte.
Si cos sviluppata una corrente di ricerche sui biases. In
modo molto generale, si afferma che c' un bias quando i punteggi ad un test non hanno lo stesso significato, la stessa vali
dita per individui appartenenti a gruppi diversi. Nell'ambito
delle operazioni di selezione, questa differenza di significato
pu condurre a penalizzare un gruppo. Prendiamo un esempio fittizio. Ci sono due gruppi: un gruppo favorito F e un
gruppo sfavorito D. I punteggi di F sono superiori a quelli di
D in un test. Se si utilizza la correlazione positiva tra questo
test e un criterio (l'efficienza professionale ad esempio) per
procedere ad una selezione, s sceglier per forza un maggior
numero di persone del gruppo F. Ma pu anche darsi che non
esistano differenze tra il gruppo F e il gruppo D al criterio (se
emerge che in media i soggetti del gruppo D hanno gli stessi
punteggi di quelli del gruppo F). Il test pu, in effetti, predire
accuratamente il successo al criterio all'interno di ogni gruppo,
ma non le differenze di successo tra i gruppi. In questo esempio, una selezione fondata sui punteggi al predittore penalizza
ingiustamente il gruppo D ed in questo senso distorta a favore del gruppo F.
In linea di principio, l'origine dei biases pu essere diversa,
la stessa caratteristica psicologica pu non avere lo stesso significato nei due gruppi se interagisce con altre caratteristiche
dei soggetti di tali gruppi (si pu pensare, ad esempio, che l'intelligenza misurata da uno stesso test non abbia lo stesso significato a seconda che i soggetti sappiano leggere o meno). La
106
formazione universitaria e deve essere seguito da un anno di tirocinio e da un esame di stato per l'autorizzazione ad esercitare la professione.
Le indicazioni fornite dal codice deontologico rimangono
tuttavia spesso piuttosto vaghe e la loro applicazione talvolta
problematica. Cosa si intende per una tecnica scientificamente
valida se non ci si riferisce a delle norme? Qual l'informazione veramente pertinente da cercare in una diagnosi o in una
procedura di selezione? Nel contesto dell'aiuto agli altri probabilmente pi facile rispettare il codice deontologico, anche
se le problematiche sollevate sui test e in particolare sui test di
intelligenza investono questo ambito con tutta la loro forza. In
altri ambiti comunque la situazione anche peggiore. La privacy messa in discussione nelle procedure di selezione: lo psicologo obbligato a fornire informazioni sul candidato perch
pagato per questo!
QUADRO 3.
LA DEONTOLOGIA DELL'USO DEI TESI
109
110
CONCLUSIONI
Un test un dispositivo d'osservazione concepito per valutare certe caratteristiche psicologiche degli individui, collocando le loro condotte in relazione a quelle che sono state osservate in seno alla popolazione alla quale gli individui appartengono. Per compiere questa funzione un test deve essere
stato standardizzato, e le misure che il test consente di raccogliere devono essersi mostrate valide ed affidabili. L'intelligenza non l'unica caratteristica psicologica che possa essere
valutata dai test: esistono infatti test di conoscenza di vari domini, test psicomotori, test d personalit, ecc. La particolarit
dei test di intelligenza di valutare un'abilit piuttosto generale di adattamento cognitivo a situazioni nuove. Questo metodo di valutazione dell'intelligenza ha mostrato il suo interesse, ma anche i suoi limiti.
Due tipi di limitazione dei test d'intelligenza devono essere
tenuti in considerazione nel loro utilizzo. Uno riguarda il livello
di generalit effettivo della capacit di adattamento cognitivo
valutata, l'altro riguarda la molteplicit dei determinanti della
performance osservata.
Sul primo punto, bisogna innanzi tutto osservare che la validit di un test d'intelligenza limitata alla cultura in seno alla
quale il test stato concepito. L'intelligenza umana si sviluppa
attraverso l'uso di linguaggi, di simboli, di rappresentazioni che
sono gli strumenti del pensiero e danno significato alle situazioni.
il funzionamento dell'intelligenza umana inscindibile dagli
strumenti simbolici e concettuali sui quali si basa. La situazione
test nel suo insieme (la relazione individuale con l'esaminatore,
il materiale utilizzato, il tipo di problema posto, ecc.) non consente di valutare le capacit di adattamento del soggetto testato
a meno che tale situazione non abbia per lui un senso.
Immaginiamo per un istante che il problema della diagnosi
del ritardo mentale si sia posta nella societ pigmea. Gli item
111
telligenza, bens il test essenzialmente verbo-concettuale. Diversi tentativi di costruzione di test di intelligenza sociale
hanno dato risultati ancora incerti: la validit e la fedelt di questi test si sono dimostrate inferiori a quelle dei test di intelligenza verbo-concettuale. Certe componenti dell'intelligenza
sociale sono in correlazione con l'intelligenza verbo-concettuale, mentre altre no, il che limita, ancora una volta, la generalit dell'intelligenza misurata dai test descritti in quest'opera.
Questi test valutano soprattutto la forma d'intelligenza necessaria per andare bene a scuola, e, pi generalmente, per apprendere nel contesto di un insegnamento esplicito. Si tratta
dell'intelligenza che si chiama talvolta accademica o geometrica. Non bisogna sottostimare l'importanza di questa
forma di intelligenza, n la relativa generalit del suo utilizzo
nella nostra societ. Essa gioca in effetti un ruolo primordiale
nelle societ complesse in cui l'acculturazione passa in buona
parte attraverso una trasmissione scolastica dei saperi. Ma, al
di l di questo, essa non esaurisce la diversit delle risorse cognitive umane.
In seno all'intelligenza stessa che noi abbiamo chiamato
verbo-concettuale, le analisi fattoriali dei test hanno permesso
di distinguere diverse dimensioni corrispondenti ad abilit relativamente differenziate (verbale, numerica e spaziale). Il fatto
che esistano delle correlazioni positive tra tutti questi test la
scia tuttavia spazio ad un fattore generale di successo nell'insieme dei test. C' un consenso abbastanza ampio, in epoca recente, su di un modello gerarchico della struttura fattoriale dell'intelligenza costruito a sua volta da un fattore generale di intelligenza e da fattori di gruppo corrispondenti ad abilit distinte. Si pu dunque effettivamente parlare di un fattore di intelligenza generale, ma soltanto se si tratta di un fattore d intelligenza verbo-concettuale.
Un secondo tipo di limite dei test di intelligenza riguarda
la molteplicit delle determinanti della performance osservata.
Una stessa performance in un test pu essere ottenuta con meccanismi diversi, strategie diverse; il soggetto pu essere pi o
meno familiare con il contenuto del test; uno stesso punteggio,
uno stesso QI, uno stesso scarto tra OI verbale e Qi performance possono avere significati diversi. Il risultato ad un test di
intelligenza deve essere messo in relazione con l'insieme delle
informazioni raccolte nel corso dell'esame psicologico per po113
glio perch certi item, che erano stati scelti in partenza in una
prospettiva pratica, erano buoni indicatori dell'efficienza cognitiva. Alcuni esempi di questi ritorni della teoria sui test sono
stati forniti in quest'opera, proprio a proposito della reinterpretazione degli item delle matrici progressive nel contesto di
modelli di elaborazione dell'informazione. All'inverso, la costruzione di test che operazionalizzano una teoria dell'intelligenza ha talvolta contribuito a metterla in questione. cos che
l'elaborazione di test ispirati alla teoria di Piaget ha contribuito
a scuotere la concezione degli stadi di sviluppo cognitivo che
si fondavano su questa teoria.
- Se la costruzione dei test di intelligenza si inscritta fin dall'inizio in questo percorso di mutuo scambio tra elaborazione
teorica e verifica empirica, ci si pu tuttavia rammaricare del
fatto che la relazione tra ricerca di base e la sua applicazione
stata a lungo molto limitata. Ci sono per questo delle ragioni
storiche. Per Binet, la riflessione teorica sull'intelligenza e la
messa a punto di una scala destinata a misurarla erano due momenti strettamente articolati di uno stesso percorso. Il successo
dei test stato tale per il fatto che la risposta ad una domanda
sociale ha richiamato i ricercatori dalle loro questioni teoriche.
Bisogna aggiungere a questo che, anche se l'avessero voluto,
difficilmente gli psicologi che utilizzavano i test di intelligenza
avrebbero avuto modo di rinnovarli teoricamente nella fase di
ricerca in psicologia in cui ha dominato il comportamentismo.
Lo sviluppo del cognitivismo, che ha preso slancio a partire dagli anni Settanta, offre un quadro pi favorevole al rinnovamento delle idee sul funzionamento dell'intelligenza. Le ricerche hanno per ora rivolto il loro interesse alla rappresentazione
dei processi di elaborazione dell'informazione in gioco nella
soluzione degli item dei test esistenti piuttosto che all'elaborazione di nuovi test [Huteau 1995; Huteau e Lantrey 1978; Lautrey 1995; Lautrey e Huteau 1990]. La situazione attuale sembra tuttavia pi favorevole di quella passata n quanto la ricerca
di base su differenti aspetti del funzionamento intellettivo e la
costruzione di strumenti che consentano di valutarli praticamente camminano parallelamente e con uno stesso passo.
115
LETTURE CONSIGLIATE
119