Sei sulla pagina 1di 84

Appunti dalle lezioni di

Teoria e tecnica dei test cognitivi


Prof. A. Troncone

ARGOMENTI
Presupposti teorici
Concetto di misura: problemi e fasi della misurazione in psicologia
(Le scale di misura)
Definizione e classificazione dei test psicologici
Modelli di costruzione dei test: i 3 livelli di astrazione nella costruzione di un test, la teoria dellerrore casuale
Metodi di costruzione dei test e sue fasi
La validit di un test
La standardizzazione di un test
Test cognitivi
Definizione e tipologie
Test di livello
-

le scale Wechsler

Approfondimento: la WAIS-r
Approfondimento: le Matrici Progressive di Raven

Presupposti teorici

La misura definita come lassegnazione di numeri ad oggetti secondo determinate regole


misurare significa attribuire numeri ad oggetti o ad eventi in modo tale che specifiche relazioni tra i numeri
corrispondono ad analoghe relazioni tra gli oggetti
la misurazione una procedura di classificazione che consente di attribuire un oggetto ad una determinata classe e di
costruire allinterno della classe una relazione dordine
tale relazione dordine pu essere anche non quantitativa, per es. pi di, uguale a

Loggetto delle misurazioni in psicologia sono le caratteristiche psicologiche degli individui


Misurare le caratteristiche psicologiche pone delle difficolt in quanto le caratteristiche psicologiche non sono
direttamente misurabili, si tratta di variabili inferite, sulla base di qualche teoria, dal comportamento dellindividuo
Poich le caratteristiche psicologiche non sono direttamente osservabili necessaria una misurazione indiretta
Se per es. la lunghezza di un tavolo una misura che si pu percepire direttamente, ci non accade per la misurazione di
costrutti psicologici.
Ad esempio: come si fa a misurare il livello dansia di un soggetto?
Come si fa a misurare lintelligenza di un bambino?
Esiste il costrutto intelligenza?
Quali sono i comportamenti direttamente osservabili da cui posso inferire la presenza dellintelligenza?
Il costrutto intelligenza sar la sintesi di un certo numero di comportamenti intelligenti
Bisogna decidere come selezionare tali comportamenti in modo che siano rappresentativi per descrivere in modo
sufficiente il costrutto

Si misura lintelligenza e/o lansia sulla base di osservazioni di alcuni indizi e comportamenti che si suppone siano una
manifestazione delloggetto da misurare: si ipotizza che il comportamento osservato sia legato probabilisticamente alla
caratteristica che si vuole misurare sulla base di una teoria psicologica che descrive tale legame
Tutte le misure psicologiche sono basate sullosservazione del comportamento
Da questa osservazione vengono inferite le caratteristiche che si vogliono misurare
Pi il comportamento complesso pi difficile sar inferire e isolare tali caratteristiche: non sempre facile stabilire un
legame chiaro tra comportamento e costrutto
La misura di caratteristiche psicologiche deve derivare dalla teoria psicologica
I comportamenti che effettivamente sono interpretati come indizi di una data caratteristica dipendono in modo
determinante dalla definizione teorica della caratteristica stessa la teoria ha un ruolo fondamentale nella definizione
e giustificazione di ogni tipo di misurazione

Ma perch cos importante misurare?


la misurazione in psicologia serve per la descrizioni dei suoi oggetti di studio cos come accade in altre discipline in cui
si effettuano misurazioni di grandezze fisiche

scopo comune di tali misurazioni


-analisi e conoscenza dei fenomeni/problemi
-interventi pratici

chi opera professionalmente con le persone chiamato continuamente a fare delle valutazioni, ad elaborare giudizi, a
prendere decisioni
pi il numero di informazioni in nostro possesso pi la valutazione sar corretta.

Il processo di misurazione in psicologia si articola attraverso diverse fasi:


-

definizione teorica di un costrutto (concetto non osservabile direttamente), cio di una funzione psichica, di
una dimensione psicologica

definizione in termini operativi del costrutto e scelta di indicatori comportamentali in grado di rivelare la
presenza della data caratteristica o lappartenenza ad una data classificazione psicologica

messa a punto di uno strumento che consenta di ottenere delle misure, cio dei valori quantitativi di tali
indicatori (test)

quando si studia un evento necessario ridurne la complessit cercando di esplicitare, attraverso definizioni operative,
loggetto di studio: si tratta di definire quali caratteristiche dellevento riteniamo importanti e quali trascurabili
I procedimenti di valutazione numerica dei fenomeni psichici e comportamentali sono le SCALE DI MISURA

I DIVERSI TIPI DI SCALE DI MISURA


Scala = insieme di numeri o simboli le cui propriet rispecchiano le propriet empiriche degli oggetti alle quali sono
stati assegnati dei numeri
Le scale di misura si basano su tre elementi:
1.

Un sistema empirico

2.

Un sistema numerico

3.

Una regola che consente di passare da un sistema allaltro

Sistema empirico = un insieme di entit non numeriche (es. un insieme di persone, un insieme di stimoli, un insieme di
item ecc.)
Questi tre elementi sono interconnessi in quanto le propriet del sistema empirico condizionano la scelta del sistema
numerico, le caratteristiche del sistema numerico condizionano la scelta della regola che consente di passare dalluno
allaltro
Si distinguono 4 tipi di scale di misura

1.

scala nominale

2.

scala ordinale

3.

scala a intervalli equivalenti

4.

scala a rapporti equivalenti

SCALA NOMINALE
La scala nominale un modo per categorizzare le voci che interessano sulla base di una o pi caratteristiche distintive
rispetto alle quali esse vengono collocate in categorie mutuamente escludentesi ed esaustive
Sistema empirico = sistema in cui esiste solamente la suddivisione in categorie distinte e mutualmente escludentesi (es.
sesso, professione, stato civile ecc.)
Sistema numerico = misura utilizzata
Regola = attribuire numeri uguali agli elementi della stessa categoria e numeri diversi ad elementi appartenenti a
categorie diverse
Il sistema numerico ha la sola propriet di simbolo ed i numeri costituiscono solo delle denominazioni delle categorie
La scala nominale rappresenta una classificazione qualitativa del carattere che interessa
Il numero viene usato come simbolo non rappresenta una misura ma serve per identificare la categoria di
appartenenza del soggetto.
I numeri assegnati sono semplici etichette e non sono suscettibili di essere elaborati direttamente
Propriet formali della scala nominale:
-i membri di ciascuna categoria sono equivalenti tra loro
-i membri di categorie diverse non sono equivalenti
la relazione di equivalenza tra i membri
-

simmetrica (se A uguale a B, anche B uguale ad A)

transitiva (se A uguale a B e B uguale a C, anche C sar uguale ad A)

Le operazioni consentite dal punto di vista statistico sono:


-conteggio di frequenze
-uso di metodi che trattano dati categoriali (non sono possibili operazioni aritmetiche come addizioni, sottrazioni,
gerarchie ecc.)

SCALA ORDINALE
La scala ordinale una scala quantitativa che descrive un ordine di rango tra le caratteristiche classificate
Sistema empirico = gli elementi che lo compongono godono della stessa caratteristica ma in quantit o grado diverso, il
sistema ordinabile rispetto a tale grado
Il sistema numerico indica la posizione reciproca degli elementi
Regola = ad uno stesso numero associata una stessa quantit di caratteristica; i numeri indicano solamente una
graduatoria tra le quantit di caratteristiche presenti
Attribuire un rango significa associare a ciascun elemento del gruppo un numero corrispondente al posto che tale
soggetto occupa rispetto agli altri del gruppo
Come la scala nominale permette di fare delle classificazioni tra le caratteristiche psicologiche ma oltre a ci consente
di organizzarle secondo una gerarchia
Le regole utilizzate per costruire una scala ordinale sono:
-

i soggetti ai quali viene assegnato il numero 1 presentano una quantit superiore della caratteristica oggetto di
misura rispetto ai soggetti ai quali viene assegnato il numero 2

tutti i soggetti ai quali viene assegnato lo stesso numero presentano la stessa quantit della caratteristica in
esame

il numero assegnato non corrisponde direttamente alla quantit della caratteristica che interessa ma indica una relazione
dordine tra le quantit
(pi grande di)
Esempio di scala ordinale:
classificazione dellordine di arrivo di 10 soggetti ad una gara
Propriet formali della scala ordinale
-equivalenza tra tutti i membri di una medesima categoria
-relazione dordine tra le categorie
la relazione dordine tra le categorie
-

asimmetrica (se A maggiore di B, B non sar maggiore di A)

transitiva (se A maggiore di B, essendo B maggiore di C, anche A maggiore di C)

operazioni statistiche consentite


-conteggio di frequenza
-metodi statistici applicabili a ordini di rango (non sono possibili operazioni di
tipo aritmetico come addizioni, sottrazioni ecc.)
7

limiti delle scale ordinali


-

una scala ordinale fornisce solo un ordine di rango tra i soggetti ma non d alcuna indicazione su quanto
grande sia la distanza tra un soggetto ed un altro (non si sa di quanto B abbia superato A)

le scale ordinali non hanno uno zero assoluto e non dispongono di una unit di misura per cui le grandezze che
intercorrono tra i diversi livelli della scala non sono omogenee (es. la distanza tra il primo ed il secondo
classificato non necessariamente uguale alla distanza tra il terzo ed il quarto ecc.)

altro esempio:
se le risposte ad un item di un test sono: spesso raramente mai
(si attribuisce

3 alla risp. spesso,

2 alla risp. raramente,

1 alla risp. mai)

non possibile affermare che

alla risp. raramente (=2) associata la caratteristica in quantit doppia rispetto alla risp. mai (=1)

la differenza di quantit di caratteristica posseduta da chi risponde mai (=1) e chi risponde raramente (=2) sia
uguale a quella che intercorre tra chi risponde raramente (=2) e chi risponde spesso (=3)

nonostante questi limiti le informazioni ricavate attraverso una scala ordinale possono essere utilmente sfruttate per
prendere decisioni
(esempio: dovendo selezionare delle persone per un numero limitato di posti di lavoro lesaminatore pu scegliere le
prime in graduatoria)

SCALA AD INTERVALLI EQUIVALENTI


La scala ad intervalli equivalenti consente di misurare la distanza tra le caratteristiche classificate
caratterizzata da un intervallo uguale tra i diversi valori in quanto dispone di una unit di misura
La scala ad intervalli equivalenti utilizza ununit di misura costante che consente di effettuare operazioni algebriche
basate sulle differenze tra i numeri associati ai diversi punti della scala
Nel sistema empirico presente ununit di misura
Nel sistema numerico possibile stabilire lentit delle differenze di intensit della caratteristica
Esempio: punteggi al test di intelligenza in 10 soggetti
Soggetti
A
B
C
D
E
F
G
H
I
L

Punteggi al test di intelligenza


130
80
100
90
95
105
85
75
65
80

La scala in grado di
-

indicare qual il soggetto pi intelligente (livello ordinale)

valutare se la differenza tra due soggetti, A e B, pi grande o pi piccola della differenza tra C e D

La scala parte da uno zero arbitrario:


come la scala ordinale non prevede uno zero assoluto
Anche se la scala che viene utilizzata per misurare una caratteristica (es. intelligenza) prevede un punteggio uguale a
zero non si pu pensare che un individuo abbia intelligenza pari a zero.
Ne segue che non possibile stabilire rapporti diretti tra le misure ottenute
Senza la possibilit di stabilire uno zero assoluto non possibile parlare di una vera e propria quantit di caratteristica
misurata. Pertanto, le misure di costrutti psicologici come la personalit, lintelligenza, gli atteggiamenti, misurati su
scale ad intervalli forniscono indicazioni non tanto sulla quantit effettiva dellaspetto misurato nei soggetti valutati
quanto sulla loro posizione reciproca
Propriet formali della scala ad intervalli equivalenti:
9

-costanza del rapporto tra gli intervalli che consente di utilizzare tutte le tecniche statistiche (le relazioni tra le distanze
non cambiano)
- possibile affermare che la distanza tra la quantit di intelligenza posseduta da C (=100) e D (=90) la met della
distanza tra le quantit di intelligenza possedute da G (=85) e I (=65)
- possibile eseguire somme algebriche tra i punteggi: gli individui A (=130) e I (=65) possiedono complessivamente la
stessa quantit della caratteristica misurata posseduta dagli individui C (=100) e E (=95)
il limite della scala lassenza di un zero assoluto: non possibile sostenere che A (=130) possieda il doppio
dellintelligenza di I (=65) anche se il suo punteggio doppio rispetto a I.

10

SCALA A RAPPORTI EQUIVALENTI


la scala che consente il pi elevato livello di misura possibile
Lorigine della scala lo zero assoluto
A differenza della scala ad intervalli il punto zero non arbitrario ma indica unassenza reale e totale della propriet
misurata
Nel sistema empirico possibile identificare oltre allunit di misura anche un elemento di intensit nulla
Il sistema numerico godr di tutte le propriet dei numeri reali
La regola di trasformazione potr comprendere anche luguaglianza del rapporto tra due elementi
Qualsiasi misura si effettui con una scala a rapporti pu essere interpretata in termini di distanza dallo zero reale
possibile effettuare operazioni non solo sulle differenze tra i valori della scala ma anche sui valori stessi
Esempio
Tempo impiegato per risolvere un problema
Soggetti
A
B
C
D
E
F
G
H
I
L

Tempo (minuti)
1
1
2
3
1
4
5
2
2
1

possibile affermare che A (=1 min) ha impiega met del tempo impiegato da C (=2 min)
Propriet formali: costanza del rapporto tra i valori utilizzati
Sono di questo tipo i sistemi empirici del peso, dellet, della lunghezza ecc.
In psicologia tali sistemi sono relativamente rari, il pi usato il tempo di reazione

11

DEFINIZIONE E CLASSIFICAZIONE DEI TEST PSICOLOGICI


Gli strumenti di misurazione delle caratteristiche psicologiche sono i test
Gli strumenti di misura si basano sullosservazione, in situazioni pi o meno controllate, delle reazioni degli individui
a stimoli pi o meno standardizzati
(Si intende per standardizzati quegli stimoli per i quali sono gi previste le modalit di risposta)
Il presupposto teorico sottostante che gli individui differiscono realmente ed in modo relativamente stabile nei loro
comportamenti, attitudini, interessi ecc.
Lobiettivo dei costruttori di test mettere a punto delle procedure per trasformare queste differenze psicologiche in
differenze quantitative e numeriche, in cui luso dei numeri servir ad esprimere tali differenze
test = procedura sistematica attraverso la quale viene presentato ad una persona un insieme di stimoli (domande,
problemi, compiti ecc.) in grado di elicitare particolari risposte valutabili ed interpretabili quantitativamente sulla base
di criteri specifici o di definiti standard prestazionali
Il test una situazione standardizzata volta alla stimolazione di un comportamento che valutato mediante confronto
con quello di individui posti nella stessa situazione, al fine di classificare il soggetto sia quantitativamente che
tipologicamente.
I reattivi psicologici rappresentano, pertanto, un tentativo di ottenere campioni completi e sistematici di certi tipi di
comportamento in una situazione standardizzata in cui, allinterno del processo di raccolta dei dati, la valutazione
soggettiva ridotta al minimo, o talora del tutto assente
scopo del test ottenere una prestazione qui ed ora da parte di un soggetto, che permetta di fare una previsione, una
generalizzazione circa il comportamento che egli manifester al di fuori della situazione di testing
i test sono mezzi di conoscenza che hanno lo scopo di valutare in modo il pi possibile oggettivo caratteristiche ritenute
importanti per diversi scopi

gli strumenti di misura si possono classificare in base al tipo di


stimolo

situazione
SITUAZIONE

Non standardizzato

Controllata

Non controllata

Test proiettivi

Osservazione libera
Intervista

STIMOLO
Standardizzato

Test cognitivi
Test di personalit
Scale atteggiamento

Intervista semi-strutturata
Osservazione sistematica

12

Le diverse caratteristiche del comportamento di un individuo possono essere studiate attraverso strumenti diversi con un
diverso grado di controllo da parte dellosservatore
Alcune caratteristiche sono rilevabili solo con certi strumenti (es. il profitto in una materia non pu essere valutato
attraverso un test proiettivo!)
centrale, quindi, la definizione operativa del costrutto oggetto di misura
i test non sono strumenti perfetti di valutazione e conoscenza ma presentano sempre un grado di precisione limitato che
per pu essere quantificato
nessun test da solo offre delle garanzie assolutamente sicure circa possibili decisioni sugli individui: non esistono
metodi o strumenti in grado di azzerare ogni margine di errore
anche altre modalit di indagine utilizzate in ambito psicologico (interviste, colloqui ecc.) sono soggette ad errori la cui
entit pu essere incrementata ulteriormente da interferenze di tipo soggettivo (es. caratteristiche dellintervistatore)
anche se i test costituiscono delle misure imperfette degli attributi psicologici rappresentano la forma migliore, pi
corretta ed economica per ottenere le informazioni necessarie al fine di prendere decisioni riguardanti le persone

In sintesi
gli elementi che caratterizzano un test come strumento di misura sono:
a.

un insieme di stimoli (item) presentati al soggetto in condizioni uniformi (standardizzate)

b.

una risposta o prestazione data agli stimoli proposti (campione di un comportamento)

c.

lattribuzione di un punteggio alla prestazione secondo criteri standardizzati e definiti a priori e interpretabili in
relazione a particolari standard di performance

13

MODELLI DI COSTRUZIONE DEI TEST PSICOLOGICI


il processo di misurazione in psicologia si articola attraverso diverse fasi:
-

definizione teorica di un costrutto (concetto non osservabile direttamente), cio di una funzione psichica, di
una dimensione psicologica (LIVELLO TEORICO + LIVELLO DERIVATO)

definizione in termini operativi del costrutto e scelta di indicatori comportamentali in grado di rivelare la
presenza della data caratteristica o lappartenenza ad una data classificazione psicologica (LIVELLO
EMPIRICO)

messa a punto di uno strumento che consenta di ottenere delle misure, cio dei valori quantitativi di tali
indicatori (test)
possibile pertanto distinguere 3 livelli di astrazione presenti nella costruzione di un test psicologico
1.

livello teorico (livello dei concetti)

2.

livello derivato

3.

livello empirico (livello delle misurazioni)

1. livello teorico = teoria pura, sistema di idee e di considerazioni legate


in maniera coerente tra loro

definizione teorica della dimensione psicologica in questione

IDEA
CONCETTO TEORICO

proposizioni non osservabili

i legami tra le idee nella teoria sono chiamati proposizioni non osservabili

14

2. livello derivato = i concetti derivati sono anchessi dei concetti astratti ma pi dettagliati dei concetti teorici
la relazione tra concetti teorici e concetti derivati chiamata definizione teorica e genera un costrutto teorico
costrutto teorico = definizione di una nozione teorica tale che se ne possa dare una definizione empirica
la definizione del costrutto meno astratta del livello teorico e fornisce pi elementi descrittivi
CONCETTO TEORICO

Definizione teorica costrutto teorico

CONCETTO DERIVATO

3. livello empirico = livello che consente una definizione in termini operativi del costrutto e scelta di indicatori
comportamentali in grado di rivelare la presenza della data caratteristica
i legami tra i concetti teorici-derivati ed i concetti empirici si definiscono regole di corrispondenza
attraverso le regole di corrispondenza si determinano le definizioni operative
definizione operativa = definizione attraverso la quale si indica chiaramente come si pu misurare il costrutto teorico,
attraverso quali indicatori comportamentali

CONCETTO
TEORICO
DERIVATO

Regole di corrispondenza (definizione operativa)


cosa misuro

CONCETTO EMPIRICO

15

il legame tra i concetti empirici e la realt osservata si chiama definizione empirica


definizione empirica= spiegazione del metodo utilizzato per la raccolta dei dati, viene esplicitata la precisa operazione
che si compie per raccogliere i dati (es. usando questionario carta e matita, scheda di autoosservazione)

CONCETTO EMPIRICO
Definizione empirica
(metodo di misura)
come misuro
REALT
OSSERVATA
il livello empirico osservabile e misurabile, il dominio della psicometria intesa come ambito che riguarda le
misurazione di caratteristiche psicologiche
In sintesi
quando si misura si cerca di fornire un valore empirico ad un concetto teorico
il concetto teorico viene colto empiricamente solo attraverso una misurazione
CONCETTO TEORICO

Definizione teorica costrutto teorico

CONCETTO
TEORICO
DERIVATO

Regole di corrispondenza (definizione operativa)


cosa misuro

CONCETTO EMPIRICO
Definizione empirica
(metodo di misura)
come misuro
REALT
OSSERVATA
16

esempio
teoria della frustrazione-aggressione di Dollard et al. (1939)
1. livello teorico = la frustrazione viene ipotizzata come causa dellaggressivit
(tra frustrazione ed aggressivit presente un legame proposizionale non osservabile)
2. livello derivato-costrutto teorico= si definisce laggressivit come insieme di comportamenti atti a recare danno
intenzionale ad unaltra persona;
sulla base di questa definizione teorica dellaggressivit
- deriva che laggressivit descritta in termini di comportamento e non di emozioni, un concetto esclusivamente
comportamentale
-si esclude che si possa definire aggressione: un danno non intenzionale, un danno intenzionale ad un oggetto, un danno
intenzionale verso se stesso
( evidente come nella definizione di un costrutto teorico necessario non solo specificare cosa sia il concetto teorico
descritto ma anche quello che non )
3. livello empirico
possibili definizioni operative dellaggressivit:
-numero di volte in cui la persona utilizza la forza fisica
-punteggio totale in un questionario di autovalutazione contenente frasi che fanno riferimento a comportamenti di tipo
aggressivo
-valutazione su una scala di unaltra persona che conosce bene il soggetto e lo valuta relativamente ad una serie di
comportamenti (es. perdere la calma facilmente, usare le maniere forti ecc.)
data la complessit dei costrutti psicologici essi sono raramente definibili solo con un metodo di misurazione, ne segue
che esistono pi definizioni operative per uno stesso costrutto
(definizione operativa = definizione attraverso la quale si indica chiaramente come si pu misurare il costrutto teorico,
attraverso quali indicatori comportamentali)

esistono molti indicatori per ogni costrutto


INDICATORE = misura empirica che tramite una regola di corrispondenza (cio una definizione operativa) si pone in
relazione al costrutto teorico, una variabile osservata che si ipotizza cogliere il costrutto o una parte di esso

17

Esempi di indicatori: tempo di reazione ad un dato stimolo, frequenza di un determinato comportamento ecc.
Per il costrutto aggressivit secondo la teoria di Dollard gli indicatori sono:
-numero di volte in cui la persona utilizza la forza fisica
-punteggio totale in un questionario di autovalutazione contenente frasi che fanno riferimento a comportamenti di tipo
aggressivo
-valutazione su una scala di unaltra persona che conosce bene il soggetto e lo valuta relativamente ad una serie di
comportamenti (es. perdere la calma facilmente, usare le maniere forti ecc.)

importante che ci sia il massimo raccordo tra la definizione teorica e la definizione empirica: la scelta degli indicatori
deve essere strettamente collegata alla definizione teorica

CONCETTO
TEORICO
DERIVATO
Regole di corrispondenza (definizione operativa)
cosa misuro
CONCETTO
EMPIRICO
Def. empirica
(metodo di misura)
come misuro
METODO DI
MISURA 1

INDICATORE 1
(VARIABILE OSSERVATA)

METODO
DI MISURA 2

INDICATORE 2

INDICATORE 3

INDICATORE 4

ci significa che possiamo avere regole di corrispondenza (definizioni operative) diverse per misurare uno stesso
costrutto teorico

18

CONCETTO
TEORICO
COSTRUTTO
Regole di corrispondenza
(definizione operativa)
cosa misuro

CONCETTO EMPIRICO
Definizione empirica
(metodo di misura)
come misuro
REALT
OSSERVATA
INDICATORE

Definizione empirica (metodo di misura)


come misuro

TEST
PSICOLOGICO

La misura del concetto empirico si ottiene con un test psicologico


Per costruire un test psicologico bisogna quindi utilizzare un modello teorico specifico
possibile definire i modelli di costruzione dei test psicologici come regole di corrispondenza tra indicatori e costrutti
teorici

19

I modelli principali utilizzati per la costruzione dei test sono:


1.

modello classico della teoria dei test: la teoria dellerrore casuale

2.

modello derivante dalla teoria della generalizzabilit

3.

modelli derivanti dalla teoria rappresentazionale della misurazione

4.

modelli della teoria della risposta allitem

LA TEORIA DELLERRORE CASUALE


Presupposto: la misura di ogni oggetto o caratteristica, in qualunque disciplina, per definizione imprecisa
es. se misuriamo ripetutamente la lunghezza di un tavolo non otterremo mai al millimetro la stessa misura
le misure di caratteristiche fisiche hanno raggiunto livelli di precisione soddisfacenti che consentono di trarre
conclusioni attendibili sulle misure degli oggetti
in psicologia limprecisione delle misure pi elevata
(attendibilit della misura)
La misura non mai un valore puntuale ma un intervallo di incertezza
la grande maggioranza dei test psicologici stata costruita sulla base della teoria dellerrore casuale
il modello classico risale al lavoro di Charles Spearman
secondo tale modello il punteggio ottenuto ad un test scomponibile in due componenti ipotetiche
X=V+E
X= punteggio ottenuto in una misurazione
V= punteggio vero, reale valore della caratteristica misurata
E= errore nella misurazione
Il punteggio osservato ad un test include una parte di punteggio vero ed una componente di errore inerente allatto di
misurare
Quando si misura si cerca di fornire un valore empirico ad un concetto teorico
Il concetto teorico viene colto empiricamente solo attraverso una misurazione
Nellatto di misurare inevitabile che avvengano degli errori connessi alloperazione stessa

20

Secondo la teoria dellerrore casuale si possono distinguere

errori sistematici

errori casuali

errore sistematico = errore il cui effetto influenza sistematicamente, cio nella stessa direzione e con la stessa intensit,
tutti i punteggi raccolti ad un test
lerrore sistematico uguale per tutti i soggetti, pertanto nel caso di confronto tra soggetti come se si aggiungesse una
costante alla variabile misurata che non modifica le inferenze su di essa
al contrario se si volessero raggiungere delle conclusioni sul valore assoluto della variabile misurata lerrore sistematico
sarebbe fuorviante in quanto porterebbe a fare affermazioni sul valore della variabile che a seconda della grandezza
dellerrore sistematico potrebbero essere relativamente lontane dai valori reali
(es. si vuole misurare il tempo di reazione ad un certo stimolo visivo per cui si misura il tempo, registrato da un
computer, che il sogg impiega a premere un tasto della tastiera: la misura effettuata non sar mai perfetta perch ci sar
una frazione di tempo tra quando il sogg preme il tasto e quando questo segnale verr trasmesso alla memoria, questo
errore sar uguale per tutti i sogg)
generalmente lerrore sistematico per la misura delle variabili psicologiche meno fuorviante dellerrore casuale
soprattutto quando le inferenze effettuate sono comparative e non assolute, tutti i soggetti hanno utilizzato lo stesso
strumento e quindi hanno nel loro punteggio la stessa porzione di errore
unaccurata costruzione e taratura dello strumento pu tendenzialmente eliminare lapporto di errori sistematici o
almeno ridurne il contributo
errore casuale = errore che agisce in modo diverso per soggetti diversi sottoposti ad uno stesso test
lerrore casuale ha una natura non sistematica in quanto non si in grado di prevederne la direzione e varier da
soggetto a soggetto
errori casuali possono derivare da
-ambiguit dellitem (lerrore varier da soggetto a soggetto in funzione di come egli interpreta il significato dellitem)
-umore del soggetto
-stanchezza
-somministratore
lerrore casuale pu avere effetti molto importanti sulla attendibilit e validit del test
allinterno dellapproccio classico la teoria dellattendibilit e della validit sono costruite a partire proprio dal concetto
di errore casuale
il punteggio di un soggetto ad un test non sar mai il punteggio vero
il punteggio osservato infatti una variabile che assume i suoi valori secondo una distribuzione di probabilit che
contiene il punteggio vero
data una serie infinita di misurazioni lerrore di misurazione scompare ed il punteggio derivato dalla media di tutti i
punteggi osservati il punteggio vero
nella realt non possibile fare una serie infinita di misurazioni per cui lerrore inevitabile

21

il punteggio di un soggetto al test considerato un campione proveniente da una popolazione (o universo) di punteggi
possibili contenente il punteggio vero
di conseguenza tanti pi campionamenti effettueremo tanto pi la media dei campioni tender alla media della
popolazione cio al punteggio vero
un test una modalit capace di catturare sistematicamente la parte vera dei punteggi degli item che la compongono

22

METODI DI COSTRUZIONE DEI TEST PSICOLOGICI


Il processo di costruzione di un test pu essere diviso in 6 fasi
1.

determinazione del costrutto da misurare

2.

preparazione della prima versione del test

3.

prove preliminari del test gli item che compongono la versione provvisoria sono sottoposti ad una prima
revisione che consente di rifinire ulteriormente la prima versione del test

4.

somministrazione del test la prima versione del test somministrata ad un campione adeguato di soggetti

5.

selezione degli item sulla base dei risultati ottenuti vengono selezionati gli item che comporranno la versione
definitiva (le fasi 4 e 5 sono ripetute finch il test non ha caratteristiche adeguate)

6.

versione finale del test la versione finale del test viene somministrata ad un campione adeguato allo scopo di
averne una sua taratura; vengono verificate le caratteristiche psicometriche, vengono forniti i punteggi di
riferimento, vengono descritte le modalit di somministrazione, alla fine viene prodotto il manuale
FASE 1: DETERMINAZIONE DEL COSTRUTTO

Presupposto: la misurazione un tentativo di dare sostanza empirica a concetti teorici astratti, la misurazione senza una
teoria un atto vuoto
Il primo passo in un processo di misurazione scegliere cosa misurare
La scelta di misurare un certo costrutto dipende dai nostri interessi teorici, si arriva a ritenere importante quel costrutto
allinterno del campo teorico di cui ci occupiamo
Il secondo passo la definizione chiara del costrutto
La definizione del costrutto ha vari elementi di soggettivit, cio legati alle scelte del ricercatore, ma non deve essere
arbitraria, le scelte devono sempre essere giustificate cio coerenti con le premesse, con il metodo.
Prima di fornire una definizione specifica bisogna passare in rassegna tutti i lavori teorici e le ricerche principali che nel
panorama scientifico internazionale si sono occupate direttamente o indirettamente di questo costrutto.
necessario comprendere come altri autori hanno affrontato questo problema, se gi esiste una definizione ed una scala
di misura adeguata del costrutto ecc.
La definizione del costrutto non arbitraria ma possibile giustificare la sua definizione in base a lavori precedenti, a
teorizzazioni rilevanti, a scale di misura gi esistenti
Pertanto molto raramente si proporranno delle definizioni completamente nuove
Alla fine di questo processo emerger il costrutto teorico che si intende misurare, inserito nella letteratura teorica
rilevante, chiaramente definito e pronto a essere operazionalizzato empiricamente

23

Es.
livello derivato-costrutto teorico= si definisce laggressivit come insieme di comportamenti atti a recare danno
intenzionale ad unaltra persona
Sulla base di questa definizione teorica dellaggressivit deriva che

laggressivit descritta in termini di comportamento e non di emozioni, un concetto esclusivamente


comportamentale

si esclude che si possa definire aggressione: un danno non intenzionale, un danno intenzionale ad un oggetto,
un danno intenzionale verso se stesso

FASE 2: PREPARAZIONE DELLA VERSIONE PRELIMINARE


DEL TEST
Si procede allo sviluppo di item che catturino il significato del costrutto psicologico definito
Definizione criteri generatori

Studio prototipico

Scelta del formato di risposta

Scelta del numero di item del test finale

Generazione degli item

Obiettivo studio prototipico= avere elementi di conoscenza che possano ampliare la nostra conoscenza teorica del
costrutto
possibile ricorrere allopinione di persone esperte del campo oppure anche non esperte che possano contribuire alla
comprensione di quei comportamenti che si associano alla presenza del costrutto
Es. discussione approfondita con colleghi che studiano costrutti simili, focus group (piccoli gruppi di discussione
composti da persone assimilabili ai sogg per i quali il test finale mirato con analisi dei contenuti da cui si ricavano
suggerimenti per la definizione dei criteri generatori)
Lo studio prototipico raffina la definizione dei criteri generatori per gli item
Questa modalit utilizzata soprattutto per test di personalit o scale di atteggiamento, meno per i test cognitivi
Una volta definiti i criteri generatori si produrr un numero di item approssimativamente uguale per ognuno di essi

24

Scelta del formato di risposta = a seconda del formato bisogna formulare gli item in un modo o in un altro (test di
personalit: vero/falso, s/no, stimoli ambigui; scale di atteggiamento: scala di Likert completamente falso, molto
falso, abbastanza falso, n vero n falso, abbastanza vero, molto vero, completamente vero; test di intelligenza: item a
esclusione, item analogici, item a sequenza, item di vocabolario, item di abilit spaziali ecc)
Scelta del numero di item del test finale
Premessa: lattendibilit di un test aumenta con laumentare del numero degli item (considerando ogni item un tentativo
di misurazione del costrutto il test pu essere considerato come un insieme di misure ripetute della stessa variabile, ne
segue che se si aumentano gli item aumenta la precisione della misura), quando il numero degli item e la durata di
compilazione del test sono eccessive la validit diminuisce (i sogg tendono a perdere motivazione e rispondere in modo
casuale)
Come indicazione di massima per avere unattendibilit minimamente sufficiente conviene utilizzare almeno 10 item
per ogni dimensione con un tempo di compilazione tra i 15 e i 30 minuti
Per la versione preliminare necessario produrre almeno il doppio degli item della versione finale per avere la
possibilit di selezionare gli item che rispondono meglio ai criteri metodologici e statistici seguiti nella costruzione del
test

FASE 3: PROVE PRELIMINARI DEL TEST


Gli item che compongono la versione provvisoria sono sottoposti ad una prima revisione che consente di rifinire
ulteriormente la prima versione del test
Obiettivo= rifinire la formulazione degli item, eliminando o riformulando opportunamente quegli item che risultano
ambigui o di difficile comprensione
I giudici migliori delladeguatezza semantica degli item sono sempre i soggetti ai quali essi saranno somministrati

realizzazione di uno studio pilota per indagare


comprensibilit ed ambiguit degli item
Es. si pu chiedere ai soggetti dello studio pilota di fornire una spiegazione scritta del significato delle frasi e di valutare
su una scala da 0 a 10 quanto sia chiara e comprensibile
Da questi risultati si procede alla riformulazione degli item (es. eliminazione di parti che creano ambiguit o difficolt
di comprensione, introduzione di item nuovi ecc.)
Per completare la preparazione del test preliminare necessario scrivere in chiaro le istruzioni per la sua
somministrazione che consentano al soggetto di comprendere appieno qual il suo compito
Di solito si usa la prima pagina del test in cui vanno spiegate:
-le finalit della ricerca
-le modalit di risposta agli item con esempi chiarificatori
25

-che assicurata lanonimit e la riservatezza delle risposte


-limportanza della sincerit delle risposte

FASE 4: SOMMINISTRAZIONE DEL TEST


La prima versione del test somministrata ad un campione adeguato di soggetti
Prima di arrivare alla versione finale necessario preventivare almeno 2 somministrazioni
percorso iterativo:

somministrazione selezione
nuova somministrazione nuova selezione
nuova somministrazione ecc.

Criteri pratici per stabilire quali e quanti sogg. contattare per la somministrazione

buona regola avere un rapporto tra numero di item e soggetti di almeno 1 a 3 (3 soggetti per ogni item) e non
scendere sotto i 100 soggetti; ci garantisce che lapplicazione di alcuni metodi statistici (es. analisi fattoriale)
diano risultati affidabili

necessario raccogliere un campione di soggetti che tenga conto delle variabili descrittive e demografiche che
possono influenzare le risposte e che cerchi di essere bilanciato in tal senso, indispensabile effettuare una
stratificazione almeno rispetto al sesso raccogliendo un campione composto da met maschi e met femmine;
rispetto alle altre variabili, qualora sia difficile una vera stratificazione rispetto allet, alla classe sociale, alla
professione, preferibile raccogliere persone di et differente, variare la professione

(se per la versione finale del test indispensabile una stratificazione accurata, in questa fase sufficiente raccogliere un
campione il pi possibile eterogeneo rispetto alle variabili usate per la stratificazione)

FASE 5: SELEZIONE DEGLI ITEM

Sulla base dei risultati ottenuti vengono selezionati gli item che comporranno la versione definitiva
Le 4 fasi descritte per la costruzione di un test possono essere considerate applicabili in generale, con le dovute
specificit, a test di vario tipo
Le modalit di selezione degli item sono molto diverse a seconda del tipo di test
La capacit discriminativa di un item viene valutata con metodi diversi, la prima grande distinzione riguarda se il test
prevede una risposta esatta oppure no
In entrambi i casi, anche se con metodi diversi, gli item sono selezionati in base alla loro capacit discriminativa.

26

Un esempio di metodo per la selezione di item con risposte esatte basati sulle caratteristiche distributive degli item
lutilizzo dellindice di difficolt dellitem
Si ha un test con un certo numero di item, ogni item ha una sola risposta esatta
Somministrato il test la prima informazione di cui si dispone il numero di persone che hanno risposto correttamente ed
il numero di persone che hanno sbagliato. Lindice di difficolt dellitem (p) rapporto tra il n di persone che hanno
risposto correttamente ad un item (Np) ed il n totale delle persone
p= Np
N
0 (quando Np=0, nessuno ha risposto correttamente)
P varia tra
1 (quando Np = 1 tutti hanno risposto correttamente)
Se p=.50 significa che met dei soggetti hanno risposto correttamente allitem laltra met ha sbagliato, in questo caso
litem riesce a descrivere le differenze tra le persone pertanto molto discriminativo
Un criterio per selezionare gli item sar quello di eliminare quelli che discriminano poco
Si eliminano quegli item ai quali molti soggetti rispondono o correttamente o erroneamente. Se ad un item tutti i
soggetti rispondono in modo corretto questitem non avr alcuna capacit discriminativa
possibile selezionare gli item definendo un intervallo di p allinterno del quale ritenere sufficiente la capacit
discriminativi dellitem. Di solito questintervallo viene posto tra .20 e .80: si selezionano quegli item ai quali risponde
correttamente tra il 20% e l80% dei soggetti
Altri metodi per item con risposte esatte sono: il calcolo dellindice di discriminazione ottenuto in base ai rapporti tra un
singolo item ed il punteggio totale dei cui litem parte, la valutazione della correlazione tra litem ed il punteggio
totale del test ecc.
Altri criteri di selezione sono parte del processo di verifica della validit e dellattendibilit di un test

27

FASE 6: VERSIONE FINALE DEL TEST


la versione finale del test viene somministrata ad un campione adeguato allo scopo di averne una sua taratura
Operazioni realizzate in questa fase

verifica delle caratteristiche psicometriche

definizione dei punteggi di riferimento

descrizione delle modalit di somministrazione

realizzazione del manuale

28

LA VALIDIT DI UN TEST
DIMENSIONALIT DI UN TEST
Assunzione alla base della costruzione di un test:
si ipotizza che gli item (gli indicatori) siano il riflesso osservabile del costrutto latente
Problema: come possibile empiricamente stabilire il numero e le caratteristiche delle dimensioni latenti di un test?
Come si fa ad essere sicuri che il test misura effettivamente la/le dimensione/i da noi immaginate?
Allo scopo di verificare empiricamente le dimensioni misurate dal test la tecnica delezione per lo studio della
dimensionalit lanalisi fattoriale
Analisi fattoriale = tecnica statistica che consente di individuare dimensioni latenti ad una serie di item o variabili
Si parte dal presupposto che se alcune variabili correlano tra di loro si pu ipotizzare che ci sia qualcosa che le
accomuna
Esempio
Dalla descrizione di una persona emerge che ama andare alle feste, parlare con persone appena conosciute, prendere
liniziativa nel conoscere persone nuove. Per molte persone questi comportamenti si presentano relativamente insieme,
cio se piace parlare con persone sconosciute facile trovare nella stessa persona il piacere di andare alle feste ecc.
esiste quindi una correlazione positiva tra questi comportamenti
Si pu ipotizzare che una qualche dimensione latente a questi comportamenti sia la causa di queste correlazioni
Attraverso lanalisi fattoriale si cerca in primo luogo di valutare se queste correlazioni sono sufficientemente elevate e
coese da consentire lemergere di una dimensione che le accomuni
Se queste variabili si raggruppano in una o pi dimensioni (fattore) si cerca di capire qual questa dimensione e se essa
corrisponde a quanto in partenza si sia ipotizzato
Si parte con unipotesi e si verifica con lanalisi fattoriale se questipotesi plausibile
La dimensione alla base delle variabili presentate pu essere lestroversione
Lanalisi fattoriale serve per identificare i fattori latenti (dimensioni, tratti o componenti) che spiegano le correlazioni
tra delle variabili osservate (indicatori o item) in maniera parsimoniosa, il numero di fattori sempre inferiore rispetto
al numero di item di partenza
Durante lanalisi possibile che siano scartati alcuni item sulla base di una scarsa relazione con i fattori estratti o che sia
riconsiderato il numero di fattori da estrarre
Nel caso in cui siano stati scartati alcuni item o si sia deciso di estrarre un numero diverso di fattori, sono ripetuti
iterativamente questi ultimi due passaggi finch non si giudichi soddisfacente la soluzione fattoriale

29

Attraverso lanalisi fattoriale possibile

comprendere la dimensionalit del test e quindi verificare la validit dellipotesi di partenza (in che misura gli
item sono il riflesso osservabile del costrutto latente)

selezionare gli item migliori, cio quelli che maggiormente sono riferibili alle dimensioni latenti

la selezione degli item in funzione dei risultati dellanalisi fattoriale non avviene in un solo passaggio: un processo
iterativo in cui di volta in volta alcuni item sono eliminati, viene nuovamente effettuata unanalisi fattoriale, vengono
eliminati altri item e cos via finch la soluzione finale non sia soddisfacente

30

LATTENDIBILIT DELLE DIMENSIONI DI UN TEST:


quanto preciso questo test?
Lattendibilit si riferisce alla precisione dello strumento
Attendibilit = una misurazione si definisce attendibile se quando viene compiuta in momenti diversi, da operatori
diversi, con strumenti diversi d gli stessi risultati
accordo tra tentativi indipendenti di misurare lo stesso concetto teorico
La grande maggioranza dei test psicologici stata costruita sulla base della teoria dellerrore casuale
Presupposto: ogni tentativo di misurazione affetto da errore
ne segue che X = V + E
X= punteggio ottenuto in una misurazione
V= punteggio vero, reale valore della caratteristica misurata
E= errore nella misurazione

Il punteggio ottenuto da un individuo ad un test costituito da


il punteggio vero + lerrore di misura
Gli studi sullattendibilit si propongono di quantificare lincidenza degli errori casuali sulle misurazioni
Lattendibilit la percentuale di X (punteggio rilevato) che dovuta al punteggio vero e che non riflette lerrore
casuale di misurazione
Lattendibilit uguale al rapporto tra la componente vera del punteggio (V) e la somma della componente vera (V) e di
errore casuale (E) della misurazione
Attendibilit

p = V__
V+E

0 (V=0)
Lattendibilit varia tra
1 (E=0)

31

Quanto pi p si avvicina a 0 pi la componente di punteggio vero assente, il punteggio in realt non misura nulla e
riflette solo la componente di errore casuale
Quanto pi p si avvicina a 1 tanto pi la misura priva di errore casuale
p=1 una situazione ideale irraggiungibile
data una serie infinita di misurazioni lerrore di misurazione scompare ed il punteggio derivante dalla media di tutti i
punteggi osservati il punteggio vero
nella realt non possibile fare una serie infinita di misurazioni
(in genere misure che dimostrano di includere nel punteggio osservato un 70% di punteggio vero sono considerate
sufficientemente affidabili (p> 70))
il punteggio di un soggetto ad un test considerato un campione proveniente da una popolazione di punteggi possibili
contenente il punteggio vero tanti pi campionamenti effettueremo tanto pi la media dei campioni tender alla
media della popolazione (punteggio vero)

per un numero infinito di misurazioni la media del punteggio osservato uguale alla media del punteggio vero
affinch per infinite misurazioni il punteggio vero e la media dei punteggi osservati coincidano necessario che:
-lerrore sia indipendente dal punteggio vero, la correlazione tra punteggio vero ed errore casuale deve essere nulla
altrimenti sarebbe un errore sistematico
-la media degli errori casuali per infinite misurazioni deve essere uguale a zero, altrimenti non ci sarebbe coincidenza
tra media dei punteggi osservati e punteggio vero, e lerrore sarebbe sistematico
-la correlazione tra errori di uno stesso soggetto in occasioni diverse deve essere uguale a zero (se si assume che il
punteggio sia un campione casuale di una popolazione, levento errore deve essere indipendente dallevento errore
precedente, se cos non fosse non sarebbe unestrazione casuale)

32

2 disegni di ricerca
per misurare lattendibilit di un test

metodo delle differenze tra gruppi

metodi correlazionali

(metodo dellanalisi della varianza)


METODO DELLE DIFFERENZE TRA GRUPPI - ANALISI DELLA VARIANZA
Presupposto Varianza totale = varianza vera + varianza derrore
Si estraggono 2 campioni della stessa popolazione
Si misura la stessa caratteristica psicologica in ogni gruppo (con qualche variante in base alla metodologia scelta)
Si confrontano i punteggi nel test ottenuti tra i gruppi
Se le differenze tra i 2 gruppi sono piccole (varianza tra i gruppi) come quelle che si osservano allinterno dello stesso
gruppo per effetto del caso (varianza entro i gruppi) si conclude che il test per laspetto esaminato attendibile
Secondo la teoria classica dellattendibilit un test tanto pi attendibile quanto pi la varianza vera costituisce la
maggior parte della varianza totale
Coeff. di attendibilit= rtt =

varianza vera
________________________
varianza totale

33

METODI CORRELAZIONALI
Ipotesi = uno strumento tanto pi attendibile quanto pi sono correlate tra loro le stime di tali misurazioni ottenuti da
operatori diversi in tempi diversi
Coeff. di attendibilit = coeff. di correlazione tra la misurazione 1 e tutto linsieme di misurazioni da 1 a k
Il calcolo delle correlazioni varier in base allapproccio utilizzato per la verifica dellattendibilit

Esistono 4 approcci per la verifica dellattendibilit


1.

attendibilit come equivalenza di forme parallele

2.

attendibilit come verifica dellomogeneit degli item

3.

attendibilit come accordo tra valutatori

4.

attendibilit come stabilit al retest

1. Attendibilit come equivalenza di forme parallele


Le forme parallele di un test sono due forme dello stesso test che si propongono di misurare in maniera interscambiabile
lo stesso costrutto psicologico
Le forme parallele dovranno essere formate da un numero uguale di item con le stesse caratteristiche psicometriche
Lattendibilit data dalla correlazione tra i punteggi di questi due test
Nel caso in cui si utilizza il metodo del confronto tra gruppi si somministrer per ciascun gruppo una forma del test e
poi si confrontano i punteggi ottenuti dai due gruppi
Nel caso in cui si utilizzano metodi correlazionali si calcolano le correlazioni tra i punteggi ottenuti dagli stessi soggetti
in forme parallele del test
2. Attendibilit come verifica dellomogeneit degli item (coerenza interna)
il test pu essere considerato come un insieme di misure ripetute della stessa variabile, ne segue che se si aumentano gli
item aumenta la precisione della misura
si considera ogni item un tentativo di misurazione del costrutto, ogni item, seguendo la logica delle forme parallele,
una forma parallela di tutti gli altri item
si va a verificare quanto gli item sono coerenti in quanto misure parallele di uno stesso costrutto
la misura pi utilizzata per verificare lomogeneit degli item lalfa di Cronbach
nella prassi valori di alfa inferiori a .60 sono considerati deficitari

34

la valutazione dellattendibilit in base alla omogeneit degli item ha senso solo se la variabile definita teoricamente
come processi omogenei, ne segue che gli indici di omogeneit sono calcolati quando il test costruito per misurare
variabili ristrette

la formula che pone in relazione il numero degli item e lattendibilit del test la formula profetica di Spearman-Brown
con la formula profetica di Spearman-Brown possibile stimare lattendibilit in funzione dellaumentare del numero di
item che lo compongono, oppure stimare quanti item dovrebbero essere aggiunti ad un test per ottenere un certo livello
di attendibilit
la verifica della coerenza interna pu essere utilizzata anche per la selezione degli item
si verifica il contributo di ogni item allattendibilit del test e si eliminano quelli che contribuiscono meno o che
riducono lattendibilit stessa
in questo modo gli item selezionati saranno quelli pi coerenti allinterno della dimensione considerata, ci ha senso se
il test misura una sola dimensione

3. Attendibilit come accordo tra valutatori


si considera componente dellattendibilit laccordo tra valutatori, cio la concordanza tra correttori diversi
nellassegnare i punteggi
si va a verificare la stabilit delloperazione di codifica di uno stesso protocollo fatta da due ricercatori in maniera
indipendente
Nel caso in cui si utilizza il metodo del confronto tra gruppi si utilizzer lo stesso test ma operatori diversi per le
valutazioni di ciascun gruppo
Nel caso in cui si utilizzano metodi correlazionali si calcolano le correlazioni tra le siglature date da operatori diversi

4. Attendibilit come stabilit al retest


lattendibilit intesa come stabilit della misura nel tempo: una misura attendibile deve presentare un certo grado di
stabilit temporale nonostante linstabilit delle reazioni dei soggetti nel tempo
(le fonti di instabilit delle reazioni dei soggetti sono: stato di salute, motivazione al test, tensione emotiva,
comprensione del compito, fluttuazioni attenzione ecc. )
si somministra lo stesso strumento agli stessi soggetti in due occasioni ad una certa distanza di tempo
si calcola la correlazione trai due punteggi alle due misurazioni
lintervallo di tempo per somministrare il retest va scelto in base al caso, di solito 2-4 settimane

35

LA VALIDIT: cosa misura questo test?


La validit indica la capacit di una misura di cogliere effettivamente la caratteristica che si vuole misurare e non
unaltra.
La verifica della validit di una misura unoperazione complessa.
possibile ottenere solo prove indirette della validit di una misura.
Le prove della validit di una misura sono deduzioni logiche sulle caratteristiche che dovrebbe possedere una misura
valida di un dato costrutto. Bisogna verificare che la misura si inserisca coerentemente in una rete di relazioni che
rappresenta il significato fondamentale della caratteristica che si vuole misurare. Ci avviene attraverso la verifica di
una serie di condizioni che debbono essere soddisfatte
Per rispondere alla domanda cosa misura questo test? necessaria la verifica di
1.

significativit teorica ed osservativa di un costrutto

2.

attendibilit

3.

validit di criterio

4.

validit di costrutto

5.

validit nomologica

1. SIGNIFICATIVIT TEORICA ED OSSERVATIVA DI UN COSTRUTTO


Aspetto della validit prettamente teorico che non implica una verifica sul piano empirico
significativit teorica = giudizio sulla natura e la coerenza interna del linguaggio usato per rappresentare il costrutto,
giudizio sulla definizione dei termini che specificano il costrutto e le connessioni di questultimo con altri costrutti nella
struttura teorica pi ampia di cui esso parte
significativit osservativa = giudizio sulla natura delle relazioni tra termini teorici e definizione empirica (regole di
corrispondenza = legami tra i concetti empirici e i concetti teorici, attraverso le regole di corrispondenza si determinano
le definizioni operative, cosa misuro)
questo aspetto della validit un giudizio sulla bont della struttura teorica, riguarda esclusivamente il livello di
valutazione della teoria: come essa esplicita il costrutto, come lo pone in relazione con altri, come ne fornisce una
definizione empirica
il concetto di significativit teorica ed osservativa di un costrutto rappresenta un superamento dei limiti del concetto di
validit di contenuto che descriveva solo il piano della significativit osservativa del costrutto
La validit di contenuto consiste nella capacit dello strumento di rappresentare accuratamente luniverso dei
comportamenti legati al costrutto psicologico che si vuole misurare. Il contenuto degli item del test dovrebbe
rappresentare appropriatamente, esaustivamente ed in maniera rilevante il costrutto di interesse. Questo tipo di validit
viene appurato avvalendosi di giudizi di esperti nel settore senza il riferimento a criteri statistici.

36

2. ATTENDIBILIT
Lattendibilit costituisce una precondizione o condizione necessaria per la verifica dei vari tipi di validit: non ha senso
indagare la validit di una misura se essa non riesce a cogliere nessun fenomeno sistematico.
Lattendibilit un aspetto della validit in quanto solo se una misura affidabile possiamo verificare se e quanto sia
valida
Lattendibilit, fedelt, costanza delle misurazioni psicologiche ottenute mediante un test un aspetto della validit che
costituisce parte integrante delle verifiche sulla validit
Perch ci sia validit di una misura di un costrutto condizione necessaria, ma non sufficiente, che la misura sia
attendibile, pu accadere che una misura abbia unattendibilit elevata ma una validit nulla

3. VALIDIT DI CRITERIO
validit di criterio = grado di corrispondenza tra una misura ed un criterio di riferimento
Rappresenta il grado di associazione tra la misura che si vuole ottenere ed un criterio rilevante. Il criterio corrisponde ad
una misura di un concetto teoricamente connesso al costrutto in esame.
La validit di criterio pu assumere due forme

1.

1.

validit concorrente

2.

validit predittiva

validit concorrente

se il criterio e la misura del costrutto sono misurate contemporaneamente; lassociazione tra criterio e misura del
costrutto evidenzia il livello di validit concorrente.
Es. relazione tra QI misurato con un test di intelligenza e risoluzione di un problema di una certa complessit
cognitiva
2.

validit predittiva

se il criterio viene misurato in un momento successivo alla rilevazione della misura del costrutto; lassociazione tra
criterio e misura del costrutto indica quanto il costrutto sotto indagine predica il criterio.
Es. test che misura lattitudine ad un tipo di lavoro: la validit del test verificata mediante lanalisi della
correlazione tra i punteggi del test e la reale riuscita nel lavoro (misura-criterio), misurata a distanza di tempo
Per verificare che un test misura realmente una certa variabile esistono 2 metodi per la verifica della validit rispetto ad
un criterio

37

1.

metodo dei gruppi contrapposti = si valuta la validit del test in base alla sua capacit di discriminare categorie
di soggetti diagnosticate in base al criterio, tale capacit si valuta confortando le medie dei punteggi al test dei
diversi gruppi (es. validazione MMPI, sono state ritenute valide le scale che hanno consentito di differenziare
chi stato definito con una diagnosi clinica in base al criterio)

2.

metodo correlazionale = si valuta la validit del test in base allentit della correlazione tra punteggi al test e
punteggi al criterio ottenuti dagli stessi soggetti (correlazione tra punteggi al test e quelli in un test gi noto che
misura la stessa variabile)

Il punto essenziale nella validit di criterio la scelta del criterio di riferimento


Il criterio deve essere valido, plausibile, fornire informazioni rilevanti, essere ben inserito nel tessuto teorico a cui
appartiene il costrutto

4. VALIDITA DI COSTRUTTO
Validit di costrutto = grado in cui uno strumento misura il costrutto che dovrebbe misurare
2 aspetti della validit di costrutto
validit convergente = indica il grado di accordo tra diverse misure dello stesso costrutto
validit discriminante = riguarda il grado di distinzione tra misure di costrutti diversi
due misure di uno stesso costrutto dovrebbero avere una correlazione elevata perch possano essere considerate delle
misure valide di quel costrutto (validit convergente)
la validit convergente esprime il grado di accordo tra diversi tentativi di misura dello stesso costrutto
misure di costrutti diversi dovrebbero non avere correlazioni elevate affinch i due costrutti siano effettivamente diversi
(validit discriminante)
la validit discriminante riflette il grado in cui i tentativi di misurare costrutti diversi sono effettivamente distinguibili
luno dallaltro
mentre le altre verifiche di validit sono applicabili ad una sola definizione operativa del costrutto la validit di costrutto
riguarda pi definizioni operative contemporanee dello stesso costrutto
il costrutto emerge dalle relazioni risultanti tra tentativi diversi di operazionalizzarlo, cio di misurarlo, e la sua validit
il risultato delle relazioni tra le diverse misure
Es. un nuovo test per la misura dellansia mostra elevata validit convergente se tale misura risulta fortemente associata
ad unaltra misura dellansia ottenuta tramite un metodo diverso
Es. si vuole indagare la validit di una misura dansia e di una misura di depressione. Le due misure raggiungono
validit discriminante se lassociazione tra esse non cos forte da confondere le due forme di disagio.
Il modo migliore per valutare la validit concorrente e discriminante di impostare uno studio in cui pi costrutti sono
misurati con pi metodi, per ogni tratto (costrutto) si avranno tante misure quanti sono i metodi utilizzati

38

(es. di metodi: griglie di osservazione, questionario, lista aggettivi, soggetti valutatori diversi che usano uno stesso
questionario ecc.)

5. VALIDITA NOMOLOGICA
aspetto della validit pi complesso e meno affrontato dai ricercatori
per verificare la validit nomologica bisogna dimostrare che il costrutto predice ci che deve predire e che si inserisce
appropriatamente in una rete di relazioni con altri costrutti teoricamente affini
per poter verificare la validit nomologica necessaria una teoria ben chiara e sviluppata in cui sia indicato il tipo di
predizione possibile e come il costrutto in esame si colleghi con altri costrutti
diff. con validit di costrutto= la validit di costrutto volta allesame della convergenza tra misure diverse di uno
stesso costrutto ed alla discriminazione tra costrutti diversi ma non informativa sulle relazioni predittive tra il costrutto
in esame ed altri costrutti teorici
diff. con validit di criterio= mentre la validit di criterio riguarda lo studio del rapporto tra un costrutto ed un criterio
quella nomologica riguarda le relazioni tra un costrutto in contemporanea con molti criteri e la valutazione delle
relazioni con altri costrutti

39

IN SINTESI
Esempio di studio ipotetico per verificare la validit del test
Al termine della fase di selezione degli item, arrivati alla versione finale del test, necessario pianificare uno studio per
la verifica delle caratteristiche psicometriche
-verifica della dimensionalit
si somministra il test ad un campione di soggetti e si effettua unanalisi fattoriale estraendo i fattori che rappresentano le
dimensioni principali
se i risultati confermano le dimensioni individuate in fase di selezione degli item si procede alla fase successiva,
altrimenti bisogna selezionare nuovi item e risomministrare il test finch la soluzione non diventa stabile
-verifica dellattendibilit
si calcola lalfa di Cronbach per ogni dimensione individuata
-verifica della validit teorica ed osservativa
necessario fornire argomentazioni convincenti circa la bont della definizione del costrutto teorico e del suo
inserimento nel corpo teorico esistente , della sua adeguata connessione con altri costrutti esistenti affini, della sua
capacit di aumentare la comprensione dei fenomeni psicologici; bisogna inoltre dimostrare che la misura proposta sia
una valida operazionalizzazione, cio riesce a cogliere il costrutto
-verifica della validit di criterio
si pianifica uno studio in cui la misura proposta, il test, riesca a predire in modo significativo criteri rilevanti, se il test
valido ed il criterio rilevante si trover una relazione significativa tra il test ed il criterio
-verifica della validit di costrutto
necessario pianificare uno studio in cui utilizzare metodi diversi per misurare le stesse dimensioni
-verifica validit nomologica
necessario fornire unelaborazione teorica particolareggiata del costrutto indicando con quali costrutti esso si pone in
relazione o meno e perch;
necessario pianificare uno o pi studi in cui misurare questinsieme di costrutti e verificare che le loro relazioni siano
effettivamente quelle teorizzate

40

LA STANDARDIZZAZIONE DI UN TEST
Il punteggio grezzo ottenuto ad un test un numero che non significa nulla
Es. sapere che un soggetto ha avuto il punteggio 18 ad un test non dice nulla sulla caratteristica psicologica misurata.
necessario avere un termine di confronto per assumere significato
Standardizzare una misura significa trasformare i punteggi grezzi ottenuti in un test in punteggi che abbiano un
significato psicologico necessario riferire la stessa misura ad una scala standard con media e varianza note
la standardizzazione necessaria quando
-

si vuole avere unidea della posizione che un soggetto occupa nellambito di un gruppo

si vogliono confrontare due prestazioni dello stesso soggetto

La taratura la procedura di somministrazione di un test in condizioni controllate ad un campione ampio e


rappresentativo della popolazione finalizzato alla determinazione delle norme
Tale campione si definisce normativo
Campione normativo

gruppo di soggetti le cui risposte al test sono prese come termine di riferimento per valutare le risposte di qualsiasi altro
soggetto che successivamente sottoposto a quel test
Per costruire le norme di un test si presuppone che la caratteristica che si vuole misurare abbia una distribuzione nota
nella popolazione
Tale distribuzione di solito la distribuzione normale: si presuppone che molti individui abbiano quantit intermedie
della caratteristica mentre pochi ne abbiano quantit rilevanti o irrilevanti
La curva normale, o curva di Gauss, una distribuzione teorica di frequenze dei punteggi di una popolazione
caratterizzata da una maggiore concentrazione di dati al centro che vanno assottigliandosi verso gli estremi
importante perch
-

si ottiene anche quando si rappresentano eventi legati alla legge del caso

molti dei fenomeni di cui si occupano le scienze del comportamento, molte variabili fisico-biologiche e
psicologiche, hanno una distribuzione normale

molte procedure statistiche sono basate sulle propriet della curva normale

assumere che la caratteristica sia distribuita normalmente nella popolazione implica lutilizzo della media come
riferimento normativo
poich la media della popolazione non nota ma stimata in base alla media del campione normativo, per ottenere dei
riferimenti normativi validi il campione normativo deve essere rappresentativo della popolazione
41

per costruire le norme di un test necessario un buon campionamento, tale da rendere rappresentativo il campione
normativo
soprattutto in campo clinico necessario conoscere il processo che stato seguito per arrivare alla definizione delle
norme : norme di riferimento ottenute su popolazioni con caratteristiche lontane da quelle dei soggetti valutati
potrebbero avere scarso significato
necessario che il manuale illustri le caratteristiche del campione su cui il test stato tarato
se i dati normativi di un test sono basati su campioni di comodo il campione non rappresentativo della popolazione ed
i dati normativi sono un riferimento poco valido che non consente di prendere decisioni difendibili

42

5 passi per una buona TARATURA


1.

identificare la popolazione che interessa

2.

decidere come effettuare il campionamento: necessario stimare la numerosit del campione ed il tipo di
campionamento da effettuare
il campione normativo deve avere una buona corrispondenza con le caratteristiche della popolazione ed essere
sufficientemente ampio da ridurre i possibili errori di stima dei parametri
2 tipi di campionamento
-campionamento probabilistico: tutte le unit appartenenti alla popolazione dalla quale si vuole estrarre il
campione hanno la stessa probabilit di essere estratte e far parte del campione
-campionamento non probabilistico: tutte le unit appartenenti alla popolazione dalla quale si vuole estrarre il
campione non hanno la stessa probabilit di essere estratte

in generale la scelta del tipo di campionamento dipende pi che da valutazioni teoriche da decisioni pratiche, in
primo luogo le risorse disponibili
il pi semplice campionamento probabilistico il campionamento casuale semplice: si estrae a caso da una
popolazione predeterminata un numero prefissato di elementi
spesso si ricorre ad un campionamento stratificato: si suddivide la popolazione in pi popolazioni omogenee
rispetto ad una caratteristica (sesso, livello socioeconomico ecc.) e da queste si estraggono campioni casuali
semplici
a parit di numerosit il campione stratificato pi adatto alla standardizzazione dei test in quanto si pu
operare la stratificazione in base alle variabili che si suppone siano maggiormente correlate con lo stesso test
sul campione normativo sono calcolate media e ds come stima di media e ds della popolazione, se il campione
realmente rappresentativo la media del campione abbastanza simile alla media della popolazione, i due parametri
differiscono in base allerrore di campionamento
la precisione della stima della media della popolazione si pu calcolare in base alla ds del campione estratto ed alla
sua numerosit
in base a tali calcoli possibile stabilire quanto deve essere ampio un campione se si desidera una determinata
precisione
3.

calcolare gli indicatori statistici (media, varianza ecc)

4.

preparare le tavole di conversione dei punteggi grezzi in punteggi standardizzati

5.

preparare una dettagliata documentazione della procedura seguita da inserire nel manuale del test
43

LA TRASFORMAZIONE DEI PUNTEGGI


Le norme si definiscono punteggi normativi e sono costituiti dallinsieme di punteggi trasformati riferiti ad un
campionamento su scala nazionale
Se i dati normativi provengono da campionamenti su popolazioni specifiche si parla di norme locali, norme che si
riferiscono ad una popolazione particolare e non ad un campione rappresentativo della popolazione generale
La pi comune trasformazione di un punteggio grezzo ottenuto da un singolo individuo quella che tiene conto dei
risultati medi ottenuti al test da un gruppo di soggetti con caratteristiche analoghe
La scala pi comune usata nella ricerca definita standard ed ha
-

media = 0

varianza = 1

Tale scala si ottiene trasformando una serie di punteggi i in una serie di punteggi z i con la formula
z = i media
ds
xi = punteggio grezzo
media = media del campione normativo
ds = ds del campione normativo
la distribuzione dei punteggi standardizzati ha media=0 e ds=1
il punto z indica la posizione relativa del soggetto allinterno del suo gruppo di riferimento
se il punteggio standardizzato positivo sapremo che esso superiore alla media
se il punteggio standardizzato negativo sapremo che esso inferiore alla media
la trasformazione in punti z consente di sfruttare le propriet della distribuzione normale e le tavole relative
se il campione normativo non abbastanza numeroso pu capitare che la caratteristica misurata non si distribuisca in
modo normale
la trasformazione in punti z con media =0 e ds=1 rappresenta una normalizzazione della distribuzione, cio si rende
normale una distribuzione che di per s non lo per usare le caratteristiche di una distribuzione normale
sebbene non tutti i ricercatori sostengano tale trasformazione essa utilizzata poich si ritiene che la maggior parte delle
caratteristiche psicologiche che si misurano si distribuiscono in modo normale pertanto difficile immaginare una
situazione nella quale la distribuzione dei punteggi del campione radicalmente diversa da una distribuzione normale
la normalizzazione lecita e utile quando la distribuzione della popolazione normale o quando, in base alla teoria, ci
si aspetto che lo sia;
44

tale trasformazione utile e giustificata solo quando la distribuzione campionaria non si discosta molto da quella
normale, altrimenti bisogna chiedersi se il campione estratto veramente rappresentativo della popolazione o se
lipotesi di distribuzione normale del costrutto da misurare sia veramente sostenibile

45

COSA CI SI DEVE ASPETTTARE DA UN BUON MANUALE


Manuale = volume che accompagna il test che fornisce tutte le informazioni necessarie per un uso corretto dello
strumento
Informazioni essenziali che il manuale deve fornire

giustificazione teorica dello scopo dello strumento, cosa lo strumento si propone di misurare, quali sono i
fondamenti teorici o pratici che hanno condotto alla costruzione, quali le fasi dello sviluppo

descrizione dettagliata del test e delle modalit di applicazione (tali descrizioni variano come complessit in
base alla tipologia di test)

descrizione delle caratteristiche metrologiche dello strumento: descrizione delle prove di validit, degli indici
di attendibilit, accurata descrizione del campione di standardizzazione

tutte le informazioni devono essere esplicite e le scelte operate devono essere giustificate

descrizione chiara delle istruzioni per la correzione delle risposte e di come comportarsi nei casi dubbi

indicazione delle norme relative alla standardizzazione o taratura dello strumento

gli strumenti di misura per le caratteristiche psicologiche relative alla stessa area possono essere molti e lutilizzatore
deve poter essere messo in grado di scegliere quello pi vicino ai suoi scopi o quello pi soddisfacente in base alle
caratteristiche indicate dal manuale

46

_________________
I test cognitivi
_________________
CLASSIFICAZIONE DEI TEST
esistono molti modi per classificare i test psicologici
utilizzando come criterio larea psicologica che si propongono di misurare
possibile distinguere
TEST COGNITIVI

2 tipologie di test:

TEST NON COGNITIVI


TEST COGNITIVI:

TEST NON COGNITIVI:

test di livello

test di personalit

test di attitudine

test di atteggiamento

test di profitto
test neuropsicologici

test cognitivi

test non cognitivi

le risposte sono valutate come giuste o sbagliate

si sicuri che i soggetti non ottengano punteggi pi alti rispetto


alle loro capacit (le persone non possono far finta di sapere pi
cose di quelle che sanno in realt)

nei test cognitivi


nei test non cognitivi

le

risposte

vanno

interpretate

come

autodescrizioni

dei

comportamenti e opinioni degli individui

un individuo pu fingere o forzare una data caratteristica

47

TEST COGNITIVI :
test di abilit generale o di livello
test di attitudine
test di profitto
test neuropsicologici
I test di abilit generale o di livello danno una stima globale del livello cognitivo di una persona: valutano le capacit
degli individui in specifici ambiti cognitivi (verbale, matematico, spaziale, ragionamento induttivo, rapidit percettiva
ecc.), misurano dei fattori specifici che correlano con labilit cognitiva generale ma che danno informazioni ulteriori su
qualche abilit particolare.
Prevedono una serie di problemi che vanno a valutare specificamente le varie abilit sotto indagine. Il soggetto
esaminato deve individuare la risposta corretta. Trovano ampio utilizzo nellorientamento scolastico e professionale,
nella selezione del personale
I test di intelligenza si propongono di misurare le abilit generali di ragionamento. Sono costituiti da prove di difficolt
crescente che coprono le diverse abilit cognitive riassumibili nel termine intelligenza. Il soggetto esaminato deve
tentare di individuare la risposta corretta ad ogni problema. Il punteggio ottenuto da ogni soggetto viene rapportato alla
sua et o alla prestazione di un gruppo di riferimento.
I test di attitudine hanno lobiettivo di fornire una stima della performance futura di un individuo in qualche campo
specifico. Ci si riferisce a potenzialit dellindividuo, ossia si fanno ipotesi sulla sua capacit di far progressi in una
certa abilit
Si distinguono dai test di livello per il diverso scopo: i test di abilit misurano il grado di competenza presente in
determinate abilit, i test attitudinali misurano la previsione delle prestazioni future a compiti che richiedono lutilizzo
delle abilit valutate attraverso il test.
Lo studio delle attitudini avviene attraverso lo studio delle abilit, la differenza tra i due test prevalentemente teorica
in quanto a livello pratico vengono usati indifferentemente
I test di profitto misurano il grado di padronanza di un insieme di cognizioni e sono di fondamentale utilizzo in ambito
educativo. Prevedono dei quesiti e delle prove a cui il soggetto esaminato deve fornire risposte corrette. Si differenziano
dai test di abilit e di intelligenza per la loro maggiore specificit: i test di abilit e di intelligenza si propongono di
misurare capacit astratte attraverso prove che indagano aspetti formali del ragionamento, i test di profitto si
concentrano sul grado di competenza acquisito in una specifica materia, misurano quanto i soggetti abbiano imparato in
un determinato campo. Pi che le capacit formali sono i contenuti ad essere oggetto della misurazione.
I test neuropsicologici sono misure indirette del funzionamento del cervello in cui gli stimoli sono volti ad evidenziare
la presenza di comportamenti che sono tipicamente associati a lesioni organiche

48

possibile classificare i test cognitivi in base ad ulteriori distinzioni realizzate in funzione di


1.

il modo di somministrazione

test individuali in cui gli stimoli sono presentati individualmente al soggetto e c uninterazione
diadica soggetto-esaminatore

2.

test collettivi in cui gli stimoli sono presentati a pi soggetti contemporaneamente

test automatizzati in cui gli stimoli sono presentati al soggetto sullo schermo di un computer

materiale e contenuti su cui si chiede ai soggetti di operare

contenuto simbolico (simboli numerici, alfabetici, grafici o appositamente ideati)

contenuto grafico-spaziale (es. disegni)

contenuto semantico-verbale (es. conoscenza di vocaboli, conoscenza di informazioni della vita quotidiana
ecc.)

3.

tipo di reazione del soggetto che viene rilevata

test carta e matita (il sogg. trova gli stimoli stampati su un foglio e appone la sua risposta su un foglio)

test di produzione orale (il sogg. deve rispondere oralmente allo stimolo)

test di performance che richiedono esecuzione materiale di compiti (es. riproduzione di disegni,
ricomposizione dellimmagine di un oggetto)

4.

caratteristiche dei soggetti

test adatti a specifiche fasce di et (es. bambini, adulti, anziani)

test utilizzabili con la maggior parte della popolazione (es. adulti con scolarit non inferiore a quella
dellobbligo)

test adatti alle caratteristiche di popolazioni specificamente caratterizzate (es. sogg. con deficit cognitivo,
handicap, pz neurologici ecc.)

5.

modo in cui sono espressi i risultati

test in cui il giudizio viene espresso con riferimento ad ununica scala come livello mentale generale (es.
et mentale, QI ecc.) o come singola abilit specifica (es. abilit a ragionare con simboli astratti, su
contenuti di meccanica ecc.)

test in cui il risultato riferito a pi abilit o attitudini e quindi viene espresso mediante un profilo (es.
batterie multifattoriali usate per lorientamento)

49

TEST DI ABILIT GENERALE O DI LIVELLO


Test per misurare globalmente lefficienza mentale di un individuo, vengono utilizzati quando si ritiene utile una
valutazione complessiva del livello cognitivo
implicano una valutazione complessiva del livello di sviluppo o di
efficienza mentale, non si riferiscono allanalisi fattoriale nella definizione
del costrutto
2 punti che accomunano
tutti i test di livello*
i concetti di abilit generale sono accomunati dal riferimento ad una
generica capacit di ragionamento
*queste definizioni scaturiscono dalla distinzione tra test di livello e test di fattore g
assunti comuni ai test di livello:
-esiste una caratteristica psicologica in qualche modo unitaria definibile abilit mentale o intelligenza
-per ottenere misure valide di questa entit globale bisogna stimolare processi mentali complessi e far elaborare
contenuti diversi
4 teorie alla base dei test di livello di largo uso
1. la concezione dellintelligenza alla base della scala Binet-Simon
2. il concetto di abilit mentale ed i test collettivi di Otis
3. test basati sulla produzione di disegni
4. la definizione di intelligenza secondo David Wechsler

50

LE SCALE WECHSLER
Lintelligenza una capacit di natura multidimensionale e multideterminata
ci che si definisce come intelligenza non una particolare abilit, ma una competenza generale, una capacit
globale che in un modo o nellaltro consente ad un individuo di predisporsi alla comprensione del mondo e ad
affrontarne le sfide. Lintelligenza una funzione dellintera personalit ed sensibile ad altri fattori oltre quelli
inclusi nel concetto di abilit cognitive. I test di intelligenza misurano inevitabilmente anche questi fattori (Wechsler,
1981).
Lintelligenza non coincide con la semplice abilit intellettuale, ma concepita come unentit globale,
multideterminata e variamente sfaccettata in cui non possibile distinguere una singola abilit come essenziale o di
importanza determinante (Wechsler, 1986, p. 13).
Wechsler nella sua concezione di intelligenza ridimensiona il valore del quoziente intellettivo, non parla, infatti, di
efficienza come livello prestazionale, ma la intende come abilit con molte sfaccettature e come una funzione dellintera
personalit.
Le scale Wechsler sono le scale di intelligenza pi utilizzate, pi richieste, ma anche pi lunghe come tempi di
somministrazione.
Storia delle scale Wechsler
Wechsler critic lestensione delle scale per bambini, come in origine la scala di Binet, alla valutazione degli adulti per
le seguenti osservazioni:
-

stimoli poco interessanti per gli adulti

mancanza di dati normativi per gli adulti

la risposta prevista spesso legata allattitudine a manipolare parole e non a comprenderne


il significato

lintelligenza delladulto non si pu valutare in termini di Et Mentale se non a rischio di


errori grossolani

Secondo Wechsler non esiste una qualche singola capacit che rivesta maggior peso nella struttura dellintelligenza,
essendo tutte le abilit superiori ugualmente importanti nel determinare la capacit di intelligenza globale
Ne segue lutilizzazione di gruppi di item che possano variamente rappresentare differenziati campioni di
comportamento in molte aree
Wechsler decise che i campioni di comportamenti intelligente dovevano essere di tipo verbale e di tipo non verbale e
che ciascuno di essi doveva contribuire in ugual misura a definire la capacit di intelligenza globale

Sulla base di queste critiche e sulla sua concezione dellintelligenza nel 1939 ide la scala Wechsler-Bellevue per
adulti, composta da 10 prove diverse per contenuto e per tipo di operazione mentale richiesta
51

Abbandon il concetto di EM e nella WB-I provvide alla sostituzione dei QI di rapporto derivati dalla formula
QI=EM/EC, con i QI di deviazione
QI di deviazione indicano di quanto un sogg devia al di sopra o al di sotto della prestazione media fornita dai soggetti
del suo stesso gruppo di et (sono dei punti standard in cui la media uguale a 100 e la ds a 15)
Poich essi sono calcolati non rispetto ad un unico gruppo comprendente tutte le et, ma gruppo per gruppo per
ciascuna delle et considerate la prestazione al test di un sogg perfettamente confrontabile con quella dei suoi coetanei
Sulla base della Wechsler-Bellevue sono state pubblicate
1.

Wechsler Preschool and Primary Scale of Intelligence (WIPPSI) per bambini dai 4 ai 6 anni
Pubblicata nel 1967 viene aggiornata nel 1989 con una verisone riveduta WPPSI-r

2.

Wechsler Intelligence Scale for Children (WISC) per bambini e ragazzi dai 5 ai 16 anni
Pubblicata da Wechsler nel 1949, rimasta in uso fino al 1974 data in cui viene pubblicata la versione riveduta
WISC-r

3.

Wechsler Adult Intelligence Scale (WAIS) per adulti


Pubblicata nel 1955, viene aggiornata dopo la morte dellautore con la versione riveduta WAIS-R (pubblicata
negli Stati Uniti nel 1981)

I pregi comunemente riconosciuti alle scale Wechsler sono:


-grande variet dei contenuti che consente una migliore campionatura delle abilit del sogg
-tipo e numero di prove sostanzialmente costanti a qualsiasi et che consente confronti pi validi a distanza di tempo
-contenuti attraenti per i bambini

I limiti
-per i bambini pi piccoli, specialmente con livello intellettivo pi modesto, anche la WIPPSI troppo difficile e facilita
calo di attenzione
-non sempre il manuale italiano riporta dati normativi appropriati
limportanza attribuita alle differenze tra QI-V E QI-P pu indurre a dimenticare che le scale sono principalmente una
misura del livello generale

52

WAIS-r: WECHSLER ADULT INTELLIGENCE SCALE revised


Si compone di 11 subtest
6 subtest finalizzati alla valutazione dellintelligenza di tipo verbale
Scala verbale:

Informazione

Comprensione

Ragionamento aritmetico

Analogie

Memoria di cifre

Vocabolario
5 subtest finalizzati alla valutazione dellintelligenza pratica

Scala di performance

Associazione simboli a numeri

Completamento di figure

Disegno con cubi

Riordinamento di storie figurate

Ricostruzione di figure

Il test formato da 166 domande selezionate attraverso lanalisi degli item in modo da risultare altamente significative
per la valutazione dellintelligenza
Somministrazione di circa 1 ora, 1 ora e 30 min

53

Subreattivi verbali

Informazione
Richiesta del subtest: rispondere ad una serie di domande di informazione generale
Obiettivo del subtest: valutare lestensione delle conoscenze e degli interessi del sogg, misurare la sua capacit di
assorbire e ritenere informazioni dallambiente circostante e richiamarle istantaneamente
Il risultato influenzato dallambiente di provenienza e dal tipo di educazione offerta al sogg, la componente culturale
non tuttavia ritenuta da Wechsler tale da invalidare il subtest che viene considerato unottima misura dellintelligenza
globale
Punteggi alti indicano buon livello intellettivo ed una buona cultura accompagnati ad unampia gamma di interessi e
ad un sufficiente adattamento sociale
Punteggi bassi possono essere indice di deficit intellettivo o di svantaggio culturale dovuto o a stimolazione
ambientale carente, o da marcate difficolt di rapporto con lambiente o da pregresse difficolt scolastiche
variabili cognitive implicate nel subtest Informazione

capacit di prestare attenzione alle domande

comprensione verbale

capacit di richiamo delle informazioni dalla memoria e lungo termine

quantit complessiva delle conoscenze del sogg (ricchezza dellambiente educativo, grado di istruzione
ricevuta, preferenze culturali)

facilit ad imparare nozioni di tipo verbale-scolastico-culturale

Comprensione
Richiesta del subtest: si chiede al soggetto di descrivere come comportarsi in determinate circostanze, trovare un perch
a fatti o azioni comuni, di spiegare il significato di certe prassi sociali e il significato di alcuni proverbi
Obiettivo del subtest: valutare le capacit di giudizio sociale e di acquisire ed applicare le conoscenze apprese dalla vita
quotidiana secondo criteri di appropriatezza formale e di buon senso
Sono essenziali le capacit di ragionamento pratico, di prospettarsi per intero la gamma di possibilit esistenti e di
scegliere quelle socialmente appropriate usando un metro di giudizio morale e tenendo sotto controllo le proprie
reazioni impulsive
Punteggi alti indicano buon senso pratico, adattamento affettivo, maturit sociale
Punteggi bassi possono indicare deficit nelle capacit di pensiero concreto, difficolt di verbalizzazione,
atteggiamento rinunciatario o oppositivo
variabili cognitive implicate nel subtest Comprensione

capacit di prestare attenzione alle domande in maniera continuativa

comprensione verbale

54

capacit di giudizio sociale

capacit di ragionamento pratico, buon senso

capacit di interiorizzare e valutare le esperienze passate e di generalizzazione

capacit di distinguere da un insieme di informazioni gli elementi essenziali da quelli accessori

conoscenza approfondita dellambiente sociale, degli usi e dei costumi

grado di interazione sociale effettivamente agito

Memoria di cifre
Richiesta del subtest: vengono lette al soggetto una serie di numeri (fino a 7 cifre) e gli si chiede di ripeterle, in avanti
(ripetizione diretta) e allindietro (ripetizione inversa)
Obiettivo del subtest: valutare la capacit di mantenere lattenzione concentrata su un compito inibendo le attivit
concorrenti e misurare la capacit di richiamo immediato in sequenza ordinata dei dati
un subtest valido nel fornire indicazioni sui meccanismi di ricezione, sintesi ed organizzazione delle informazioni,
sullintegrit delle componenti neuropsicologiche connesse con le memoria a breve termine, sulle sindromi organiche e
sulle abilit cognitive di base
Punteggi alti sono indicativi di buone capacit di attenzione e concentrazione
Punteggi bassi possono indicare disturbi specifici di attenzione, deficit mentale o stati dansia (punteggi molto bassi
possono indicare lesistenza di patologia organica)
variabili cognitive implicate nel subtest Memoria di cifre

discriminazione e attenzione uditiva

capacit di vigilanza mentale

capacit di concentrazione

memoria uditiva a breve termine

capacit di rappresentazione mentale di tipo verbale o uditivo

capacit di reversibilit cognitiva

Ragionamento aritmetico
Richiesta del subtest: vengono letti brevi problemi aritmetici, in ordine crescente di difficolt, a cui il soggetto deve
rispondere oralmente
Obiettivo del subtest: valutare la capacit di usare i numeri, i concetti numerici di base ed il ragionamento per risolvere i
problemi di tipo aritmetico che si presentano nella vita quotidiana
Questo subtest richiede la capacit di recepire con immediatezza le istruzioni verbali, di operare mentalmente sui dati
del problema, di concentrarsi su stimoli ben definiti e di utilizzare compiutamente i concetti astratti di numero e di
operazione numerica. Sono implicate tutte le abilit di ragionamento generale e di ragionamento numerico
Punteggi alti sono indicativi di buona prontezza mentale e capacit di attenzione e concentrazione
Punteggi bassi possono indicare o stati ansiosi o difficolt di attenzione e concentrazione di natura organica
variabili cognitive implicate nel subtest Ragionamento Aritmetico

capacit di attenzione
55

capacit di concentrazione sui dati escludendo interferenze

capacit di recepire con accuratezza e immagazzinare ordinatamente le informazioni verbali

capacit di operare con i numeri ed i concetti numerici di base

memoria a breve e lungo termine (richiamo di strategie di soluzione dei problemi usate precedentemente in
contesti scolastici)

ragionamento generale

Analogie
Richiesta del subtest: si chiede al soggetto di dire in che cosa si somigliano, cosa hanno di simile due oggetti
Obiettivo del subtest : misurare la capacit di individuare relazioni significative tra concetti utilizzando i processi di
astrazione e generalizzazione
Punteggi alti sono indicativi di unadeguata prestazione nella formazione dei concetti
Punteggi bassi sono indicativi di limiti di tipo cognitivo o interferenza di fattori emotivi
Rapaport (1981) distingue tre livelli qualitativamente diversi di formazione dei concetti
1.

concreto

2.

funzionale

3.

concettuale/astratto

1. (es. cane leone)


Nel caso di livello concreto il sogg non essendo capace di fare astrazioni pu o non rispondere, spiegando i due non si
assomigliano affatto oppure fornire risposte del tipo si assomigliano perch entrambi hanno zampe, code o peli
Il/ i particolari concreti sono presi come riferimento nello stabilire lanalogia anche se simili particolari non sono
essenziali quando si tratta con concetti con un minimo di complessit
2. (es. carro bici)
Nel caso di livello funzionale il sogg pu fornire risposte del tipo si viaggia su tutti e due
Tale definizione si riferisce ad una funzione degli oggetti, ma non prende in considerazione il fatto che essi hanno altre
funzioni e caratteristiche pi generali da un punto di vista concettuale
Il livello funzionale generalmente parziale e non esauriente
3. (es. cane-leone)
Nel caso di livello concettuale-astratto il sogg fornir risposte del tipo sono entrambi animali, mammiferi, carnivori,
quadrupedi ecc
Tale definizione deriva dalla individuazione dei particolari essenziali dei due elementi tali da poterli riconoscere come
appartenenti alla stessa categoria generale
variabili cognitive implicate nel subtest Analogie

comprensione verbale

capacit di astrazione , generalizzazione

ragionamento verbale
56

memoria a lungo termine

capacit di discriminare tra caratteristiche essenziali e non essenziali

capacit di individuazione e di scelta delle relazioni pi significative tra entit (tipo di concettualizzazione se
concreta, funzionale o astratta)

Vocabolario
Richiesta del subtest: si chiede al soggetto il significato di parole che gli vengono lette una per una
Obiettivo del subtest: misurare lestensione e la profondit della concettualizzazione verbale ed il grado di padronanza
ed accuratezza delle funzioni espressive del linguaggio
Indica il grado di apprendimento verbale accumulato dal sogg, lestensione delle sue conoscenze ed il livello qualitativo
del suo ragionamento
una prova pi di ragionamento verbale che di conoscenza di vocaboli in quanto la definizione del significato delle
parole implica una riorganizzazione delle conoscenze linguistiche attuata tramite la manipolazione cognitiva di segni e
stimoli verbali
Le risposte riflettono le acquisizioni dovute allambiente familiare e solo in seconda istanza quelle derivanti
dallambiente culturale, i suoi risultati sono stabili nel tempo
Punteggi alti sono tipici di sogg dotati o di perfezionisti
Punteggi bassi possono essere indicativi di deficit intellettivo, svantaggio culturale e presenza di disturbi emozionali

variabili cognitive implicate nel subtest Vocabolario

memoria a lungo termine

concettualizzazione verbale

capacit di riorganizzazione semantica

capacit generale di apprendere

ricchezza dellambiente culturale

grado di istruzione scolastica

57

subreattivi di performance
Completamento di figure
Richiesta del subtest: si presentano ai soggetti dei disegni incompleti raffiguranti oggetti comuni e si chiede di indicare
qual la parte mancante
Obiettivo del subtest: valutare la capacit di richiamo visuo-percettivo, di distinguere tra dettagli essenziali e non, di
completamento cognitivo su base visiva
una misura delle capacit di concettualizzazione visiva, di riconoscimento visivo e delle abilit di analisi e di
organizzazione di stimoli percepiti per tempi limitati
Il rendimento influenzato dalle capacit di attenzione e concentrazione, dal livello di familiarit con gli oggetti di uso
comune e dal grado di aderenza alla realt
Punteggi alti sono indicativi di normali capacit di riconoscimento visivo
Punteggi bassi sono di solito indicativi di deficit intellettivi o percettivo
variabili cognitive implicate nel subtest Completamento di figure

capacit di riconoscimento visivo

capacit di richiamo visuo-percettivo

capacit di completamento cognitivo su base visuo-percettiva

capacit di attenzione, concentrazione

capacit di esplorazione visiva

capacit di valutare quali sono le parti essenziali e non di una figura

Riordinamento di storie
Richiesta del subtest: ai soggetti viene presentato un gruppo di vignette che nel loro insieme compongono una breve
storia, si chiede di riordinare le parti in modo che la storia abbia un senso
Obiettivo del subtest: misurare la capacit di analizzare dettagliatamente i dati visivi e di organizzarli, sia in base al loro
significato specifico sia a quello complessivo allinterno della storia, secondo un modello di pianificazione sequenziale
Misura le abilit a recepire ed organizzare visivamente dei dati e di cogliere una situazione nel suo insieme attraverso
luso della pianificazione sequenziale, ci richiede capacit di anticipazione mentale e di generalizzazione dal
particolare al globale
Punteggi alti sono indicativi di capacit di pianificazione cognitiva e di adattamento sociale
Punteggi bassi sono indicativi di difficolt intellettive o percettive
variabili cognitive implicate nel subtest Riordinamento di storie figurate

organizzazione visuo-spaziale

organizzazione temporale

coordinazione motoria

capacit di analizzare visivamente i dettagli e di attribuire loro il giusto significato

capacit di pianificazione cognitiva


58

capacit di comprendere le situazioni nel loro insieme

conoscenze sociali, capacit di comprendere il modo di comportarsi delle persone

Disegno con cubi


Richiesta del subtest: si danno al sogg dei cubi con le facce dai diversi colori e modelli di disegni geometrici da
riprodurre con i cubi stessi
Obiettivo del subtest: misurare labilit di concettualizzazione, pianificazione e ridefinizione delle strategie di soluzione
dei problemi attraverso la capacit di percepire, analizzare e sintetizzare secondo la modalit visiva di pensiero
Misura labilit di percepire, suddividere e riprodurre disegni astratti
considerato unottima misura dellintelligenza generale in quanto sono implicati la concettualizzazione non verbale, il
pensiero concreto, il pensiero astratto, labilit generale di pianificare ed organizzare
Punteggi alti sono indicativi di doti di ragionamento spaziale e di flessibilit intellettuale
Punteggi bassi possono indicare o deficit intellettivi, deficit percettivo-motori, insicurezza o atteggiamento
rinunciatario, patologia organica
variabili cognitive implicate nel subtest Disegno con cubi

analisi visiva (capacit di scomposizione di un insieme nelle sue parti componenti)

sintesi visiva (capacit di organizzazione delle parti per costruire un tutto)

organizzazione visuo-percettiva (sviluppo immagine anticipatoria del disegno)

coordinazione visuo-motoria (riproduttiva)

flessibilit intellettiva

Associazione di simboli a numeri


Richiesta del subtest: si chiede di associare dei simboli grafici (disegni geometrici astratti) a dei numeri (da 1 a 9)
copiandoli in un apposito spazio
Obiettivo del subtest: misurare la capacit di adattarsi a nuove situazioni di apprendimento, di imparare schemi visuomotori da esperienze ripetitive e di operare rapidamente con materiale insolito
Lesecuzione richiede destrezza visuo-motoria, coordinazione dei movimenti della mano, velocit e accuratezza,
capacit di richiamo visivo immediato e di informazioni sotto sforzo persistente
Punteggi alti sono indicativi integrit neuropsicologica, buona capacit di attuare nuovi apprendimenti, destrezza
visuo-motoria
Punteggi bassi indicano ritardo mentale, deficit psicomotori, patologia organica
variabili cognitive implicate nel subtest Associazione simboli a numeri

capacit di recepire le istruzioni date dallesaminatore

ampiezza dello span di attenzione su materiale figurale

capacit di concentrazione

memoria visiva a breve termine

59

capacit di recepire materiale insolito

velocit e coordinazione grafo-motoria (imitativa)

capacit di sostenere a lungo lo sforzo

Ricostruzione di figure
Richiesta del subtest: si presentano ai soggetti delle parti di cartoncino che vanno ricomposte in modo da formare un
qualcosa che abbia senso (per es. un animale, una parte del corpo)
Obiettivo del subtest: valutare la capacit di analizzare e sintetizzare flessibilmente gli indizi visuo-percettivi di
elementi isolati, giungendo ad una raffigurazione mentale anticipatoria del loro insieme ed ad una loro effettiva
organizzazione in una struttura significativa
Misura lorganizzazione visiva e labilit di utilizzare elementi isolati ponendoli in relazione gli uni agli altri per
strutturare un insieme significativo, il raggiungimento della soluzione richiede una raffigurazione anticipatoria
dellinsieme, la capacit di cogliere percettivamente gli indizi utili alla ricostruzione, la capacit di orientare nello
spazio dei pezzi, la capacit di coordinare flessibilmente i tentativi di soluzione
Punteggi alti sono indicativi della capacit di organizzare gli elementi a disposizione in strutture dotate di significato
Punteggi bassi indicano deficit di tipo percettivo o cognitivo
variabili cognitive implicate nel subtest Ricostruzione di oggetti

organizzazione visuo-spaziale

capacit di orientamento spaziale di figure

capacit di analisi e sintesi su dati visivi

flessibilit cognitiva

capacit di raffigurazione anticipatoria dellinsieme

memoria di richiamo visivo a lungo termine

capacit di affrontare compiti nuovi

coordinazione visuo-motoria

60

Standardizzazione
TARATURA ITALIANA (Orsini e Laicardi, 1997)
Campione di 1630 soggetti
6 gruppi di et dai 16 ai 64 anni
Per ciascun gruppo di et dai 200 ai 430 soggetti, met maschi e met femmine
Stratificazione fatta in base alle categorie professionali: imprenditori e liberi professionisti, dirigenti e impiegati,
lavoratori in proprio, lavoratori dipendenti, condizione non professionale
Stratificazione per livello di istruzione: laurea, diploma superiore, licenza media, licenza elementare, analfabeta.
Regioni coinvolte: Basilicata, Calabria, Campania, Lazio, Marche, Puglia, Sardegna e Sicilia
Lordine di somministrazione ha previsto lapplicazione di un subetest della Scala verbale alternato ad uno della Scala
di performance

Attendibilit (taratura italiana)


I coefficienti di attendibilit sono stati calcolati con 2 metodi

split-half: suddivisione del reattivo in due parti uguali raggruppando tra loro gli item pari con quelli dispari e
correlando le due met ottenute
{il coefficiente di correlazione ottenuto (coeff di consistenza interna) rappresenta una misura dellomogeneit
del subtest, cio del grado in cui esso misura una stessa variabile}

test-retest: somministrazione dello stesso test dopo un determinato periodo di tempo e correlazione dei
punteggi ottenuti nelle due applicazioni
{il coefficiente di correlazione ottenuto fornisce informazioni sulla stabilit dei punteggi nel corso del tempo}

I coeff di consistenza interna dei QI risultano elevati per tutti i gruppi di et (medie: QIV=.95; QIP=.93; QIT=.96);
i valori medi dei coeff di attendibilit dei subtest vanno da .77 nella Ricostruzione di oggetti a .95 nel Vocabolario)
I coeff di attendibilit per test-retest ottenuti da sogg del gruppo 25-34 anni variano da .72 nella Ricostruzione di
oggetti a .93 per il Vocabolario, per let dei 45-54 anni i coeff di correlazione variano da .67 per la Ricostruzione
di oggetti a .94 per lInformazione

61

Validit
Poich lintelligenza concepita dallo stesso Wechsler come entit multideterminata e variamente sfaccettata derivante da una complessa interazione tra variabili cognitive e fattori non intellettivi - lanalisi fattoriale sempre
stata ritenuta uno strumento appropriato per individuarne i costrutti sottostanti
Sulla WAIS-R stato eseguito un numero notevole di analisi fattoriali
In letteratura sono presenti posizioni notevolmente diverse sulle modalit di estrazione dei fattori, sul loro numero e
sulla loro composizione
possibile distinguere gli studi riconducibili a 2 modelli
1.

Teorie multifattoriali (Modello a tre fattori)

2.

Teorie gerarchiche

62

Modello a tre fattori


In generale nellambito delle teorie multifattoriali la soluzione a tre fattori quella che pi frequentemente emerge dagli
studi fattoriali
Dallo studio di Orsini e Laicardi (1997) di analisi fattoriale eseguito su 1630 soggetti del campione italiano emerge che
la soluzione a tre fattori interpreta meglio i dati per la maggior parte dei gruppi di et studiati
Dagli studi pi recenti la struttura fattoriale della WAIS-R risulta
1) fattore di Comprensione verbale (CV), risulta saturato dai subtest Informazione, Vocabolario,
Comprensione e Analogie
2) fattore di Organizzazione percettiva (OP), saturato dai subtest Completamento di figure, Riordinamento
di storie figurate, Disegno con cubi, Ricostruzione di oggetti
3) fattore di Capacit di concentrazione (CC) saturato dai subtest Memoria di cifre, Ragionamento
aritmetico, Associazione simboli a numeri
CV = capacit di operare mentalmente su contenuti di natura verbale attraverso le conoscenze acquisite dalleducazione
OP = capacit di operare mentalmente su contenuti di natura visiva organizzandoli secondo schemi visuo-spazio-motori
CC = capacit di indirizzare lattenzione su compiti specifici e di mantenerla concentrata inibendo le attivit concorrenti
MODELLO A TRE FATTORI
Fattore generale
g

Fattori
Comprensione
verbale

Organizzazione
percettiva

Capacit di
concentrazione

Subtest
Informazione

Completamento di figure

Memoria di cifre

Vocabolario

Riordinamento di storie fig

Ragion aritmetico

Comprensione

Disegno con cubi

Assoc simb a num

Analogie

Ricostruzione di oggetti

63

Teorie gerarchiche
La teoria gerarchica di Vernon (1950) spiega lorganizzazione delle abilit umane secondo un modello piramidale
composto da fattori specifici, fattori di gruppo principali e fattore g
I fattori specifici (abilit specifiche chiamate in causa dalle particolari caratteristiche di ciascun subtest) si raggruppano
in fattori pi ampi fattori di gruppo secondari che rientrano in due fattori pi grandi definiti fattori di gruppo principali
I fattori di gruppo principali sono 2:

fattore verbale-educazionale (v:ed)

fattore spaziale-meccanico pratico (k:m)

Il fattore unificante i fattori di gruppo principali il fattore g


Secondo Vernon il fattore g il primo responsabile delladeguato funzionamento mentale nelle sue pi articolate
manifestazioni
La teoria di Vernon stata utilizzata da Blaha e Mandes per interpretare la struttura fattoriale della WAIS-R
La struttura fattoriale ipotizzata da Blaha e Mandes (1993) la seguente:
-fattore g, saturato da tutti gli undici subtest, rappresenta la capacit generale di soluzione dei problemi
-fattore v:ed, saturato da tutti i subtest della Scala verbale, rappresenta lintelligenza verbale , cio la capacit di
ricezione e di elaborazione di contenuti verbali nella soluzione dei problemi
-fattore k:m, saturato da tutti i subtest della Scala di performance, rappresenta lintelligenza visuo-percettiva, cio la
capacit di ricezione e di elaborazione di immagini visive nella soluzione dei problemi
-fattore di Comprensione verbale (CV), saturato dai subtest Informazione, Vocabolario, Analogie e Comprensione,
esprime la capacit di operare mentalmente su contenuti di natura verbale attraverso le conoscenze acquisite con
leducazione
-fattore di Attenzione-concentrazione (AC), saturato dai subtest Memoria di cifre e Ragionamento aritmetico, indica la
capacit di indirizzare e mantenere lattenzione su compiti specifici senza perdere informazioni
-fattore spaziale (k), saturato dai subtest Completamento di figure, Disegno con cubi e Ricostruzione di oggetti, misura
la capacit di operare mentalmente su contenuti di natura visiva organizzandoli secondo schemi visuo-spazio-motori
-fattore quasi-specifico (QS), presenta buone saturazioni nei subtest Riordinamento di storie figurate e Associazione
simboli a numeri, indica le abilit di porre in sequenza, di prestare attenzione ai dettagli e di produzione convergente

64

TEORIA GERARCHICA
g

Fattori di gruppo
principali
v:ed

k:m

Fattori specifici
CV

AC

QS

CV (Informazione, Analogie, Vocabolario, Comprensione)


AC (Ragionamento aritmetico, Memoria di cifre)
K (Completamento di figure, Disegno cubi, Ricostruzione oggetti)
QS (Riordinamento storie, Associazione simboli a numeri)

La scarsit di ricerche riguardanti la soluzione fattoriale di tipo gerarchico consiglia di utilizzare questo modello solo
nel caso in cui la soluzione a tre fattori non risulti adatta a spiegare i dati ottenuti dal sogg

65

Scoring
Lesecuzione di ciascuno dei subtest d luogo ad un punteggio grezzo che deve essere convertito in punteggio ponderato
(PP) in base alla tabella del gruppo di riferimento
Sommando tra loro i 6 punteggi ponderati della Scala verbale ed i 5 della Scala di performance si ottengono
rispettivamente il punteggio verbale ed il punteggio di performance
Si procede al calcolo del punteggio totale che dato dalla somma del punteggio verbale con quello di performance
Attraverso la tabella corrispondente al gruppo di et del soggetto il punteggio verbale viene convertito in quoziente di
intelligenza verbale (QIV), il punteggio di performance in quoziente di intelligenza di performance (QIP) ed il
punteggio totale in quoziente di intelligenza totale (QIT)
Operazioni da effettuare per lo scoring
1.

convertire per ciascun subtest il punteggio grezzo in PP

2.

sommare i PP dei subtest della scala verbale

3.

sommare I PP dei subtest della scala di performance

4.

calcolare il punteggio totale

5.

convertire il PP della scala verbale in QI verbale

6.

convertire il PP della scala di performance in QI di performance

7.

convertire il PP della scala totale in QI totale

66

INTERPRETAZIONE DEI RISULTATI DELLA WAIS-R


Premessa
fondamentale per una corretta interpretazione la comprensione del sogg intesa come relazione con lui,
osservazione del comportamento, attenzione ai bisogni.
Durante la somministrazione il focus dellattenzione deve sempre essere la comprensione della persona, con la
sua specificit e complessit, e non la meccanica formulazione delle domande, registrazione delle risposte e
computo dei punteggi
Nessun indice della WAIS-r pu essere utilizzato per emettere diagnosi, necessario avvalorare qualsiasi dato
con i risultati di altri test e con una vasta indagine che comprenda elementi derivati dal colloquio,
dallosservazione del sogg e dalla sua storia

67

Passaggi da seguire per linterpretazione


1. valutazione del QI totale
in relazione allimportanza del fattore g - quota di abilit generale presente in tutte le attivit mentali- nelleconomia
della scala (che da solo spiega circa il 40% della varianza totale) il test deve essere valutato in primo luogo in base al QI
totale
2. verificare la validit interna del QI totale
nel valutare il QI totale bisogna verificare la sua validit interna: maggiore la varianza del QI totale (ossia il grado di
dispersione degli 11 subtest) meno esso valido nello spiegare da solo la prestazione del sogg
in presenza di unalta dispersione dei punteggi ponderati il QI totale non ha una buona validit interna e diventa
indispensabile prendere in esame il QI verbale ed il QI di performance
si considera non omogeneo un QI totale quando la gamma dei subtest che lo compongono uguale o maggiore di 7
punti ponderati
3. verificare la validit esterna del QI totale
necessario verificare la validit del QI attraverso lesame del suo grado di accordo con altre informazioni sul sogg:
dati anamnestici, risultati scolastici, attivit professionale, interessi e abilit particolari ecc.
4. valutare eventuali differenze tra QI verbale e QI di performance
in una normale prestazione i valori del QI verbale e del QI di performance non dovrebbero essere troppo diversi tra loro
si pu considerare significativa una differenza tra i due QI quando di 10 punti o pi
se QI v QI p 10 ipotesi: lelaborazione delle informazioni avviene
preferenzialmente secondo una determinata
modalit cognitiva
se QI v QI p ipotizzabile una maggiore abilit nella modalit verbale di pensiero rispetto a quella visiva
se QIv QI p ipotizzabile una maggiore abilit nella modalit visiva di pensiero rispetto a quella verbale
5. verificare la validit interna del QI verbale e del QI di performance
in presenza di profili non dispersi il QI verbale e il QI di performance sono sufficienti a descrivere la prestazione del
sogg
se i valori di gamma di dispersione dei subtest che compongono il QI verbale e di performance sono di 6 punti ponderati
o pi necessario approfondire lanalisi dei QI disomogenei servendosi dei dati fattoriali (secondo il modello a tre
fattori o il modello gerarchico)

68

Significati da attribuire ai dati

Che significato dare al QI totale


Secondo Wechsler (1981) con il QI totale viene valutata una competenza generale, una capacit globale che in un
modo o nellaltro consente ad un individuo di predisposi alla comprensione del mondo e ad affrontarne le sfide; questa
capacit globale una funzione dellintera personalit ed influenzata da fattori non intellettivi
In una prospettiva fattoriale il QI totale si pu far corrispondere al fattore g che rappresenta la quota di abilit generale
presente in tutte le attivit mentali. Un alto punteggio nel fattore g corrisponde ad un buon livello di prestazione in ogni
tipo di abilit mentale
Generalmente il QI totale considerato un buon predittore delle capacit di apprendimento scolastico ed
extrascolastico, del grado di efficienza intellettiva, della capacit di autonomia cognitiva personale e del successo nella
ricerca di un impiego
In campo clinico il QI totale considerato un buon criterio per la definizione del ritardo mentale e un indice prognostico
importante nella psicoterapia dei disturbi mentali
Il QI totale ha media =100 e ds = 15
Classificazione dellintelligenza in base al QI totale

Sopra 141

Eccezionale

131- 140

Eccellente

116-130

Superiore

111- 115

Medio-alta

90- 110

Media

85-89

Medio-bassa

70- 84*

Ai limiti inferiori della norma

60- 69

Ipodotazione Ritardo mentale

Area
problematica

*funzionamento intellettivo limite


per Q.I. di valore compreso tra 70-84 non giustificata la diagnosi di ritardo mentale)

69

Classificazione del ritardo mentale


Q.I. < 70

ritardo mentale

Secondo lAmerican Associaton of Mental Deficiency possono essere distinti 4 livelli di ritardo mentale

Lieve

da 69 a 55 circa

Moderato

da 54 a 40

Grave

da 39 a 25

Gravissimo

inferiore a 25

Anche il DSM IV classifica il ritardo mentale allo stesso modo


Il manuale della WAIS-R non contempla valori di QI inferiori a 45 e non conste quindi una classificazione completa di
tutti i sogg con ritardo mentale

Calcolo del deterioramento mentale


Sebbene lo stesso Wechsler avvisi della scarsa validit di tale indice possibile effettuare il calcolo del deterioramento
mentale
Lindice di decadimento mentale basato sul confronto tra i risultati delle prove che non variano con quelle che variano
in rapporto allet.
INDICE:

prove che non variano X 100


prove che variano

I subtest che variano con let sono:

Memoria di cifre

Analogie

Associazione simboli a numeri

Disegno con cubi

I subtest che non variano con let sono:

Informazione

Vocabolario

Ricostruzione di figure

Completamento di figure

70

Significato del concetto di Q.I.


Lattribuzione di un numero per definire la performance del soggetto alla scala di intelligenza, soprattutto quando
rientra nellarea problematica, se non accompagnata dalla spiegazione delle determinanti del risultato stesso priva di
un reale significato clinico.

Il Q.I. non una misura statica, ma storica: espressione del livello di abilit di un individuo in un dato
momento, quindi non immutabile e assoluto, ma suscettibile di possibili modificazioni nel percorso
evolutivo

Il QI non espressione di unabilit unitaria (intelligenza), ma di una serie di funzioni diverse che sono
influenzate dalla cultura nella quale lindividuo si trova inserito

Il QI spesso legato a conoscenze e acquisizioni scolastiche

In sintesi: il QI espressione di una molteplicit di fattori che interagiscono con tre variabili principali: la dotazione
naturale, lambiente psicologico, lambiente educativo

Che significato dare al QI verbale al QI di performance ed a eventuali differenze


La distinzione tra QI verbale e QI di performance nelle scale Wechsler ha lo scopo di confrontare labilit di un soggetto
a usare parole e simboli con quella di servirsi di oggetti e di percepire gli schemi visivi
La differenza tra QI verbale e QI di performance non pu mai essere usata come unico indice in base al quale formulare
una diagnosi ma solo come elemento utile per generare ipotesi di lavoro
Una differenza di 10 punti tra QI verbale e QI di performance generalmente indicativa di uneffettiva differenza tra
modalit verbale e modalit visiva di pensiero
Una differenza di 20 punti o pi tra QI verbale e di performance definita abnorme e richiede obbligatoriamente degli
approfondimenti clinici
Nel modello fattoriale gerarchico il QI verbale e QI di performance sono fatti corrispondere rispettivamente al fattore
verbale-educazionale e al fattore spaziale-meccanico-pratico
Il fattore verbale-educazionale rappresenta le acquisizioni cumulativamente ricavate dal soggetto dal sistema educativo
e scolastico in cui cresciuto.
Sono componenti del fattore verbale-educazionale la capacit di ritenzione e di manipolazione dei dati verbali nella
memoria a breve e a lungo termine e le abilit numeriche
modalit verbale di pensiero
Il fattore spaziale-meccanico-pratico consiste in abilit spaziali-meccaniche e pratiche e riguarda compiti di tipo visuopercettivo, meccanico e manuale.
Sono componenti del fattore spaziale-meccanico-pratico le capacit di riconoscimento e richiamo visivo, di analisi e
sintesi visuo-percettiva e di coordinazione visuo-motoria.

71

modalit visiva di pensiero


In generale stato riscontrato
QI v QI p in sogg con

alto grado di istruzione, dirigenti, funzionari, liberi professionisti

problemi di coordinazione motoria

danno cerebrale emisferico destro o bilaterale

disturbi di tipo schizofrenico o depressivo

QI v QI p in sogg

che svolgono attivit tecniche e lavori di tipo manuale

con danno cerebrale emisferico sinistro

con ritardo mentale lieve

con disturbi dellapprendimento

comportamenti delinquenziali

Interpretazione dei punteggi fattoriali


Se i QI verbale e di performance non sono omogenei occorre uninterpretazione della WAIS-R in base ai modelli
fattoriali
Sia per il modello a tre fattori che per quello gerarchico il calcolo del valore dei fattori avviene secondo il metodo di
Parker
Procedimento
1.

trovare la media dei punteggi ponderati dei subtest componenti ciascun fattore

2.

confrontare i punteggi ottenuti con i seguenti parametri


16 e oltre= ottimo
14-15= buono
13= medio-superiore
8-12 = medio
7= medio-inferiore
5-6 =scarso
4 e inf. = molto scarso

72

Configurazione dei punteggi alla WAIS-R in alcuni campioni di sogg


Differenze tra maschi e femmine
La gran parte degli studi in letteratura indica lesistenza di strutture cognitive differenti tra maschi e femmine
Tali differenze sono ricondotte alle differenze tra intelligenza fluida (abilit indipendente dagli apprendimenti scolastici,
relativa allunione di apprendimenti occasionali con abilit basate su capacit elementari, si evidenzia in compiti basati
sulla comprensione di relazioni tra stimoli non verbali) e cristallizzata (abilit effetto dellapplicazione dellintelligenza
fluida ad apprendimenti scolastici, si evidenzia in compiti connessi ad apprendimenti scolastici)
Secondo Horn i subtest della WAIS-R si possono raggruppare in 4 categorie
1.

intelligenza cristallizzata: subtest Informazione, Vocabolario, Comprensione e Analogie

2.

intelligenza fluida: subtest Completamento di figure, Riordinamento di storie fig, Disegno con cubi,
Ricostruzione di oggetti, Analogie e Memoria di cifre

3.

capacit di richiamo: subtest Informazione, Ragionamento aritmetico, Memoria di cifre

4.

velocit associativa: subtest Associazione simboli a numeri

Studi sulle prestazioni in et adulta hanno indicato che


-

i maschi sono favoriti nelle prove spaziali e numeriche

le donne sono favorite nelle prove di espressione verbale e di velocit psicomotoria

i maschi hanno una maggior presenza di abilit cognitive connesse con lintelligenza fluida

le femmine un maggior possesso di abilit connesse con lintelligenza cristallizzata e la velocit


associativa

labilit nella capacit di richiamo analoga

Ipotesi per spiegare le differenze


-le femmine applicano strategie di tipo verbale anche a problemi non verbali, i maschi usano nei confronti di problemi
non verbali sono strategie di tipo visuo-percettivo
-influenza degli ormoni sessuali sul cervello
-maggiore efficienza della trasmissione degli impulsi nervosi a livello cerebrale nelle femmine rispetto ai maschi

Cambiamenti dellintelligenza con laumentare dellet


Dagli studi effettuati emerge che

Le abilit di tipo verbali vengono mantenute fino ad et avanzata

Le abilit di performance iniziano a decadere gi nella prima et adulta

Quando vengono esclusi gli effetti della scolarit il declino procede parallelamente per maschi e femmine

73

Ritardo mentale
Premessa: sono classificati ritardati mentali i sogg che ottengono un QI totale inferiore a 70
Secondo Wechsler le caratteristiche della WAIS di un sogg con insufficienza mentale sono:
-

profilo poco disperso

con punteggi migliori nei subtest Ricostruzione di oggetti e Comprensione e peggiori in Associazione
simboli a numeri, Memoria di cifre e Ragionamento aritmetico

il QI v non diverso dal QI p di pi di 10 punti

Dagli studi in letteratura emerge

profili poco dispersi

sono considerati facili i subtest della scala di performance, in particolare Ricostruzione di ogg, Riordinamento
di storie, Completamento di fig; sono ritenuti pi difficili i subtest della scala verbale, soprattutto
Ragionamento aritmetico, Informazione e Vocabolario

il QI v di solito leggermente inferiore a quello di performance

Patologia cerebrale
Wechsler ha indicato che la caduta nei subtest
Memoria di cifre
Associazione simboli a numeri
Disegno con cubi
segno di patologia organica
Wechsler definisce tale configurazione sindrome cerebrale organica (SCO)
Dagli studi successivi emerge che

nonostante le critiche lindice SCO ancora utilizzato nella diagnostica delle disfunzioni cerebrali

le differenze tra QI v e QI p di almeno 10 punti possono giustificare ipotesi diagnostiche di patologia cerebrale
ma richiedono approfondimenti anamnestici e neuropsicologici adeguati

solitamente i pz con danno emisferico unilaterale sin mostrano un deficit nel QI v; i pz con danno emisferico
unilaterale dx un deficit nel QI p; i sogg con danno emisferico bilaterale un deficit nel QI p ma non in quello
verbale

74

Disturbi specifici dellapprendimento (DSA)


Definizione: un disordine in uno o pi dei processi di base implicati nella comprensione o nelluso del linguaggio,
parlato o scritto, che pu manifestarsi in una imperfetta abilit nellascoltare, nel parlare, nel leggere, nello scrivere,
nellortografia o nelleseguire calcoli matematici.
I disturbi dellapprendimento comprendono condizioni quali handicap percettivi, danno cerebrale, disfunzione cerebrale
minima, dislessia e afasia di sviluppo.
Molti studiosi concordano sul fatto che in questa patologia sia presente una dotazione intellettiva complessiva media o
anche superiore alla media
I disturbi nellapprendere ostacolano lespressione omogenea dellintelligenza nelle varie abilit che risultano in questo
modo notevolmente disarmoniche
Caratteristiche della WISC nei DSA
Negli studi sui DSA un indice frequentemente utilizzato nella diagnosi la differenza tra QIv e QIp
La maggioranza delle ricerche converge nellindicare che in questa patologia il QIv minore del QIp da un valore che
QIv < QIp

va dai 4 ai 25 punti e oltre

I lavori basati sui punteggi fattoriali hanno messo in evidenza che nei sogg con DSA spesso si trovano punteggi pi
elevati nei fattori visuo-percettivo che in quelli di tipo verbale
Adottando il modello a tre fattori nel sogg con DSA viene riscontrata la relazione
Organizzazione percettiva > Comprensione verbale
Il Fattore di Capacit di concentrazione mostra una grande variabilit
Organizzazione percettiva = Compl fig, Riord storie, Disegno cubi,
Ricostruzione ogg
Comprensione verbale = Vocabolario, Informazione, Comprensione,
Analogie

Unaltra modalit di studio dei DSA la categorizzazione di Bannatyne


Secondo Bannatyne per una migliore comprensione clinica dei risultati alla WISC utile raggruppare i subtest nelle 3
categorie:
1.

Concettualizzazione verbale (Analogie, Vocab e Comprensione)

2.

Abilit spaziale (Compl fig, Disegno cubi, Ricostr ogg)

3.

Capacit sequenziale (Memoria cifre, Cifrario, Riord storie figurate)


75

Nelle DSA si pu osservare secondo lA. la relazione


Abilit spaziale > Concettualizzazione verbale > Capacit sequenziale
Sia Bannatyne che altri studiosi hanno riscontrato tale configurazione nella dislessia (disabilit nella lettura) ed in altri
tipi di disturbo dellapprendimento

76

Disturbo psichiatrico grave


Generalmente si ritiene che le prestazioni alla WAIS dei sogg normali siano abbastanza omogenee e non presentino una
gamma di dispersione dei punteggi ponderati eccessivamente elevata
Secondo Rapaport (1969)

le prestazioni caratterizzate da unampia dispersione dei punteggi, per quanto possano essere rilevate talvolta
anche in sogg normali, si riscontrano molto pi spesso in sogg patologici

nei sogg psichiatrici i subtest verbali sono pi stabili e resistenti al disturbo mentale di quelli di performance e
presentano minore dispersione

nei sogg con disturbo mentale i subtest verbali mantengono un punteggio maggiore di quelli di performance

In generale dagli studi effettuati emerge che

le indicazioni di Rapaport non hanno trovato sempre conferma

il valore del QI totale variabile da persona a persona e sembra essere notevolmente influenzato
verso il basso- dal numero di anni trascorsi dallesordio e dai lunghi periodi di ospedalizzazione

nella patologia psichiatrica grave esiste una grande variabilit intersubtest (cfr. fig)

77

Scala dIntelligenza Wechsler per Bambini riveduta (WISC-r)


costituita da 12 subtest
Scala verbale
1.

Cultura generale

2.

Comprensione

3.

Memoria di cifre

4.

Ragionamento aritmetico

5.

Somiglianze

6.

Vocabolario

Scala di performance
1.

Completamento di figure

2.

Riordinamento di storie figurate

3.

Disegno con cubetti

4.

Ricostruzione di figure

5.

Associazione simboli a numeri

6.

Labirinti

dalla somma dei punteggi ai singoli subtest si ottiene il calcolo dei quozienti intellettivi (QI)
per il calcolo dei valori dei QI non sono usati la Memoria di cifre della Scala Verbale e i Labirinti della Scala di
Performance, che sono considerati test supplementari

78

MATRICI PROGRESSIVE DI RAVEN


Le PM sono connesse con la teoria di Spearman (teoria dei due fattori: un fattore g innato, non modificabile dalla
scolarizzazione, evidenziato da test che chiedono di rilevare rapporti e relazioni e fattori specifici s - in gran parte
incrementabili con mezzi educativi)
Le PM sono un Test della capacit della persona, al momento della prova, di comprendere figure prive di significato
presentate alla sua osservazione, vedere le relazioni tra esse, concettualizzare la natura della figura completando ogni
sistema di relazioni presentato e, cos facendo, elaborare un metodo sistematico di ragionamento (Raven, Court,
Raven, 1977)
Gli stimoli sono presentati in serie ciascuna distinta da una lettera
Ogni serie comincia con un problema che si pu risolvere intuitivamente e prosegue con problemi qualitativamente
analoghi ma in ordine progressivo di difficolt
Ciascun problema rappresenta la matrice (o lorigine) di un sistema di pensiero
Lordine di presentazione (difficolt crescente) permette al soggetto di addestrarsi a un sistema di lavoro e fornisce
allesaminatore informazioni sulle sue capacit intellettuali
Tempo di somministrazione = circa unora
La somministrazione pu essere individuale o collettiva
Il corretto completamento della figura dipende dalla comprensione dei rapporti tra le parti: per poter risolvere gli item
necessario seguire una sequenza ed una logica precisa, bisogna ragionare su un problema che di natura visuopercettivo-motorio.
Diagnosi clinica
Clinica neurologica con studio di lesioni emisferiche
Diagnostica neuropsicologica sugli anziani
Ambiti di utilizzo

Selezione del personale


I risultati al compito proposto dipendono meno dal fattore educativo di quanto non avvenga per altri test simili (test
culture free): le tavole sono state elaborate per poter esaminare la massima ampiezza delle abilit mentali e per essere
applicabili a persone di ogni et indipendentemente dal livello culturale.
Il test di Raven dovrebbe valutare il fattore G dellintelligenza, cio lintelligenza astratta, ossia quellinsieme di
capacit che consentono di trovare soluzioni a un quesito pi o meno complesso a prescindere dai condizionamenti
socio-culturali (non sono implicati addestramento e apprendimento di nozioni).

79

Gli AA sottolineano che le PM non sono un test di intelligenza generale ma un reattivo capace di fornire risultati
proporzionali allefficienza intellettuale
Per ottenere indicazioni utili a fini applicativi utile somministrare anche

Un test di vocabolario

Un test di funzioni gestaltiche per valutare in che misura il sogg capace di percepire come un insieme
unitario degli elementi separati

Un test di disegno con cubi per valutare lorientamento

Un test di scelta di oggetti per valutare la flessibilit del pensiero

ATTENDIBILIT
Buona omogeneit interna
Buona attendibilit al retest
VALIDIT
Validit rispetto a criteri
Nei campioni di lingua inglese buona la validit rispetto a criteri (buona correlazione con scale Binet e Wechsler),
meno buona nei campioni italiani
Nelle ricerche italiane risultata bassa anche la correlazione con il profitto scolastico
La validit predittiva rispetto al profitto scolastico, al contrario del dato sulla validit concorrente, buona
Validit di costrutto
Gli studi fattoriali hanno evidenziato un fattore g di diverso peso a seconda dello studio
La maggior parte degli studi segnala saturazione in s (abilit a visualizzare rapporti spaziali)
Le ricerche italiane
-

hanno rilevato deboli correlazioni, anche se statisticamente significative, tra i risultati alle PM e indici
socioeconomici quali la professione o listruzione

in culture non europee i nativi scolarizzati ottengono alle PM risultati statisticamente superiori ai nativi non
secolarizzati

80

Esistono 3 versioni delle PM:


1.

PM 38 o Standard Progressive Matrices

per soggetti dai 12 ai 65 anni


gli stimoli sono raggruppati in serie, ciascuna distinta da una lettera (da A ad E), ogni serie comprende 12 problemi
2.

PM colorate o PM 47 colorate

Per

bambini al di sotto degli 8 anni

adulti di basso livello intellettivo

anziani

include:
o

le serie A e B

una serie Ab intermedia

le serie C, D ed E stampate a colori

si consiglia la somministrazione delle ultime 3 serie solo ai soggetti che hanno risolto bene gli ultimi problemi della
serie B, dimostrando di aver raggiunto una certa capacit di astrazione

PM 47 (Advanced Progressive Matrices)

composta da :
o

I serie di 12 stimoli che ha lo scopo di allenare i soggetti al metodo di lavoro

II serie costituita da 36 problemi in ordine progressivo di difficolt

questarticolazione consente di valutare anche lefficienza intellettiva del soggetto stimata in base al numero di
problemi della II serie correttamente risolti in un limite di tempo dato
tale dato, non ottenibile con le PM 38 pu essere utile sia nella selezione del personale che nella diagnosi clinica

81

PM 38 Standard Progressive Matrices


somministrazione
sono possibili somministrazioni individuali e collettive
CONSEGNA esame individuale:
Guardi questo (mostrare la prima fig) un disegno al quale manca un pezzo. Questi pezzi qui sotto (mostrarglieli uno
dopo laltro) hanno tutti forma identica al quello del pezzo che manca, essi potrebbero riempire perfettamente lo spazio
bianco, ma non completerebbero uniformemente il disegno
spiegare chiaramente il perch i numeri 1, 2, 3 rappresenterebbero le risposte false e perch il numero 6 non darebbe
che una risposta approssimativa, continuare
se il candidato non sa mostrarlo, lesaminatore continuer a dare delle spiegazioni finch il sogg avr completamente
capito la natura del problema da risolvere
lesaminatore continuer dicendo che su ciascuna pagine del quaderno vi sar una figura disposta in modo analogo a
quella esaminata e dir
il suo lavoro deve consistere nel trovare per ogni prova il pezzo che rappresenta la risposta esatta, cio quella che
serve a completare perfettamente il disegno della matrice
voltare la pagina e mostrare il disegno A2
questi problemi sono semplici allinizio, ma divengono sempre pi difficili. Se per lei far molta attenzione nel modo
di risolvere i problemi facili, trover i seguenti meno difficili. Si limiter a segnalare il pezzo che completa il disegno.
Lavori con il suo solito ritmo di lavoro e vedremo quante risposte esatte sar capace di darmi. Il suo tempo senza
limite. Faccia attenzione, non c alcuna fretta. Si ricordi che per ogni problema non vi che una sola risposta esatta
lesaminatore annota sul foglio di risposta il numero dei pezzi che il sogg indica per ciascun problema
caratteristiche delle 5 serie
Serie A = problemi basati sul completamento di un pattern
Il problema si presenta come ununit percettiva semplice che si struttura in base alle leggi della gestalt in modo
immediato ed impersonale
Sono problemi che implicano un tipo di conoscenza di carattere globalistico-sincretico
I primi 6 item riguardano problemi di similitudine e di continuit su base geometrica semplice, gli item dal 7 al 12 vede
la base geometrica divenire pi complessa
Serie B = problemi che richiedono la comprensione dei rapporti tra le parti
Le figure della serie B presentano un elementare rapporto analogico, che riunisce in un sistema organico gli elementi
della figura da completare

82

Il meccanismo da impiegare per la soluzione quello di unanalisi dei dati percettivi senza dover ricorrere a
completamento di informazioni in quanto queste sono gi disponibili. Una capacit operativa di questo tipo gi
presente in bambini di 6 anni
Item 1-2 sono problemi di geometria semplice
Item 3-5 sono problemi di ricostruzione di strutture semplici e discontinue
Item 6-7 sono problemi che richiedono la ricostruzione di strutture pi complesse attraverso unanalisi di pi dati
percettivi
Item 8-12 sono problemi che implicano un vero e proprio ragionamento per analogia
In sintesi nella serie B: i primi 6 problemi sono di carattere grafico-percettivo, tali da vere una parte mancante le cui
caratteristica implicita nel disegno presentato; nel secondo gruppo necessario operare la scoperta degli indici di
analisi che consentono il completamento della figura
Serie C
I problemi sono pi difficili in quanto implicano un ragionamento astratto, richiedono la capacit di enumerare e
comprendere il concetto di grandezza, lintuizione della progressivit delle grandezze
Primi 6 item: sono presentati degli stimoli in grandezza progressiva che occorre completare con il successivo termine
della serie
Item 7-12: i problemi riguardano scostamenti semplici e di carattere simmetrico nellambito di figure complete; bisogna
diagnosticare posizioni successive o aumenti di ampiezza e riconoscere come tali quelli nella posizione mancante
Queste prestazioni sono caratterizzate dalla necessit di una discreta capacit di percezione spaziale
Serie D
I problemi richiedono unanalisi critica dei parametri che caratterizzano ciascun item e quindi una valutazione di quelli
che mancano nella figura da completare. Mentre nella serie C il parametro era singolo, in questa serie i parametri
diventano pi di uno, ma il procedimento operativo sostanzialmente lo stesso.
Si tratta di analizzare quali elementi sono in variazione e di tener presente questo dato per il completamento del
problema, la difficolt della serie consiste quasi esclusivamente nel riconoscere i parametri che variano e la direzione di
tale variazione (in senso orizzontale o verticale)
Seri E
Lultima serie di problemi richiede lanalisi di tutti gli elementi che li costituiscono e del modo in cui essi sono
combinati tra di loro. Si tratta di prestazioni astratte che si accompagnano a giudizi di somma e sottrazione. In questa
serie sono implicati i meccanismi della logica tradizionale legati al principio di esclusione, transizione, identit,
progressivit
Quando gli elementi richiedono un procedimento di carattere sottrattivi questo rappresenta sempre la conclusione di una
analisi e di una formulazione critica di ipotest verificata attraverso valutazioni quantitative; occorre la capacit di
operare con materiale immaginativo che viene manipolato quantitativamente.
Le operazioni richieste raramente avvengono prima del quattordicesimo anno di et e sono espressione delle pi mature
capacit di astrazione logica.

83

In base al punteggio finale conseguito si pu classificare un soggetto nelle seguenti categorie:

Gruppo I: soggetti di intelligenza superiore

il punteggio supera o fa parte del 95 centile

Gruppo II: soggetti di intelligenza nettamente sup alla media

il punteggio supera o fa parte del 75 centile

Gruppo III: soggetti di intelligenza media

il punteggio si trova tra il 25 e 75 centile

Gruppo IV: soggetti di intelligenza nettamente inf alla media

il punteggio finale inferiore al 25 centile

Gruppo V: soggetti deboli

il punteggio inferiore al 5 centile


taratura italiana
la ricerca stata finalizzata alla costruzione di tabelle di taratura italiana finora mancanti (prima il manuale riportava
delle vecchie norme quasi inutilizzabili)
campione:
la ricerca stata condotta su 1123 sogg non rappresentativi della popolazione lombarda, ma espressione dei gruppi di
popolazione che hanno pi probabilit di essere esaminati con le SPM
sogg con et dagli 11 ai 60 anni
scolarit da analfabeta a universitaria
entrambi i sessi
sono stati esaminati nel corso di vari anni ed in vari luoghi (centri medici, servizi di igiene e profilassi, istituti per lievi
insufficienti mentali)
Lo studio ha evidenziato che i risultati alle SPM sono influenzati dallet e dalla scolarit
ci ha imposto tabelle di taratura in funzione di questi 2 parametri
nessuna differenza attribuibile al sesso
Come evidenziato dalle ricerche riportate nella taratura italiana i sogg con scolarit elevata abitualmente ricorrono a
meccanismi di pensiero logico-astrattivo al quale non sono costretti a ricorrere sogg che non fanno dello studio
unattivit prevalente.
Labitudine ad operare con procedimenti di analisi, astrazione, giudizio, e di sintesi combinatoria degli elementi di
partenza un modo di procedere tipicamente legato alla cultura occidentale ed alla consuetudine scolastica ed
ambientale, queste considerazioni possono spiegare linfluenza dellet e della scolarit sui risultati
84