Sei sulla pagina 1di 22

Diagnosi e classificazione della Disabilità Intellettuale

Una diagnosi della disabilità intellettuale si sviluppa dall’incontro di tre criteri: (a)
significative limitazioni nel funzionamento intellettuale; (b) significative limitazioni
nel comportamento adattivo; (c) età di insorgenza prima dei 18 anni.

Come è stato discusso più ampiamente in Schalock, Luckasson e Shogren, vi è una


notevole coerenza in questi tre criteri – e le loro definizioni operative – negli ultimi
50 anni. Come è stato discusso più ampiamente nei capitoli 4 e 5, le definizioni del
primo e del secondo criterio sono le seguenti:

• Funzionamento intellettuale: un punteggio QI che approssimativamente è due


deviazioni standard sotto la media, considerando l’ errore standard di misurazione
degli specifici strumenti usati per assessment e i punti di forza e i limiti (degli
strumenti).
• Comportamento adattivo: prestazioni su una misura standardizzata del
comportamento adattivo, che è regolato sulla popolazione generale, comprese le
persone con e senza disabilità intellettuale, che è approssimativamente due deviazioni
standard sotto la media di o (a) uno dei seguenti tre tipi di comportamento adattivo:
concettuale, sociale e pratico o (b) un punteggio complessivo relativo ad una misura
standardizzata di abilità concettuali, sociali e pratiche.

Il terzo criterio, età di insorgenza, si riferisce all’età in cui la disabilità comincia.

Ai fini del criterio l’età di insorgenza permette di distinguere la disabilità intellettuale


dalle altre forme di disabilità che possono verificarsi più tardi nella vita. La disabilità
intellettuale si origina in genere vicino al momento della nascita – o durante lo
sviluppo fetale, il processo di nascita, o subito dopo la nascita. A volte, tuttavia,
soprattutto quando l’eziologia della disabilità indica danneggiamenti progressivi
(come la malnutrizione) o di un danno derivante da una malattia acquisita o lesioni

1  

 
(come un’ infezione o lesione traumatica del cervello), la condizione può avere
origine più tardi. Quindi, la disabilità non deve necessariamente essere stata
formalmente identificata, ma deve avere avuto origine durante il periodo dello
sviluppo. L’insorgenza del primo criterio è evidente nelle prime formulazioni della
definizione di disabilità. Come riportato nella tabella 1.2., c’è stato un piccolo
cambiamento nell’età di insorgenza (generalmente prima dei 18 anni) nel corso degli
ultimi 50 anni.

Si può analizzare l’età di insorgenza sia da un punto di vista neurologico che da una
prospettiva di politica sociale. Neurologicamente, il momento di principale sviluppo e
cambiamento del cervello avviene durante il periodo prenatale, l’infanzia e gli anni
della fanciullezza, anche se un notevole cambiamento si verifica durante
l’adolescenza e successivamente. Così, da una prospettiva neurologica, 18 è
abbondante per la manifestazione. Da una prospettiva delle politiche sociali,
attualmente si trovano entrambe le età 18 e 21, quest’ultima usata come limite
massimo. Anche se vi è una consistenza storica nell’uso dei 18 anni d’età, il criterio
dei 21 si trova nella legge sullo Sviluppo delle Disabilità del 1990 (anche se esso
originariamente utilizza 18 anni come età; Thompson & Wehmeyer, 2008). Anche se
questa discrepanza può causare molta confusione, la nostra posizione è che il 18 è
ancora il miglior limite superiore per le seguenti cause: (a) estendendo all’età di 21
anni può cambiare il numero di persone che possono beneficiare di diagnosi e di
conseguenza cambiare l’impatto dell’andamento che prevale in quanto la classe
dovrebbe includere individui con altre disabilità cognitive (ad esempio, lesioni
cerebrali traumatiche e malattie mentali); (b) estendendo ai 21 anni non sarebbe utile
diagnosticare gli individui che non sono stati diagnosticati prima dei 18 anni, perché
ogni esame con molta probabilità si riferisce ai record scolastici che determinano
come lo studente stava procedendo in quel momento; (c) mantenendo l’età di 18 anni
si è coerenti con le pratiche di diagnosi di molti paesi (ad esempio, in tutta Europa e
nell’area del Pacifico), e (d) mantenendo il criterio attuale di “origine prima dei 18
2  

 
anni”, si lascia aperta la possibilità che, quando una diagnosi accurata dell’ ID non è
stata effettuata durante il periodo di sviluppo, una diagnosi retrospettiva può essere
necessaria in alcune situazioni (vedi capitolo 8).

Nei successivi cinque capitoli, discuteremo in particolare dei fattori che incidono su
una migliore pratica diagnostica. Si tratta di (a) una comprensione del funzionamento
intellettivo e il suo assessment (capitolo 4), (b) comportamento adattivo e il suo
assessment (capitolo 5), (c) il ruolo dei fattori eziologici nella diagnosi dell’ ID
(capitolo 6), (d) un approccio multidimensionale per la classificazione (capitolo 7), e
(e) il ruolo del giudizio clinico nella diagnosi, nella classificazione e lo sviluppo di
sistemi di supporto (capitolo 8). In tutti questi cinque capitoli, i lettori troveranno
anche una discussione sulle migliori pratiche di orientamento riguardanti le diagnosi
e la classificazione dell’ID. Le più importanti di queste linee guida sono le seguenti:

• Una diagnosi dell’ID si basa su tre criteri: limitazioni significative nelle funzioni
intellettuali, il comportamento adattivo espresso nelle abilità concettuali, sociali e
pratiche, e l’età di insorgenza prima dei 18 anni.
• ID viene diagnosticata utilizzando le informazioni ottenute dall’assessment e
attraverso gli strumenti standardizzati, somministrati individualmente, che valutano le
funzioni intellettuali e il comportamento adattivo.
• Una valida diagnosi dell’ID si basa su molteplici dati che non comprendono solo di
dare una stessa valutazione al significato delle limitazioni nel comportamento
adattivo e quelle del funzionamento intellettuale ma è necessario anche per la
valutazione di modelli di punteggi e fattori del test che influenzano l’errore standard
nella misurazione a causa della standardizzazione degli strumenti utilizzati
nell’assessment.
• Se i criteri diagnostici sono uniti, la diagnosi può essere applicata per raggiungere
diversi scopi mirati, tra cui, ma non solo, istituire la presenza della disabilità in un

3  

 
individuo e confermare l’idoneità di un individuo a servizi, benefici e tutele
giuridiche.
• Informazioni riguardo gli individui con ID (o individui stessi) possono essere
raggruppati o classificati in base ai diversi scopi, come il servizio di
rimborso\finanziamento, per sviluppare un servizio e un supporto personalizzato,per
condurre ricerche e\o comunicare riguardo le caratteristiche selezionate.
• Medici e altri utenti di questo manuale dovrebbero scegliere un sistema di
classificazione multidimensionale, coerente con uno specifico scopo. Inoltre, bisogna
stare attenti a non usare le informazioni per la classificazione per fini inappropriati.
• Per prevenire un raggruppamento inadatto degli individui con ID, i sistemi di
classificazione che portano ad analoghi servizi, posizionamenti o altri esiti per gli
individui in particolari sottocategorie, devono essere basati su una forte evidenza che
i sistemi di classificazione impiegati saranno vantaggiosi per il beneficio di ogni
persona del gruppo.
• Il giudizio clinico è essenziale, e un più alto livello di giudizio clinico è
frequentemente richiesto nella diagnostica complessa e nella classificazione di
situazioni nelle quali la complessità delle funzioni dell’individuo preclude soltanto un
assessment standardizzato, le restrizioni legali significativamente riducono le
opportunità di osservare e valutare la persona, l’informazione storica è assente e non
può essere ottenuta, o ci sono seri problemi circa la validità dei dati. Il giudizio
clinico è definito come un particolare tipo di sentenza radicata in un lato livello di
competenza, di esperienza e di giudizio clinico, che emerge direttamente attraverso
un training esteso, attraverso l’esperienza con la persona e un’ampia serie di dati. Ai
fini del giudizio clinico e l’uso di strategie per tale giudizio permette di migliorare la
qualità, la validità e la precisione della decisione del clinico o delle raccomandazioni
per un caso particolare.
• Una diagnosi retrospettiva dovrebbe essere basata su molteplici dati che non
comprendono solo un’ uguale considerazione al comportamento adattivo e
4  

 
all’intelligenza ma è necessaria anche per la valutazione di modelli di punteggi e
fattori del test che influenzano i punteggi ottenuti dagli strumenti usati
nell’assessment come il tempo dello stesso. Se indicato, potrebbe anche essere
necessario sviluppare una valutazione contemporanea per mostrare somiglianze e
cambiamenti nel funzionamento nell’arco della vita.
• Se c’è inconsistenza nella serie di dati o nelle informazioni ottenute, il clinico
necessita di esplorare le possibili ragioni di queste differenze includendo errori,
trainer male addestrati, selezione impropria di test, somministrazione dello stesso test
troppo vicino nel tempo, gestendo edizioni differenti dello stesso test e non usando la
versione più recente, e\o non riconoscendo gli effetti delle caratteristiche personali e
dei fattori ambientali che possono influenzare i risultati dei test.

CAPITOLO 4

Funzionamento intellettuale ed il suo assessment

Ai fini della diagnosi, la funzione intellettuale sarà meglio concettualizzato e


catturato da un fattore generale di intelligenza. L’intelligenza è una generale capacità
mentale. Essa include ragionamento, progettazione, problem soving, pensiero
astratto, comprensione di idee complesse, apprendimento rapido e apprendimento
dall’esperienze.

5  

 
Le “limitazioni significative nel funzionamento intellettivo”, criterio per una diagnosi
di disabilità intellettuale, sono un punteggio QI che è circa due deviazioni standard
sotto la media, considerando l’errore standard di misurazione per gli specifici
strumenti utilizzati e i suoi punti di forza e i limiti.

QUADRO GENERALE

Il modello multidimensionale del funzionamento umano, presentato nella tabella 2.1,


include le abilità intellettuali come una delle cinque dimensioni del funzionamento
umano. Il funzionamento intellettuale, che è un termine più ampio sia di “capacità
intellettuali” sia di “intelligenza”, riflette il fatto che quello che è considerato un
comportamento intelligente dipende da altre dimensioni del funzionamento umano: il
comportamento adattivo che ognuno esibisce, lo stato di salute mentale e fisico della
persona, l’opportunità di partecipare ad attività importanti di vita e il contesto nel
quale le persone vivono la loro vita quotidiana. Quindi, come discusso in questo
capitolo, le misurazioni\indici di intelligenza, comunemente usate, devono essere
interpretate in un contesto più ampio di un unico punteggio QI.

Sebbene l’obiettivo primario di questo capitolo sia l’intelligenza e la sua valutazione,


è importante che i lettori di questo manuale notino le seguenti implicazioni
dell’intelligenza sulla multidimensionalità dell’ ID:

• Le limitazioni nell’intelligenza possono essere considerate alla luce di altre quattro


dimensioni del funzionamento umano: comportamento adattivo, salute,
partecipazione e contesto.
• La misurazione dell’intelligenza può avere un rapporto diverso, a seconda se viene
utilizzata a scopo di diagnosi o classificazione.
• Anche se lontano dalla perfezione, il funzionamento intellettuale è attualmente
rappresentato nel migliore dei modi dai punteggi QI, ottenuti da strumenti di
assessment adeguati, standardizzati e somministrati individualmente.
6  

 
L’assessment del funzionamento intellettuale è essenziale per fare una diagnosi di ID,
come di fatto tutte le definizioni storiche di ID (ex ritardo mentale) fanno riferimento,
in maniera significativa, al subaverage (media più bassa) del funzionamento
intellettivo, come criterio di diagnosi. I nostri tre obiettivi in questo capitolo saranno
quelli di presentare discussioni riguardo (a) la definizione e la natura
dell’intelligenza; (b) la definizione operativa di significative limitazioni nel
funzionamento intellettuale e (c) questioni impegnative e le relative linee guida per la
misurazione dell’intelligenza e l’interpretazione dei punteggi QI.

DEFINIZIONE E NATURA DELL’INTELLIGENZA

Gli individui differiscono nella loro capacità di capire le complessità e ragionare, di


adattarsi all’ambiente ed usare il pensiero per risolvere i problemi (Neisser et al.
1996). Anche se ragionamento, adattamento, comprensione e pensiero sono in
qualche modo descrittivi di “intelligenza”, essa stessa ha eluso con successo una
definizione che sia accettabile per tutti. Durante il secolo scorso, tre essenziali quadri
concettuali sono stati utilizzati nel tentativo di definire meglio il costrutto di
intelligenza: intelligenza come un unico (ad esempio, monofattoriale) tratto;
intelligenza composta da più tratti, fenomeno gerarchico; o l’intelligenza come un
costrutto multidimensionale.

Intelligenza come unico tratto

Poiché i tanti modi disponibili per misurare la capacità cognitiva erano altamente
correlati, Spearman (1927) ha concluso che il rapporto tra queste varie misure della
capacità cognitiva potrebbe essere descritto attraverso un singolo fattore di
intelligenza generale (ad esempio, g). La maggior parte dei test d’intelligenza
individuali comunemente utilizzati, come la famiglia delle scale Wechsler e la scala

7  

 
d’intelligenza di Stanford e Binet, quarta edizione, forniscono i parametri di questo
fattore g. Sebbene Thurstone (1938) non fu inizialmente in grado di replicare i
risultati del lavoro di Spearman, successivamente riuscì a riconoscere la presenza di
un errore nella calcolo del suo fattore analitico. Quando questo errore fu corretto,
anche Thurstone ottenne lo stesso fattore generale di intelligenza di Spearman (vedi
Carroll, 1997). In sintesi, il quadro di questo fattore generale è attualmente la
concettualizzazione più diffusa riguardo l’intelligenza (Gottfredson,1997).

Fenomeno gerarchico di più tratti

Alcuni teorici tendono a concettualizzare l’intelligenza come una struttura gerarchica,


con g all’apice, sostenuta da varie abilità cognitive più specializzate. Carroll (1993)
ha esaminato centinaia di studi di analisi, riguardo al fattore del test d’intelligenza,
pubblicati tra il 1920 e il 1990. Queste analisi hanno portato ad un modello
gerarchico che presenta tre strati, con il fattore g all’apice, di una struttura piramidale.
Nel modello di Carroll, sono state distinte approssimativamente 60 discrete abilità
alla base della piramide. Queste abilità cognitive limitrofe sono altamente correlate
tra loro e sono state inoltre analizzate all’interno di 10 abilità più ampie, che formano
il secondo strato della gerarchia. Infine, queste 10 abilità più ampie sono state
sottoposte all’analisi fattoriale, che ha prodotto un singolo fattore di g.

Intelligenza multipla

I critici (ad esempio, Ceci, 1990; H. Gardner, 1983; Gould, 1978) riguardo ai due
quadri concettuali sopra citati, hanno osservato che la dipendenza da una singola
metrica di intelligenza ignora una serie di settori importanti della capacità mentale.
Gardner ha sostenuto che la maggior parte dei test d’intelligenza valutano solo la
linguistica, la logica e alcuni aspetti dell’intelligenza spaziale; altre forme e tipi di
intelligenza sono in gran parte ignorate. Egli ha constatato che il formato carta –

8  

 
matita, tipica del test d’intelligenza, restringe il campo dei test d’intelligenza alle sole
cose che si prestano ai test carta – matita.

Recenti teorie di intelligenza multipla hanno proposto da due a otto tipi di


intelligenza (vedi Cattell, 1963¸Das, Naglieri & Kirby, 1994; H. Gardner, 1983;
Greenspan, 1981). A seguire un breve riassunto delle principali teorie
dell’intelligenza multipla.

Cattel (1963) e Horn e Cattell (1966) hanno individuato due fattori principali che
spiegano l’abilità intellettuale: l’intelligenza cristallizzata (gc) e l’intelligenza fluida
(gf). L’intelligenza cristallizzata fu definita come quelle attività più globali, tra cui la
conoscenza e l’informazione, che sono state acquisite dagli individui attraverso le
esperienze di vita e l’educazione. L’intelligenza fluida è stata spiegata in riferimento
alle abilità di ragionamento e memoria. Per di più, Cattell ha definito gc come un
tratto stabile, laddove gf può invece diminuire con l’età.

H. Gardner (1983, 1993) postulò un modello teorico sull’intelligenza multipla.


Inizialmente, il suo modello era composto da sette intelligenze diverse, ognuna delle
quali collegava particolari problem-solving alle capacità di elaborazione delle
informazioni, e ciascuna con la propria traiettoria di sviluppo. Le originali sette
intelligenze nel modello di Gardner sono linguistica, logico-matematica, spaziale,
musicale, corporeo-cinestetica, interpersonale e intrapersonale. Nel 1998, H. Gardner
ha aggiunto al suo modello un’ottava capacità indipendente, l’intelligenza
naturalistica. Riguardo agli otto tipi di intelligenza di Gardner, quest’ultimo affermò
che solo tre (linguistica, logico-matematica e spaziale) sono valutati da test
d’intelligenza contemporanei. Gardner (vedi Chen & Gardner, 1997) raccomanda
l’utilizzo di mezzi non standardizzati per la valutazione dell’intelligenza multipla; ha
considerato il processo come uno in corso in cui deve essere usato un assessment
personalizzato in una varietà di contesti. La critica significativa rimane valida e

9  

 
pertinente riguardo il modello di intelligenza multipla di Gardner che non ha una base
empirica e una validazione psicometrica.

Das e al (1994) e Naglieri e Das (1997) hanno proposto un modello a quattro fattori
dei processi cognitivi che stanno alla base dell’intelligenza: la pianificazione,
l’attenzione, l’elaborazione simultanea e la trasformazione successiva. Denominato
come PASS model, le sue origini possono essere trovate nei primi lavori del
neurologo russo Luria. Il processo di pianificazione comprende la regolazione di sé,
l’analisi e la valutazione delle situazioni e l’uso delle conoscenze per risolvere il
problema. Il processo attenzionale prevede la regolazione dell’attività, mettendo a
fuoco specifici stimoli e, allo stesso tempo, inibendo le risposte su altri stimoli
considerati meno rilevanti. L’elaborazione simultanea comporta la comprensione di
raggruppamenti di stimoli o l’individuazione di analogie all’interno di un gruppo di
stimoli. L’elaborazione successiva riguarda il processo di raggruppare un certo
numero di stimoli in una serie lineare che abbia senso.

Sternberg (1988) e Sternberg e Detterman (1986) hanno proposto un modello a tre


fattori di intelligenza che hanno chiamato la teoria triarchica dell’intelligenza umana.
Secondo Sternberg (1988), i tre aspetti fondamentali dell’intelligenza sono analitici,
creativi e pratici. Le abilità analitiche comportano la capacità di analizzare e di
criticare le idee. La creatività è definita come la capacità di una persona di generare
nuove idee in grado di offrire un contributo significativo, e l’intelligenza pratica è la
capacità dell’individuo di trasformare le idee in applicazione pratica e di convincere
gli altri della loro utilità. Questo tipo di distinzione tra l’intelligenza accademica e
pratica è stato offerto da un certo numero di teorici (cf. Neisser,1976). Sternberg ha
anche accettato la sfida di sviluppare una metrica con cui valutare ogni proposta dei
suoi aspetti di intelligenza, ma tutt’oggi non esiste tale strumento.

10  

 
Il modello dell’intelligenza multipla di Greenspan (1981), che ha una certa
sovrapposizione con il modello triarchico di Sternberg così come l’attuale definizione
di comportamento adattivo presentato nel capitolo 5 di questo manuale, si è evoluto
nel tempo. Il modello tripartito di intelligenza proposto da Greenspan e i suoi colleghi
(Greenspan, 1997, 2006b; Greenspan & Love, 1997; Greenspan, Switzky &
Granfield, 1996) identifica l’intelligenza come composta da una intelligenza
concettuale, pratica e sociale. L’intelligenza concettuale è sostanzialmente
equivalente al singolo fattore g, anche se Greenspan si oppose con veemenza alla
posizione di usare solo g o un punteggio QI unitario per rappresentare un’abilità
intellettuale dell’individuo. L’intelligenza pratica include la prestazione di tutti i
giorni che è tipicamente misurata con le scale di valutazione del comportamento
adattivo, l’intelligenza sociale viene definita come l’insieme di abilità sociali e
interpersonali dell’individuo (ad esempio, giudizio morale, empatia, abilità sociali).
Ingenuità e credulità sono stati aggiunti come elementi critici di intelligenza sociale
(Greenspan & Granfield, 1992; Greenspan, Loughlin & Black, 2001).

In sintesi, molte delle teorie dell’intelligenza multipla, di cui sopra abbiamo parlato,
non sono state convalidate attraverso misure standardizzate e quantificabili.
L’intelligenza multipla di H. Gardner, con l’eccezione di qualche utile applicazione
in contesti educativi, continua a rimanere teorica. Sternberg ha fallito nei suoi
tentativi di sviluppare una scala in grado di misurare in modo affidabile il suo
modello di intelligenza triarchico. I modelli di Greenspan e Sternberg affrontano la
comune sfida di rendere operative le abilità per quantificare i costrutti dei loro
modelli tripartiti, in particolare nel campo dell’intelligenza sociale.

Una sola dimensione di intelligenza continua a raccogliere il massimo sostegno


all’interno della comunità scientifica (Carrol, 1997; Gottfredson, 1997; Hernstein &
Murray, 1994). Quindi, fintanto che le misurazioni di intelligenza multipla potranno
essere valutate in maniera affidabile e valida, rimarrà la posizione di AAIDD sul
11  

 
funzionamento intellettuale (come definito all’inizio di questo capitolo) meglio
concettualizzato e catturato da un fattore generale di intelligenza (g).

SIGNIFICATIVA LIMITAZIONE DEL FUNZIONAMENTO


INTELLETTUALE: DEFINIZIONE OPERATIVA

In questo manuale, coerente con il manuale del 2002 (Luckasson et al. 2002), il
criterio di funzionamento intellettuale per una diagnosi di ID è di circa due deviazioni
standard sotto la media, considerando l'errore di misura standard per gli strumenti di
valutazione utilizzati e dai punti di forza e di limitazione dello strumento. In
riferimento a questa definizione operativa di limitazioni significative, si considerano
le seguenti linee guida:

• l'intento di questa definizione non è di specificare un deciso e veloce punteggio cut-


off che definisca le limitazioni significative nel criterio ID di funzionamento
intellettuale. Piuttosto si deve usare il giudizio clinico per interpretare il punteggio
ottenuto in riferimento all'errore standard del test di misurazione, ai punti di forza e le
limitazioni dello strumento di assessment, e ad altri fattori come gli effetti pratica,
effetti di stanchezza e l'età delle norme utilizzate (vedi sezione seguente). Inoltre, le
significative limitazioni nel funzionamento intellettuale sono solo uno dei tre criteri
utilizzati per stabilire una diagnosi di ID.
• l'uso dell’“approssimativamente” riflette il ruolo del giudizio clinico nel soppesare i
fattori che contribuiscono alla validità ed alla precisione di una decisione. Il termine
inoltre affronta l’errore statistico e di incertezza, inerente a qualsiasi valutazione del
comportamento umano. A tale riguardo, il processo di decision-making non può
essere considerato solo come un calcolo statico.

12  

 
Sfide
CRITERI DI CHALLENGING E RELATIVE LINEE-GUIDA
RIGUARDANTI LA MISURAZIONE DELL’INTELLIGENZA E
L’INTERPRETAZIONE DEI PUNTEGGI QI

Dare un’unica definizione di intelligenza si è dimostrato essere un compito difficile,


misurare o quantificare l’intelligenza lo è altrettanto. E’ importante notare che i
punteggi QI, dedotti da un test d’intelligenza, si stanno sviluppando, oggi, sulla base
di un punteggio deviato (rispetto alla media) e non su un più vecchio concetto di età
mentale. Quindi, in riferimento al criterio delle limitazioni significative nelle funzioni
intellettuali per una diagnosi di ID, una valida diagnosi è basata su quanto il
punteggio del soggetto sia lontano dalla media nel rispettivo strumento di assessment
standardizzato, e non sul rapporto tra età mentale e età cronologica. Vi sono numerosi
challenges e questioni psicometriche in relazione alla misurazione dell’intelligenza e
all’interpretazione dei punteggi QI. Sebbene, potenzialmente, potremmo essere
confortati dal fatto che i test di intelligenza hanno generalmente una buona
affidabilità ed hanno anche dimostrato validità in alcuni degli obiettivi proposti, il
tipico test di intelligenza non è privo di challenges psicometrici. A tal proposito, in
questa sezione del capitolo, noi discuteremo 10 challenges e le relative linee guida
riguardanti la misurazione dell’intelligenza e l’interpretazione dei punteggi QI: errore
della misurazione, prova di correttezza, l’effetto Flynn, comparazione di punteggi da
test differenti, l’utilità dei punteggi alla fine estrema della distribuzione, la
determinazione di un punteggio cut-off, valutare il ruolo che un punteggio QI gioca
nel determinare una diagnosi, le credenziali dell’assessor e la selezione del test.

MISURAZIONE DELL’ERRORE

I risultati di un assessment psicometrico devono essere valutati nei termini


dell’accuratezza degli strumenti utilizzati così come nel caso di assessment
d’intelligenza. Un punteggio QI è soggetto a variazioni in funzione ad una serie di

13  
potenziali fonti di errore, tra cui variazione durante la performance del test,
comportamento dell’esaminatore, cooperazione del soggetto, ed altri fattori personali
ed ambientali. Quindi, la variazione nei punteggi potrebbe o non potrebbe
rappresentare l’individuo reale o il giusto livello di funzioni intellettuali. Il termine
errore standard di misurazione, che varia in base al test, al sottogruppo ed all’età del
gruppo, è utilizzato per quantificare questa variabilità ed offre un determinato
intervallo di affidabilità statistica all’interno del quale cade l’esatto punteggio del
soggetto.

Per le misurazioni ben standardizzate della generale funzione intellettuale, l’errore


standard di misurazione è approssimativamente da 3 a 5 punti. Come riportato nel
rispettivo manuale di standardizzazione del test, l’errore standard di misurazione del
test può essere utilizzato per stabilire un intervallo di affidabilità statistica riguardo al
risultato ottenuto. Dalle proprietà della curva normale, un intervallo di affidabilità
può essere stabilito attraverso parametri con un errore standard di misurazione
minimo (punteggi di circa 66%-74,66%) oppure parametri con due errori standard di
misurazione (da 62% a 78,95%). Capire e indirizzare l’errore standard di misurazione
è una questione critica che deve essere parte integrante di una decisione concernente
una diagnosi di ID, basata, in parte, sulle limitazioni significative nella funzione
intellettuale. Sia l’AAIDD che l’American Psychiatric Association (2000) supportano
come miglior pratica quella di considerare il punteggio QI in associazione ad un
intervallo di affidabilità. Entrambi i sistemi fanno affidamento all’errore standard di
misurazione riportato, che fa riferimento ad una deviazione standard del test e ad una
misurazione dell’attendibilità del test stesso. Attualmente, la miglior pratica
standardizzata che prevale nella costruzione, nella presentazione e
nell’interpretazione del test, è quella di utilizzare misurazioni interne di affidabilità
per stimare un errore standard di misurazione. Presentare un punteggio QI con un
intervallo di affidabilità è un metodo critico che sottolinea l’uso appropriato dei test

14  

 
di intelligenza e una loro migliore efficacia; allo stesso tempo la presentazione deve
essere parte integrante di una qualsiasi decisione concernente una diagnosi del ID.

PROVA DI CORRETTEZZA

Vi sono almeno due aree nelle quali la prova di correttezza potrebbe essere
particolarmente significativa. La prima è quando i test che richiedono una risposta
orale sono usati con individui che presentano diverse abilità verbali limitate. In queste
situazioni, il punteggio del test potrebbe sottovalutare il loro livello di funzione
intellettuale. La seconda area include gli individui di diverse etnie o culture, che
potrebbero ottenere risultati marcatamente differenti. I lettori potranno consultare il
capitolo 3 e 8 per una discussione riguardante la selezione delle linee guida del test e
la prova di correttezza.

L’EFFETTO FLYNN

Le ricerche di Flynn (1984, 1987, 2006, 2007), migliori di quelle di altri (Kanaya,
Scullin, Ceci, 2003), trovarono che i punteggi QI erano aumentati, negli Stati Uniti,
da una generazione all’altra, così come negli altri Paesi sviluppati per i quali erano
disponibili i dati sul QI. Questo aumento nei punteggi di QI nel tempo fu chiamato
l’effetto Flynn da Hernstein e Murray (1994). L’effetto Flynn si riferisce
all’osservazione che ogni campione standardizzato per un test di intelligenza
superiore dal 1932 al 1978 risultava in una media QI che tendeva ad aumentare nel
tempo. Flynn osservò che questo effetto era anche riscontrabile nei campioni degli
altri Paesi. Sebbene la causa di questo effetto sia sconosciuta, Neisser suggerì che i
potenziali fattori potevano essere considerati: la nutrizione, i cambiamenti culturali,
le esperienze, i cambiamenti nell’insegnamento, i cambiamenti nell’educazione dei
figli.

15  

 
L’effetto Flynn aumenta i potenziali challenge per la diagnosi del ID. Poiché Flynn
riportò che la media del QI aumentava di circa O.33 punti per anno, alcuni ricercatori
hanno suggerito che ogni punteggio ID ottenuto potrebbe essere aggiustato di 0.33
punti per ogni anno in cui il test è stato somministrato, prima che la standardizzazione
venga completata. Per esempio, se il Wechsler Adult Intellegence Scale (WAIS-III;
1997) venne utilizzato per valutare un QI individuale nel 2005, la media del QI della
popolazione fu stabilita a 100, quando esso fu originariamente regolato nel 1995
(pubblicato nel 1997). Adesso, basandosi sui dati di Flynn, la media del QI della
popolazione nel WAIS-III dovrebbe aumentare di 0.33 punti per anno. Quindi la
media corretta dovrebbe essere 103 nel 2005. Perciò utilizzando le limitazioni
significative di circa due deviazioni standard sotto la media, il cut-off QI della Full-
Scale dovrebbe essere all’incirca 73 (più o meno l’errore standard di misurazione).

Ci sono inoltre dati che suggeriscono che l’effetto Flynn potrebbe non essere una
funzione del tempo puramente lineare e che l’impatto dell’effetto potrebbe anche
invertirsi. Teasdale e Owens (2005), per esempio, attuarono una relazione su un
grande campione di uomini danesi nei quali l’effetto Flynn raggiungeva il picco e
poi si invertiva. Riguardo ad un campione norvegese, Sundet, Barlaug e Torjussen
(2004) riportarono una diminuzione ed una eventuale cessazione dell’effetto Flynn
nel tempo.

Questi dati sembra vogliano suggerire che, mentre l’effetto Flynn è evidente, il modo
in cui uno può correggerlo è ancora una questione da risolvere. Come affrontato nel
User’s Guide (Schalock, 2007), che accompagna la decima edizione del Manuale, le
migliori pratiche richiedono il riconoscimento di un potenziale effetto Flynn, mentre
le edizioni più vecchie di test di intelligenza sono utilizzate nell’assessment o
nell’interpretazione di un punteggio QI.

Come suggerito nel User’s Guide:

16  

 
“La più grande raccomandazione che si evince da questo lavoro (riguardante l’effetto
Flynn) è che tutti gli assessment intellettuali devono utilizzare un test di intelligenza
valido e appropriato, somministrato individualmente. Nei casi di test con versioni
multiple, la versione più recente con le norme più attuali dovrebbe essere usata
sempre. Nei casi in cui viene utilizzato un test con regole vecchie, una correzione
delle regole stesse è autorizzata.”

COMPARAZIONE DI PUNTEGGI DA TEST DIFFERENTI

Non tutti i punteggi ottenuti tramite i test di intelligenza sottoposti alle stesse persone
saranno identici. Nello specifico non ci si aspetta che i punteggi QI siano gli stessi tra
test e test tra edizioni dello stesso test o tra i vari periodi di tempo (Evance, 1991).
Molti studi hanno rilevato differenti risultati tra test oppurtanamente selezionati. Per
esempio, Quereshi e Seitz (1994) riportarono che il Weschler Preschool e il WPPSI,
WISC-R, WPPSI-R non producevano gli stessi risultati quando vcenivano
somministrati sui bambini. I punteggi più alti venivano ottenuti nel WPPSI e i più
bassi nel WPPSI-R. Il SBIS-4 ha prodotto punteggi significativamente più alti (più di
14 punti) rispetto a quelli ottenuti dal WISC-R per studenti con punteggi QI più bassi
ma ha prodotto punteggi significativamente più bassi per studenti con punteggi QI
più alti. I due test hanno prodotto punteggi similari per studenti con punteggi QI tra
70 e 90 (Prewett e Matavich, 1992). I punteggi nel WISC-III erano correlati in modo
significativo con i punteggi nel SBIS-4 somministrati su una popolazione di studenti
con un leggero ritardo mentale ma la media QI nel WISC-III era 8 punti più bassa
(Lukens & Hurrel, 1996). Nelson e Dacey (1999) riportarono che in un campione di
adulti che avevano un ritardo mentale moderato un SBIS aveva prodotto punteggi
significativamente più bassi rispetto a un WISCHLER TEST. I loro risultati erano
coerenti con i primi lavori pubblicati nel Manuale tecnico di Stanford–Binet. Gli
utenti di questo manuale avevano la necessità di essere consapevoli delle differenze
potenziali fra i punteggi ottenuti tra due differenti test. Fonti di variazione possono
17  

 
risultare da: (a) test somministrati nei gruppi o su individui; (b) gli obiettivi per i
quali il test viene somministrato (per esempio, somministrato inizialmente per
misurare il successo scolastico e successivamente utilizzato per calcolare il QI); (c) le
proprietà del test (per esempio, usare due test con errori standard di misurazione
molto diversi); (d) somministrazione non standardizzata degli strumenti di
assessment, (e) il contenuto del test tra differenti scale e tra differenti livelli di età
sulla stessa scala, (f) punteggi ottenuti in test verbali contro i punteggi ottenuti in
quelli non verbali, (g) differenze nella standardizzazione dei gruppi campione, (h)
cambi tra differenti edizioni della stessa scala\test, (i) uso di una scala alternativa in
relazione all’aumento dell’età cronologica dell’individuo, (j) variazioni nelle abilità o
performance del soggetto.

L’EFFETTO PRATICO

L’effetto pratico si riferisce agli aumenti nei punteggi QI dei test d’intelligenza che
risultano da un soggetto a cui è stato ri somministrato nuovamente lo stesso test.
Kaufman (1994) notò che l’effetto pratico può verificarsi quando lo stesso individuo
viene testato nuovamente con uno strumento simile. Per esempio, il manuale del
WAIS-III presenta dei dati che mostrano l’aumento artificiale nei punteggi QI quando
lo stesso strumento viene ri somministrato in un breve ibtervallo di tempo. Il manuale
WAIS-III riporta inoltre l’aumento medio tra le somministrazioni con intervalli da
due a dodici settimane (Wischler,1997). Per questa ragione la pratica clinica stabilita
è di evitare la somministrazione dello stesso tes d’intelligenza nello stesso anno, allo
stesso soggetto poiché esso spesso condurrà ad una sopravvalutazione della reale
intelligenza dell’esaminato.

PUNTEGGI ESTREMI

È generalmente riconosciuto che uno strumento psicomnetrico funziona meglio


quando viene utilizzato con persone che ottengono un punteggio all’interno di due o
18  

 
tre deviazioni standard rispetto alla metrica. La diagnosi dell’ID comunque può
comportare l’assessment della performance all’estremo della distribuione del QI (ad
esempio, quattro o cinque deviazioni standard sotto la media). Sebbene i manuali per
il WISC-IV (Weschler et al., 2004), WAIS-IV (Weschler, 2008) e SSIB-IV
(Thorndike, 1986b) indicano che questi strumenti possono essere utilizzati per
classificare gli ID, tutte le cautele sull’uso delle rispettive scale per valutare le
popolazioni all’estremità erano necessarie per creare dei dati di gruppi standard di
soggetti che ottengono punteggi molto bassi (come 25 o minori).

Notiamo nel voler evidenziare la fragilità dei test usati con gli individui che
ottengono punteggi estremi basati sulla proprietà di una distribuzione normale, il
campione standardizzati di 2.200 bambini nel WISC-III si sarebbe aspettato che
includesse solo 50 individui i cui punteggi QI fossero sotto 70 punti tra tutti i gruppi
di età. Se si esaminasse il numero degli individui nel campione normativo ripartito
negli strati di età (cinque, sei anni, ecc) e da cui scaturiscono i punteggi QI
dovrebbero esserci meno che tre individui al di sotto del punteggio cut off di 70.
Nonostante queste precauzioni, Sattler (1988) notò l’utilità di entrambe le scale
Wischler e Sbiss 4 nel produrre una disagnosi di ID. Lui, comunque, menzionò che
nessuno degli strumenti era stato costruito per l’uso con persone le cui performance
del test producevano risultati estremamente bassi o estremamente alti. Sebbene le
pratiche standard comportano di norma l’uso di queste scale per un aiuto nella
diagnosi di ID, bisogna riconoscere che i punteggi estremi sono più soggetti agli
errori di misurazione e forse meno affidabili rispetto ai punteggi più vicini alla media
del test. Questa fiducia sull’interpretazione dei punteggi estremi può essere di
maggiore interesse se l’ID viene diagnosticato unicamente sulla base del punteggio
QI. I tre criteri sono limitazioni significative nella funzione intellettuale, limitazioni
significative nel comportamento adattivo, età d’insorgenza prima dei 18 anni.
Avendo i due criteri delle limitazioni significative (limitazioni significative nella
funzione intellettuale e nel comportamento adattivo, alle quali viene data uguale
19  

 
considerazione) per diagnosticare un individuo che presenta un ID, vi sono tutele
addizionali contro la falsa identificazioni di un individuo che presenta ID. Vi sono
coloro che vorrebbero sostenere che la considerevole correlazione tra i punteggi QI e
il comportamento adattivo in persone che hanno in effetti ID crei un processo
eccessivo per garantire una diagnosi migliore. Non esistono tutele per un falso
negativo, un serio problema che rimanda al campo l’attenzione.

I problemi affrontati dalle persone che hanno ID ma che non ricevono una diagnosi
ID possono essere significativi. Questi individui sono vulnerabili al rifiuto dei
supporti essenziali e all’esclusione da quelle che potrebbero essere importanti
protezioni (vedi capitolo 12).

DETERMINAZIONE DI UN PUNTEGGIO CUT OFF

Il criterio delle limitazioni significative nella funzione intellettuale per una diagnosi
di ID è un punteggio QI di circa due deviazioni standard al di sotto della media
consoderando l’errore standard di misurazione per gli specifici strumenti utilizzati e i
punti di forza e di limitazione degli stessi strumenti. È chiaro per questo criterio di
limitazioni significative utilizzato in questo manuale che AAIDD (proprio come
l’American Psychiatric Association, 2000) non sono d’accordo per un punto fisso di
cut off stabilito per la diagnosi di ID. Entrambi i sistemi (AAIDD e APA) esiggono
un giudizio clinico che riguardi come interpretare una possibile misurazione
dell’errore. Sebbene un cut off fisso per diagnosticare un individuo che presenta ID
non sia intenzionato, e non possa essere giustificato psicometricamente, esso è
diventato operativo in molti stati (Greenspan &Switzky, 2006). Deve essere
sottolineato che la diagnosi di ID è destinata a riflettere un giudizio clinico piuttosto
che una determinazione attuariale. Un punteggio fisso di cut off per l’ID non è
psicometricamente giustificabile. La scelta di un test d’intelligenza sarà condotta dal
giudizio clinbico sugli strumenti più appropriati. I punteggi QI ottenuti da diversi test

20  

 
d’intelligenza non sono necessariamente equivalenti tra loro. Dato che un processo
diagnostico include la raffiugurazione di una linea di inclusione/esclusione è
importante utilizzare un intervallo che rispecchi l’errore standard di misurazione del
test.

VALUTARE IL RUOLO CHE UN PUNTEGGIO QI GIOCA


NELL’EFFETTUARE UNA DIAGNOSI.

Un punteggio QI può essere riportato con intervalli di affidabilità piuttosto che con
un singolo punteggio. Quindi nel valutare il ruolo che un punteggio QI gioca
nell’effettuare una diagnosi di ID i medici dovrebebro (a) determinare quale sia
l’errore standard di misurazione per il particolare strumento di assessment utilizzato,
comprendendo che lo standard della misurazione è un test specifico ed è utilizzato per
stabilire un intervallo di affidabilità statistica all’interno del quale cade il reale
punteggio del soggetto; (b) interpretare il punteggio ottenuto in relazione all’errore
standard di misurazione del test ai punti di forza e le limitazioni degli strumenti di
assessment, e ad altri fattori (come l’effetto pratico, gli effetti della stanchezza, l’età e
le norme utilizzate) che determinano la misura dell’errore che comporta ad una stima
esatta del punteggio del soggetto, (c) determinare se il processo di assessment era
coerente con le prime due assunzioni della definizione di ID (vedi capitolo 1); (d)
usare un processo di assessment basato sulla conoscenza della ricerca, sull’etica
professionale e sugli standard professionali (vedi capitolo 8); (e) assicurarsi che
all’interno del resoconto l’errore standard di misurazione sia propriamente mirato.

21  

 
22  

Potrebbero piacerti anche