Sei sulla pagina 1di 31

CORSO DI LAUREA IN SCIENZE E TECNICHE PSICOLOGICHE

Teorie e tecniche dei test


2009/2010

Dott.ssa Alessandra Busonera: alessandrabusonera@yahoo.it

La validit delle misure psicologiche


La validit di un reattivo psicologico riflette il grado di precisione e di accuratezza con cui, di fatto, lo strumento misura ci che si propone di misurare. Largomento della validit dei test molto importante, infatti, indipendentemente dallapproccio seguito nella costruzione dello strumento, il ricercatore deve sempre affrontare il problema di cosa effettivamente il test misuri, di quali relazioni il reattivo presenti con test che misurano costrutti simili o comunque relazionati, e di quali previsioni consenta di effettuare in merito a particolari comportamenti.

La validit delle misure psicologiche Un buon modo di concettualizzate la validit dei reattivi consiste nel ricondurla a tre principali categorie: a) Validit di contenuto; b) Validit di costrutto; c) Validit rispetto a un criterio. A questi tre principali tipi di validit si aggiunge la validit esterna.

La validit delle misure psicologiche

Il grado generale di validit di uno strumento di misurazione determinato dal grado in cui ognuno di questi aspetti della validit viene soddisfatto.

Validit Esterna
Essa riguarda lapplicabilit del reattivo in contesti temporali e spaziali diversi. Per ci che concerne la generalizzabilit a diversi momenti temporali, necessario tenere in considerazione che i reattivi subiscono le influenze che il mutare dei tempi porta con s e, di conseguenza, occorre aggiornare continuamente gli item, per far s che il test stia al passo coi tempi

Validit Esterna
Consideriamo, come esempio, gli studi sullemotivit umana, che fanno spesso ricorso a parole tab, materiale considerato in grado di suscitare, nei soggetti sottoposti alla prova, forti reazioni emotive. Con il passare del tempo, per, luso del linguaggio subisce notevoli trasformazioni e parole un tempo considerate tab od offensive, dopo alcuni decenni, potrebbero entrare a far parte del vocabolario comune, diventando stimoli praticamente neutri. Un test di questo tipo, ha quindi bisogno di periodici aggiornamenti per poter mantenere, nel tempo, la sua validit esterna.

Validit Esterna
Un discorso analogo vale per quanto riguarda lapplicabilit dei reattivi in diversi contesti sociali e culturali. Se le risposte del soggetto agli item possono subire linfluenza della cultura, della religione, della storia, delle usanze o delle condizioni di vita vigenti in una determinata realt sociale, allora lo strumento presenta dei problemi relativi alla validit esterna ed i suoi risultati non potranno essere generalizzati a contesti e realt sociali differenti.

Validit di contenuto
Si riferisce alla popolazione di item dalla quale sono stati selezionati gli item che compongono la forma definitiva del reattivo. Gli item finali che vanno a comporre un test o un questionario rappresentano infatti un campione dellintera popolazione di item che possono fungere da validi indicatori del costrutto psicologico indagato. Se il campione finale di item stato estratto da tale popolazione, allora la validit del test garantita.

Validit di contenuto
Quindi, un reattivo ha validit di contenuto se gli item che lo compongono sono validi indicatori del costrutto che il reattivo stesso si propone di indagare e, di conseguenza, riescono a coprire adeguatamente largomento dinteresse. Per fare un esempio semplice, la validit di un contenuto di un test di profitto, poniamo in Teoria e tecniche dei test, consiste nella presenza di item rappresentativi di tutti i compiti che si riferiscono al contenuto e agli scopi del corso.

Validit di contenuto
La validit di contenuto non viene calcolata ricorrendo ad indici statistici, ma solitamente espressa tramite una serie di giudizi. Abbiamo infatti visto che,in fase di costruzione del test, gli item possono essere valutati da giudici esperti in materia, titolati per giudicare quanto essi siano rappresentativi della materia che vanno a trattare.

Validit di contenuto
I giudizi sulla validit di contenuto non sono assoluti e pu capitare che gli esperti non si trovino daccordo nel valutare gli item di un reattivo. Lawshe (1975) ha proposto una semplice formula per quantificare il grado di consenso di un gruppo di esperti sulla validit di contenuto di un test. Ogni giudice deve rispondere alla seguente domanda, riferita a ciascun item: Labilit o la conoscenza valutata dal seguente item, rispetto alla performance richiesta, : essenziale; utile, ma non essenziale; non necessaria.

Validit di contenuto
Viene poi conteggiato il numero di esperti che ritengono essenziale litem. Si ritiene che ci sia un sufficiente grado di validit di contenuto quando pi del 50% dei giudici ritiene litem essenziale. A partire da questo assunto, Lawshe ha sviluppato la seguente formula:

( NE N / 2 ) VC =
N /2

Dove:

VC = validit di contenuto; NE = numero di giudici indicanti litem come essenziale; N = numero totale dei giudici

Poniamo il caso in cui gli esperti consultati siano 20. I tre esempi seguenti illustrano il significato di diversi livelli di validit di contenuto: 1) Validit di contenuto negativa: litem ritenuto essenziale da meno della met degli esperti. 8 (20 / 2) VC = = .20 20 / 2 2) Validit di contenuto zero: quando solo la met esatta degli esperti indica come essenziale litem.

10 (20 / 2 ) VC = = .00 20 / 2

3) Validit di contenuto positiva: pi della met degli esperti, ma non tutti, giudica essenziale litem.
18 (20 / 2) VC = = .80 20 / 2

In caso di valutazione positiva, il valore del coefficiente di validit varia da .00 a .99. Tramite questa procedura quindi possibile valutare la validit di contenuto di ciascun item di un test. Lo stesso Lawshe ha predisposto una tabella a partire dalla quale si pu risalire, a seconda del numero dei giudici, al grado minimo di concordanza statisticamente significativo (p=.05). Per esempio, nel caso del ricorso a dieci esperti, un item ha bisogno di un coefficiente di validit di contenuto di .62 per essere significativo ad un livello di probabilit del 5%. Gli item che non raggiungono il livello di significativit statistica fissato vengono eliminati dal test.

Valori minimi del coefficiente di validit di contenuto in rapporto al numero di giudici (p= .05) Numero di giudici 5 6 7 8 9 10 11 12 13 14 15 20 25 30 35 40 Valore minimo di concordanza .99 .99 .99 .75 .78 .62 .59 .56 .54 .51 .49 .42 .37 .33 .31 .29

Validit rispetto ad un criterio


E definita come il grado di corrispondenza tra una misura ed un criterio di riferimento. Essa si basa sul concetto che un test volto alla rilevazione di uno specifico costrutto, per poter essere considerato valido, debba risultare in relazione con altre misure, o indici, del medesimo costrutto o di costrutti affini. Questo tipo di validit riguarda, quindi, la possibilit di confrontare i risultati di un test o di un questionario (reattivo predittivo) con un criterio, ossia con una variabile i cui valori siano previsti a partire dai punteggi al reattivo. In genere, i valori del criterio sono ottenuti tramite limpiego di un reattivo la cui validit ed attendibilit siano confermate.

Validit rispetto ad un criterio La connessione tra le due serie di misure (test predittivo e test criterio) viene calcolata ricorrendo al coefficiente di correlazione, generalmente quello di Pearson-Bravais, ma la scelta del coefficiente di correlazione da applicare dipende, come al solito, dal tipo di misure adottate e serve ad esprimere il livello di validit del test.

Validit rispetto ad un criterio Cos, un nuovo test di intelligenza, per poter essere ritenuto valido, dovrebbe fornire punteggi che correlano fortemente con quelli ottenuti tramite altri test di intelligenza la cui validit sia gi stata appurata. Inoltre, dovrebbe essere verificata anche la correlazione con abilit o comportamenti che implicano intelligenza, ad esempio un buon andamento scolastico.

Validit rispetto ad un criterio


I punteggi di QI di un gruppo di studenti, ottenuti tramite la somministrazione di un test di intelligenza, possono essere utilizzati per predire il loro rendimento scolastico. Dato che le procedure di valutazione del rendimento scolastico sono ben definite, possiamo considerare il rendimento scolastico come variabile criterio; possiamo allora affermare che il test di intelligenza valido se questultimo si rivela in grado di predire efficacemente il rendimento scolastico.

Validit rispetto ad un criterio


In realt, si distinguono due tipi di validit orientata al criterio: la validit concorrente e la validit predittiva. Se i valori del criterio ed i punteggi del reattivo sono stati ottenuti nello stesso momento o periodo di tempo, si parla di validit concorrente; il caso, ad esempio, di un test di intelligenza che correla con landamento scolastico di un soggetto nel periodo in cui il test viene somministrato. Se, invece, i punteggi del reattivo sono stati ottenuti in un momento precedente rispetto ai valori del criterio, e sono in grado di prevederli, allora si parla di validit predittiva.

Validit di costrutto
La validit di costrutto riguarda la definizione operativa del costrutto misurato tramite il reattivo. Definire operativamente un costrutto psicologico significa tradurlo in eventi comportamentali specifici (operazionalizzazione), ossia in variabili operative osservabili e misurabili (indicatori). Una buona definizione operazionale quella che riesce a rappresentare adeguatamente la variabile concettuale sottostante.

Validit di costrutto
Lindicatore comportamentale dovrebbe essere il prodotto diretto del costrutto latente. Se lidentificazione degli indicatori di un determinato costrutto avvenuta in maniera corretta, le risposte agli item dei reattivi psicologici sono il prodotto del costrutto latente in esame e non di altri fattori.

Validit di costrutto
Test e questionari sono dotati di validit di costrutto quando possibile affermare che essi misurano realmente il costrutto teorico in esame, eliminando la possibilit di qualsiasi altra spiegazione per i risultati ottenuti.

Validit convergente
La validit convergente un tipo di validit di costrutto. Essa indica il grado di accordo tra due o pi misure che si suppone misurino lo stesso costrutto, costrutti affini o caratteristiche differenti di un medesimo costrutto. Lidea alla base di questo tipo di validit che misure rilevate tramite reattivi messi a punto per valutare un medesimo costrutto debbano convergere.

Validit convergente
La validit convergente dei test viene spesso testata per la sua facilit di applicazione. Il test di cui ci interessa verificare la validit convergente che spesso un test nuovo, messo a punto di recente viene somministrato ad un gruppo di soggetti assieme ad un reattivo pi vecchio, che funge da termine di paragone, in quanto valuta le stesse o simili caratteristiche. Di questultimo si devono gi conoscere le propriet psicometriche in termini di attendibilit, validit, ecc.

Validit convergente
Ci si attende di trovare correlazioni elevate tra i punteggi dei due strumenti, vecchio e nuovo. Un coefficiente di correlazione maggiore di .80 significa che essi misurano lo stesso costrutto, e che quindi il nuovo strumento pu considerarsi a sua volta un buon misuratore del costrutto in questione.

Validit convergente
ATTENZIONE: le correlazioni tra un vecchio test, le cui caratteristiche psicologiche siano gi note e sufficientemente buone, ed il nuovo test da noi costruito dovrebbero essere tendenzialmente alte e positivema non troppo. Infatti, se ci fosse una correlazione molto alta (.95, .98, ecc) tra i due strumenti, ma il nuovo reattivo non mostrasse vantaggi aggiuntivi rispetto al secondo (ad es. maggiore facilit di somministrazione, minor costo, maggiore brevit), esso sarebbe una specie di duplicato del precedente e di esso, probabilmente, non vi sarebbe stata alcuna necessit.

Validit discriminante
Un altro tipo di validit di costrutto la validit discriminante (o divergente), che indica il grado di disaccordo tra due o pi misure volte ad indagare costrutti diversi. Lo psicometrista si chiede: In che misura il nuovo test messo a punto riesce a discriminare il costrutto che si pone di studiare rispetto a costrutti diversi, misurati da test diversi?

Validit discriminante
Se due reattivi A e B misurano entrambi lansia di tratto, soggetti che ottengono punteggi alti al reattivo A dovrebbero ottenere punteggi alti anche al reattivo B (validit convergente). Nel caso in cui, invece, il reattivo A sia pensato per misurare lansia ed il reattivo B per misurare le fobie, essendo ansia e fobia due costrutti differenti, i punteggi ottenuti dai soggetti al punteggio A non dovrebbero concordare con quelli che gli stessi soggetti ottengono al reattivo B (validit discriminante).

Validit discriminante
In questultimo caso, qualora i punteggi del reattivo A e del reattivo B concordassero, potrebbe esserci una sovrapposizione tra gli item dei due test, nel senso che alcuni item, allinterno di uno dei due test o di entrambi, potrebbero erroneamente rilevare sia lansia che la fobia, senza riuscire a discriminare realmente tra i due costrutti.

Validit discriminante
Il procedimento per la validazione discriminante di un test analogo a quello per il controllo della validit convergente, solo che in questo caso si dovrebbe ottenere un basso livello di correlazione tra i punteggi al test e quelli delle misure di altre variabili, con le quali, teoricamente, ci si aspetta che il test non correli.