Sei sulla pagina 1di 7

Cap.

7: ATTENDIBILITA’ E
VALIDITA’ DELLA
MISURAZIONE
Poiché in psicologia si utilizzano determinati strumenti di
misurazione, bisogna assicurarsi che questi siano costruiti in
modo tale da evitare errori, che possono essere casuali (errori
dovuti a fluttuazioni del caso, che si pensa vadano ora in una direzione, ora in un’altra, compensandosi) e
sistematici (un esempio può essere un tipo di istruzioni devianti di un test, es. aggressività).

Per prevenire o valutare l’entità degli errori, i ricercatori hanno parlato di attendibilità e validità. In
psicologia si studiano maggiormente i costrutti, concetti astratti che indicano un complesso della vita
psichica del soggetto. Questi costrutti non sono osservabili direttamente, ma grazie ad alcuni indicatori
empirici osservabili. L’indicatore è una variabile che indica il costrutto non osservabile tramite una regola di
corrispondenza.

Un indicatore si dice: Il rapporto che esiste tra costrutto ed indicatore può essere di due tipi, ognuno dei
quali dipende dal tipo dalla denominazione che si da al tipo di indicatore.

- Riflessivo: quando è un a semplice costruzione empirica del costrutto, un prolungamento o una


conseguenza del costrutto stesso;

- Formativo: se è l’indicatore stesso a contribuire o a causare il costrutto. Gli indicatori non sono una
manifestazione del costrutto ma lo determinano.

In sostanza, quando è riflessivo il costrutto viene considerato causa dell’indicatore, quando è formativo è
l’indicatore ad essere considerato causa del costrutto.

Per quanto riguarda i costrutti, ce ne sono alcuni più complicati organizzati in dimensioni. Le dimensioni non
sono osservabili e sono formate da alcuni aspetti che rappresentano ognuno una parte del costrutto e si
collocano tra costrutti ed indicatori. Lo studio delle dimensioni è chiamato studio della dimensionalità e la
tecnica utilizzata per condurlo si chiama analisi fattoriale (o analisi delle strutture), che permette di
identificare le dimensioni latenti dei costrutti, raggruppando gli ITEM e scegliendo la soluzione più semplice.

ATTENDIBILITA’ E VALIDITA’
Se una misurazione è attendibile, il costrutto è misurato bene, se non è attendibile, vuol dire che abbiamo
commesso errori e il costrutto stesso non rappresenta i risultati desiderati.

Si definisce:
- Validità di uno strumento: il grado in cui uno strumento misura ciò che dice di misurare;

- Attendibilità: il grado di accordo tra misurazioni indipendenti dello stesso costrutto.

ACCURATEZZA, PRECISIONE E STABILITA’


L’attendibilità, è la correlazione tra due o più misure indipendenti all’interno dello stesso costrutto. Uno
strumento di misura attendibile produce una misurazione di cui ci possiamo fidare, perché ha dato risultati
coerenti in occasioni simili. L’attendibilità può essere definita come “il grado in cui i punteggi dei test sono
liberi dagli errori di misura.”

La stabilità si riferisce al grado di correlazione tra misurazioni avvenute in tempi diversi dello stesso
costrutto.

L’accuratezza si riferisce invece al grado di corrispondenza tra il costrutto misurato e la realtà.

La precisione è il grado di sistematicità o coerenza con cui eseguiamo la misurazione, con cui si associano
eventi o oggetti a determinate categorie di riferimento.

La differenza tra stabilità e precisione:

- Si parla di stabilità quando la cosa misurata su uno stesso campione di persone risulta la stessa in
una seconda misurazione a distanza di tempo.

- Si parla invece di precisione quando proponendo in maniera diversa due indicatori dello stesso
costrutto allo stesso oggetto, questi fornisce sempre la stessa risposta.

A volte si può eseguire una misurazione precisa e coerente senza che questa sia anche accurata.
L’accuratezza infatti implica la precisione: se una misura è accurata sarà per forza precisa, se è precisa non
necessariamente è accurata. La stabilità della misurazione si riferisce alla correlazione nel tempo di due o
più misurazioni. Come per la precisione, la definizione di accuratezza implica la definizione di stabilità: se
uno strumento di misura è accurato necessariamente è anche stabile, se è stabile non è detto che sia
accurato.
LA TEORIA CLASSICA DELL’ATTENDIBILITA’:

Secondo la teoria classica dell’attendibilità il punteggio prodotto dalla misurazione è formato da due
componenti, V ed E: in condizioni ideali E è nullo, nelle condizioni reali ha sempre un suo peso.
L’attendibilità di uno strumento di misura viene definita come il rapporto tra la varianza della parte vera e
la varianza osservata o totale. Non si può sapere il vero ammontare della varianza dell’errore di misura e
dei punteggi veri, si può solo arrivare a stimarla. Il limite minimo dell’attendibilità è 0 (quando il punteggio
osservato è composto solo da errore), il limite massimo è 1 (quando tutto il punteggio osservato è vero),
quindi l’attendibilità è la proporzione di varianza vera rispetto alla varianza totale prodotta dallo strumento
di misurazione (è un coefficiente di determinazione).

IL RAPPORTO TRA ATTENDIBILITA’ E VALIDITA’:


Attendibilità e validità sono due componenti fondamentali per eseguire una misurazione adeguata.

- L’attendibilità ci assicura che le diverse misure siano coerenti tra di loro

- La validità che riflettano adeguatamente il costrutto che volevamo misurare

L’attendibilità dunque è considerata la base della validità, in quanto senza attendibilità una misura non può
essere nemmeno valida.
DIVERSE APPLICAZIONI DELL’ATTENDIBILITA’:
Le principali applicazioni del concetto di attendibilità della teoria classica sono:

- L’attendibilità test-retest: Misura la stabilità nel tempo delle risposte dei soggetti o i cambiamenti
nelle situazioni sperimentali

- Le forme parallele o equivalenti di uno strumento: Consiste nel somministrare agli stessi
partecipanti nello stesso momento due forme diverse dello strumento che tuttavia misurano lo
stesso costrutto

- La consistenza interna e lo “split-half” di una scala o di un test: Sono due metodi diversi per
vedere se i molteplici item che compongono lo strumento e che vengono somministrati ai soggetti
nello stesso momento sono correlati tra loro mostrando maggiore o minore eterogeneità nel
contenuto

- La consistenza interna (calibrazione) di due o più osservatori, valutatori o giudici: Misura


l’accordo o il disaccordo tra loro in ciascuna codifica eseguita.

L’α DI CRONBACH DI UNA SCALA DI MISURA:


L’α di Cronbach è uno degli indici più utilizzati all’interno della psicologia sociale, poiché oltre ad essere
idoneo al tipo di misura utilizzata da quest’ultima (scale di misura di atteggiamento o personalità), è un
indice chiaro e comprensibile per molti dei suoi aspetti.

Supponiamo di avere una scala composta di 8 item di cui si vuol conoscere l’attendibilità tramite l’ α di
Cronbach.

Procedura per calcolare l’ α di Cronbach: dopo aver sottoposto la scala ad un campione adeguato di
soggetti, dividiamo in due gruppi uguali gli 8 item: 4 da una parte e 4 dall’altra; calcoliamo poi i punteggi
totali di ciascun gruppo di item per ciascun soggetto, e quindi correliamo queste due misure. Abbiamo un
primo coefficiente di correlazione. Adesso dividiamo ancora gli 8 item originali in altri due gruppi della
stessa numerosità, diversi dai raggruppamenti precedenti e calcoliamo anche in questo caso la
correlazione. Il processo va avanti nella stessa maniera finché non è stato calcolato un coefficiente di
correlazione per tutte le possibili divisioni a metà degli 8 item. Il coefficiente α di Cronbach è dato dalla
media di tutte queste correlazioni (il valore assoluto). L’ α di Cronbach viene definito come la media delle
intercorrelazioni tra tutte le possibili divisioni a metà del test.

L’ α di Cronbach dipende da due elementi: l’intercorrelazione tra gli item e la lunghezza della scala.
LA K DI COHEN DI UNA GRIGLIA DI OSSERVAZIONE:
Il K di Cohen è un coefficiente di attendibilità utilizzato principalmente quando ci sono due o più valutatori
che eseguono una stessa misurazione in genere basata su una forma di codifica o classificazione nominale o
ordinale. Dopo aver registrato ogni seduta di interazione ed addestrato alcuni all’uso dell’IPA, gli
osservatori codificano ciascun evento interattivo di interesse di ciascuna seduta sulla base delle categorie
della griglia stessa. In casi come questi è ovvio che la principale fonte di errore è l’osservatore stesso. Il
concetto di base dell’attendibilità relativa ad un sistema di codifica è quello di accordo: se due osservatori
che osservano lo stesso materiale vanno d’accordo, allora il sistema può dirsi attendibile, se due osservatori
non vanno d’accordo il sistema di categorie non può dirsi attendibile.

Procedura per calcolare il K di Cohen su questa griglia:

1) Addestrare due osservatori all’uso della griglia stessa.

2) Fargli codificare lo stesso materiale video registrato indipendentemente l’uno dall’altro, in modo
che non si possano influenzare: ogni volta che si presenta un comportamento che rientra nella
definizione di una categoria del sistema di categorie, l’osservatore deve associare quel determinato
comportamento alla specifica categoria, utilizzando una griglia carta e matita, oppure un
programma di codifica al computer.

3) Dopo la codifica è necessario costruire una matrice di confusione (o di accordo) che riporta in riga
le categorie del sistema riferibili al primo osservatore (O1), in colonna le categorie riferibili al
secondo (O2) e nelle celle le frequenze riferibili all’accordo tra i due osservatori rispetto a ciascuna
categoria.

La soluzione a questo problema è la proporzione di accordo, consistente nel rapporto tra tutti gli accordi
(Ao) e la somma degli accordi più i disaccordi (Ao + D). Si tratta di sommare le frequenze nelle celle nella
diagonale e dividerle per le frequenze totali della matrice di confusione. Il difetto di questo tipo di indici è
che esso dipende anche da fattori estranei alla questione dell’attendibilità, ad esempio dal numero di codici
utilizzati.

Tutti questi problemi nascono dal fatto che nel calcolo non si tiene conto di un fattore che solitamente
inflaziona il valore dell’accordo stesso: l’accordo dovuto al caso.

VALIDITA’:
L’approccio tradizionale distingue la validità in diversi aspetti:

- La validità di contenuto

- L’attendibilità

- La validità di criterio (concorrente predittiva)

- La validità di costrutto (esterna ed interna).


Quando si parla di validità di uno strumento di misura si intende oltre ad una definizione concettuale e
operativa del costrutto che si vuole misurare, anche la definizione delle relazioni con misurazioni diverse
del costrutto, con misure di altri costrutti all’interno di un sistema teorico e con misure di variabili presenti
nel mondo reale.

VALIDITA’ DI CONTENUTO:
Viene stabilita dimostrando che gli item utilizzati per la misurazione sono un campione rappresentativo
dell’universo del contenuto degli item rilevanti per quel costrutto. Tale validità è soddisfatta quando il
costrutto è stato esplicato teoricamente in termini di aspetti specifici, che esauriscono il dominio del
contenuto, che deve essere coperto dal costrutto stesso.

La validità di contenuto può essere definita come il grado in cui gli item che fanno parte dello strumento
costituiscono un campione rappresentativo dell’universo dei comportamenti possibili relativi al costrutto che
si vuole misurare. La validità di contenuto è in realtà rappresentata dalla cosiddetta significatività teorica (è
la natura e la coerenza del linguaggio usato per rappresentare e definire il costrutto) e operativa (si riferisce
alle regole di corrispondenza tra aspetti teorici ed empirci) del costrutto.

Ultimo aspetto, a volte fatto rientrare nella validità di contenuto, riguarda la validità di facciata: è il grado
in cui gli item utilizzati appaiono ragionevoli o sensibili come indicatori del costrutto che si vuole misurare,
alle persone a cui è diretto quel test o anche a quelle che lo usano. Questa validità è soddisfatta quando
sulla base di un esame superficiale del test stesso una persona deduce che è valido. Lo strumento di misura
perciò non è valido, ma lo sembra.

VALIDITA’ DI CRITERIO O ESTERNA:


È il grado di corrispondenza tra la misura e una variabile esterna diversa dal costrutto originario, che si
assume come criterio di riferimento. Quando il criterio è concomitante con il costrutto di cui si vuol stabilire
la validità di criterio si parla di validità concorrente. Quando il criterio è differito nel tempo, si parla di
validità predittiva.

Nella validità di criterio si mette in correlazione un criterio con il costrutto diverso dal criterio stesso, ma
con il quale deve avere un giustificato legame teorico. Per determinare la validità di criterio in genere si
usano 3 metodi:

1) Si usa spesso per stabilire la validità concorrente, e consiste nell’eseguire una correlazione tra il test
e il criterio, non avendo la correlazione implicazioni causali.
2) Si usa per stabilire la validità predittiva e consiste nell’applicare tecniche di regressione al criterio,
potendo la correlazione testare relazioni predittive

3) Si applica ad entrambi e consiste nel verificare se il test discrimina tra due o più gruppi di soggetti,
che sulla base delle proprie caratteristiche dovrebbero differenziarsi per la caratteristica misurata.

VALIDITA’ DI COSTRUTTO:
Viene intesa da alcuni come validità tout court, dato che viene definita come il grado in cui uno strumento
misura ciò che intende misurare. Una misurazione ha validità di costrutto se essa correla con misurazioni
dello stesso costrutto fatte con metodi diversi e non correla invece con misurazioni di costrutti diversi, fatte
con lo stesso o con diversi metodi. È composta di due aspetti:

- Validità convergente: è il grado di accordo tra due misurazioni dello stesso costrutto fatte con
metodi diversi.

- Validità divergente: è il grado di discriminazione tra due misurazioni di costrutti diversi.

VALIDITA’ NOMOLOGICA:
È il grado in cui il costrutto che vogliamo misurare si inserisce in una serie di relazioni predittive, positive,
negative o nulle tra costrutti e criteri appositamente definiti. Diversamente dalla validità di criterio in questo
caso non c’è un solo criterio, ma molte misure all’interno di una rete nomologica o di relazioni tra costrutti.
Può essere intesa come uso di riassunti schematici e qualitativi relativi a studi precedenti che mostrano le
relazioni del costrutto con le altre misure.

Potrebbero piacerti anche