Sei sulla pagina 1di 60

Modulo 1

- Cosa è un reattivo psicologico


o Secondo Anastasi un reattivo psicologico consiste in una misurazione obiettiva
e standardizzata di un campione di comportamento
o La funzione di un test consiste nel misurare le differenze tra gl individui o tra le
reazioni di uno stesso individuo sottoposto a diverse condizioni
o Sono degli strumenti ideati per facilitare la conoscenza interpersonale e
renderla più valida, meno soggetta a differenze individuali e a distorsioni
o Ogni mezzo diagnostico deve essere elaborato in base ad una chiara
concezione teorica delle dimensioni o dei costrutti psicologici che intende
rilevare
o Al fine di evitare danni ai soggetti a cui i test vengono somminstrati, i reattivi
psicologici devono essere adattati prima di essere somministrati a soggetti di
popolazioni diverse rispetto a quelle per cui sono stati progettati, nei manuali
deve essere riportato se tale verifica di validità è stata effettuata
- L’applicazione dei test ed il trattamento dei dati
o Deve avvenire nel rispetto dell’etica professionale e del codice deontologico,
è quindi necessario:
 Mantenere la privacy e la riservatezza dei dati
 Garantire il consenso informato
 Agire sempre per il benessere personale del soggetto
 Prevedere degli incontri di de-briefing in modo da rendere evidente al
paziente le condizioni di somministrazione e laddove necessario evitare
di somministrare test che possono creare shock
 Ricordarsi articoli 21 – che vieta di insegnare l’uso di strumenti
psicologici ai non addetti ai lavori
o Laddove non si volesse alterare la validità del test psicologico si potrebbe non
comunicare ai soggetti il reale obiettivo della prova (test singolo cieco e
dell’inganno), in modo da ridurre la desiderabilità sociale
- Differenza tra test psicologici e Assessment psicologici
o Nell’assessment di un individuo bisogna tenere in considerazione la complessità
della vita psicologica di un soggetto, il fatto che una persona abbia ottenuto un
punteggio basso su di un test per la valutazione della depressione non
necessariamente significa che sia depresso; occorre approfondire maggiormente
integrando informazioni derivanti anche da altre fonti
o L’assessment psicologico è un processo di valutazione inteso come
espressione di un giudizio che alla fine porta ad una valutazione sintetica
nella quale un ampio spettro di informazioni (tra cui quelle che derivano dai test),
vengono integrate ed elaborate per fornire una spiegazione psicologica della
situazione di un soggetto
- Quali sono le principali caratteristiche di un reattivo psicologico
o Al fine di operare una scelta cosciente di un test è necessario conoscere le
caratteristiche fondamentali:
 Obiettività (Anastasi)
• Riguarda il come si assegna il punteggio al test e come si
interpretano i punteggi, che non può avvenire in modo
soggettivo, ma si basa su criteri oggettivi quindi riproducibili
 Standardizzazione (Anastasi)

1|Page
• Un test può dirsi standardizzato nella misura in cui le procedure
di somministrazione, l’attribuzione dei punteggi e la
valutazione dei risultati sono uniformi e indipendentemente
dagli esaminatori o circostanze esterne permettono di ottenere
risultati affidabili
 Campione di comportamento (Anastasi)
• Rappresenta il numero minimo di stimoli, solitamente tre, riferiti
ad un comportamento
• I test psicologici, a differenza dei test medici che forniscono un
risultato chiaro e specifico, non necessariamente portano alla
luce conflitti, desideri proibiti ma rappresentano un campione
del comportamento della persona e si spera che questo
campione sia rappresentativo ma potrebbe non esserlo per via
delle distorsioni
• Il campione di comportamento non rappresenta la certezza
quindi ha a che fare con la probabilità a posteriori che prevede Commented [FM1]:
che facendo un numero di tentativi tendenti ad infinito la
probabillità osservata si avvicinerà alla probabilità a priori
 Validità
• Rappresenta il grado e la precisione con cui un test misura ciò
che si vuole misurare e consiste nella capacità di misurare in
modo preciso ed accurato
 Attendibilità
• Un reattivo viene considerato attendibile quando, applicato in
tempi diversi alla stessa persona (anche da parte di persone
diverse e in luoghi differenti) dà risultati simili.
 Sensibiiltà
• Consiste nella capacità di un test di discriminare tra individuo
ed individuo (es. tra i diversi livelli evolutivi di un individuo quindi
in questo caso è necessario che gli item abbracino l’intero tratto
evolutivo dell’attitudine da valutare)
 Universalità
• Riguarda la possibilità di applicare il test a culture differenti
o L’Influenza culturale dei test
- L’influenza della cultura fà si che i test vengano
classificati su di un continuum che va dai test:
o Culture-free:
 Valutano un costrutto (es.
l’intelligenza) a prescindere dalle
influenze culturali (es. Test delle
matrici di Raven)
o Culture-Reduced:
 Valutano un costrutto (es.
l’intelligenza) in contesti culturali
diversi.
 Vengono ridotti dei Bias culturali
attraverso l’individuazione e
l’eliminazione degli item

2|Page
eccessivamente collegati ad aspetti
socio-culturali
o Non Verbal
 Valutano un costrutto (es.
l’intelligenza) in soggetti che, per
disabilità dovute a cause organiche o
per caratteristiche dell’ambiente
socioculturale di provenienza, non
sono in grado di rispondere ad alcuni
stimoli verbali o a tutti
o Cultural specific
 Valutano un costrutto (es.
l’intelligenza) in soggetti appartenenti
ad un preciso e circoscritto ambiente
socio-culturale, Il materiale stimolo
(verbale e non) è specificamente
organizzato e strutturato in funzione di
quest’ultimo
 Praticità ed economicità
• Si riferisce a caratteristiche non metodologiche ma a
caratteristiche che possono indirizzare la scelta di un test
piuttosto che un altro
o Per Praticità
 Significa la facilità, la semplicità di correzione e
la facilità di conteggio dei punteggi
o Per Economicità
 Si intende il costo limitato per il tempo di
applicazione e la rapidità di spoglio dei dati
- La tassonomia dei test psicologici
o Le principali tipologie di test sono:
 Test di livello intellettuale generale
• Test di intelligenza individuali o collettivi
 Test per la misurazione delle singole abilità
• Test attitudinali, di profitto
 Test che misurano caratteristiche emotive, atteggiamenti, interessi e
comportamenti
• Test di personalità che riguardano i caratteri latenti non intellettivi
della personalità

3|Page
- Test di performance Massima e Tipica
o I test di performance massima detti cognitivi o di livello
 Valutano il livello di competenze prevalentemente di tipo cognitivo o
esecutivo
 Sono quelli che richiedono al soggetto di dare il meglio di se stessi e si
suddividono in
• Test di abilità
• Test di profitto
• Test attitudinali
• Test di intelligenza
• Test neuropsicologici
o I test di prestazione tipica si occupano di valutazioni di personalità e/o cliniche e
degli atteggiamenti
• Il metodo tradizionale è l’intervista faccia a faccia
- I principali test da tenere in considerazione sono:
o Test di personalità
 Esplorano la personalità nella sua globalità o in qualche sua
dimensione
• Es. Test dominanza-sottomissione o introversione-
estroversione
 L’interpretazione dei dati è sia qualitativa sia quantitativa
• Oltre al punteggio anche la valutazione dello psicologo ha
rilevanza nella definizione del profilo di personalità
 Sono previste due categorie:
• Obiettivi
o Costruiti con gli stessi principi dei test di rendimento
o Si compongono di prove o domande le cui risposte
vengono quantitativamente conteggiate e poi
qualitativamente valutate

4|Page
o Valutano una sintomatologia clinica e qualificano
nosograficamente le possibili modificazioni nel corso
del tempo
o Per la costruzione sono previsti diversi metodi, tra cui:
 Metodo della costruzione empirica
• Valida empiricamente il reattivo
servendosi delle frequenze di risposte di
gruppi di riferimento formati da individui
che presentano i sintomi (caratteristiche)
da analizzare
o Il test permette di discriminare tra gruppi normali e
gruppi patologici
o I punteggi grezzi ottenuti dal campione vengono
trasformati in punteggi standardizzati utilizzati per
analizzare la predittività del reattivo
 Permettono di conoscere dove il punteggio del
soggetto si posiziona rispetto alla popolazione
o Tra i principali questionari troviamo:
 MMPI (Inventario Multifasico di personalità)
• Si tratta di un questionario a banda larga,
ovvero vengono prese in considerazione
un elevato numero di
caratteristiche/Tratti
• Prende in esame i tratti patologici della
personalità mediante confronto tra le
risposte dei soggetti esaminati e quelle
dei pazienti affetti da disturbi mentali
• Prende in considerazione tre obiettivi:
o Raggiungimento di un campione di
comportamento significativo per
lo psichiatra (Affidabilità)
o Facilità di presentazione tramite
semplificazione linguistica
(applicabilità a diversi contesti)
o Creazione di un repertorio di
item molto ampio al fine
estendere il ventaglio di
descrizione di personalità valide
(maggiore di 1000 nella prima
versione)
• Prevede la scala Lie
o Per controllare la presenza di
distorsioni tramite una serie di
item
o Permettendo di mettere in luce
tendenze dei partecipanti ad
esagerare aspetti positivi o
nascondere aspetti negativi della
personalità
 MMPI 1 Vs MMPI 2

5|Page
• I punteggi del questionario sembravano
non poter permettere la formulazione di
diagnosi valide, in particolar modo per le
patologie relative alla depressione
• Alcune ricerche hanno messo in evidenza
che molte correlazioni esistenti tra le
diverse scale del questionario fossero
dovute ad avere degli item in comune e
ciò riduceva la possibilità di ottenere un
punteggio singolo solo per una
determinata scala
• Adeguatezza del campione di
standardizzazione originale
o Il campione era poco
rappresentativo della popolazione
di riferimento
• Linguaggio e i riferimenti contenuti negli
item
o Si faceva riferimento a credenze
religiose o frasi sessiste che
creavano confusione
• Esigua numerosità del set originale degli
item
o Non poteva essere effettuata una
corretta valutazione necessaria
per un assessment psicologico
 Big Five Questionaire
• E’ un reattivo che si basa su due principi:
o L’approccio Fattoriale presentato
da Eynseck, che identifica le
dimensioni caratterizzanti e le
differenze individuali utilizzando
analisi statistiche
o La teoria della sedimentazione
linguistica elaborata da Cattel,
che prende in considerazione il
linguaggio comune come
serbatoio di descrittori delle
differenze intellettuali
• I vantaggi
o Economicità e praticità
 In meno di 10 minuti è
possibile effettuare una
profilazione della
personalità

6|Page
o Ampiamente generalizzabile ad
altri contesti con lingue e culture
differenti
• L’acronimo per ricordare le 5 dimensioni
è:
o Openess to experience – identifica
la persona aperta al
cambiamento, creativo, tollerante
o Coscientiousness – Si considera la
tendenza ad essere cauti,
meticolosi, organizzati nella
gestione del proprio
comportamento
o Extraversion/introversion –
Consiste nell’aver fiducia e
sicurezza nei contesti sociali
o Agreebleness – Consiste nel
andare d’accordo con gli altri
nelle situazioni quotidiane
o Nevroticism – Consiste nella
capacità di controllare le
emozioni e gli impulsi
• Ad ognuno delle cinque dimensioni sono
state associate due sottodimensioni che
si riferiscono ad aspetti differenti della
stessa dimensione
• Le affermazioni sono formulate metà in
modo positivo rispetto alla
denominazione della scala e metà in
senso negativo in modo da controllare
risposte date a caso
• E’ stata prevista la scala Lie per
individuare la tendenza del partecipante
verso un profilo falsamente positivo o
negativo
o Tramite la scala Lie è possibile
ponderare i risultati e se invece la
simulazione supera un
determinato punto critico il
soggetto viene elimnato d’ufficio in
quanto inattendibile
• Proiettivi
o Sono idonei all’indagine dei processi inconsci
o Non sono facilmente generalizzabili in quanto si tratta di
test che non sono rigidamente struturati
o Il soggetto risponde liberamente mettendo qualcosa di
personale nelle sue risposte
o Le risposte consentono di scorgere elementi inconsci
della personalità, infatti il termine proiettivi si riferisce a
quanto previsto dalla psicoanalisi, in cui il soggetto

7|Page
espelle da sè sentimenti, emozioni, desideri che egli non
riconosce in se o rifiuta di se, proiettandoli verso altri
o Le caratteristiche principali sono:
 Ambiguità dello stimolo fornito
 Molteplicità delle risposte possibili che non
sono sottoposte a giudizio Vero/Falso
 E’ previsto il rapporto interpersonale con
l’esaminatore
o Tra i test principali ricordiamo:
 Test Roarshach
• Utilizza delle macchie di inchiostro per
analizzare la personalità
• E’ stato sviluppato come metodo
esplorativo per studiare la relazione tra
percezione e personalità, partendo dalle
osservazioni delle risposte riportate dai
pazienti schizofrenici che erano
completamente differenti da quanto
riportati dai pazienti non clinici
• Al soggetto vengono sottoposte 10
macchie che risultano essere:
o Accidentali
o Simmetriche
o Suggestive
• I tratti di personalità che possono essere
rilevati sono classificati in base a tre
dimensioni
o Aspetti cognitivi o intellettuali
o Aspetti affetttivi o emotivi
o Aspetti del funzionamento
dell’ego
 Metodo delle piccole favole
• Utilizzato come metodo di indagine nei
confronti dei bambini in sostituzione del
colloquio psicoanalitico
• Al bambino viene descritto un
protagonista che si trova in una specifica
situazione che rimanda ad uno degli stadi
dello sviluppo psicosessuale (Orale,
Anale,Edipico)
• Lo sperimentatore valuterà la risposta,
le reazioni dei bambini in modo da
costruire un piano di intervento
psicoterapico
• L’esaminatore deve avere una
conoscenza del modello psicoanalitico
in particolar modo riguardo la struttura
della personalità e gli stadi
evolutivi/affettivi dei bambini

8|Page
 Blacky Pictures test
• Ideato nel 1950 da Blum
• Si pone l’obiettivo di far emergere le
dinamiche della personalità di soggetti
bambini tra i 5/6 anni e 10/12 anni, in
particolar modo indaga alcune variabili
quali:
o Sviluppo psicosessuale
o Meccanismi di difesa
o Relazioni oggettuali
• Si basa sulla teoria psicoanalitica e
rientra nei reattivi narrativi e di
contenuto
• Costituito da 12 vignette che raccontano
l’avventura di Blacky e della sua famglia
composta da Papà, Mamma e Fratello
• Ognuna delle vignette richiama una
particolare tappa dello sviluppo
psicosessuale
• Viene chiesto al soggetto di individuare
Tippy, la sorellina o fratellino (cugino/a)
• Viene poi chiesto al soggetto di
inventare una storia e per ogni vignetta
vengono poste delle domande volte ad
indagare la dimensione psicoanalitica
 Test Appercezione Tematica (TAT)
• Rappresenta il test proiettivo più utilizzato
per l’analisi globale della personalità
attraverso la rilevazione delle tematiche
basilari intese come emozioni,
sentimenti, vissuti affettivi profondi e
processi cognitivi complessi e conflitti
di personalità che ricorrono nelle
elaborazioni immaginative dell’individuo
• La prima versione venne definita da
Murray con il termine di appercezione
per evidenziare che gli individui
interpretano attivamente lo stimolo
ambiguo in base ai loro tratti di
personalità e alle loro esperienze di vita
o Test che misurano l’efficacia (test di rendimento)
 Sono strutturati in base ad item standard scelti con difficoltà crescenti
in campioni rappresentativi al fine di valutare funzioni psichiche o
attitudini
 Il test di livelli intellettuale generale
• Elaborato da Binet nel 1905 è noto come “scala 1905”
• E’ stato predisposto all’interno di una didattica per bambini affetti
da disturbi mentali

9|Page
• La prima versione non presentava indicazioni circa il metodo
oggettivo per l’assegnazione del punteggio
• Nel 1908 viene rielaborato aumentando il numero degli item e
migliorando la qualità delle prove, attraverso la
somministrazione del test a circa 300 bambini normodotati tra i 3
e i 13 anni
o Gli item furono divisi secondo i livelli di età e ciò permise
di esprimere il puteggio del test di un soggetto in termini di
età mentale
• Nel 1912 Kulmann estende la scala verso i livelli inferiori
gettando le basi per lo sviluppo dei test di intelligenza
prescolastici e infantili
• Nel 1916 viene elaborata la scala Stanford-Binet, rilevante in
quanto per la prima volta viene adottato il Q.I. attraverso il
rapporto tra età mentale ed età cronologica
 Tra i test più importanti possiamo ricordate
• Test di Raven (matrice progressive)
o E’ un test per la valutazione complessiva dell’intelligenza
intesa come ampiezza delle abilità mentali indipendenti
dal valore culturale
o E’ un test utilizzato per la misurazione dell'intelligenza non
verbale.
o Gli item da analizzare sono 6 o 8 disegni, In ogni scheda
viene richiesto di completare una serie di figure con
quella mancante. Ogni gruppo di item diventa sempre
più difficile, richiedendo una sempre più elevata
capacità di analisi, codifica, interpretazione
e comprensione degli item.
o Le matrici di Raven sono considerate il test elettivo per
misurare il fattore g dell'intelligenza, ovvero l'intelligenza
definita fluida.

Modulo 2
- Gli ambiti di applicazione
o Pianificazione educativo-didattica
 Negli ultimi anni gli interventi degli psicologi all’interno del
settore educativo sono aumentati notevolmente, ad
esempio, gli insegnanti richiedono per i loro studenti test per
la misurazione della dislessia, disortografia, discalcuia o
iperattività
 Si tratta di un ambito molto importante che si interseca con
altri ambiti quali l’orientamento, il benessere la precocità
degli interventi

10 | P a g e
 Si parte dall’utilizzo dei test di tipo cognitivo fino ad arrivare
a quelli per l’orientamento professionale e alla selezione
del personale
 Nella pianificazione educativo-didattica lo psicologo ha un
duplice ruolo:
• Fornire gli strumenti pratici che abilitano
l’identificazione di potenziali difficoltà di
apprendimento e le migliori modalità di recupero
• Partecipare alla costruzione degli strumenti di
valutazione di caratteristiche psicologiche cognitive
e non cognitive
o Neuropsicologia clinica
 Gli psicologici utilizzano strumenti di accertamento per la
diagnosi dei danni cerebrali derivanti da incidenti,
ischemia, demenza e per aiutare i soggetti che soffrono di
epilessia.
 I test neuropsicologici possono localizzare il danno nel
cervello, la sua natura e l’effetto sul corpo o sulle funzioni
sociali o sugli stati emozionali
o Psicologia del lavoro e selezione del personale
 Gli specialisti di PSI del lavoro utlizzano i test nell’ambito
dell’assessment delle abilità, attitudini e personalità per la
selezione, promozione, coaching e formazione
professionale e consulenza sulla progressione di carriera
o Diagnostica clinica forense
 Le perizie forensi sono un’accezione della diagnostica
clinica in cui il professionista viene coinvolto nella
valutazione, ad esempio, dell’affidamento dei minori o sul
loro maltrattamento
 Possono essere coinvolti anche in questioni che riguardano la
responsabilità di un crimine per cui il giudice vuole avere
informazioni sul livello intellettivo di un individuo
o La diagnosi clinica e la terapia
 I test vengono utilizzati dal clinico a supporto delle proprie
attività principalmente in tre situazioni
• L’identificazione dei disturbi di cui soffre il paziente
o Per effettuare una valutazione di tipo
nosologico e psicopatologico per
identificare le modalità di trattamento da
applicare a livello individuale, familiare o di
gruppo
• Per valutare gli effetti delle terapie e identificare i
fattori di rischio e di protezione
• Per rendere oggettive le valutazioni degli
psicoterapeuti che a volte sono messe in
discussione dalla comunità scientiifica
- Cenni storici
o I pionieri della psicometria sono riconducibili alla scuola Francese
fondata sulle indagini empriche clinico-descrittive delle patologie, tra i
principali studiosi ricordiamo:

11 | P a g e
 Pinel
• Supportò il passaggio della concezione della malattia
mentale da “possessione demoniaca” a “disturbo
patologico” quindi ad una concezione medica e
guaribile e non più a concezione soprannaturale
 Wundt
• Istituisce a Lipsia il primo laboratorio pr studiare
fenomeni psicologici
• Segna due elementi di frattura:
o Si distacca dalla filosofia come ambito
disciplinare
o Riguarda la possibilità di descrivere il
fenomeno psicologico studiando l’inferenza
che il soggetto effettua circa la natura di un
oggetto e sulle relazioni tra oggetti
attraverso le percezioni sensoriali
 Fechner
• E’ convinto di aver individuato metodologie e
tecniche in grado di supportare la misurazione nello
stesso senso della fisica
• Il punto di unione tra il mondo spirituale e quello
materiale rafforza la necessità di individuare una
funzione matematica di valore universale in grado di
accrescere in modo controllabile e indifferente la
conoscenza del mondo
• Fechner ritenne di avere trovato tale legge
derivandola da una relazione scoperta da Weber
• Weber, studiando il tatto e l’udito, avevo
rilevato che se si presenta ad un partecipante
uno stimolo di una data intensità (R) e si cerca
poi di vedere di quanto questo stimolo deve
essere fatto variare perchè il partecipante
percepisca l’avvenuta variazione, questa
differenza appena percepibile non è
costante ma dipende da valore iniziale di
(R), ciò che è costante è il rapporto K
 K=0.2 (Stimolo iniziale)
 20 candele di luce
 R= 24 (20*0.2)

 Spearman
• Utilizzo per primo l’analisi fattoriale per
l’interpretazione dei dati psicologici
• L’analisi fattoriale fù applicata all’intelligenza e alla
costruzione degli strumenti di rilevazione
• Postula l'esistenza di un fattore generale
d'intelligenza, denominato «fattore g», e, accanto a

12 | P a g e
esso, alcuni fattori specifici, indicati come «s1, s2 , s3
... »
 Thurstone
• Thurstone (1931) ritiene l'intelligenza un costrutto la
multidimensionale, quindi un insieme di eterogenee
abilità primarie indipendenti fra loro. Pur avendo
individuato con i sui studi l’esistenza di 12 di queste
abilità, soltanto 7 sono state confermate da studi
successivi e, attualmente, vengono denominate
Primary Mental Abilities (PMAs):
• Secondo questo schema nel 1938 Thurstone
progettò il primo test di Abilità mentali primarie,
costituito da 7 subtest, ciascuno dei quali consentiva
di misurare una particolare capacità
o Comprensione verbale Fluenza verbale
o Capacità numerica Capacità spaziale
o Memoria associativa Velocità percettiva
o Ragionamento induttivo
 Piaget considera la componente fondamentale del costrutto
di intelligenza gli schemi, definiti come pattern
comportamentali o strutture mentali organizzate che
consentono di individuare la modalità più efficace per
eseguire un compito con successo.
• Queste strutture mentali si evolvono nella direzione
di una crescente maturità, mediante il processo di
equilibrazione.
 La famosa teoria delle intelligenze multiple proposta da
Gardner è di tipo multifattoriale ed è costruita partendo dallo
studio delle relazioni cervello/comportamento.
• In questa prospettiva coesistono diverse forme di
intelligenza, tra loro relativamente indipendenti, ma
non è possibile affermarne in maniera definitiva la
natura e il numero. Quelle meglio definite, e per
questo più autonome anche ontologicamente, sono:
linguistica, logico-matematica e spaziale (le tre più
note), musicale, corporeo-cinestesica, interpersonale
e intrapersonale (le quattro più innovative proposte
dall'autore) (1983; 1993)
 DMS
• L’insieme delle classificazioni dei disturbi
psicologici è riassunto all’interno del DSM,
pubblicato nel 1952 sulla base delle sezioni dei
disturbi mentali del ICD pubblicato dal OMS
• DSM e ICD sono in gran parte sovrapponibili
• Il DSM si costruisce intorno ai seguenti cardini
o Nosografico
 I quadri sintomatologici sono
descritti a prescindere dal vissuto del
singolo e sono valutati in base a
casistiche frequenziali

13 | P a g e
o Ateorico
 Non si basa su teorie
o Assiale
 Raggruppa i disturbi su 5 assi al fine
di semplificare e indicare una
diagnosi standard
o Su basi statistiche
 Il sintomo acquista valore come dato
frequenziale
 I concetti di moda, media, mediana,
frequenza, varianza vengono utilizzati
per vautare la presenza o meno di un
disturbo
• Le critiche al DSM
o A differenza della medicina dove sono
presenti dei sintomi di per sè sufficienti a
formulare una diagnosi
o In psicometria e psicologia si utilizzano
insiemi di criteri politetici vale a dire per una
diagnosi non si richiede che tutti i criteri
siano soddisfatti ma che solo un certo
numero di criteri siano soddisfatti (almeno
quattro sintomi di sette), da qui deriva la
principale critica al DSM in quanto non si
capisce quale siano i limiti che portano un
soggetto a essere sano o meno
 Perchè un soggetto è considerato
sano se ha 4 caratteristiche e non 3 o
5?

14 | P a g e
Modulo 3
- Il disegno di ricerca
o Si intende l’organizzazione spaziale e temporale di una ricerca al
fine di aumentare i controlli e la sua validità
o L’obiettivo del disegno di ricerca è di esercitare il massimo
controllo escludendo l’intervento di variabili di disturbo
o E’ costituito dall’esposizione delle teorie e delle ipotesi che
riguardano le relazioni causali
o Il disegno di ricerca è la struttura portante della ricerca e consiste:
 Nella pianificazione e progettazione ed in particolare
riguarda ciò che attiene alla
• Somministrazione del trattamento e alla
manipolazione della variabile indipendente nonchè
alla rievazione dei suoi effetti sulla variabile
dipendente
• All’estrazione dalla popolazione e la costruzione dei
gruppi
 Sempre presente nei veri esperimenti e quasi esperimenti
 Assente nelle indagini descrittive
- La ricerca sperimentale
o L’obiettivo è individuare le relazioni causali tra fattori, ossia
individuare relazioni in cui si suppone che un fattore dipendente
sia causato da almeno un fattore indipendente (chiamato anche
fattore sperimentale)
o Nella sperimentazione la manipolazione della variabile
indipendente viene chiamato Fattore indipendente
 Consiste nella variazione indotta in un fattore di ingresso di
un sistema allo scopo di provocare modificazioni sul fattore
che rappresenta il prodotto del sistema stesso
o Nella ricerca per esperimento si cerca di controllare al massimo
l’effetto di tutti i fattori cercando di eliminare l’effetto dei fattori di
disturbo e mettendo in evidenza l’effetto del fattore indipendente,
viceversa
 Nella ricerca Standard ed interpretativa il successo della
ricerca dipende dal fatto che l’operazione di rilevazione dei
dati non modifica la realtà tenendo in conto il maggior
numero di aspetti di essa
o In virtù del controllo dei fattori la sperimentazione viene in genere
condotta in ambiente controllato ma non necessariamente in
laboratorio (es. in classe, in contesti naturali)
- Le stragie di ricerca possono essere distinte in
o Lo schema sperimentale Vero e proprio
 Si tratta delle situazioni dove si è in grado di controllare tutti
i fattori in gioco e considerati rilevanti per l’ipotesi guida
o I quasi esperimenti
 Un disegno quasi sperimentale è uno schema di ricerca in
cui il ricercatore non può controllare l’introduzione dello
stimolo sperimentale o i fattori di disturbo e quindi deve

15 | P a g e
limitarsi a studiare comparativamente situazioni già
predeterminate
 Il ricercatore raccoglie dati ma senza influire su di essi
quindi può solo effettuare delle comparazioni tra situazioni
diverse
o Metodi descrittivi
- I metodi di analisi dell’indagine sperimentale
o All’interno dell’indagine sperimentale sono stati definiti dei metodi
di analisi, tra cui:
 Metodo Comportamentale
• Lo sperimentatore è in grado di identificare le
variabili dipendenti ed indipendenti
• Si riferisce alla circostanza in cui lo sperimentatore
esercita il controllo sia dello:
o Stimolo (dati ambientali)
 il ricercatore è in grado di decidere
tra gli eventi ambientali quelli da
considerare come variabili
indipendenti
o Risposta (comportamento)
 Il ricercatore è i grado di decidere le
risposte da osservare come variabili
dipendenti
 Metodo Fenomenologico
• Lo sperimentatore deve definire il campo
fenomenologico in cui si trova il soggetto
• Per dato fenomenologico si intende l’insieme delle
percezioni di ciò che il soggetto vede, ode....
• I dati fenomenologici vengono sempre utilizzati
come variabiali dipendenti
 Metodo Osservativo
• Vengono definite le procedure le tecniche e gli
strumenti che permettono di osservare, registrare,
descrivere e codificare il comportamento umano o
l’interazione che si realizza tra le persone sia in
condizioni naturali sia di laboratorio
• In questo caso si tratta comunque di prove indiziarie
e non di prove conclusive in quanto non è possibile
escludere, tramite controllo sperimentale, tutte le
possibili interpreazioni alternative dei risultati ottenuti
o I disegni sperimentali
 Sono disegni di ricerca mediante i quali lo sperimentatore
può ridurre o eliminare il rischio di ipotesi alternative che
minacciano la validità delle conclusioni della propria
indagine
 Consente di garantire la validità interna e spesso la validità
esterna
 Costruire un disegno sperimentale significa mettere a punto
un insieme di elementi e procedure che consentono di dire,
con la più alta sicurezza, che gli effetti riscontrati sulla

16 | P a g e
variabile dipendente sono causati dalla manipolazione della
variabile indipendente e non da variabili incontrollate
 Nei disegni sperimentali:
• i soggetti che compogono il campione sono scelti in
modo casuale dalla popolazione
• i soggetti del campione sono assegnati
casualmente alle condizioni di trattamento
• Ogni soggetto o gruppo deve essere sottoposto ad
una sola condizione sperimentale per cui si avrà
una sola prestazione ed un solo punteggio per ogni
soggetto
 Come si mette in atto un esperimento ?
• I piani sperimentali possono essere di tre diversi tipi:
o Gruppo unico (meno affidabile)
1. GS - Si seleziona un gruppo
sperimentale
2. PI - si rileva il valore della variabile
dipendente prima dello stimolo
3. FS - Si introduce lo stimolo
sperimentale
4. PF - Si rileva nuovamente il valore
della variabile dipendente
5. Si analizzano le variazioni intercorse
prima e dopo lo stimolo sperimentale
 Questo schema sperimentale non
garantisce rilevazioni affidabili in
quanto non si è sicuri che il
cambiamento sia dovuto
all’introduzione dello stimolo
sperimentale ma potrebbe essere
dovuto ad altre variabili (es. fattore
tempo)

o A due gruppi
 Per rendere un piano sperimentale
più affidabile sarà necessario
prendere in considerazione sia un
gruppo sperimentale ed un gruppo
di controllo
 Al gruppo di controllo NON verrà
applicato lo stimolo sperimentale
mentre verrà applicato al gruppo
sperimentale
 Essendo i due gruppi equivalenti le
differenze tra i due gruppi saranno
da attribuirsi allo stimolo
sperimentale

17 | P a g e
 Questo tipo di disegno non permette
di controllare l’interazione pre-test
per trattamento in quanto
• Proponendo ai due gruppi
una prova iniziale può
risultare una fonte di invalidità
dei risultati in quanto gli allievi
avendo già ricevuto una prova
iniziale, sapranno su quali
argomenti dovranno
focalizzarsi durante l’intervento
formativo

o A quattro gruppi (più affidabile)


 Per rilevare l’effetto delle prove
iniziali è possibile aggiungere ulteriori
due gruppi
• Ad uno si applica il fattore
sperimentale
• Ad uno si applica il fattore
ordinario
• Ad entrambi si
somministrano i test iniziali
 I quattro gruppi si differenzieranno
sia in termini di presenza e assenza
del trattamento – FS - (G1 e G3) (G2
e G3) sia in presenza e assenza del
pre-test Pi (G1 e G2 con pre-test e
post test) (G3 e G4)
 L’effetto del fattore sperimentale può
essere esaminato confrontando il
post-test dei gruppi 1 e 3 con quello
dei gruppi 2 e 4.

• Questo metodo è sicuramente più affidabile in quanto


controlla gli effetti della selezione, regressione,
mortalità, storia e maturazione tuttavia risulta

18 | P a g e
essere molto oneroso quindi poco applicabile, una
una possibile soluzione è:
• Applicare il fattore ordinario e fattore sperimentale
sullo stesso gruppo in tempi diversi
o In questo caso la validità potrebbe essere
inficiata dal fatto che con il passare del
tempo i componenti del campione
acquisiranno mag giore maturazione e
quindi non si potrà essere certi di cosa avrà
prodotto il cambiamento
• Un’altra possibile soluzione nel ricorrere ad un
campione ciclico ossia applicare il fattore ordinario
ad una classe dell’anno corrente ed il fattore
sperimentale alla stessa classe dell’anno scolastico
successivo e poi confrontare i risultati
o I disegni quasi sperimentali
 Assomigliano agli esperimenti in quanto possiedono gli
stessi aspetti essenziali
• Una ipotesi causale da verificare
• La possibilità di qualche manipolazione della
variabile indipendente
 Tuttavia non controllano tutte le variabili di disturbo e quindi
le inferenze basate sui loro dati non sono affidabili ed in
particolar modo ciò accade perchè
• Non è possibile manipolare a piacimento la variabile
indipendente
• Non si possono scegliere in modo casuale dalla
popolazione i soggetti che compono il campione
• I soggetti non si possono assegnare ai gruppi in
modo randomizzato
 Fanno parte dei disegni quasi sperimentali
• I disegni con gruppo di controllo non equivalente
o Sono la soluzione migliore quando i gruppi
costituiscono delle entità naturali che
vengono mantenute intatte per studiarne le
caratteristiche
o La mancanza di equivalenza dei gruppi viene
limitata componendo un gruppo di controllo
più simile a quello sperimentale
o Questo tipo di disegno, che non prevede la
randomizzazione, presenta pecche
relativamente alla validità interna ha però il
vantaggio di rispettare la validità ecologica in
quanto il gruppo di controllo non viene tolto dal
contesto della vita quotidiana
• Disegni a serie temporali interrotte
o Assomigliano ad un disegno ad un solo
gruppo e due prove ma invece di una
singola misura prima del trattamento e dopo

19 | P a g e
il trattamento, richiedono diverse
misurazioni della variabile dipendente a
scadenze ben definite, sia prima sia dopo il
trattamento
o Prima del trattamento
 Per un certo periodo di tempo si
effettueranno una serie di misurazioni
• Tali misuazioni formeranno la
baseline che sarà utilizzata
come punto di paragone per
l’andamento dei dati raccolti
dopo il trattamento
 Successivamente si effettueranno le
manipolazioni
 Interrotte le manipolazioni si
effettueranno le misurazioni per un
altro periodo di tempo
 In questo modo si potrà vedere
l’effetto del trattamento come
differenza tra la serie di osservazioni
che precedono il trattamento e le
serie di osservazioni che lo seguono
• Svantaggio
o E’ costituito dall’impossibilità di tenere sotto
controllo le minacce della validità interna
costituite dalla storia, dal deterioramento
dello strumento, mortalità ed eventi che
possono cambiare il modo di raccolta e
codifica dei dati
• Vantaggio
o Per via delle molteplici misurazioni viene
controllato l’effetto della regressione verso
la media
 I disegni simulati prima e dopo (campioni differenti nel
pretest e posttest)
• Quando le ricerche sono condotte sul campo non
sempre è possibile assegnare casualmente i
soggetti ai differenti livelli di trattamento
• Tuttavia in molte circostanze è possibile esercitare
un sufficiente controllo sui momenti di registrazione
delle prove preliminari e del post-test
• Questo disegno è quindi utile quando riguarda
l’intera popolazione, in questo caso è possibile
rilevare l’impatto esercitato da un intervento
qualunque sull’insieme della popolazione se si
possono raccogliere e misurare i dati della variabile
che interessa sia prima che accada l’evento che
modifica tale variabile sia dopo
o I disegni osservativi/descrittivi

20 | P a g e
 Il metodo osservativo può essere definito come
l’applicazione dell’insieme di tecniche strumenti
all’osservazione pianificata e alla registrazione e all’analisi
del comportamento umano e animale che viene osservato
in ambiente naturale
 Un disegno di ricerca che preveda l’uso del metodo
osservativo rinuncia a priori al controllo sperimentale delle
variabili in gioco e quindi appartiene alla categoria dei
disegni non sperimentali
 Appartengono a questa categoria
• Survey
o Si tratta di un metodo molto utile per l’analisi
dei fenomeni sociali ed offre la possibilità di
quantificare i dati
o Formata da un insieme di quesiti sottoposti
attraverso diverse modalità ad un campione
che sia rappresentativo della popolazione
o Le caratteristiche dell’inchiesta sono:
 Realizzazione della survey nello
stesso momento
 Utilizzo di un insieme ordinato di
domande
 Precisa classificazione delle
domande e quindi confronti
quantitativi delle risposte
• L’osservazione naturalistica
o Consiste nell’osservazione diretta del
comportamento
o E’ caratterizzato dalle proprietà di
 Non intrusività
 Assenza di artificiosità
• La ricerca di archivio
o Riguarda l’ambito teorico della psicologia
quindi opposto alla ricerca sul campo
o Si occupa di osservazioni e misurazioni già
effettuate e disponibili
o I vantaggi sono
 Riduzione dei costi e tempi di
attuazione delle ricerche
o Svantaggi
 Effetti distorsivi dovuti alla mancanza
di conoscenza rispetto a come i dati
siano stati raccolti e rilevati in passato
(Es. desiderabilità sociale)
• Lo studio dei singoli casi
o Consiste in veri e propri “esperimenti
naturali” in cui si attua uno studio intensivo
e qualitativo di un singolo soggetto basato
su una raccolta di evidenze aneddotiche al

21 | P a g e
fine di definire un intervento sul
comportamento del soggetto
o Vantaggio
 Si limita ad un periodo relativamente
breve il coinvolgimento nella ricerca
di massimo 1 o 2 soggetti
o Svantaggi
 La validità e affidabilità della ricerca
è collegata alla preparazione
metodologia del ricercatore

22 | P a g e
Modulo 4
- Lo svolgimento delle attività di ricerca sperimentale ha la necessità di
avere dei riferimenti sia di carattere progettuale e organizzativo (piano di
ricerca) sia le procedure di controllo in modo da poter dimostrare la
validità delle attività di ricerca
- Alla parola validità possono essere attribuiti diversi significati
o Cook & Campbell definiscono la validità
 La migliore approssimazione disponibile alla verità o falsità
di proposizioni relative alle conclusioni della ricerca stessa
o Considerando il progetto nella sua complessità, la validità
 Logicità, coerenza, robustezza e attendibilità della ricerca
stessa quindi alla effettiva corrispondenza tra mondo reale,
trasposizione concettuale e conclusioni derivate
dall’indagine compiuta
o Pedon e Gnisci evidenziano cinque aspetti connessi alla validità
1. L’esistenza o meno di una relazione causale tra variabile
indipendente e dipendente nelle condizioni e sui soggetti
realmente studiati
2. Verificare se la relazione riscontrata tra le variabili vale
anche per persone, luoghi e tempi diversi da quelle
esaminate
3. Assicurare che il test effettivamente misuri quello che il
ricercatore si è proposto di misurare
4. Controllare se i risultati della ricerca sono dovuti alla
manipolazione della variabile indipedente oppure a
variazioni casuali
5. Possibilità o meno di generalizzare i risultati, ottenuti in
laboratorio, alla vita vissuta in ambiente naturale
o In funzione degli scopi la validità può essere distinta in:
 Complesso della ricerca
• Validità interna
o Fondamentale in quanto riguarda la teoria di
riferimento e la logica della ricerca stessa
o E’ collegata alla verifica dell’esistenza di una
legame costante tra variabile indipendente e
dipendente
 Si ha validità interna quando
sperimentalmente è possibile
stabilire una relazione, tra le due
variabili, confermandone la causalità
o La relazione può essere considerata causale
quando soddisfa due requisiti:
 La direzione o simmetria
• Riguarda il verso del legame
tra VI e VD e consiste nel
avere la certezza che la
modificazione della variabile
indipendente sia la causa del

23 | P a g e
cambiamento della variabile
dipendente e non viceversa
• Il cambiamento della VI deve
precedere temporalmente il
cambiamento della VD
 L’esclusione di fattori di confusione
• Il ricercatore tramite la
predisposizione di procedure
adeguate dovrà provare che le
modifiche della variabile
dipendente siano determinate
direttamente dalla
manipolazione della variabile
indipendente, controllando
tutte le variabili che sono
potenzialmente in grado di
influire sulla relazione causale
o Le minacce alla validità interna possono
derivare da:
 Variabili di confusione
• Le variabili di confusione sono
variabili importanti che
vengono scambiate per
variabili indipendenti (es. la
variabile sesso non può
essere assegnata e quindi non
può essere controllata quindi
se tale variabile è quella
indipendente allora ci
troviamo in un quasi
esperimento)
 La selezione
• La non corretta selezione e
numerosità dei soggetti del
gruppo di controllo e del
gruppo sperimentale può
portare a errate decisioni e per
questo motivo è di
fondamentale importanza
l’equivalenza rispetto alle
variabili di interesse del
gruppo sperimentale e del
gruppo di controllo
• Alcuni fattori che possono
minare l’equivalenza sono:
Motivazione, livello di
intelligenza
• Nel caso in cui non ci fosse
equivalenza non potremmo

24 | P a g e
essere confidenti che le
differenze riscontrate nel
post-test siano derivanti dal
trattamento
 Mortalità
• In particolar modo nelle
ricerche che si protraggono
per molto tempo può
succedere che i componenti
del campione si ritirino dopo il
pre-test influenzando i risultati
della ricerca
o Per ridurre tale effetto,
si suggerisce di
effettuare le prove in
tempi molto
ravvicinati
 Effetto storia (vedi anche effetto
delle prove)
• Durante l’esperimento si
possono verificare degli
eventi, anche personali.
• In particolar modo l’effetto
storia si verifica negli
esperimenti che hanno due
misurazioni, pre-test e post-
test
• Metodi di controllo dell’effetto
storia
o Casualizzazione delle
condizioni
sperimentali
 Consiste nel
distribuire
equamente le
più importanti
fonti di errore
tra i gruppi
sottoposti ad
esperimento
(es. distribuire
lo svolgimento
del corso
all’interno di un
giorno della
settimana)
o Controllo della
costanza
 Cercando di
mantenere il

25 | P a g e
più possibile
costanti le
condizioni di
sperimentazion
e per tutti i
soggetti e per
tutto il periodo
ad eccezione
del
trattamento
 Unica
sessione e
stessa
situazione, per
mantenere
costanti e
comuni a tutti i
soggetti le
distorsioni si
deve eseguire
l’esperimento
in una unica
sessione e
nello stesso
ambiente
 Per evitare che
fattori estranei
concorrano con
il trattamento
ad influenzare i
soggetti
sperimentali si
può ridurre il
tempo tra il
pre-test e
post-test
 Processi di maturazione
• Si tratta di cambiamenti di
ordine biologico o
psicologico che avvengono
con il trascorrere del tempo
o Biologico
 Fame, fatica,
coordinazione
o Psicologico
 Stanchezza,
noia,
motivazione

26 | P a g e
• Un esempio è rappresentato
dai processi di detenzione
del segnale
o I soggetti che devono
discriminare tra uno
stimolo (visivo,
uditivo) per identificare
il vero segnale e il
possibile rumore, con
il passare del tempo
modificano i loro
criteri di decisione nel
riconoscimento del
segnale
• Per ridurre tale effetto
possono essere effettuate
delle misurazioni ripetute ad
intervalli costanti,
avvalendosi sempre del
gruppo di controllo
 Strumentazione
• La variabilità dovuta alla
stuttura di strumenti quali ad
esempio, Interviste,
questionari, test possono
esercitare un’influenza sulla
affidabilità delle misurazioni
attraverso variabili quali:
stanchezza, disattenzione,
aumento di esperienza
• Nella strumentazione bisogna
includere anche lo
sperimentatore in quanto il
cambio di sperimentatore
durante una ricerca può
arrivare ad inficiare i risultati
derivanti dal pretest e del
posttest
o Per ridurre tale effetto
bisognerebbe
mantenere costanti la
strumentazione
(incluso lo
sperimentatore)
 Effetto delle prove
• La partecipazione alle stesse
prove, più volte, procede un
effetto di apprendimento che
può influire sui risultati delle
prove successive. L’utilizzo

27 | P a g e
del pre-test, a volte, può
quindi influire sui risultati della
ricerca mettendo a rischio la
validità interna
• Per ridurre tale effetto si
potrebbe:
o Far passare il pre-test
come un evento
ordinario della vita dei
gruppi
o Eliminare il pre-test,
laddove esista una
equivalenza dei
gruppi, i singoli
partecipanti dovranno
essere stati
selezionati in modo
casuale e la
numerosità è conforme
alle regole di
campionamento
 Effetto statistico
• Gli effetti derivanti dalla storia,
maturazione e prove hanno
un effetto sulle stesse
elaborazioni utilzzate per
accertare, ad esempio, la
causalità
• Es: In sperimentazioni in cui si
realizzano prove ripetute sugli
stessi soggetti e stessa
variabile risulta che i punteggi
estremi tendono a regredire
verso la media
• Per ridurre questo effetto è
possibile utilizzare il gruppo di
controllo
 Errori derivanti dai partecipanti
• Acquiescenza
o Il ricercatore ne sà più
di me
• Desiderabilità sociale
o Questa cosa non potrei
mai dirla
 Errori derivanti dallo
sperimentatore
• Età, genere, appartenenza
etnica, esperienza
o Per ridurre tali errori,
laddove previsti più

28 | P a g e
sperimentatori si
potrebbe rendere
casuali gli interventi dei
ricercatori
• Aspettative del ricercatore
che vuole trovare proprio
quello che si aspetta di
trovare
o Per ridurre tali errori,
applicare il disegno
con doppio cieco
quindi nè i
partecipanti nè il
ricercatore sono a
conoscenza delle
ipotesi di ricerca
• Validità esterna
o L’obiettivo è accertare che quanto
riscontrato fra le variabili risulti
generalizzabile in modo da poter inferire le
conclusioni a situazioni, popolazioni anche
diversi da quelle in cui è stata condotta la
ricerca
o Il modo più semplice per ottenere la validità
esterna è di ripetere la ricerca sulla
popolazione, cambiando una o più variabili
(metodo che richiede comunque molto sforzo
e quindi poco utilizzato)
o La migliore soluzione è scegliere la giusta
popolazione di riferimento e la numerosità
campionaria adeguata a rappresentare la
popolazione
 Più grande sarà il campione
maggiore sarà la sua
rappresentatività
o Le minacce alla validità esterna sono
rappresentate da
 Limiti di validità della popolazione
• Sono rappresentati dalla
difficoltà nel reperire la
popolazione di ricerca è
quindi necesario stabilire a
priori la popolazione di
riferimento e le modalità di
selezione degli individui da
inserire nel campione
adottando le tecniche di
campionamento più idonee
alla ricerca
 Limiti temporali

29 | P a g e
• Possono derivare dalle
variazioni stagionali che
possono vanificare l’obiettivo
di una ricerca (es. effettuare
una ricerca sul bullismo nel
mese di Luglio quando le
scuole sono chiuse)
 Struttura del disegno sperimentale
• Quale ad esempio l’utilizzo del
pretest che produce
apprendimento
• Tendenza dei soggetti a
rispondere in modo
compiacente in assenza
dell’intervento dello
sperimentatore
• Mancanza di conoscenza di
alcuni parametri importanti
dei soggetti che partecipano
alla sperimentazione
o Per aumentare la validità esterna è
possibile
 Adoperare misurazioni non intrusive
 Raccogliere i dati primi che i soggetti
si accorgano che il ricercatore ha
iniziato il lavoro di indagine
 Condurre la ricerca in ambienti
naturali
• Validità di costrutto
o Si tratta della corrispondenza tra il piano
della ricerca e la teoria di riferimento.
Ogni ricerca deriva da una teoria, da cui
discendono ipotesi che vanno verificate.
Le variabili oggetto di misurazione devono
essere pertinenti rispetto alle ipotesi e
teoria di riferimento
o Il costrutto è un concetto astratto (es. ansia,
emozioni , intelligenza) e non è facile da
essere osservato
o Vengono inferiti dal comportamento grazie
ad indicatori osservabili (es. battito
cardiaco, sudorazione), tali indicatori
dipendono dalla teoria di riferimento e dagli
strumenti adottati
o Al costrutto deve quindi essere data una
chiara definizione in modo tale da
identificare gli indicatori rappresentativi
che consentirano manipolazioni soddisfacienti

30 | P a g e
o La validità di costrutto è simile alla validità
interna si raggiunge cercando di eliminare le
variabili alternative che possono influenzare
il comportamento in esame, nella validità di
costrutto occorre escludere altre possibili
spiegazioni teoriche dipendenti dai risultati
ottenuti
• Validità statistica
o Attraverso l’applicazione di tecniche
statistiche controlla che i risultati della ricerca
non siamo dovuti al caso ma ad una effettiva
relazione causale tra le variabili e quindi alla
diretta manipolazione delle VI
o La validità statistica è collegata alla validità
interna, entrambe verificano i rapporti tra le
variabili sperimentali (causale o meno)
o L’importanza della validità statistica è legata
al fatto che unità sperimentali diverse,
sottoposte allo stesso trattamento,
potrebbero fornire risultato differenti e le
differenze potrebbero derivare da:
 Differenze individuali dei soggetti
trattati
 Mancanza di uniformità
nell’esecuzione dell’esperimento
 Mancato controllo delle variabili di
confusione
• In questi casi la la variabilità
può essere controllata con
tecniche di campionamento e
disegni sperimentali
 Il caso
• La variabilità legata al caso
può essere valutata mediante
tecniche statistiche
• Si tratta di un metodo a
posteriori che può indicare se
bisogna modificare le
condizioni sperimentali e di
controllo
o La validità statistica si avvale del calcolo
delle probabilità e l’inferenza statistica per
valutare la variabilità dei fenomeni che
avrebbe luogo se agisse solo il caso
 Viene quindi confrontata la
variabilità empiricamente osservata
e quella teorica prevista dal calcolo
delle probabilità
• Se la variabilità
empiricamente osservata è

31 | P a g e
molto superiore alla
variabilità teorica
o Allora la differenza può
essere spiegata solo
stabilendo che oltre al
caso deve aver agito
qualche altro fattore
• La validità ecologica
o Riguarda la percezione del soggetto
sperimentale sia verso il compito sia verso
l’ambiente durante lo svolgimento della
sperimentazione
o I fattori che possono compromettere la
validità ecologica sono due
 Le condizioni di laboratorio
• Rendono poco naturali le
reazioni del soggetto
rendendole poco assimilabili
a quelli della vita quotidiana
• Lo sperimentatore potrebbe
non riuscire a comprendere
come il soggetto percepisce
la situazione e quindi dovrà
aver incluso nel disegno
sperimentale tale variabile
 Complesso delle misure
• L’interpretazione dei punteggi ottenuti dalla
misurazione è uno dei momenti più delicati
o Validità di facciata
 Si riferisce a ciò che appare
superficialmente, riguarda se il test
risulta valido sia agli esaminatori
sia al personale tecnico che decide
il suo uso e sia al personale non
tecnico a cui viene somministrato il
test
 Secondo Anastasi la validità di
facciata può avere effetti positivi e
negativi sui punteggi di un test (es.
test altamente professionale può
motivare le persone viceversa un
test confuso non stimolerà a
completare il test)
 La validità di facciata è di difficile
misurazione
o Validità di contenuto
 Lo scopo dello studio di una validità
di contenuto è la valutazione se gli
item siano una rappresentazione

32 | P a g e
adeguata di un dominio di
performance o un costrutto (si
riferisce alla variabile che si vuole
studiare) di interesse specifico
 Al contrario della validità di
facciata la validità di contenuto
deve essere considerata come una
caratteristica dimensionale del test
e non un aspetto solamente
qualitativo come nel caso della
V/facciata
 Si verifica quando una misura
rappresenta in modo accurato
l’universo del contenuto misurato
 Necessita anch’essa del giudizio da
parte di esperti
 Per valutare la validità di
contenuto di un test musicale si
potrebbe presentare un test ad un
numero di soggetti che sono
studenti del conservatorio e
chiedergli di giudicare se il test
copre tutte le prestazioni musicali
importanti rispetto alla loro
esperienza (metodo Delphi)
 La verifica della validità del
contenuto deve essere effettuata al
momento della costruzione dello
strumento di contenuto quindi prima
della rilevazione dei dati
 Per verificare la validità del
contenuto è necessario controllare i
valutare i seguenti standard
• Qualità e rappresentatività
degli indicatori
• Adeguatezza e sensibilità
della costruzione degli
indicatori
 La validità di contenuto non
sempre è in grado di garantire
l’attendibilità di quelli che sono gli
stimoli come indicatori della
variabile psicologica (Tratto
latente) che si vuole misurare, ci
sono molti esempi che provano
come gli stimoli ideati per misurare
una variabile siano poi risultati
validi per misurarne un’altra quindi i

33 | P a g e
test hanno anche la funzione di
predire il funzionamento futuro
(es. test per i disturbi specifici di
apprendimento)
o Validità criterio
 Indica la capacità di uno strumento di
misurazione di realizzare previsioni
accurate e il risultato ottenuto è
adeguato a predire un critero esterno
 Il criterio è una misura con cui si
confrontano i risultati ottenuti nel
test per stabilire se questo test sia
in grado di misurare effettivamente il
tratto latente, le caratteristiche di
un buon criterio sono:
• Il criterio deve realmente
riflettere gli aspetti
fondamentali del costrutto
che si vuole misurare
• La reperibilità che permette
ad un criterio di essere
recuperato più volte nel
momento in cui che il
criterio può variare da una
situazione all’altra che si sta
analizzando o da un test ad
un altro
• L’assenza di distorsione è
un’altra caratteristica in
quanto la misura criterio
non deve essere alterata dai
Bias in particolar modo
quando la misura criterio con
cui ci confrontiamo è una
scala di punteggi, se coloro
che assegnano i punteggi
criterio, ad esempio, sulla
base di altri rendimenti
come il proprio giudizio sul
operato del lavoratore allora
il punteggio criterio può
risultare distorto e quindi si
parla di contaminazione che
risulta essere il giudizio
fornito su di una persona
sulla base di altre
caratteristiche che si
conoscono del soggetto e
non sulla effettiva
prestazione

34 | P a g e
o Per misurare la validità di criterio esistono
due modi:
 La validità predittiva
• Si ha quando la
misurazione del criterio è
compiuta, rispetto a quella
del test, dopo un certo
periodo di tempo
 La validità concorrente
• Si ha quando la
misurazione del criterio
viene compiuta
contemporaneamente con
quella del test che si vuole
validare
o Validità di costrutto
 La validità di costrutto (Cronbach e
Meehl, 1955) si definisce come il
grado in cui uno strumento misura
il costrutto che si intende misurare,
cioè gli attributi o le qualità
psicologiche che si presuppone
siano posseduti dalle persone.
 Per costrutto si intende un
concetto o una definizione legato a
una teoria, che non può essere
direttamente osservato ma solo
inferito
 Esistono due tipi di validità di
costrutto:
• Validità convergente
o Corrisponde al grado
di accordo tra misure
diverse dello stesso
costrutto quindi due o
più misure dello
stesso costrutto
dovrebbero avere una
correlazione elevata
per poter essere
considerate misure
valide di quel costrutto
o la validità
convergente è data
dalla correlazione tra
i punteggi di un
nuovo test con i
punteggi di un test

35 | P a g e
che è stato
ampiamente validato
• Validità discriminante
o Si intende il grado di
discriminazione tra
due misurazioni di
costrutti diversi
quindi due o più
misure dovrebbero
avere una
correlazione non
elevata affinchè i due
costrutti siano
effettivamente diversi
o si ha validità
discriminante
quando si ottiene un
basso livello di
correlazione tra i
punteggi al test con
quelli delle altre
variabili con i quali ci
si aspetta che il test
non correli
o Risulta alta quando la
misura del costrutto
da validare non
correla con le misure
di altri costrutti in
teoria distinti dal primo
• La validità nomologica
o Bisogna dimostrare che il costrutto
predice ciò che deve predire e non
predice ciò che non deve predire e che si
inserisce in una rete appropriata di
relazioni con altri costrutti teoricamente
affini.
o Questo tipo di validità riguarda un
costrutto in contemporanea con molti
criteri, alcuni positivi, altri negativi, altri
ancora indipendenti
o I Conflitti tra validità
 Validità Interna Vs Validità Esterna
• La validità interna è massimata dove esiste un controllo
totale di tutte le variabili, il massimo controllo lo si può
avere in laboratorio anche se poi non è sempre facilmente
generalizzabile
 Validità Interna Vs Validità di costrutto

36 | P a g e
• La validità interna riguarda il nesso causale tra due
variabili senza porsi il problema del significato delle
misure e delle variabili delle operazioni quindi senza
prendere in conto il significato della relazione tra
l’indicatore ed il costrutto
• La Validità di costrutto riguarda le regole di
corrispondenza tra gli indicatori che utilizziamo per
misurare
• Il conflitto si viene a creare laddove per aumentare la
validità interna distorciamo gli indicatori, enfatizzando
al massimo le operazioni di calcolo per cercare di avere
delle misure affidabili allontanandosi dal costrutto teorico
 Validità Esterna Vs Costrutto
• Entrambe riguardano generalizzazioni
• La validità esterna riguarda la generalizzazione di un
nesso causale quindi la trasferibilità in contesti differenti
senza prendere in considerazione i costrutti di cui la misura
è coinvolta nella relazione tra X e Y
• La validità di costrutto riguarda la generalizzazione
dell’etichetta riguardo a cui sono state misurate le variabili
XeY
 Validità Interna Vs validità statistica
• La corretta applicazione di ragionamenti causali di tipo
qualitativo e logico può avere contrasti con le procedure
statistiche per una valutazione quantitativa
o Il Controllo
 In psicologia il concetto di controllo viene utilizzato in due modi:
• Il Gruppo di controllo
o Il gruppo di controllo ha le stesse caratteristiche
del gruppo sperimentale e funge da punto di
comparazione per la verifica degli effetti della
variabile indipendente
o La comparazione avviene confrontando i risultati del
gruppo sperimentale che riceve il trattamento con
quello di controllo che non è sottoposto a
\wtrattamento
o La comparazione può anche riguardare i risultati
dello stesso gruppo sperimentale sottoposto a
differenti livelli della stessa variabile indipendente
(esperimento entro i gruppi), il gruppo controlla se
stesso
o In ogni caso si ricorre ad un pre-test
 Le strategie di controllo che possono essere utlizzate
riguardano:
• L’ambiente di ricerca
o Il laboratorio è considerato l’ambiente ideale
in quanto permette di eliminare o tenere sotto

37 | P a g e
controllo le variabili estranee e di
confusione
 Il laboratorio semplifica la situazione
sperimentale riducendo le variabili che non
interessano e aumentando il controllo sulla
variabile indipendente
 Consente di mantenere costanti tutte le altre
variabili poichè si sottopongono i soggetti alle
stesse prove, nello stesso luogo, con lo stesso
sperimentatore e nel medesimo momento
della giornata
• Gli strumenti di ricerca utilizzati
o Ogni strumento di misura per essere valido deve
essere oggettivo, attendibile e sensibile
 Laddove si avesse il dubbio che un eventuale
assenza dell’effetto della variabile
indipendente sia dovuto allo strumento di
misura, bisognerà:
• Ripetere l’esperimento di misura con
un altro strumento
o Se il risultato delle due
misurazioni coinciderà allora
sia le misurazioni sia lo
strumento saranno attendibili
• Quando si ripete un esperimento ci
possiamo trovare di fronte a due
situazioni:
o La ripetizione
 Si ripete l’esperimento
in modo più fedele
possibile all’originale
o La replica
 Si opera una modifica
rispetto alla prima
sperimentazione per
vedere se si ottiene lo
stesso risultato
• I partecipanti alla ricerca
o Per ridurre l’effetto dei disturbi da parte dei
partecipanti si può nascondere ai soggetti
sperimentali sia lo scopo della ricerca sia la
condizione alla quale ognuno di essi è sottoposto
(metodo del singolo cieco)
• Lo sperimentatore
o In questo caso è necessario ridurre al minimo i
contatti con i partecipanti, i ricercatori potrebbero
inoltre essere tenuti anche essi all’oscuro delle
ipotesi dell’esperimento e della formazione dei
gruppi (metodo del doppio cieco)

38 | P a g e
o Nel caso del metodo osservativo, il controllo si
effettua mediante l’impiego di parecchi osservatori in
modo da poter effettuare la comparazione dei dati
rilevati assegnandogli un valore che prende in
considerazione un coefficiente di accordo
o Principali elementi importanti
 Popolazione
• Sono tutti i fatti di interesse a cui si rivolge il ricercatore
(es. individui, comportamenti, stimoli)
o Finite
 E’ possibile definire il numero di elementi
o Infinite
 E’ impossibile definire il numero di elementi
 Campione
• Insieme di elementi, tratti dalla popolazione di interesse
• Il campione deve risultare rappresentativo della
popolazione per la ricerca in atto in modo da poter
consentire di generalizzare i risultati ottenuti
• Nel campione devono essere presenti tutte le
caratteristiche della popolazione
• Più il campione risulterà grande e più si ridurranno gli
errori di campionamento
 Il campionamento
• Casuale
o Quando la selezione avviene da una popolazione
in cui gli elementi sono ordinabili ed ogni
elemento ha la stessa probabilità di essere
selezionato
• Casuale Stratificato
o Quando la popolazione viene suddivisa
preliminarmente in sub-popolazione o strati e da
ogni strato viene estratto un sub-campione,
sempre in modo casuale, di numerosità
proporzionale alla numerosità del campione
totale (es. utilizzando variabili quali, sesso, età)
• Ragionato
o Sono utilizzati laddove non risulta semplice reperire
soggetti disponibili e quindi non scelti in modo
casuale
o La generalizzabilità dipende da quanto si riesce a
descrivere i soggetti del campione in modo
obiettivo
o Questo tipo di campionamento può portare ad
errori sistematici che influiranno sul
campionamento
 Costruzione dei gruppi sperimentali
• Randomizzata

39 | P a g e
o Assegnazione casuale libera
o Viene utilizzata quando si utilizza un numero di
soggetti elevato
• Pareggiamento
o Consiste nel rendere i gruppi simili rispetto alla
variabile da controllare
o Viene utilizzata per piccoli gruppi in modo da
distribuire equamente le variabili di disturbo
• Metodo dei blocchi
o Consiste nell’abbinare le caratteristiche dei gruppi
o Bisogna identificare la variabile in base alla quale
formare i blocchi (es. quoziente intellettivo)
o Successivamente si misurano tutti i soggetti del
campione
o Si suddividono i soggetti in base alla media e
deviazione standard

40 | P a g e
Modulo 5
- I test di profitto
o I test di profitto vengono utilizzati per sollecitare lo studente
affinchè riveli e manifesti, tramite il comportamento o la
prestazione, ciò che ha appreso o sa fare, sulla bae dei criteri di
valutazione derivati e congruenti con gli obiettivi operativi stabiliti
per controllare il livello di padronanza raggiunti
o I test che si riferiscono al profitto possono essere utilizzati per
 Stimolare l’interesse dello studente
 Controllare il grado di preparazione dello studente prima
di iniziare un corso scolastico
 Misurare il progresso fatto durante il corso di istruzione
 Determinare la necessità o l’efficacia del lavoro di
recupero
o I test di profitto sono un insieme di elementi di prova (item)
espressi in modo da provocare una risposta rigidamente
predeterminata
o Si tratta di strumenti che presentano un alto livello di
 Rappresentatività del curriculu svolto
• Possono essere inseriti nei test un elevato
numero di item che riguardano quanto studiato
 Omogeneità
• Le stesse domande sono poste nello stesso
momento a tutti gli studenti
o Le prove oggettive di profitto vengono distinte in base a
 Procedimento utilizzato per la loro costruzione
• Informali
o Non prevedono attività di
standardizzazione
o I risultati vengono utilizzati in modo
circoscritto (es. all’interno della classe)
• Standardizzate
o Sono utili per effettuare confronti su piani
territoriali ampi in modo da confrontare i
risultati
o Prevede azioni formalizzata di scelta degli
obiettivi
o Prevede la formulazione dei quesiti
o Prevede la sperimentazione su di un
campione ristretto
o Prevede l’analisi dei quesiti con revisione
della prova oggettiva
 Posizione temporale utilizzata per il loro uso
• Iniziale o di prerequisiti
o Utilizzati per controllare se gli studenti
possiedono le conoscenze necessarie per
affrontare un nuovo corso di istruzione

41 | P a g e
o Nel caso in cui l’obiettivo della prova sia di
constatare lacune degli studenti allora la
prova può considerarsi diagnostica
• Formative o sommative
o Permettono di rilevare la preparazione
complessiva raggiunta al termine di una
parte significativa del percorso di
istruzione
o Sono costituite da quesiti che riguardano
solo gli aspetti più generali ed importanti e
consentono di ottenere una visione
d’insieme della preparazione degli studenti
 Lettura dei risultati
• Rango
o Permettono di realizzare una gerarchia
della classe sulla base dei punteggi
ottenuti nella prova stessa in modo da
evidenziare il rapporto esistente tra la
prestazione di ogni studente ed il resto della
classe
• Competenza
o Permettono di stabilire se sono stati
conseguiti gli obiettivi scolastici
programmati dal docente
o Limitazioni delle prove oggettive
 Non consentono di misurare i processi cognitivi
• Dalla semplice risposta al quesito non si coglie il
ragionamento sotteso quindi una risposta esatta
potrebbe derivare da un ragionamento errato e
viceversa
 Soltanto alcuni aspetti dell’apprendimento sono
misurati
• Non vengono misurate abilità espressive (es.
oralità)
 Limitano il dialogo tra studenti e docenti
 Le risposte possono essere casuali
 Le istruzioni potrebbero essere incomprese
• Istruzioni poco chiare potrebbe portare gli studenti
ad ottenere prestazioni inferiori rispetto alla loro
conoscenza
 La preparazione richiede tempo
• Affinchè una prova oggettiva sia valida ed
attendibile deve essere ben preparata
o I vantaggi
 Stessi elementi di prova

42 | P a g e
• I risultati ottenuti sono comparabili in quanto le
prove hanno uguaglianza di contenuto,
formulazione e risposte
 Eliminazione dell’influenza dell’espressione
• Non vengono saggiate la ricchezza di
vocabolario, leggibilità della grafia, esposizine
 Velocità di applicazione
• Il tempo di somministrazione
• Il tempo di correzione è molto veloce
 Oggettività nella correzione
• Un unico correttore strutturato
 Campione esteso
• Gli item inseriti rappresentano un campione di
tutti i possibili stimoli che possono essere realizzati
per saggiare le competenze
- La costruzione degli item per i test
 Gli item possono essere classificati in diverse modalità
• A risposta aperta
o Consentono allo studente di organizzare e
rispondere con una certa libertà e con
parole proprie
o La risposta può essere semplice o
complessa
o La qualità della risposta deve essere
valutata da una persona competente
• A risposta di tipo oggettivo
o La risposta è delimitata ad una breve
frase, parola o simbolo, viene quindi
predeterminata l’esattezza
o Questo item può essere corretto da un
operatore, senza conoscenze specifiche, o
da un automa
 Questa tipologia di item si
suddividono in due gruppi
• Lo studente deve
rispondere fornendo una
risposta
• Lo studente seleziona una
risposta tra quelle che gli
vengono presentate
 La forma degli elementi di prova
• I tipo Vero/Falso
o Consiste in una frase che deve essere
giudicata vera o falsa oppure una
domanda a cui rispondere Si/NO

43 | P a g e
o Possono essere previsti un numero
consistente di elementi/argomenti
riducendo l’effetto del caso
o La correzione è oggettiva
• Limiti di applicazione
o Si tratta di quesiti che devono basarsi su
affermazioni assolutamente vere o false e
tra le affermazioni significative poche
soddisfano questo criterio
o La formulazione deve essere precisa e
non deve accettare eccezioni
o Lo studente deve conoscere il grado di
verità dell’affermazione
o Lo studente deve conoscere il grado di non
verità accettato dall’insegnante
 Es. acqua bolle a 100°
o Lo studente ha il 50% di probabilità di
indovinare la risposta esatta
• Buone Pratiche
o Le frasi devono essere formulate in modo
NON ambiguo altrimenti lo studente rischia
di prendere un punteggio basso anche se
conosce la risposta che avrebbe voluto
l’insegnante
o Il testo NON deve contenere concetti che
sono parzialmente veri o parzialmente
falsi (un solo concetto)
o Sono da evitare frasi lunghe, complesse in
quanto lo studente potrebbe non
comprendere il concetto sotteso
o Sono da evitare test con tranelli
 Per evitare di creare atteggiamenti
negativi nei confronti dei test e degli
insegnanti da parte degli studenti
o Inserire nel testo solo ciò che risulta
importante ai fini della risposta evitando
quindi di inserire testo non attinente
o Evitare le forme negative e non usare mai
le doppie negazioni
 Le forme negative, se utilizzate,
dovranno essere evidenziate con
carattere differente (grassetto,
corsivo)
o Evitare di inserire termini specifici che
alterano il risultato
 Gli studenti riescono ad individuare
come falsi i quesiti che riportano

44 | P a g e
Mai, Sempre, Tutto e come veri
quelli che riportano Usualmente,
Alcune volte, possibilmente
 Il quesito vero falso modificato
• Viene chiesto di modificare una affermazione, se
falsa, sostituendo una parola
• La difficoltà di questo test consiste nel fatto che lo
studente potrebbe fornire delle risposte differenti
da quelle attese, in base alla propria
interpretazione
 Il tipo a scelta multipla
• Consiste in una domanda iniziale che accetta due
o più risposte o frasi da completare
• Allo studente viene chiesto di scegliere la
risposta migliore o quella che ritiene più corretta
• Questo tipo di quesito risolve l’ambiguità
associata alla ricerca di una risposta che sia
assolutamente vera
• Limiti di applicazione
o Il fattore caso è ridotto sopratutto se sono
previste quattro risposte
• Buone Pratiche
o La frase scelta dall’insegnante dovrebbe
essere formulata in modo chiaro sia nella
presentazione sia nella risposta
o Non bisogna inserire le scelte possibili nel
mezzo di una frase in quanto lo studente
non avendo ancora finito di leggere l’intera
frase non avrà una idea chiara di cosa gli si
stia chiedendo
o Nel testo non dovrebbero essere inseriti
termini difficili o tecnici. Frasi difficili
dovrebbe essere suddivise in più parti
o Gli elementi più importanti dovrebbero
essere posti all’inizio del quesito
o Ogni domanda dovrebbe avere una sola
risposta corretta
o La frase introduttiva del quesito dovrebbe
essere di per sè abbastanza significativa
ed attirare l’attenzione dello studente
o Evitare frasi negative o con doppia
negazione
o Sistemare le risposte in ordine cronologico
o Tra le possibili risposte usare con cautela la
dizione “nessuno dei precedenti” in quanto
potrebbe rappresentare un indizio esterno
che porterebbe gli studenti a selezionarla

45 | P a g e
 Il tipo a corrispondenza
• Si tratta di un elemento di prova costituito da due
liste, una di premesse e l’altra di risposte
• Lo studente è invitato ad accoppiare ad ogni
premessa la corretta risposta
• L’abbinamento dovrebbe risultare veloce quindi
possono essere proposte differenti domande
riducendo quindi l’effetto del fattore caso
• Limiti di applicazione
o Si tratta di uno strumento poco flessibile
da utilizzarsi solo nelle situazioni in cui il
materiale si presta alla elencazione di un
numero di concetti importanti e tra loro
connessi
• Buone pratiche
o Prevedere solo premesse omogenee e
risposte omogenee
o Evitare di produrre liste troppo lunghe
 In quanto altrimenti sarebbe
richiesto un elevato tempo di
lettura
 Es. liste con 20 quesiti richiedono
400 confronti iniziali
 L’esperienza suggerisce di
prevedere al massimo 8/10 coppie
o Prevedere liste e risposte brevi
 Semmai bisognasse prevedere un
testo lungo è opportuno prevederlo
come premessa in quanto gli
studenti leggono le premesse una
volta sola mentre leggono tutte le
risposte
o Spiegare chiaramente agli studenti la
modalità di funzionamento del test e le
modalità di accoppiamento (es. cantanti
con canzoni, pittori con quadri)
o Una dei vantaggi delle corrispondenze è
di ridurre al minimo le possibilità di
indovinare la risposta tuttavia se lo
studente conosce, ad esempio 8 risposte
su 10, la possibilità di indovinare le risposte
rimanente diventa di 1 a 2. Se ne conosce
9 su 10, la decima è riconosciuta per
eliminazione. Si suggerisce quindi di
prevedere un numero maggiore di
risposte rispetto alle premesse
 Il tipo a completamento

46 | P a g e
• Sono composti da una frase o da un testo nel
quale sono stati eliminati uno o più elementi e lo
studente deve completare la frase scivendo una
risposta nello spazio lasciato vuoto
• Limiti di utilizzazione
o Il problema consiste nel trovare quesiti
con una risposta corretta, laddove il
numero delle possibili risposte corrette
aumenta anche la correzione diventa più
difficoltosa e i punteggi sono meno
attendibili
• Buone pratiche
o L’elemento di prova non dovrebbe
prevedere risposte multiple
o Non bisogna prevedere più di due
complementamenti in quanto altrimenti
aumentano le possibili combinazioni e di
conseguenza i tempi di risposta
o Porre lo spazio (lacuna) alla fine della frase
o vicina alla fine per evitare che si debba
tornare indietro per formulare la risposta
o Per i problemi che richiedono calcoli
specificare il livello di precisione atteso
 Elementi a risposta aperta
• Si tratta di un elemento di prova che richiede allo
studente di rispondere ricorrendo alla propria
esperienza e conoscenza
• Lo studente risponderà con parole proprie quindi
verranno indagate anche capacità espressive
• Limiti di utilizzazione
o Il problema principali riguarda l’attendibilità
dei punteggi in quanto:
 La correzione del quesito è
soggettiva
• Sono state verificate
differenti valutazioni da
parte di diversi insegnanti
agli stessi test ed addirittura
differenti valutazioni dello
stesso insegnante in
differenti giorni
 Inserire un numero basso di
elementi a risposta aperta può
pregiudicare la prestazione di uno
studente al quale gli sono capitate
domande su cui erano meno
preparato

47 | P a g e
• Buone pratiche
o Bisogna limitare la libertà di risposta dello
studente in modo da evitare difficoltà nella
comparazione delle differenti
dissertazioni
o I quesiti dovranno essere specifici al fine di
stimolare lo studente nel selezionare le
informazioni pertinenti (es. chiedere di
evidenziare i possibili vantaggi o
permettendo di analizzare un problema
specifico)
 Comprensione della lettura
• E’ rappresentato da un brano di testo a cui viene
associato un insieme di quesiti
• L’elemento di prova viene utilizzato per verificare il
grado di comprensione delle singole parole, di
termini specifici, la capacità di compiere
operazioni cognitive superiori
• La lunghezza del brano ed il numero di quesiti
dipendono dalla misura che si vuole ottenere
rispetto ai livelli di comprensione
• Le capacità che vengono rilevate riguardano
o Localizzare informazioni utili nel testo
o Effettuare operazioni di conteggio
o Effettuare comparazioni
o Riconoscere il significato delle parole
o Esprimere opinioni
• La scelta del brano del testo da leggere è in
funzione delle capacità che si vogliono verificare

48 | P a g e
Modulo 6
o L’attendibilità
 Parlando di piani sperimentali bisogna distinguere tra:
• Between Subject Research (ricerca tra i soggetti)
o Si analizza la variabilità all’interno dei soggetti
analizzandoli in periodi successivi e poi si vedono le
variazioni tra i punteggi sulla variabile di interesse
(studi longitudinali)
• Within Subject Research (ricerca entro i soggetti)
o Coincidono con le Survey vale a dire la
somministrazione dello stesso test o di forme
parallele
 Attendibilità/Affidabilità/Fedeltà
• Indipendentemente dai piani sperimentali l’attendibilità
significa:
o Riproducibilità della misura laddove parliamo di
BSR
o Stabilità nel tempo dello strumento di misurazione
se parliamo di WSR
• Le questioni fondamentale per l’analisi dell’attendibilità
sono:
o La consistenza dei punteggi del test quindi la
relazione tra i punteggi ottenuti nelle varie condizioni
di prova
o Come cambiano i punteggi in una seconda prova
similare alla prima
 Riguarda le cause della variabilità tra i
punteggi del test, quindi quali sono i fattori che
producono punteggi inconsistenti e quale è la
magnitudine di questi fattori per ciascun
punteggio
o Lo scostamento tra il punteggio reale di un soggetto
ed il punteggio grezzo che si rileva dal test (solo in
ambito di teoria classica dei test)
• Secondo la teoria classica lo studio dell’attendibilità si è
concentrata nello sviluppo dei metodi per rendere più
precisa la stima del punteggio e quindi mettere in evidenza
quale sia la consistenza dell’errore all’interno del punteggio
grezzo del test
• Nella realtà c’è sempre uno scostamento tra il punteggio
dello stesso test applicato alle stesse persone in
occasioni diverse, quindi l’attendibilità non vuol dire che
saremo mai in grado di avere un’assenza di errore
casuale dovuto a fattori esterni al test
• L’errore casuale è sempre presente ed interviene in modo
del tutto incontrollabile ed imprevisto all’interno di
operazioni di misura tuttavia essendo di tipo casuale e non
sistematico possiamo ricondurlo alla teoria generale della

49 | P a g e
probabilità e quindi quantificarlo e sottrarlo al punteggio
grezzo ottenuto dal soggetto in modo da ottenere il
punteggio “reale”
• I metodi per calcolare il coefficiente dell’attendibilità sono
diversi ed ognuno misura qualcosa di diverso quindi ogni
volta che viene riportato un coefficiente di attendibilità è
necessario specificare con quali metodi e quali indici è
stato prodotto
• La scelta del metodo più appropriato dipende
dall’individuazione della fonte di errore più rilevante per
un test
• Clarin definisce l’attendibilità applicata ad un test
distinguendolo in due significati
o Attendibilità relativa alla stabilità della
misurazione nel tempo
o Metodo Test-Retest
 Il Test-retest si applica quando
siamo interessati ad andare a
determinare una stabilità delle
misure di un test nel tempo, cioè alla
mancanza di errori tra punteggi di
uno stesso test somministrato a
distanza di tempo sugli stessi
soggetti
• Consiste nell’applicare, a
distanza di tempo, due volte
lo stesso test ad un gruppo
di soggetti e nel calcolare il
coefficiente di correlazione
per determinare il grado di
concordanza dei risultati
ottenuti nelle due
applicazioni. Più alta (più si
avvicina ad 1) è la
correlazione e tanto
maggiore è l’attendibilità del
test.
• Affinchè questo coefficiente
(indice di R-Pearson) di
stabilità sia significativo
bisogna fare due assunzioni
o La caratteristica
misurata deve essere
stabile nel tempo
o L’assenza dell’effetto
ricordo

50 | P a g e
 Questo metodo è influenzato dal
tempo che intercorre fra le due
somministrazioni a causa delle
vicende di vita che possono
accadere o dell’evolvere di una
psicopatologia quindi bisognerebbe
prevedere tempi brevi tra le
somministrazioni.
• Quando l’intervallo tra il test e retest
è maggiore di 6 mesi allora la stima
dell’affidabilità del test viene
chiamata coefficiente di stabilità
T1

Stesso Test

T2

o Metodo delle Forme Parallele (stabilità):


richiede la costruzione di due versioni
comparabili del test (stesso test con item
riformulati), che sono somministrate ad uno
stesso gruppo una di seguito all’altra, o
comunque senza frapporre un ampio
intervallo di tempo. Il coefficiente di
correlazione (indice di R-Pearson) fra i due
test darà una stima dell’attendibilità e
dovrebbe essere maggiore o uguale a 0.9 in
quanto si tratta di due versioni di test molto
simili. Si applica per motivi di praticità, o
quando si vogliono evitare le distorsioni del
metodo del test-retest, evitando parimenti
che i soggetti rispondano ricordando le
risposte alla prima prova
Test 1 Test 2

Stesso Gruppo

o Attendibilità relativa alla coerenza interna dei


punteggi osservati
o Nel caso in cui si voglia verificare
l’attendibilità di un test basandoci sui dati
di una singola somministrazione in questo
caso si verifica la coerenza interna degli
item ossia il grado in cui gli item di un test
o di una scala sono omogenei nel misurare
il costrutto di un oggetto, in questo caso si
hanno due metodi:
 Metodo Split-Half: l’insieme delle
varie prove o degli item che
formano un test viene diviso in due

51 | P a g e
parti equivalenti in modo tale che si
possano considerare come due
forme parallele, anche se ridotte,
del test originale. Il coefficiente di
correlazione fra i punteggi delle due
metà del test darà una stima
dell’attendibilità, o per meglio dire in
questo caso della coerenza interna
del test.
• In questo caso si procede a
calcolare il coefficente di
correlazione con R-pearson
per ognuna delle due metà
dopodichè il calcolo viene
aggiustato secondo la
formula di Spearman-
Brown ed ottenere
l’attendibilità per il doppio
sotto-test creato. Per questo
test viene richiesto che la
varianza delle due parti del
test sia uguale. Per
esprimere una buona
attendibilità il coefficiente
deve essere maggiore di
0.80
Test 1

Test 1/1 (50%) Test 1/2 (50%)

Stesso Gruppo

o Metodo della Consistenza Interna: Si


somministra il test in un unico tempo T1.
Ogni item viene considerato un test a se
stante. Si stima (con apposite formule) la
correlazione media tra tutti gli item, e da
essa si deriva un coefficiente di stima
dell’attendibilità.
o Per determinare l’omogeneità degli item si
possono utilizzare metodi diversi, quali:
 Coefficiente alfa di Cronbach
 Formula K-R 20 e K-R 21
Test 1

Item 1 Item 2 ................. Item n

Stesso Gruppo

o La misura di una caratteristica attraverso un test

52 | P a g e
 Una volta definita la caratteristica che il test misurerà sarà
necessario scegliere gli stimoli e fissare le modalità di risposta
 Sia gli stimoli sia le modalità di risposta devono essere
appropriate alle caratteritiche che si vuole misurare, ad
esempio:
• Creatività: Risposte di tipo aperto
• Progettazione:Risposta di tipo aperto
• Problem solving:Risposta a scelta multipla
• Tratto personalità:Risposta ad alternative chiuse lungo una
scala che rispecchia il continuum psicologico (scala likert)
o Gli stimoli devono attivare soltanto le risposte attinenti alla
caratteristiche da misurare
 Lo stimolo deve essere facilmente comprensibile altrimenti non
possiamo sapere se le risposte mancano perchè è assente la
caratteristica oppure è assente la percezione
• Tutto ciò riguarda la validità a priori del testm dove un
gruppo di esperti valutano ed esprimono la loro valutazione
 Per alcuni test è possibile fare dei try-out vale a dire prove su
piccoli campioni di soggetti per evidenziare punti di debolezza del
test e l’insieme di questi controlli riguarda la validità di contenuto
del test che può essere controllata apriori
 Una volta preparati gli stimoli comincia la validazione esterna del
test, che ci permetterà di affermare se e quanto il test è una
misura buona della caratteristica presa in considerazione
 La verifica della validità del test continua anche dopo la
pubblicazione e somministrazione per verificare se le condizioni
che hanno portato alla formulazione del test siano cambiate o
meno
 Uno psicologo deve decidere di utilzzare un reattivo psicologico
piuttosto che un altro in base ai vantaggi di tipo pratico ed
economico
• Il test deve essere appropriato ai soggetti a cui viene
somministrato
• Deve essere scritto in linguaggio comprensibile
• Gli stimoli devono essere attraenti per i soggetti a cui è
rivolto
• Non deve creare problematiche di etica e deontologia
- I test di profitto – Validazione e Somministrazione
o I reattivi di profitto possono essere distinti in
 Test per la valutazione sommativa
• Costituiti da una serie di compiti elementari
afferenti a materie e livelli scolatistici determinati
• Vengono utilizzati per posizionare gli studenti lungo
una scala che evidenzia la riuscita in quella materia
 Test per la valutazione formativa

53 | P a g e
• Utilizzati per valutare il raggiungimento di un
obiettivo didattico/educativo attraverso
l’apprendimento scolastico
 Test diagnostici
• Per l’individuazione di difficoltà specifiche di
apprendimento in determinati ambiti di una materia
o Gli stadi previsti per la costruzione ed utilizzazione di una prova
oggettiva sono:
 Stadio di pianificazione
• Riguarda la costruzione dell’architettura, ed
include:
o Individuazione dei soggetti/o
o La scelta degli obiettivi (cognitivi, psicologici,
affettivi)
o La scelta dell’oggetto da valutare, quali:
 Prestazioni, comportamento
 Attitudini, interessi, atteggiamenti
 Abilità, competenze
o La scelta del tipo degli elementi di prova ed il
modo di come disporli all’interno della prova
oggettiva
o Esplicitazione della funzione della
valutazione
 Accertamento
 Verifica
 Valutazione finale
o Indicazione della numerosità dei quesiti
o Definizione delle modalità di assegnazione
dei punteggi
• Buone pratiche
o Tipo e forma degli elementi di prova
 La scelta della forma degli elementi di
prova dipende da
• Conoscenze/abilità da
rilevare
• Obiettivi che si vogliono
traguardare
 Possono essere utilizzate insieme le
diverse forme di elementi di prova, la
successione suggerita è
• Item Vero/Falso
• Item a scelta mutipla
• Item a corrispondenze
• Item a completamento
• Prove di lettura
 Gli elementi dovrebbero essere
disposti per difficoltà crescente e
raggruppati per contenuto e tipo di
quesito

54 | P a g e
 Gli elementi dovrebbero essere
ordinati per
• Difficoltà
• Base cronologica
• Ordine di insegnamento
degli argomenti
o Numerosità degli item di prova
 La numerosità è legata agli obiettivi,
ai contenuti da analizzare, al tempo
assegnato
 Un elemento utile per calcolare il
numero dei quesiti da prevedere
può essere il tempo impiegato per la
trattazione dello studio del proprio
curriculo
o Scelta della metrica per l’assegnazione del
punteggio
 L’insegnante deve stabilire il valore
ed i pesi che devono essere
assegnati a ciascuna parte della
prova oggettiva e a ciascun item di
prova
 Stadio operativo
• Terminata la fase di progettazione si può passare
alla fase operativa che prevede le azioni attuate per
l’uso della prova oggettiva
o Costruzione degli elementi di prova
 Riguarda la corretta linguistica con
cui sono espressi i contenuti in modo
tale che non si creino
fraintendimenti creando quindi
l’effetto rumore
 L’attenzione deve essere posta sia
sulla definizione della consegna sia
sulla risposta al quesito
 In generale è sconsigliabile
prevedere troppi quesiti consecutivi
aventi la risposta giusta nella stessa
posizione
o Elaborazione delle relative istruzioni
 La predisposizione della prova
oggettiva deve prevedere di definire
quali informazioni fornire agli studenti
in modo da consentirgli di
concludere la prova nel migliore dei
modi
 Più le istruzioni saranno chiare più la
precisione della misurazione e

55 | P a g e
quindi la validità e attendibilità del
test
• Si potranno riportare degli
esempi, mettendoli in
evidenza nel foglio
• Si illustrerà in modo semplice
e chiaro le caratteristiche
della prova oggettiva, le
forme utilizzate, il tipo delle
risposte da fornire
o Compilazione della stesura finale
 Gli elementi di prova andranno
disposti all’inteno di un fascicolo
 Tutti i quesiti dovranno essere
univocamente identificati
 Ogni quesito dovrà essere
presentato per interno all’iterno di
una pagina per evitare che lo
studente debba girare pagina
 I caratteri tipografici dovranno
essere sufficientemente grandi e
l’iterlinea adeguata
 La versione finale non dovrà
contenere errori
 Le informazioni di stato (anagrafica)
dovranno essere riportate in una
pagina iniziale
 Eventuali fogli di risposta dovranno
essere stampati e forniti agli studenti
o Somministrazione agli studenti
 Le procedure di somministrazione
saranno sempre le stesse ma
varieranno a seconda del tipo di
prova somministrata
• Prove oggettive di classe
• Prove di istituto
• Prove a livello nazionale
 Il tempo di esecuzione della prova
deve essere indicato nelle istruzioni
• In genere non bisognerebbe
superare i 60’
o Correzione delle prove
 La correzione prevede di
• Annotare in una tabella, sulle
righe il nome degli studenti e
sulle colonne la risposta data
ad ogni quesito
• Utilizzare le chiavi di
risposta per assegnare i

56 | P a g e
punteggi riportandoli nella
tavola di trasformazione
punteggi
• Bisognerà definire come
calcolare l’errore anche se
comunque non è importante
il singolo punteggio di ogni
studente ma è importante la
graduatoria che si verrà a
formare

Argomenti Vari
- I Punti z
o Costituiscono la più semplice modalità di standardizzazione dei
punteggi grezzi
o I punteggi grezzi si trasformano in base al punteggio medio e alla
variabilità del campione di cui il soggetto fa parte
o il punto z adatta il punteggio grezzo su una scala standard che
ha media 0 e deviazione standard 1
- I Punti T
o Consentono di ovviare all’inconveniente dei punteggi z negativi
si convertono i punti z in punti T, che hanno media 50 e
deviazione standard 10
- Il metodo Delphi
o E’ una tecnica usata per ottenere risposte ad un problema da un
gruppo (panel) di esperti indipendenti attraverso due o tre round,
gli esperti non si incontrano mai di persona. Dopo ogni round un
amministratore fornisce un anonimo sommario delle risposte
degli esperti e le loro ragioni. Quando le risposte degli esperti
cambiano leggermente tra i vari round, il processo è arrestato,
infine tra le risposte al round finale viene eseguita una sorta di media
matematica.
- Il Campione normativo
o Il gruppo di soggetti le cui risposte al test sono prese come termine di
riferimento per valutare quelle di qualsiasi altro soggetto che
successivamente sarà sottoposto a quel test si chiama campione
normativo.
- La scala likert
o E’ una tecnica per la misura dell'atteggiamento.
o Tale tecnica consiste principalmente nel mettere a punto un certo
numero di affermazioni (tecnicamente definite item) che esprimono
un atteggiamento positivo e negativo rispetto ad uno specifico
oggetto. La somma di tali giudizi tenderà a delineare in modo
ragionevolmente preciso l'atteggiamento del soggetto nei confronti
dell'oggetto.
o Per ogni item si presenta una scala di accordo/disaccordo,
generalmente a 5 o 7 modalità.

57 | P a g e
o Ai rispondenti si chiede di indicare su di esse il loro grado di accordo
o disaccordo con quanto espresso dall'affermazione.
o Questo metodo è applicabile sia per atteggiamenti di tipo
unidimensionale che multidimensionale (per cui sono necessarie
tecniche statistiche come l'analisi fattoriale o l'analisi delle
componenti principali).
- Il modello classico dei Test deriva dalla teoria della generalizzabilità e si
fonda sulla teoria dell’errore casuale e deriva dal lavoro effettuato dallo
psicometrica Charles Spearman. L’essenza di questa teoria si trova nella
scomposizione del punteggio ottenuto in un test in punteggio vero ed
errore casuale
o Quando misuriamo per, ottenere un valore empirico, c’è sempre
un errore connesso alla misurazione
o L’errore di misura è l’errore che si commette quando si utilizza un
campione per studiare le caratteristiche di un test
o I punteggi veri sarebbero i punteggi che si dovrebbero ottenere se
non intervenisse alcun errore casuale nella rilevazione
o Somministrando più volte lo stesso test agli stessi soggetti il loro
punteggio medio si avvicinerà sempre più al punteggio vero,
questo è il risultato della ripetizione, quindi un numero elevato di
ripetezione di un test. Nella ripetizione gli errori tendono ad essere
cancellati per via del teorema del limite centrale che sostiene che
quanto è maggiore il numero di applicazione di un test, su cui si
calcola la media, tanto minore è l’errore di misura e ciò perchè i
punteggi ottenuti in successive occasioni tendono a disporsi
intorno la punteggio vero per il fatto che il soggetto alcune volte
avrà punteggi superiori al punteggio vero e altre volte inferiori. I
valori quindi si distribuiscono intorno al punteggio vero del
soggetto quindi la deviazione standard dei punteggi veri di ciascun
soggetto indicherà l’affidabilità della misura che si trova all’interno di
uno strumento:
 se la deviazione standard è ampia allora la misura sarà
poco fedele altrimenti sarà relativamente affidabile

58 | P a g e
1) FASE 1

Progettare un esperimento per testare l' ipotesi che le classi solo femminili di matematica (a
differenza delle classi miste) aumentino le abilità matematiche delle adolescenti femmine. In
primo luogo, scegliere un disegno della ricerca: solo posttest o pretest-posttest. Decidere poi
le definizioni operative delle variabili indipendenti e dipendenti. Quindi, le procedure di
selezione dei progetti che utilizzano la procedura delle coppie abbinate e fanno una buona
scelta per la selezione della variabile corrispondente.

- Seleziono come popolazione tutte le classi 3 dei licei scientici del territorio Italiano
- Seleziono dalla popolazione, un campione ragionato di adolescenti femmine
- Casualmente seleziono metà del campione e lo inserisco nel gruppo sperimentale
delle sole femmine
- La rimanente metà la inserisco nel gruppo di controllo
- Assumendo che i due gruppi (sperimentale e di controllo) siano equivalenti in
termine di caratterische (es. ceto sociale, livello intellettivo...)
- Effettuo su entrambi i gruppi il pre-test in modo da rilevare le abilità matematiche
- Effettuo su entrambi i gruppi il post-test e verifico se sono avvenute delle differenze
di apprendimento
- La variabile dipendente risulta essere il punteggio ottenuto nel test di matematica
(prima e dopo)
- La variabile indipendente risulta essere l’assegnazione al gruppo sperimentale o meno

2) FASE 2

Progettare un esperimento di misure ripetute che indaga l'effetto dello stile di presentazione
della relazione sul voto ricevuto per la relazione. Utilizzare due livelli della variabile
indipendente: una presentazione "professionale" (carta di alta qualità, uso coerente di margini
e caratteri, tabelle e grafici accuratamente costruiti) e uno "stile non professionale" (carta di
media qualità, frequenti cambiamenti nei margini e caratteri, tabelle e grafici privi di etichette
adeguate). Creare una tabella che illustri il progetto sperimentale.

Ril 1 Ril 2 Ril 3 Ril 4 Ril 5 Ril 6 Ril 7 Ril 8 Ril 9 Ril 10 Media
Professionale 8 7 9 7 8 7.8
Non 5 6 6 7 7 6.2
Professionale

4) FASE 3

Il professor Melchiori ha condotto un test del gusto della vodka. Ogni partecipante
all'esperimento ha assaggiato prima 2 ml di Soplica, poi 2 ml di Zubruwka e infine 2 ml di
Wyborowa. L'assaggio di ogni marca diversa è stato seguito da una valutazione del gusto da
parte dei soggetti. Quali sono i potenziali problemi con questo progetto sperimentale e/o con
le procedure utilizzate? Rivedere la progettazione e le procedure per affrontare questi
problemi. Potreste voler considerare diverse alternative e pensare ai vantaggi e agli svantaggi
di ciascuna di esse.

Il problema è legato al fatto che gli assaggi succesivi al primo sono “alterati” dal gusto del
primo assaggio (effetto delle prove ed effetto maturazione)

59 | P a g e
Per ridurre gli effetti di cui soprta si potrebbe applicare la casualizzazione delle condizioni
sperimentali, prevedendo sei gruppi a cui vengono “randomizzati” l’ordine di assaggio della
vodka (vedi tabella), per ciascun tipo di vodka viene calcolata la media dei punteggi di
gradimento ottenuto dai 6 gruppi, la Vodka che risulterà preferita sarà quella che avrà
ottenuto la media più alta

Gruppo1 Gruppo2 Gruppo3 Gruppo4 Gruppo5 Gruppo6


Vodka1 Vodka1 Vodka2 Vodka2 Vodka3 Vodka3
Vodak2 Vodka3 Vodka1 Vodka2 Vodka1 Vodka2
Vodka3 Vodak2 Vodka3 Vodka1 Vodka2 Vodka1

60 | P a g e