Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Il presente file (in formato PDF) contiene le diapositive che, nel loro insieme, forniscono supporto visivo alle
lezioni del docente. Si raccomanda di NON considerare questo materiale alla stregua di un libro di testo! In
particolare è fortemente sconsigliata la stampa (su carta) di questo materiale. Alcune diapositive possono
essere presenti più volte in questo stesso insieme (doppioni), perchè questa sequenza di diapositive NON
rappresenta necessariamente l'ordine di utilizzo delle medesime a lezione. Inoltre, NON tutte le diapositive qui
riportate sono sempre utilizzate durante le specifiche lezioni dell'anno in corso...
!!! Si ricorda comunque che il presente materiale didattico non sostituisce i libri di testo !!!
Il presente materiale didattico é:
- utile per ripassare, ripensare e riflettere sugli argomenti trattati a lezione;
- utile per approfondire lo studio svolto sui libri di testo, consentendo di
confrontare modi diversi di presentare gli stessi argomenti e disponendo
di specifici esempi, commenti etc.;
- provvisorio e soggetto a continue revisioni e aggiornamenti;
- nella versione qui resa disponibile può risultare incompleto o di difficile lettura
in quanto alcune diapositive sfruttano caratteri, colori e/o animazioni
specifiche del software utilizzato (PowerPoint) che non sono altrimenti
riproducibili.
Lezioni di Teoria e Tcniche dei Test del prof. Renato Miceli (a.a. 2011-2012)
UNIVERSITA' DEGLI STUDI DI TORINO
Per il Corso di Laurea Triennale in: Scienze e Tecniche Psicologiche
DIPARTIMENTO DI PSICOLOGIA
OTTOBRE 2011 prof. Renato Miceli
Questionari e test; dalle proprietà alle variabili (cenni di teoria dei dati)
vettori e matrici; algebra delle sommatorie e delle produttorie
Il corso è articolato in due Moduli per un totale di 20 lezioni (3 h. ciascuna); la successione degli
argomenti trattati è soggetta al criterio di propedeuticità: in generale lo svolgimento del Primo
Modulo è propedeutico allo svolgimento del Secondo. Si consiglia pertanto una frequenza assidua.
ll corso fornisce le conoscenze teoriche e metodologiche iniziali per la realizzazione e l'utilizzo critico dei test psicologici.
Il contesto generale di riferimento è quello della Teoria Classica dei Test (T.C.T.) accompagnato da brevi cenni sugli
sviluppi più recenti della Item Response Theory (I.R.T.).
Il primo modulo è prevalentemente dedicato all'acquisizione (e/o ripasso) degli elementi di matematica e statistica
indispensabili per lo studio dei processi di misurazione in psicologia e allo studio della Teoria Classica dei Test;
il secondo modulo si concentra prevalentemente sugli aspetti applicativi dei test psicologici (scopi, uso, modalità di
somministrazione, deontologia, interpretazione dei punteggi, etc.)
Bibliografia di base
(a) L. PEDRABISSI, M. SANTINELLO, I test psicologici, Il Mulino, Bologna, 1997 (Escluso il capitolo 9).
(b) R. SARTORI, Psicologia Psicometrica, LED, Milano, 2008 (Cap. 2, 3; pag. 15-57).
L'esame è orale. Una parte, anche consistente, di domande (del tipo a "scelta multipla") potrà essere
formulata in modalità scritta (correzione, valutazione e validità saranno contestuali).
Gli studenti degli anni precedenti possono portare all'esame il programma dell'anno di riferimento;
l'esame è orale
Il ricevimento studenti si svolge (di norma) il giovedì pomeriggio (h. 15-17) previo
appuntamento tramite e-Mail all'indirizzo: g.molinengo@univda.it oppure: renato.miceli@unito.it
Primo modulo (La Teoria Classica dei Test e i suoi fondamenti ) prof. Renato Miceli
• Questionari e test; dalle proprietà alle variabili (cenni di teoria dei dati)
Vettori e matrici; algebra delle sommatorie e delle produttorie
Teoria dei livelli di scala
Distribuzioni empiriche; operatori di tendenza centrale e di dispersione
Teoria della probabilità (cenni); principali distribuzioni di probabilità e loro proprietà
La logica della decisione in statistica, test sulle ipotesi
Principali misure di relazione bivariata
La Teoria Classica dei Test (attendibilità e validità)
Cenni introduttivi alla Item Response Theory
Secondo modulo (La Teoria Classica dei Test: aspetti applicativi) dott.sa Giorgia Molinengo
EQUANIMITA'
STESSO
DOCENTE
Interrogazione ? Test
DOCENTI
DIVERSI
PROCEDURA
PROFESSIONALITA' IMPERSONALE
Questionari e test (3 / 9)
Una stessa domanda può essere posta in molti modi diversi e il modo di porla (il fraseggio) influenza le risposte
Una stessa domanda, posta nello stesso modo può essere compresa in modo diverso da gruppi di persone diversi
Ad una stessa domanda si può rispondere in maniera diversa in funzione del contesto definito dal questionario
Gli effetti dovuti al contesto sono stati studiati tramite la messa a punto di un ampio disegno Un esempio...
sperimentale in cui una domanda sull'interesse delle persone per la politica (negli U.S.A.)
veniva posta agli intervistati prima e dopo altre domande (Zammuner V. L., 1996, pp. 87-93);
(l'esempio qui presentato è una semplificazione)
Etc.,etc., ...
Questionari e test (4 / 9) Esempio di distorsione indotta dal contesto: la stessa domanda viene posta nell'ambito dello stesso questionario
prima e dopo la domanda (B) contestualizzante...
2 DOMANDE
DOMANDA "A" DOMANDA "B" (B) contestualizzante;
costringe gli intervistati a
riflettere su un comportamento
<<Alcune persone seguono le vicende politiche la maggior parte che concretamente denota
del tempo anche quando non ci sono elezioni imminenti, interesse per le vicende politiche
mentre altre persone non sono molto interessate alla politica.
Lei direbbe di seguire le vicende politiche: <<Si ricorda come ha votato il suo rappresentante presso il Parlamento
(1) la maggior parte del tempo; in una o due leggi che siano state discusse negli ultimi due anni?
(2) in modo abbastanza frequente; (1) Si;
(3) solo qualche volta; (2) No.
(4) quasi mai>> Se si, quale legge ....... come ha votato .... >>
Campione 1
A_B
analogamente rappresentativi
della stessa popolazione 2 CAMPIONI (Diverso ordine di presentazione)
(anche se di numerosità diversa)
Campione 2 B_A
RISULTATI: Risposte alla domanda "A" (interesse per la politica)
<<I dati non esistono al di fuori delle operazioni che il ricercatore compie in rapporto a un
determinanto quadro di riferimento teorico>>
<<I cosiddetti "dati" non crescono nei prati e i ricercatori non li raccolgono, essi sono
piuttosto "costruiti" dal ricercatore stesso attraverso procedure di interpretazione e di
attribuzione di significato>>
trascrizione (su un qualche
Qualche definizione: definisce una qualche supporto) di un "fatto"
caratteristica dell’entità (risultato di un PROCESSO DI
(Oggetto) sotto osservazione DATO RILEVAZIONE)
CONCETTO, (Idea),
COSTRUTTO TEORICO,
TRATTO, PROPRIETA' insieme di REGOLE (algoritmo,
procedura) che governa la
rilevazione e che permette di
evento semplice, asserto rilevare lo STATO di un oggetto VARIABILE..
descrittivo intersoggettivamente DEFINIZIONE (o caso) rispetto ad una
FATTO condiviso (il valore segnato dalla OPERATIVA proprietà (trasformando
lancetta della bilancia; l'osservazione in un "fatto")
il contenuto del documento
amministrativo; la risposta
scritta sul foglio di carta; etc.)
<< [oggettività nella scienza] ... non
implica che lo scienziato si
distacchi freddamente dall’oggetto
dei suoi studi, né che egli tratti la
gente come oggetti anziché come
CONCETTO DATO persone. Essa non comporta
neppure che ciò che lo scienziato
osserva sia ciò che realmente
accade. Oggettività significa che
delle persone, che avessero
guardato sopra la spalla dello
ENTITA' (OGGETTO) STATO dell'OGGETTO scienziato mentre faceva
sotto osservazione (rispetto alla proprietà) l’osservazione,
avrebbero visto le stesse cose>>
(McBurney D.H., 1983, p.19).
DEFINIZIONE OPERATIVA
Questionari e test (6 / 9)
grandezza, generalmente indicata con una delle ultime lettere dell'alfabeto (x, y, z),
che può assumere tutti i valori appartenenti a un determinato insieme e che
rappresenta in generale tutti gli elementi di tale insieme
VARIABILE...
MUTABILE
sequenza ordinata e codificata di rilevazioni (osservazioni) vettore (colonna) di una matrice dati
PIU' entità in PIU' archi temporali PIU' entità in UN arco temporale (processo SINCRONICO)
T0 T1 T2 ..... statura
A ...
Renato 1.75
xA,0 xA,1 xA,2
Maria 1.63
B xB,0 xB,1 xB,2 ...
Giuseppe 1.94
C xC,0 xC,1 xC,2 ... .......... ......
un esempio...
Relazione ASIMMETRICA di APPARTENENZA (ad una classe di equivalenza) Relazione ASIMMETRICA di DOMINANZA [se = 1]
CxV D1, D2, D3, ... Domande Likert S1, S2, S3, ...
Stimoli Test
Tratto da:
R. Miceli, "Gli abitanti della valle del Lys e il rischio idrogeologico",
Indagine psico-sociologica, 2006 (N = 407)
Questionari e test (9 / 9) Inoltre le matrici elementari si distinguono...
DERIVATE MACRO
(frequenze; conteggi)
(esempio : f12 2)
Ident X Y (esempio : f 21 0)
1 1 2 X \ Y 1 2 .. K Tot.
2 1 2
L'algebra delle sommatorie e delle
1 f11 f12 .. f1K f1+
3 1 1 produttorie
(unitamente all'algebra della matrici)
4 2 3 2 f21 f22 .. f22 f2+ sono strumenti utili per operare su
tali
5 3 1 "strutture di dati"
... .. .. .. .. ...
6 3 3
7 H K H fH1 fH2 .. fHK fH+
… … …
Tot. f+1 f+2 .. f+K f++
N ... ...
Algebra delle sommatorie e delle produttorie (vettori)
1 1 N
x1
x
media aritmetica =
N
x1 x2 x3 x... x N x N
x
i 1
i
2
x x3 1
N
i
N
xq 1 N
2
2
x2 x 2 1 N
x sx
N
i 1
xi
N i 1
2
i
N
i 1
xi x
scarto quadratico medio
media quadratica quadrato della media media dei quadrati (deviazione standard)
x
N
In assenza di ambiguità (quando è superfluo...)
x
i 1
i i
Algebra delle sommatorie (alcune proprietà)
N
(1) c N c
i 1
(2) c x i c xi
(3)
x y z x y
i i i i i zi
(4) x y x 2
y 2
2 x y
i i i i i i i i 2 xi yi
2
x 2
y 2
x x x
N N N N
x 2 x xi x N x 2 x xi
2 2 2 2 2
(5)
i i i
i 1 i 1 i 1 i 1
Più indici (contatori) Matrici (sommatorie e produttorie) La TABELLA DI CONTINGENZA riporta le frequenze di N individui
sottoposti a due trattamenti (T1 e T2)
con, rispettivamente, H e K modalità
Id T1i T2j
1 1 1 Freq. y 1 .......... K Totale
2 1 1 (T1 / T2)
3 1 1 K
f11 f1 j f1 K f1 f1 j
4 1 2
1
j 1
5 1 2
6 1 2 K
...
1
...
....... f i1 f ij f iK f i f ij
... 1 K j 1
... 2 1
K
... 2 1
... 2 2
H fH1 f Hj f HK f H f Hj
j 1
... 2 2
... 2 2 H
f 1 f i1
H H H K
f f ij
... 2 3
Totale f j f ij f K f iK
i 1 i 1 j 1
i 1 i 1
... 2 ...
... 2 K
... ... ...
...
...
...
f N
N H K
Livelli di scala delle variabili (1 / 8)
Il processo di rilevazione può seguire quattro percorsi...
... producendo VARIABILI DIVERSE per quanto riguarda il loro LIVELLO DI SCALA (caratteristiche formali) ...
(Stevens, 1946; Torgerson, 1958; Galtung, 1967; Krantz, Luce e altri, 1971; Conti, 1972; Marradi, 1984; Ricolfi, 1985; Miceli, 2001)
NON-ORDINATE
ORDINATE
(sconnesse)
Intesa come:
(4) MISURAZIONE => modalità di rilevazione quando si dispone di uno strumento e di una unità
=> processo di misura quando si costruisce lo strumento e si definisce l’unità
Livelli di scala delle variabili (2 / 8)
Teoria della
Il PROCESSO DI RILEVAZIONE misurazione
stabilisce una relazione ...
ELEMENTI ELEMENTI
SISTEMA EMPIRICO SISTEMA NUMERICO
(tratti o dimensioni)
Matrice dati
ID x z y w q
(Genere) (Graduatoria) (punti al test) (reddito) (N° romanzi)
A M 2 80 4 3
B M 6 20 2 0
C F 3 40 0 1
D M 1 45 3 4
E F 4 70 6 6
.... .... .... .... .... ....
B M B 1 1
trasformazione ammessa TRANSCODIFICA
C F (restano costanti le "diversità") C 0 2
D M D 1 1
E F E 0 2
Y'' (4.38-2.30) / (4.38-3.69) = 2.08 / 0.69 = +3.01 (4.38-2.30) / (2.30-3.69) = 2.08 / (-1.39) = -1.50 NO!
Livelli di scala delle variabili (6 / 8)
LIVELLO DI SCALA INTERVALLI (SCALA DI INTERVALLI)
Si dispone dei dati relativi alla temperatura media, in gradi Fahrenhheit (F), registrata nella citta X,
durante il GIORNO e la NOTTE, in due stagioni: ESTATE e INVERNO...
Dati F°
A ESTATE - GIORNO 86.0 (A – B) / (C –D)
B ESTATE - NOTTE 50.0
C INVERNO - GIORNO 46.4
86.0 50.0 46.4 39.2 36.0 7.2 5
D INVERNO - NOTTE 39.2
Conversione C°
unità di misura
(A – B) / (C –D)
A ESTATE - GIORNO 30
B
C
ESTATE - NOTTE
INVERNO - GIORNO
10
8
30 10 8 4 20 4 5
D INVERNO - NOTTE 4
Livelli di scala delle variabili (7 / 8) LIVELLO DI SCALA RAPPORTI (SCALA DI RAPPORTI) 1 € = 1.32 $; 1 $ = 0.76 €
(migliaia di $)
ID w Confronti ammessi: SI
ID w'
(reddito)
A/ B; A / C; B / C; etc... w'=0.76*w
(migliaia di €)
A 3.04
A 4 trasformazione ammessa
DILATAZIONE B 1.52
B 2
(restano costanti i rapporti)
C 0
C 0
D 3 w b w ; dove : b 0 D 2.28
E 4.56
E 6
.... ....
.... ....
Scala di rappporti
Scala di intervalli
Scala di differenze Variabili
Quantità cardinali
o VARIABILI
L quantitative CONTINUE
Scala assoluta O
o METRICHE
I conteggio
Ordinamenti
V
Ranghi Scala
o
E Gradi
ordinale
VARIABILI
DISCRETE
Attribuzione a
L categorie ordinate
L
Categorie Variabili
o categoriali
I Classi Scala nominale Politomiche
Dicotomiche
o Dummy o Booleane
Modalità
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
dispersione)
K K
VARIABILI CATEGORIALI (distribuzioni di frequenza)
F
k 1
k N f k 1
k 1
==> Distribuzione di frequenze (variabile categoriale con K classi) K
=> ASSOLUTE Fk
=> RELATIVE (o proporzioni) fk = Fk / N
p k 1
k 100
Classi di età
LIMITI TABULATI --- LIMITI VERI
Cumulative Cumulative
ETA Frequency Percent Frequency Percent 18 27 17.527.5 17.5 età 27.5
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
18-27 73 14.6 73 14.6
28 37 27.537.5 27.5 età 37.5
28-37 114 22.8 187 37.4 38 47 37.547.5 37.5 età 47.5
38-47 145 29.0 332 66.4
48-57 76 15.2 408 81.6
48 57 47.557.5 47.5 età 57.5
58-67 82 16.4 490 98.0 58 67 57.567.5 57.5 età 67.5
68-80 10 2.0 500 100.0
68 80 67.580.5 67.5 età 80.5
limiti fk
k tabul. veri fk ak dk dk
---------------------------------------------------------- ak
1 18 27 17.527.5 73 10 7.300
2 28 37 27.537.5 114 10 11.400
3 38 47 37.547.5 145 10 14.500
4 48 57 47.557.5 76 10 7.600
5 58 67 57.567.5 82 10 8.200
6 68 80 67.580.5 10 13 0.769
FREQUENZA
AMPIEZZA
DENSITÁ
=> MODA = il livello della variabile che ricorre con maggiore frequenza;
=> MEDIANA = il livello cui appartiene il caso al di sopra e al di sotto del quale sta il 50% dei casi;
1 N
=> MEDIA ARIT. = il livello che rappresenta il "centro di gravità" della distribuzione; x xi
N i 1
MODA:
Modificando l'ordine delle modalità ==>
Diploma Diploma
conseguito f % conseguito f %
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
LICEO 216 54.0 <== MODA PROFESS. 123 30.8
PROFESS. 123 30.8 ALTRO 61 15.3
ALTRO 61 15.3 LICEO 216 54.0 <== MODA
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
dispersione)
ident xi ni ident xi
a 5 1 b 3
b 3 2 a 5
11 1
c 9 3 c 9 i 6
4 e 12
2
d 34
h 17 8 f 23
i 24 9 i 24
l 31 10 l 31
m 15 11 d 34
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
dispersione)
Intervallo: N N
(b) Variabile continua; N pari i 1
==> si ordinano gli elementi del vettore; 2 2
==> si individua l'intervallo i-esimo in cui cade;
==> il valore della mediana si ottiene per "interpolazione"
xN xN
1
Me 2 2
2
ni ident xi
6 6 x 3 x 4 8 12
1 a 1 i 1; 3 i 4 Me 10
2 2 2 2
2 b 5
}
3 c 8
La mediana (Me=10) è compresa fra il valore 8 e 12
4 d 12
5 e 23
6 f 35
(c) Variabile discreta (raggruppata in classi):
==> si individua la classe mediana o l'intervallo mediano;
==> il valore della mediana si ottiene per "interpolazione"
N
Finf dove (con riferimento alla classe mediana) :
Me Linf 2 m Linf limite inferiore; fm frequenza;
fm ωm ampiezza; Finf freq. cumulata;
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
dispersione)
x1 x 2 x 3 ... x n 1 N
Variabili cardinali MEDIA ARITMETICA: x xi
N N i 1
Principali proprietà:
N N 2
(1) x
i 1
i x 0 (2) x
i 1
i x min
La somma dei QUADRATI DEGLI SCARTI da qualunque valore (a media arit.) è più grande
1
1 N r Per r = 1 ==> ARITMETICA
Me x1 200 ;
3 200 200
x1 200 ;
4 300 300
5 250 250
x 2 180.2 ; Me x 2 200 ;
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
dispersione)
Definizioni:
RANGO = numero che esprime la posizione di un valore osservato (o punteggio) nell'ambito
dell'insieme, serie o vettore ORDINATO(!) cui il valore osservato appartiene;
QUANTILE = il valore osservato del vettore ORDINATO (MINMAX) che corrsiponde ad una
qualsiasi suddivisione in parti dei dati (es: quartili, decili, centili)
(PER)CENTILE = il QUANTILE (quando la suddivisione è operata su 100 parti); in tal modo l'm-esimo
percentile corrisponde a quel valore osservato, del vettore ORDINATO (MINMAX),
al di sotto del quale cade l'm-esima percentuale dei valori osservati
!! ATTENZIONE !!
il RANGO PERCENTILE di un valore osservato (o punteggio) è una percentuale
un QUANTILE o PERCENTILE è un valore osservato (o punteggio) del vettore di dati
Per esempio:
se il risultato ottenuto da Pierino ad un test è superiore a quello dell'80% degli altri individui,
diremo che Pierino occupa l'80° rango percentile (ovvero l'80% degli inividui sottoposti al test ha
ottenuto una prestazione peggiore);
l'80° percentile (P80) nella serie di punteggi prodotti dalla somministrazione del test (cui Pierino ha
partecipato) è – per esempio – il valore (o punteggio): 33
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
dispersione) Attribuzione del RANGO: esempi
senza "pareggi" 10 individui sottoposti al test (x1) di abilità verbale con "pareggi"
RANGO (TIES=HIGH)
N_PROG IDENT x1 RANGO
1 a 15 7 RANGO (TIES=LOW)
2 b 8 10
N_PROG IDENT X1 RANGO RANGO RANGO
3 c 10 9
1 a 5 9.5 9 10
RANGO (TIES=MEAN)
4 d 12 8
2 b 8 7.0 7 7
5 e 19 4
3 c 10 6.0 6 6
6 f 23 2
4 d 12 5.0 5 5
7 g 24 1
N_PROG IDENT X1 RANGO
5 e 19 4.0 4 4
8 h 17 6
9 i 21 3 1 g 24 1 6 f 23 2.0 2 2
10 l 18 5 2 f 23 2 7 g 24 1.0 1 1
3 i 21 3 8 h 6 8.0 8 8
4 e 19 4 9 i 21 3.0 3 3
5 l 18 5 10 l 5 9.5 9 10
Ordinando in funzione
6 h 17 6
del RANGO
(R1Vmax) 7 a 15 7
8 d 12 8
9 c 10 9
10 b 8 10
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
dispersione) Calcolo dei QUANTILI: esempi
10 individui sottoposti al test (x1) di abilità verbale
Quartili
N_PROG IDENT x1
1 1
1 a 15 Q1 ?; N i N 1; 2.5 i 3.5; ... cioè ... i 3; Q1 12;
2 b 8 4 4
3 c 10
xN xN
4 d 12
2 2 1 x 5 x 6 17 18
5 e 19
Q2 Me ?; N i N 1; 5 i 6; Q2 Me 2 2
17.5
4 4 2 2 2
6 f 23
7 g 24
3 3
8 h 17 Q3 ?; N i N 1 ; 7.5 i 8.5;....i 8; Q3 21;
9 i 21 4 4 (output SAS )
10 l 18 Percentili In generale, l'm-esimo percentile SAS System
è dato da: Univariate Procedure
(N < i < N+1 per N pari)
Variable=X1
N Moments
Ordinando: MINMAX
Pm x i ; dove : i m Pertanto...
100 N 10 Sum Wgts 10
Mean 16.7 Sum 167
10 8 0.5 2.5 10 8 2
RC 100 100 25 RC 100 100 22.2 23
10 10 10 1 9
L'individuo "d" (punteggio=12) occupa il 23° (25°) rango percentile nel test X1;
ovvero:
la sua prestazione è SUPERIORE a quella del 25% (circa) e INFERIORE a quella del restante 75%
10 individui sottoposti a test (x1) di abilità verbale e (x2) di abilità logica; ci si chiede:
Ranghi
=> l'individuo "h" ha conseguito un risultato(relativamente) migliore al test 1 o 2 ? (R1Vmax)
=> l'individuo "c" ha conseguito un risultato (relativamente) migliore al test 1 o 2 ?
4 d 12 8 11 4
Formula 1 (Galton-Ferguson):
5 e 19 4 14 2
6 f 23 2 10 5
7 g 24 1 12 3 N G 0.5
8 h 17 6 6 9 RC 100
9 i 21 3 5 10 N
10 l 18 5 9 6
10 6 05
la prestazione di "h" si è collocata al di sopra del 45% degli
X1 Rc " h" 100 45 altri risultati nel test X1 e al di sopra del 15% nel test X2.
10 L'individuo "h" ha conseguito un risultato relativamente
10 9 05
X2 Rc " h" 100 15 migliore nel test X1 (dove ha anche conseguito un punteggio
10 più elevato)
COEFFICIENTE DI VARIAZIONE
(In genere, come qui, viene moltiplicato per 100;
I valori di varianza e deviazione standard esprime così
dipendono dall'unità di misura! LA PERCENTUALE DI VARIABILITA’ per ogni
UNITA’ DI VALORE MEDIO)
s
ID Gr. yi
CV 100
1 A 0.001
y A 0.4405 x
2 A 0.013
2
3 A 0.998
s A 0.1935 0.4399
4 A 0.753
s 0.4399 CV 100 99.86
5
6
A
A
0.005
0.873
A 0.4405
ID Gr. yi
1 B 25 y B 50.0000 23.2737
2 B 30 2 CV 100 46.55
3 B 35 sB 541.667 50.0000
4 B 50
s 23.2737
5 B 70
B
6 B 90
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
dispersione)
6 individui sono stati sottoposti ad un test di abilità matematica (x) e ad un test di abilità verbale (y);
ci si chiede, ad esempio:
Andrea risulta più bravo al test di matematica o a quello di verbalizzazione ?
Stessa domanda per Petra
IDENT X Y
x 57.83 y 71.33
Marco 52 60
Diana 53 63 s x 4.49 sy 9.25
Andrea 56 65
Petra 60 75
Il confronto è reso disagevole dal fatto che si hanno medie e
Luca 62 80
deviazioni standard diverse (o diverse unità di misura)
Simona 64 85
IDENT Zx Zy
Marco -1.30 -1.22
xi x
In generale... zi ; per : 1i N Diana -1.08 -0.90
1 N
1 N
1 N
xi ; xi x ; i
2
SONO TUTTI VALORI MEDI ...
concetto più generale: "MOMENTO"
x s 2
x
2
x 2
N i 1 N i 1 N i 1
Un momento è sempre la media fra prodotti i cui fattori hanno esponenti interi.
• L’ordine del momento è definito dal numero di fattori, ciascuno preso con il proprio esponente
• I prodotti possono coinvolgere 1 o più variabili
• I prodotti possono essere ottenuti sui valori grezzi o sugli scarti dalla media
grezzi scarti 1 N
M
N
z 1 ;
i 1
i
omogenei omogenei
1 variabile (non-centrali o centrali (o OMOGENEI
1 N
x 1
rispetto origine) rispetto media)
RISPETTO
ORIGINE
per z x i
misti
N i 1
misti
variabili centrali
1 N
per z xi x
i
OMOGENEI
CENTRALI x x 1
RISPETTO MEDIA N i 1
Esempio: x’ = [1.0 2.0 3.0 4.0 4.5 5.0 5.5] N=7
Momenti omogenei
grezzi (intorno origine) centrali (intorno media)
1 N 1 N
1 x i 1 3 .57 1 ( xi x) 1 0
N i 1 N i 1
1 N 2 1 N
2 x i 1 15 .07 2 ( xi x) 2 1 2.32
N i 1 N i 1
1 N 3 1 N
3 x i 1 68 .93 3 ( xi x)3 1 1.44
N i 1 N i 1
1 N 4 1 N
4 x i 1 329 .16 4 ( xi x) 4 1 9.81
N i 1 N i 1
32
1 3 ;
1.44
2
2.07
0.17 1 0.17
Pearson ==>
2 2.32 12.49
3
CON IL SEGNO DEL
MOMENTO TERZO
CURTOSI:
4 9.81 9.81
2 ; 1.82
22 2.322
5 . 38
2 2 3 1.82 3 1.18
Misure di CURTOSI Esempio: x’ = [1.0 3.3 3.4 3.5 3.6 3.7 3.8 5.0] N=8
ASIMMETRIA:
32
1 3 ;
1.24 1.54
2
1.22 1.22
2 1.08 1.26
3
==> La riflessione filosifica sul concetto di "probabilità" è successiva alla sua trattazione
matematica che nasce nel 1654 (Pascal; Fermat);
==> Approfondimenti:
Ian Hacking, 1975, L'emergenza della probabilità, Milano Il Saggiatore;
Paolo Vinais, 1999, Nel crepuscolo della probabilità, Torino, Einaudi.
==> Tre concezioni teoriche (le prime due convergono tecnicamente):
(1) FREQUENTISTA [Bernulli (1654-1705)]: La probabilità è una cartteristica complessiva di una serie infinita
(indefinitamente numerosa) di eventi ripetibili. (<<<< definizione: ex-post o empirica)
fi
Es.: E1 = "evento faccia 1 del dado" PE1 lim
N N
(2) CLASSICA [Pascal (1623-1662); Laplace (1749-1827)]: La probabilità è definita come rapporto fra casi
favorevoli e casi equamente possibili. (<<<< definizione tautologia: ex-ante o teorica)
1
Es.: k = "numero eventi equamente possibili" PE1
k
(3) SOGGETIVISTA [De Finetti (1906-1985)]: La probabilità è definita come rapporto (quota di scommessa) fra
rischio e guadagno. (<<<< implica soggetto razionale posto in condizioni olimpiche - Simon - di conoscenza)
r
Es.: r = "somma giocata"; t = "somma vinta" PE1
t
Fenomeno (esperimento):
==> aleatorio (casuale): lancio una moneta e non posso dire (con certezza) su quale faccia cadrà.
Dato un insieme degli eventi è possibile definire ==> L'INSIEME DELLE PARTI (B) ; l'insieme, cioè, dei possibili
eventi semplici e complessi associati a
Es.: spazio probabilistico di una moneta
T , C;
B 0 , T , C , TC
EVENTO IMPOSSIBILE EVENTO CERTO
(nè testa, nè croce) (testa oppure croce)
probabilità (cenni)
Teoria della probabilità
E AB Si legge "INTERSEZIONE" indica un elemento che appartiene SIA ad A SIA a B
ASSIOMI E AB Si legge "UNIONE" indica un elemento che appartiene ad A OPPURE a B
1) (definizione di evento) Gli eventi sono sottoinsiemi di uno spazio e formano una classe additiva;
2) Ad ogni evento è assegnato un numero reale positivo, detto probabilità dell'evento, indicato con: P(Ei), tale che:
0 PEi 1
3) La probabilità dell'evento certo è 1;
4) (della probabilità totale o della somma) Se Ei ed Ej sono eventi incompatibili (disgiunti) dello stesso spazio
i j
probabilistico, allora: P E E P E P E
i j In termini formali, quando due
Ei E j 0
eventi sono incompatibi si ha che:
1 1 1 3 1
P P E2 P E 4 P E6
6 6 6 6 2
P0 0;
P E 1 PE ;
Dai precedenti assiomi si ricava anche:
Esempio:
Studenti di psicologia (III anno); si sa che: 91% ha superato "Generale"; 40% ha superato "Psicometria";
35% ha superato entrambi. Estraendo a sorte uno studente qual è la probabilità che abbia superato uno
dei due esami ("Generale" OPPURE "Psicometria") ?
=> Superato "Generale" OPPURE "Psicometria" ===> P = 0.91 + 0.40 - 0.35 = 0.96
probabilità (cenni)
Teoria della probabilità
... DA 1 EVENTO A ... 2 EVENTI ... Concetto di => INDIPENDENZA STOCASTICA: due eventi A e B si dicono
stocasticamente indipendenti se la Prob. di B non è influenzata
dall'avverarsi di A (o viceversa).
Esempio (NON INDIPENDENZA): estrarre il re di denari da un mazzo di 40 carte in 2 estrazioni senza reimmissione;
=> alla prima estrazione la Prob. è 1/40; se l'evento non accade e non si reintroduce la carta estratta, alla seconda
estrazione la Prob. è 1/39. L'evento B (alla seconda estrazione) non è stocasticamente indipendente da A (alla prima)
e si indica: P(B|A) = 1/39 = 0.026
probabilità (cenni)
Teoria della probabilità
ESEMPI ed ESERCIZI ... 1 1
0.25
2 2 0 (ZERO)
Prob. di ottenere "T" e "T" lanciando 2 monete non truccate
Lanciando un dado (6 facce) definiamo i seguenti eventi: "A" = uscita numero pari; "B" = uscita numero 5;
Calcolare la probabilità esatta dell'evento: "A" e "B".
Calcolare la Prob. di ottenere 7 lanciando due dadi (numerati a 6 facce e sommando i valori delle due facce)
Vi sono 6 combinazioni di valori possibili; ognuna ha prob. 1/36; 6*(1/36) = 1/6 = 0.1666666
Calcolare la Prob. di fare "13" giocando una sola colonna al totocalcio (1; x; 2)
13
3 simboli; Prob.: 1 1
0.000000627 6.27 E 07 6.27 10 7
1/3* 1/3*1/3* ...... =
3 1594323
probabilità (cenni)
Teoria della probabilità
Dati due insiemi non vuoti A e B, si chiama funzione
di A in B una qualsiasi legge che fa corrispondere ad
ogni elemento x di A, uno e un solo elemento y di B
Il concetto di "funzione"
yi f ( xi )
B A
Attenzione!
x è un elemento di A;
f(x) è un elemento di B;
f è un ente matematico diverso sia da x, sia da f(x); f è la legge che associa all'elemento x di A, l'elemento f(x) di B.
Spesso però si dice <<...la funzione f(x) >> invece di dire <<...la funzione f >>
indicando così sia la funzione, sia il valore da essa assunto in x
Il concetto di "funzione"
yi xi Rappresentazioni di una funzione
yi 0 1 xi Obs
1
y
-3
x
-3
2 -2 -2
3 -1 -1
4 0 0
5 1 1
6 2 2
7 3 3
i 3 2 xi
yANALITICA GRAFICA TABULARE
Obs y x
1 5 -1
2 3 0
3 1 1
4 -1 2
5 -3 3
6 -5 4
Il concetto di "funzione"
Rappresentazioni di una funzione
yi x 4 xi 2
2
Obs y x
Obs y x
1 -1.00 -2.0
1 14.00 -2.0 2 -0.16 -1.9
3 0.57 -1.8
3 7.00 -1.0 4 1.19 -1.7
5 1.70 -1.6
6 2.13 -1.5
5 2.00 0.0 7 2.46 -1.4
8 2.70 -1.3
7 -1.00 1.0 9 2.87 -1.2
10 2.97 -1.1
9 -2.00 2.0 11 3.00 -1.0
12 2.97 -0.9
11 -1.00 3.0 13 2.89 -0.8
14 2.76 -0.7
13 2.00 4.0 15 2.58 -0.6
16 2.38 -0.5
15 7.00 5.0 17 2.14 -0.4
18 1.87 -0.3
17 14.00 6.0 19 1.59 -0.2
20 1.30 -0.1
21 1.00 0.0
22 0.70 0.1
23 0.41 0.2
24 0.13 0.3
25 -0.14 0.4
26 -0.38 0.5
27 -0.58 0.6
28 -0.76 0.7
29 -0.89 0.8
30 -0.97 0.9
31 -1.00 1.0
32 -0.97 1.1
33 -0.87 1.2
34 -0.70 1.3
yi x 3 3 xi 1 35
36
37
-0.46
-0.13
0.30
1.4
1.5
1.6
38 0.81 1.7
39 1.43 1.8
40 2.16 1.9
41 3.00 2.0
Il concetto di "funzione"
Funzioni empiriche E' stata rilevata l'abilità logica (x) e il grado Obs y x
di comprensione di testi in lingua italiana (y) 1 -4.0 -10
in una classe di 21 allievi.
yi f ( xi ) 2 -2.5 -9
E' possibile stabilire
una "legge" che metta yi a b xi a ? ;b ? 3 3.0 -8
16 5.5 5
17 10.0 6
R 2 0.62 18 6.5 7
19 8.0 8
20 5.5 9
21 6.0 10
Il concetto di "funzione"
Principali distribuzioni di probabilità e loro proprietà - Il concetto di: VARIABILE CASUALE (ALEATORIA)
==> Una variabile casuale è un'applicazione "x" che trasforma gli eventi (di uno spazio ) in eventi
numerici cui è associata una probabilità;
... si tratta cioè del risultato dell'attribuzione ad ogni punto dello spazio campione di un NUMERO
REALE che rappresenta l'immagine numerica degli eventi.
Ident. N°
Es.: a 4 individui si chiede di comunicare il numero di figli; si ottiene... figli
a 2
L'immagine numerica dei 4 individui è data da 3 valori:
b 3
c 3
2 3 4 <====== immagine numerica
d 4
----------------------------------
a bc d <====== eventi
Dato che ad ogni "punto" o elemento dell'immagine 2 accade 1 volta su 4 ---------- 1/4 = 0.25
numerica può essere associata una probabilità di 3 accade 2 volte su 4 ----------- 2/4 = 0.50
accadere, si avrà che: 4 accade 1 volta su 4 ----------- 1/4 = 0.25
==> Per definire x come variabile aleatoria abbiamo implicitamente definito una FUNZIONE di
PROBABILITA', cioè una LEGGE di DISTRIBUZIONE che permette di stabilire la misura
dell'incertezza con la quale la variabile casuale x può assumere i suoi valori.
(Una variabile casuale è una funzione che associa PROBABILITA' ai valori numerici ......)
1) DISCRETE; se i valori numerici che può assumere solo discreti (es.: N° di figli)
2) CONTINUE; se possono assumere un qualsiasi valure numerico in un dato intervallo dei numeri reali (-; +)
==> Per una v.c. discreta è sempre possibile assegnare ad ogni valore una probabilità
non nulla tale che la somma delle probabilità sia uguale a 1.
==> Per una v.c. continua è matematicamente impossibile assegnare probabilità non nulle
a tutti i punti dell'intervallo e soddisfare la condizione di somma uguale a 1
Es.: Statura pari a 1 mtero e 756 millimetri (1.756); anche se si osservano molti individui con una statura compresa fra 1.750 e 1.760 è del
tutto verosimile che si potrebbe NON osservare mai l'esatto valore 1.756;
Così, se la v.c. è continua la probabilità che essa assuma un determinato valore può essere
nulla, anche se l'evento non è impossibile ...
==> Per ovviare alla difficoltà si definisce la probabilità in un intervallo infinitesimo
(x; x+dx) e si definisce P(x) la probabilità che la v.c. x cada nell'intervallo infinitesimo dx.
(in generale ad ogni evento è associata una probabilità del suo verificarsi e tale
probabilità assume una distribuzione ben precisa)
==> Quando gli eventi possono assumere soltanto due valori (giusto /sbagliato) e si tratta di eventi
INDIPENDENTI e RECIPROCAMENTE ESCLUDENTESI, allora la distribuzione teorica di
probabilità è quella BINOMIALE
Se p = Prob. che si presenti un evento => SUCCESSO e q = 1-p (INSUCCESSO), allora la Prob. che l'evento "successo"
si presenti esattamente k volte in n prove è dato da:
n n!
n k nk k K !n k !
Dove:
n = numero di prove;
Es.: La prob. che si presenti 4 "testa" in 10 lanci di una moneta non truccata:
n 10; p 0.5;
k 4; q 1 05 0.5
10 4 10!
P4 0.5 0.510 4 0.54 0.56 210 0.0625 0.015625 0.205
4 4!10 4 !
Se, in modo analogo, si calcola la Prob. di ottenere 0, 1, 2, ..... 10 "testa" in 10 lanci, si ottiene:
n = 10 Prob.
k (numero di "testa") La distrib. delle Prob. è:
0 0.001 ==> SIMMETRICA perché p = q = 0.5;
1 0.010 => Se p q è ASIMMETRICA (positiva per p > 0.5);
==> DISCRETA perché k assume solo valori interi;
2 0.044 ==> ha somma = 1;
3 0.117 ==> I parametri p e q sono detti "caratteristici della distribuzione"
4 0.205
5 0.246
6 0.205
Si può anche ragionare così => un esperimento aleatorio,
7 0.117 che produce 2 esiti (es.: GIUSTO / SBAGLIATO)
indipendenti e reciprocamente escludentesi, ripetuto 10
8 0.044 volte (si pensi ad una prova d’esame con 10 domande a
ciascuna delle quali si può risposdere solo: SI / NO e solo
9 0.010
una delle due possibili risposte è GIUSTA) produce un A B C B/C
10 0.001 insieme degli eventi foramto da 10!
210 = 1024 sequenze possibili. Di queste sequenze solo k k! 10 k ! 2 10 Prob.
k! 10 k !
1 10 1024 0.010
Altre proprietà: 2 45 1024 0.044
=> media presentano k successi (es: GIUSTO). 3 120 1024 0.117
(valore atteso) => n p Se si pensa di rispondere in maniera casuale (facendo in modo 4 210 1024 0.205
che la probabilità di rispondere “GIUSTO” sia uguale a quella 5 252 1024 0.246
=> varianza => n p q
2 di rispondere “SBAGLIATO” (p = q = 0.5), la probabilità di
ottenere k successi può essere calcolata anche .... =====>
6 210 1024 0.205
Si chiede
Test (b) 16 0.2 3.2 1) calcolare la probabilità di rispondere GIUSTO a 6 domande (su 16) in ciascuna versione del test
sotto la condizione che le risposte vengano vengano fornite casualmente;
Test (c) 16 0.1 1.6 2) stabilire il valore atteso (numero di risposte GIUSTO) che, nelle diverse versioni del test, ci si può
attendere per effetto del caso
1
[NOTA: nella sottostante figura i valori di probabilità delle 3 curve sono rappresentati da linee continue per ragioni di semplicità grafica; essendo la
v.c. binomiale discreta, in corrispondenza dei diversi valori sull’ascissa, la probabilità dovrebbe essere rappresentata con un punto separato. La possibilità
di cogliere visivamente le 3 distribuzioni risulterebbe, tuttavia, del tutto compromessa]
==> Quando gli eventi possono assumere un qualsiasi valore (in un qualsiasi intervallo, anche - + )
allora la distribuzione teorica di probabilità può essere quella NORMALE
=> Molte variabili si distribuiscono approssimativamente in modo normale;
=> Gode di comode proprietà come la simmetria;
=> Viene anche detta "curva degli errori" perché si può dimostrare (Gauss) che essa descrive la LEGGE DI DISTRIBUZIONE DEGLI
ERRORI ACCIDENTALI (per es.: di misurazione di una lunghezza)
==> Una variabile casuale x ha una distribuzione normale con media e varianza 2 se la sua densità
di probabilità (funzione di probabilità) è data da: x
1
2 x 2
3.1416
1 1 1
f x exp 2 x
2
e 2 con: e 2.7183
2 2 2 2 2 media
2
var ianza
1; 2 3; Asimm 0; Curtosi 0;
1
0; 2 ; Asimm 0; Curtosi 0;
3
1
1; 2 ; Asimm 0; Curtosi 0;
5
0; 2 1; Asimm 0; Curtosi 0;
probabilità e loro proprietà
Principali distribuzioni di probabilità proprietà
1
xi 1 z 2
zi f z e 2
Per cui: 2
disponendo di una distribuziane empirica, normale, può essere utile definire
"nuovi" valori (punteggi o scale) avendo come riferimento la distribuzione dei valori Z
Usando come riferimento i valori (Z) della distribuzione nomale standardizzata è possibile definire
"nuovi" valori (punteggi o scale). Alcuni esempi...
La scala T (proposta da McCall, 1922, in onore di E.L. Thorndike) usa: media = 50 e dev.st. = 10
Ti 50 10 zi
La scala C (Guilford, 1956), considera 11 valori ed è definita con media = 5 e dev.st. = 2
La scala STANINE ("standard nine"), considera 9 valori ed è definita con media = 5 e dev.st. = 1.96
Nelle revisioni più recenti (1960) viene invece utilizzato il cosiddetto QI di deviazione...
Il QI di deviazione della serie di scale Wechsler è invece basato: media = 100 e dev.st. = 15
Corrispondenze
fra alcune 99.87 %
delle più
comuni scale 97.73 %
normalizzate
(valori arrotondati) 84.14 %
50.00 %
Percentuale
(cumulata) 15.86 %
di casi
sotto la curva
2.50% (Z=-1.96)
2.27 %
0.13 %
Deviazioni standard
Percentuale
(negli intervalli)
0.02 0.11 0.49 1.65 4.41 9.18 14.99 19.15 19.15 14.99 9.18 4.41 1.65 0.49 0.11 0.02
di casi % 0.13 2.14 13.59 34.14 34.14 13.59 2.14 0.13
%
sotto la curva
Z -4.0 -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 +0.5 +1.0 +1.5 +2.0 +2.5 +3.0 +3.5 +4.0
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
T
C (stanine) 1 2 3 4 5 6 7 8 9
QI di deviazione
Wechsler (100;15) 40 48 55 63 70 78 85 93 100 108 115 123 130 138 145 153 160
----------------------
Stanford-Binet
(100;16) 36 44 52 60 68 76 84
+0.25 92 100 108 116 124 132 140 148 156 164
+0.13
-0.39
+2.33
+0.39
+1.28
+0.84
+1.64
+1.04
+0.67
+0.52
Valori Z
-0.13
-1.04
-0.67
-0.25
-1.28
-0.52
-0.84
0.00
-1.64
-2.33
e relativi
PERCENTILI % 1 5 10 20 30 40 50 60 70 80 90 95 99 %
probabilità e loro proprietà
Principali distribuzioni di probabilità proprietà
I valori Z possono essere facilmente tabulati...
-4 -3 -2 -1 0 z 1 2 3 4
1-p
Generalmente, il software statistico fornisce direttamente (sotto l'etichetta "prob.") il valore: 1-p
Data una popolazione di numerosità N distribuita NORMALMENTE con media e varianza 2 , è possibile
estrarre innumerevoli campioni di n osservazioni.
Ogni campione di osservazioni è una variabile casuale NORMALE con media e varianza 2 .
Se si standardizzano i valori di k campioni, si avranno k variabili casuali z1, z2, ..., zk normali con stessa media
e stessa varianza.
La sommatoria dei quadrati di k variabili normali standardizzate è una variabile casuale detta CHI-QUADRO
che viene espressa dalla seguente forma funzionale:
Proprietà:
=> per la curva tende alla Normale;
=> la media (valore atteso) =
==> E' definita come rapporto fra una variabile casuale Normale Standardizzata e la radice quadrata
di una variabile 2 divisa per il numero dei suoi GdL, sotto la condizione che le due variabili
siano fra loro indipendenti;
==> molto usata per lo studio di fenomeni casuali relativi a campioni piccoli (n < 30);
==> significatività dei parametri stimati in modelli lineari classici;
==> La forma della distribuzione dipende dai GdL; le diverse curve sono CAMPANULARI e
SIMMETRICHE (platicurtiche)
==> al crescere dei GdL, t tende alla normale
Indicando con a e b le medie incognite della velocità di lettura, rispettivamente per la popolazione
di coloro che hanno seguito il metodo a e b, è possibile scrivere la corrispondente ipotesi statistica:
H: a b che naturalmente implica anche l'ipotesi opposta H: a = b
Generalmente si preferisce porsi nella condizione di RESPINGERE l'ipotesi che riveste interesse per
lo studio; e tale ipotesi viene detta IPOTESI NULLA; l'altra IPOTESI ALTERNATIVA
H0: a = b H1: a b
==> Il controllo delle ipotesi consiste nello stabilire una regola che permetta di decidere;
==> Un test statistico è una variabile casuale i cui valori (definiti dalla regola di calcolo)
stanno in un certo intervallo e seguono una distribuzione di probabilità nota.
==> I valori del test (spazio campionario) vengono generalmente suddivisi in:
- una regione di ACCETTAZIONE di H0
- una regione di RIFIUTO di H0 (accettazione di H1)
sulla base di un valore (Vc) che viene detto VALORE CRITICO (al di là del quale si
estende la regione di rifiuto)
Quando si pensa H0 come ... decidere di ... ... comporta ... ... errore di ... ... con probabilità ...
RESPINGERE H0 DECISIONE I° TIPO
SBAGLIATA
VERA
ACCETTARE H0 DECISIONE NESSUN ERRORE 1-
GIUSTA
RESPINGERE H0 DECISIONE NESSUN ERRORE 1-
GIUSTA
FALSA ACCETTARE H0 DECISIONE II° TIPO
SBAGLIATA
==> La quantità dipende dal valore prefissato di e dal valore del parametro incognito .....
==> Si desidera minimizzare sia sia ; ma POSSONO ESSERE RIDOTTI ENTRAMBI SOLO
AUMENTANDO LA DIMENSIONE DEL CAMPIONE ...
Ecco perché generalmente si preferisce porsi nella condizione di RESPINGERE (H0) l'ipotesi che riveste interesse per lo studio:
==> Es. Il ricercatore desidera sostenere che il diverso metodo di insegnamento influisce sulla velocità di lettura. Definendo:
H0: a = b
si dice: “fra i due gruppi che hanno seguito metodi diversi di insegnamento NON vi è alcuna differenza significativa”.
==> MAI SI POTRA’ SAPERE SE HO E’ VERA O FALSA; ma così facendo (assumendo che sia vero a = b) si “restringe” lo spazio
decisionale ai primi due casi (illustrati in tabella);
==> ORA PER MINIMIZZARE IL RISCHIO DI SBAGLIARE E’ SUFFICIENTE SCEGLIERE UN ABBASTANZA PICCOLO !!!
In genere si formulano le ipotesi statistiche in modo che sia più vantaggioso avere un piccolo (e consegunetemente un grande) piuttosto che il contrario: Esempio dell'accusato.
Porre H0 = innocente (H1 = colpevole) e scegliere un piccolo significa preferire la liberazione di un colpevole piuttosto che la condanna di un innocente;
viceversa, con H0 = colpevole (H1 = innocente) e sempre piccolo, significa preferire un innocente in galera piuttosto che un colpevole in libertà.
=> “sulla media" implica un solo campione e la decisione riguarda SE la media campionaria è (o non è)
significativamente diversa dalla media della popolazione;
=> “sulla differenza fra medie" implica (almeno) due campioni e la decisione riguarda SE la differenza riscontrata è
tale da far ritenere che i campioni provengano da popolazioni con medie diverse (oppure così piccola da far
ritenere che sia dovuta al caso (fluttuazioni campionarie).
[importante distinguere: CAMPIONI INDIPENDENTI / CAMPIONI DIPENDENTI]
2) Calcolo (uso tavole) del valore critico della variabile casuale associata al test [zc; tc; Fc; 2c];
3) Trasformazione dei valori campionari in quelli della variabile associata opportuna [ze; te; Fe; 2e]
(e = empirico);
(Esempi ...)
=> Due campioni (casuali e indipendenti) di studenti vengono sottoposti ad una prova di memoria;
Il primo campione è composto interamente da 43 studenti maschi che ottengono un punteggio
medio pari a 20 con uno scarto quadratico medio di 4.6; il secondo campione è composto
interamente da 40 studentesse che ottengono un punteggio medio pari a 18 con una deviazione
standard pari a 4.4. Si chiede di stabilire, con un livello di fiducia del 99%, se la differenza fra
studenti maschi e femmine è statisticamente significativa.
xM x F 20 18
3 ze 2.0
sM s F 4.6 4.4
n1 n2 2 43 40 2
=> Per controllare se un nuovo tipo di psicofarmaco influisce o meno sulla memoria delle persone si
organizza un esperimento. 60 individui che hanno trovato giovamento dallo psicofarmaco vengono
suddivise (casualmente) in due gruppi di 30 individui; al gruppo 1 viene somministrato il
medicinale, al gruppo 2 un placebo. Dopo un certo intervallo di tempo tutti sono sottoposti ad una
prova di memoria che fornisce i seguenti risultati: media pari a 13.30 e deviazione standard 1.77
per il gruppo 1 (sperimentale); media pari a 16.03 e deviazione standard 1.74 per il gruppo 2
(controllo). Si chiede di stabilire se lo psicofarmaco influisce significativamete sulla memoria
(alfa = 0.05).
= 0.05
I DATI...
Hypothesis Test
Null hypothesis: Mean 1 - Mean 2 = 0
Alternative: Mean 1 - Mean 2 ^= 0
f
=> Assume un valore compreso fra 0 e un numero positivo
2
J K fˆ jk che dipende da N e dai GdL;
2 jk
j 1 k 1 fˆjk
=> I valori seguono l'omonima distribuzione, per cui è possibile
stabilire se il valore ottenuto è significativamente diverso
da zero
Esempio: Con lo scopo di conoscere il giudizio degli studenti nei confronti dell'introduzione di una
modifica organizzativa del corso di laurea, è stato intervistato un campione casuale di 150
studenti. I risultati dell'indagine sono riportati in forma tabellare distinguendo i giudizi (y)
rispetto al genere (x) degli intervistati. Si chiede di stabilire se:
a) fra genere e giudizio esiste un qualche grado di associazione;
b) l'eventuale associazione fra genere e giudizio é statisticamente significativa (alfa = 0.05)
TABELLA DI X PER Y STATISTICHE PER LA TABELLA DI X PER Y
X Y
Frequenza‚favorev.‚contrari‚incerti ‚ Totale Statistica DF Valore Prob
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
Chi quadro 2 12.959 0.002
maschi ‚ 28 ‚ 29 ‚ 17 ‚ 74 Likelihood Ratio Chi-Square 2 13.220 0.001
ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ Mantel-Haenszel Chi-Square 1 2.110 0.146
H0: CHI-QUADRO calcolato = 0; L'associazione fra le due variabili è statisticamente significativa per alfa = 0.05 ?
Principali misure di relazione bivariata (variabili CARDINALI)
I valori di due variabili cardinali (x e y) possono essere rappresentati geometricamente come punti (coordinate) in
uno spazio cartesiano a due dimensioni ...
==> Nessuna statistica capace di cogliere (misurare o esprimere) una relazione lineare è anche
capace di cogliere l'esistenza di una relazione non-lineare
=> due variabili vengono dette: ortogonali (o indipendenti) quando si osserva una totale assenza di
relazione;
=> quando la relazione è lineare e perfetta, le variabili vengono dette collineari.
Principali misure di relazione bivariata (variabili CARDINALI)
Misure (statistiche) della relazione LINEARE fra due variabili cardinali
==> COVARIANZA; riprendendo la formula della varianza (di x), questa può essere espressa come
covarianza di x CON SE STESSA ...
1 N 1 N
s xi x xi x xi x x 2 x 2
2 2 ==> con due variabili (x e y)
si può scrivere la
N i 1 N i 1 COVARIANZA come:
Id. X Y X2 y2 XY
s x2 x 2 cov xy xy x y
1 2 10 4 100 20
2 3 9 9 81 27
3
4
4
5
9
7
16
25
81
49
36
35 covxy
5 6 5 36 25 30 rxy
6 7 3 49 9 21
---------------------------------
sx sy
Media 4.5 7.17 23.17 57.50 28.17
0.0 0.0018
Y -0.96500 1.00000
0.0018 0.0
con software statistico...
X \ Y 1 2 ... H Tot.
esito docente
1 f11 f12 ... f1H f1+
Frequenze ‚A ‚B ‚C ‚ Totale
2 f21 f22 ... f2H f2+ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
0 (INSUCCESSO) ‚ 10 ‚ 20 ‚ 10 ‚ 40
... ... ... ... ... ... ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
1 (SUCCESSO) ‚ 15 ‚ 30 ‚ 15 ‚ 60
L fL1 fL2 ... fLH fL+ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
Totale 25 50 25 100
Tot. f+1 f+2 ... f+H f++
In un'urna (x) ci sono 50 palline "N" e 70 palline "R";
Modello teorico
(nella situazione di indipendenza) .... in un'altra urna (y) ci sono 80 palline "N" e 40 palline "R";
in 120 estrazioni (con ripetizione) qual è la Prob. di estrarre "N" e "N" ???
xj\ yk N R Tot.
fˆNN ?
ˆ
f NR ?
N ? ? 50 (Prob.) * (N° di estrazioni) = Frequenza attesa = fˆ jk ˆ
f RN ?
R ? ? 70 fˆ
RR ?
Tot. 80 40 120
Dalla teoria della probabilità ... Teorema della probabilità composta (o del prodotto):
SE DUE EVENTI SONO STOCASTICAMENTE INDIPENDENTI, LA PROBABILITA' DI
50 80
Facendo qualche calcolo ... in x P N 0.416 6 in y P N 0.666 6
120 120
50 80
fˆNN 0.277 7 120 33.333 3 33
120 120
In generale ... ˆf f j f k f f j f k
jk
f f f
fˆ
che assume un valore compreso fra 0
... ... j 1 k 1 jk e un numero positivo che dipende da
ˆ
f LH f LH N (f++) e dai GdL
GdL L 1 H 1
A scopo descrittivo possono essere ricavate altre misure (SIMMETRICHE) di associazione basate sul CHI-quadro (forza della relazione ...)
2 2
Coefficiente PHI ==> φ φ 2
MIN = 0 ; MAX = 1 SOLO PER TABELLE: 2 * H
N N
φ2 MIN = 0 ; MAX = 1 PER TABELLE: L * H
Coefficiente V (Cramer) ==> V
minL 1, H 1
Frequency ‚
Expected ‚
Le variabili categoriali "esito" e "docente" Percent ‚
Row Pct ‚
sono fra loro indipendenti o esiste una Col Pct ‚A ‚B ‚C ‚ Total
qualche associazione ? ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
0 (INSUCCESSO) ‚ 10 ‚ 20 ‚ 10 ‚ 40
‚ 10 ‚ 20 ‚ 10 ‚
‚ 10.00 ‚ 20.00 ‚ 10.00 ‚ 40.00
‚ 25.00 ‚ 50.00 ‚ 25.00 ‚
‚ 40.00 ‚ 40.00 ‚ 40.00 ‚
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
esito docente 1 (SUCCESSO) ‚ 15 ‚ 30 ‚ 15 ‚ 60
‚ 15 ‚ 30 ‚ 15 ‚
Frequenze ‚A ‚B ‚C ‚ Totale ‚ 15.00 ‚ 30.00 ‚ 15.00 ‚ 60.00
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ‚ 25.00 ‚ 50.00 ‚ 25.00 ‚
0 (INSUCCESSO) ‚ 10 ‚ 20 ‚ 10 ‚ 40 ‚ 60.00 ‚ 60.00 ‚ 60.00 ‚
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
1 (SUCCESSO) ‚ 15 ‚ 30 ‚ 15 ‚ 60 Total 25 50 25 100
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ 25.00 50.00 25.00 100.00
Totale 25 50 25 100
POSSONO PRODURRE
complessitàMISURE
del costrutto e/o scarsa condivisione su def. operativa
(quando – tali variabili -godono di specifiche proprietà formali)
non sono rilevabili sulla base di un'osservazione diretta (es.:risposta a una domanda)
0.128
? arcsen 7.295 7 30'
(c) 1 . 008
100 cm.
100 cm.
(a)
ALESSANDRIA
7° 30 '
7° 30 '
EQUATORE
3) ESEGUO CALCOLI ..... C = "Circonferenza terrestre" (in Km.) C : 800 360 : 7 30'
800 360
4) OTTENGO UNA STIMA DELLA MISURA CERCATA ..... C 39452 40 mila Km.
7.30
c 39452
diametro 12564 13 mila Km.
3 . 14
DIGRESSIONE Esempio di misurazione...
(ERATOSTENE)
ANALOGIA 240 a.C.
ASTROFISICA PSICOLOGICA
[probabilistica]
[deterministica]
Modellizzazione Terra = Sfera Prob R x f abilità ;difficoltà ; etc .
[errore di specificazione +
Stima [errore di specificazione]
errore stocastico]
DIGRESSIONE
(ERATOSTENE)
ANALOGIA D’altra parte, con riferimento al concetto di “tempo” (cronologico)...
FINE (digressione)
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità) Premessa...
Es.: abilità di far di conto con la tabellina pitagorica dimensionalità dei costrutti
2 domande...
Es.: prudenza degli individui
Definizione
del concetto...
<<... Quando si dice che un uomo è prudente, significa che egli adotta un certo numero di comportamenti
caratteristici della prudenza: che contrae assicurazioni, che non punta tutto su un solo cavallo, che non si
getta a occhi chiusi in un affare ... Il termine "prudente" è così un modo pratico di esprimere astrattamente
un aspetto comune alle sue azioni abituali ... Vi sono nel suo sistema psicofisico dei caratteri che lo portano
ad agire prudentemente ...>> (tratto da: William James, The Meaning of Truth; in Lazarsfeld, 1969)
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità) Premessa...
Definito il concetto, si possono predisporre alcune domande inerenti dimensionalità dei costrutti
ai comportamenti della vita quotidiana; per esempio...
?
TIZIO = CAIO
molto prudente rispetto al patrimonio economico un pò prudente rispetto al patrimonio economico
molto imprudente rispetto alla sua salute un pò prudente rispetto alla sua salute
alcuni concetti (come quello di prudenza) sono così complessi che il loro processo di
trasformazione in dati (la loro operativizzazione) richiede una pluralità di dimensioni
guida auto
patrimonio Nel seguito (se non
altrimenti specificato) si
etc., etc. farà riferimento
esclusivo alla
misurazione di costrutti
(o tratti mentali) con
strumenti di tipo
salute UNIDIMENSIONALE
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità)
La misurazione: attendibilità validità
• La VALIDITÁ (di uno strumento) è il grado in cui lo strumento misura ciò che intende misurare
• L'ATTENDIBILITÁ è il grado di concordanza fra misurazioni indipendenti dello stesso costrutto
CONTENUTO = grado in cui gli agenti elicitanti la proprietà (ITEM) sono rappresentativi dell'universo degli agenti per
quella proprietà
FACCIATA = grado in cui gli agenti elicitanti la proprietà (ITEM) sembrano (SIC!) appropriati
CRITERIO = grado di associazione fra la misurazione del costrutto e misurazioni di altri costrutti che possono essere
considerati come riferimento esterno
PREDITTIVA (se intervine un lasso di tempo fra la misura e il riferimento esterno)
CONCORRENTE (quando le misure coinvolte sono concomitanti)
COSTRUTTO = grado in cui la misura riflette accuratamente il costrutto che si intende misurare
CONVERGENTE (presenza di relazione con misurazioni diverse dello stesso costrutto)
DISCRIMINANTE (assenza di relazione con misurazioni inerenti costrutti diversi)
NOMOLOGICA = grado in cui la misurazione del costrutto si inserisce in una serie di relazioni (predittive) con
costrutti affini e/o con criteri di riferimento
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità) La misurazione: attendibilità (teoria classica)
V2 E2 (0 ≤ rtt ≤ 1)
rtt 2 rtt 1 2
X X Coefficiente di determinazione
1 N
cov xy N
x i x yi y Coefficiente r (Bravais-Pearson)
(1) rxy i 1 quando x e y sono entrambe variabili cardinali
sx s y 1 N
1 N
x x y y
2 2
i i
N i 1 N i 1
R S
N
R S
N
2 2
i R i S Dove :
i 1 R e S indicano rispettiva mente i ranghi di x e y
R e S sono le rispettive medie
rpbi è utilizzato, ad esempio, quando in un test tutti gli item sono di tipo dicotomico e si vuole
stabilre il grado di relazione fra il punteggio ottenuto dagli individui su un item e il punteggio
totale su tutti gli Item
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità)
Nella Teoria Classica dei Test l'attendibilità è sostanzialmente intesa come COERENZA (grado di
ASSOCIAZIONE o CONCORDANZA) dei punteggi fra diverse somministrazioni; ovvero:
con che probabilità i risultati di un test sono replicabili o si avvicinano all'accuratezza desiderata?
Metodi:
test-retest
Si somministra lo stesso reattivo due volte allo stesso gruppo di individui e si calcola la CORRELAZIONE
(r) fra i punteggi.
Difficoltà: (1) metodo inadatto per caratteristiche degli individui suscettibili di "fluttuazioni" nel tempo
come: tono dell'umore, apprendimento, etc. (2) quanto tempo deve intercorre fra una somministrazione
e l'altra?
forme parallele
Si predispongono due versioni (A e B) il più possibile equivalenti dello stesso test; si somministra la
versione A a un gruppo di individui; trascorso un appropriato lasso di tempo, si somministra la versione
B allo stesso gruppo di individui e si calcola la CORRELAZIONE (r) fra i punteggi.
Difficoltà: (1) campionamento degli item? (2) ordine di somministrazione (AB o BA);
(3) quanto tempo deve intercorre fra una somministrazione e l'altra?
(1951) di Cronbach
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità)
split-half misurazione attendibilità
Si ottiene la stima dell'attendibilità calcolando la CORRELAZIONE (r) fra i punteggi, dopo aver suddiviso
in due metà equivalenti gli item del test. Difficoltà: la divisione del test in due parti EQUIVALENTI:
suddivisione casuale? Item pari e item dispari?
(1) si suddividono gli item del test in due parti equivalenti (parte X e parte Y)
(2) si calcola la CORRELAZIONE (rXY)
(3) si stima l'attendibilità correggendo il coefficiente di correlazione con la formula di Spearman-Brown
La formula di Spearman-Brown (1927) è molto generale e viene detta "profetica" perchè, dato il
coefficiente di correlazione (rXY) del test originale, permette di "prevedere" il coefficiente di
attendibilità (rSB) di un test di qualsiasi lunghezza. Inoltre consente di sapere di quanto deve essere
"allungato" un test per ottenere un dato coefficiente di attendibilità
S
Se: allora: k
L
e qualora rXY sia stato
S = n° di item DESIDERATO del test (o n° di item del test originale)
L = n° di item (del test dimezzato) su cui è stato clacolato rXY ottenuto sulla metà degli
item originali: k = 2
La formula KR20 (Kuder-Richardson, 1937) può essere utilizzata per stimare l'attendibilità
Per test formati da item dicotomici (Vero/Falso)
0 ≤ rKR20 1 ; per valori prossimi a 1 (>0.90) omogeneità degli item; adeguata attendibilità del test
rKR20 è sensibile alla difficoltà del test, all'estensione dei punteggi, al n° di item presenti nel test
In presenza (in un test) di item a difficoltà crescente (non tau-equivalenti) rKR20 indica il limite
inferiore del grado di omogeneità degli item (attendibilità)
L' di Cronbach può essere visto come una generalizzazione (applicabile anche ad item politomici)
della formula KR20
K
Dove :
K
p j q j K n di item del test
rKR 20 1 j 1 X2 varianza dei punteggi del test
K 1 X2 p proporzion e di risposte corrette ad un item
q proporzion e di risposte errate ad un item
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità) di Cronbach (1951) misurazione attendibilità
Per ottenere un punteggio complessivo, ha senso sommare fra loro solo Item (molto) interrelati
Il coefficiente fornisce una stima dell'attendibilità in termini di coerenza interna del test
Il coefficiente può essere pensato come una correlazione media degli item entro il test
Difficoltà: computazionale (quasi indispensabile l'uso dell'elaboratore e di un software idoneo)
Gli errori di misurazione (Ej) sono indipendenti fra loro e dai valori veri (Vj)
K
cov X , X i j
K Xj
2
i j
1
j
K 1 2X0 K 1 X0
2
continua...
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità)
di Cronbach misurazione attendibilità
Se le varianze degli item variano molto è conveniente standardizzare gli item, prima di calcolare
raggiunge il valore massimo 1 quando la correlazione fra ogni coppia di item è 1
In presenza di correlazioni negative fra coppie di item può assumere valori negativi
Se gli item sono dicotomici, è equivalente alla misura di attendibilità di Kuder-Richardson (KR-20)
Per valutare quanto ciascun item rispecchi l'attendibilità della scala, si calcola un coefficiente
(indipendentemente per ciascun item) dopo aver cancellato dalla scala quell'item
K 1
K 1
2X j
i j i
1 K 1
K 2 Xj
2
j i
Se CRESCE dopo che un item è stato cancellato dalla scala, si può ritenere che quell'item
NON è fortemente CORRELATO con gli altri
Se DECRESCE si può ritenere che quell'item È fortemente CORRELATO con gli altri
Esempio continua...
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità) Esempio tratto da ... Miceli, R., Sotgiu, I., & Settanni, M. (2008).
Disaster preparedness and perception of flood risk:
A study in an alpine valley in Italy
di Cronbach PERCEZIONE DEL RISCHIO IDROGEOLOGICO Journal of Environmental Psychology 28, 164-173.
Pensando ai prossimi 5 anni, ad un EVENTO ALLUVIONALE Pensando ai prossimi 5 anni, ad un EVENTO ALLUVIONALE
con FRANE e smottamenti che coinvolga la zona in cui abita con FRANE e smottamenti che coinvolga la zona in cui abita
quanto è PROBABILE che... quanto è PREOCCUPATO/A che...
["per nulla", "poco", "abbastanza", "molto"] [0,1,2,3] ["per nulla", "poco", "abbastanza", "molto"] [0,1,2,3]
?
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
d11_1 0.137704 0.792294 0.146843 0.792814
d11_2 0.532856 0.740070 0.529757 0.744839
d11_3 0.575723 0.732727 0.566770 0.739863
d11_4 0.677670 0.715834 0.670265 0.725619
?
d11_5 0.609470 0.727500 0.603324 0.734888
d12_1 -.046961 0.815073 -.047664 0.814855
d12_2 0.332153 0.764587 0.339227 0.769495
d12_3 0.551915 0.738056 0.557794 0.741075
d12_4 0.622569 0.728094 0.629054 0.731349
d12_5 0.499762 0.744861 0.503281 0.748361
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità)
K di Cohen Esempio
Misura di concordanza per varibili categoriali (ACCORDO FRA GIUDICI) -- (J. Cohen, 1960)
Due psicologi clinici sono chiamati ad esprimere (in modo indipendente) la diagnosi su 200 pazienti;
essi devono stabilire a quale fra le seguenti categorie appartiene ciascun paziente:
schizofrenico; nevrotico; danno cerebrale.
Frequenze Osservate Frequenze Attese (Indipendenza)
I J I J
Po 0.25 0.02 0.02 0.29;
Po pij ; Pc pˆ ij ; ( per i j )
Dove : Po ACCORDO OSSERVATO (proporzioni)
Pc ACCORDO ATTESO (proporzioni)
i 1 j 1 i 1 j 1 Pc 0.20 0.09 0.06 0.35
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità)
Tre assunti:
1) Le unità (nell'esempio i pazienti) sono indipendenti
K di Cohen 2) Le categorie rispettano i requisiti della logica classica
3) I giudici operano in modo indipendente
nell'esempio c'é associazione, ma – "a occhio" - si vede che non c'é accordo
CHI-QUADRO (e misure derivate) sono INADEGUATE
Po Pc Fo Fc
k k
1 Pc N Fc
k < 0 !! DISACCORDO !! l'accordo osservato è minore di quello dovuto al caso; (MIN -1)
(Con riferimento all'esempio...) Po 0.25 0.02 0.02 0.29; Pc 0.20 0.09 0.06 0.35
0.29 0.35 58 70
k 0.09 k 0.09
1 0.35 200 70 continua...
(attendibilità e validità
Teoria Classica dei Test (attendibilità validità) K di Cohen Ulteriore Esempio (ALTRI DATI)
k 0.492
8.34 Pr . 0.001
L'errore standard della stima
per H0: k =0 si calcola: z
k 0.059
Fc Pc
k ; k
N N Fc
N 1 Pc
k
82
0.059 H0: RESPINTA
200200 82
La Teoria Classica dei Test (punteggi grezzi, standardizzati, norme
norme statistiche)
Per semplicità si immagini di aver realizzato un test composto da L item (S1, S2, etc.), tutti che
prevedono una risposta dicotomica (Vero/Falso; 1/0) e di averlo somministrato a N individui
(O_1, O_2, etc.) che hanno in comune la proprietà di essere studenti della stessa età di un'unica
struttura scolastica
Supponiamo anche di aver ottemperato con rigore a tutte le procedure inerenti la definizione
degli item e del test in generale
Supponiamo anche di aver attentamente valutato validità e attendibilità del test e di aver ottenuto
risultati ottimi
Supponiamo infine di aver trasformato i punteggi grezzi in tutti i modi che la T.C.T. (e la statistica)
ci mettono a disposizione (percentuali, ranghi, percentili, ranghi percentili, punti Z, T, "stanini", etc.)
(per es.) O_2 è più bravo di O_1?
PUNTEGGIO
S1 S2 S3 S... GREZZO
(per es.) la prestazione di O_4 è superiore
O_1 1 1 0 ... 5
a quella del 20% degli altri individui?
O_2 0 1 0 ... 10 SI (ovvero O_4 occupa il 20° rango percentile?)
O_3 1 1 0 ... 2
CAMPIONE
TEST DATI
NORMATIVO
PUNTEGGI
GRUPPO
(appartenente alla
stessa popolazione DATI INTERPRETAZIONE
del campione normativo)
STIMOLI
AGENTE ITEM elicitano la risposta; sono pertanto
QUANTITATIVO
DOMANDE reattivi, reagenti, RIVELATORI
QUALITATIVO MODELLO LATENTE
MANIFESTO MISURA
IL MODELLO DEVE
GARANTIRE LA CONFRONTABILITA’ DEI PUNTEGGI
Se assumo: Scalogramma
Una persona capace di GUTTMAN
LE DOMANDE rispondere correttamente ad errore
HANNO UGUALE una domanda più difficile di ???
DIFFICOLTA' un’altra, risponderà altrettanto
correttamente a tutte le
domande più facili di quella
Se assumo:
LE DOMANDE
HANNO DIFFERENTI
DIFFICOLTA'
I.R.T.
errore
su risposta
Garantire la confrontabilità
NON
CONFRONTABILTA’
QUANTITATIVO
QUALITATIVO MODELLO LATENTE (Domande di difficoltà crescente...; 1= risposta corretta; 0 = risposta sbagliata)
MANIFESTO MISURA
D1 D2 D3 PUNTEGGIO
MODELLO CONFRONTABILITA'
T.C.T. I.R.T.
PUNTEGGIO
PUNTEGGIO S1 S2 S3 S.... (riga)
S1 S2 S3 S.... (riga) O_1 1 1 0 ... 5
O_1 1 1 0 ... 5 O_2 0 1 0 ... 10
O_2 0 1 0 ... 10 O_3 1 1 0 ... 2
O_3 1 1 0 ... 2 O_4 1 0 1 ... 7
O_4 1 0 1 ... 7 O_.. ... ... ... ... ...
O_.. ... ... ... ... ... PUNTEGGIO 25 10 18 ...
colonna
CAMPIONE
NORMATIVO
DIFFICOLTA'
S_2 S_3 S_1 DOMANDE
z
ABILITA' ABILITA'
INDIVIDUI O_1 O_2 O_3 INDIVIDUI
O_2 O_1 O_3
Cenni introduttivi alla Item Response Theory
<<Maxwell’s very detailed analysis
<<L’analisi molto dettagliata, condotta
[of the concepts of mass and force] ...
da Maxwell sui concetti di massa e forza,
has greatly fascinated me on finding
mi ha molto affascinato dato che lo stesso
that the same sort of argument should
tipo di argomenti può essere applicato in
be applicable elsewhere, in particular
altri contesti, in particolare nei problemi
in problems of measurement in
di misurazione in psicologia.>>
psychology.>> (G. Rasch, 1960, p. 111)
(Pag. 112 e seguenti) <<... Ora si immagini la seguente condizione sperimentale cui prendono parte due gruppi di elementi. Un
gruppo è formato da un ampio numero di oggetti: O1, O2, ...,On che definiamo come “corpi solidi” (non vogliamo finire
nell’idrodinamica o nella teoria dei gas) e che possono avere dimensioni molto diverse ed essere costituiti da diversi materiali.
L’altro gruppo: I1, I2, ..., Ik può essere definito come “strumenti” dato che ciascuno di essi può esercitare una influenza meccanica
(vogliamo evitare l’elettromagnetismo) su ogni oggetto del primo gruppo. [...] Se ogni strumento Ij viene applicato a ciascun
oggetto O , un insieme di valori numerici (rapporti di) accelerazione può essere osservato e riportato in una tabella come quella
seguente:
strumenti
j I1 I2 ... Ij ... Ik
[...] Complessivamente il dato di fatto empirico può essere riassunto nella seguente
O1 A11 A12 ... A1j ... A1k affermazione che, per il nostro scopo attuale, possiamo indicare come la
legge moltiplicativa dell’accelerazione (in corsivo nel testo):
O2 A21 A22 ... A2j ... A2k l’accelerazione Aj ricevuta dall’oggetto solido O sotto l’influenza meccanica dello
oggetti strumento Ij è il prodotto di due fattori, uno relativo all’oggetto, uno allo strumento.
O A1 A2 ... Aj ... Ak
Indicando i due fattori con 1/M e Fj la precedente affermazione può venire espressa
On An1 An2 ... Anj ... Ank tramite la formula:
Fj
A j
M
S1 S2 S3 S....
O_1 1 1 0 ... DIFFICOLTA'
S_2 S_3 S_1 DOMANDE
O_2 0 1 0 ...
O_3
O_4
O_..
1
1
...
1
0
...
0
1
...
...
...
...
? O_1 O_2 O_3
ABILITA'
INDIVIDUI
<<Una persona in possesso di una maggiore abilità rispetto a un'altra dovrebbe avere
una maggiore probabilità di rispondere correttamente a ogni domanda di quel tipo, e
analogamente, se una domanda è più difficile di un'altra ciò significa che per ogni
persona la probabilità di rispondere correttamente alla seconda domanda è
maggiore>> (G. Rasch, 1960)
- ottenere i parametri; ?
- garantire il principo di misurazione fondamentale (oggettività specifica)
Cenni introduttivi alla Item Response Theory
misurazione fondamentale
concatenazione (fisica) di oggetti nuovo oggetto
(oggettività specifica)
Per esempio...
oggetti: A, B; proprietà (carattere): PESO;
OGGETTO A || OGGETTO B == OGGETTO AB
osservo A > B e posso chiedere:
PESO A + PESO B == PESO AB
<<Quanto peso deve essere aggiunto a B affinchè i due oggetti siano uguali
(rispetto alla proprietà “peso”) ? >>
Molte proprietà (abilità, intelligenza, atteggiamenti,…) non ottemperano R. Duncan Luce, J.W. Tukey, 1964
(nel sistema fisico di riferimento) al requisito della concatenazione;
ma, analogamente alla temperatura, possono essere misurate D.H. Krantz, R. Duncan Luce, P. Suppes, A. Tversky, 1971
misurazione fondamentale
(oggettività specifica) Quale trasformazione (funzione) ?
A
Oggetto/i (O)
I = f(O,A)
confronto
interazione (I)
I1=f(O1,A) e I2=f(O2,A)
fra due entità g(I1,I2) = g [f(O1,A),f(O2,A)]
Agente/i (A) g(I1,I2) = g [f(O1,A),f(O2,A)] = v(O1,O2) A
Affinché il confronto O1,O2 sia oggettivo è necessario ottenere la funzione v
Analogamente per quanto riguarda il confronto fra Agenti: g(I1,I2) = g [f(O,A1),f(O,A2)] = w(A1,A2) O O
NOTAZIONE
O ==> oggetti ---------- individui ==> (abilità)
A ==> agenti ---------- domande ==> (difficoltà)
I ==> interazioni ----- risposte ==> x (giusto/sbagliato; 1/0)
g P x1 , P x 2 g P 1 , , P 2 , v P 1 , P 2
è possibile giungere a stime asintoticamente tale funzione può essere espressa come...
corrette ed efficienti di tali parametri;
exp n s
INVARIANZA
simmetricamente consentono di confrontare la
Pxn ,s 1| ,
1 exp n s
DIFFICOLTA’ delle DOMANDE, in modo INDIPENDENTE
dagli individui cui sono state sottoposte (sample free)
P(xn,s=1)
1
Dimostrazioni...
0.5 SALTANDO LE
DIMOSTRAZIONI...
0 (n - s )
exp n s Cenni introduttivi alla Item Response Theory
Pxn ,s 1| ,
1 exp n s Traccia di tre item (1=-1.0; 2=0.0; 3=+1.0)
Traccia di un item (1=0.0)
P(xn,s=1) P(xn,s=1)
1 1
0.85
0.68
0.5
0.50
0.44
0
(n - s ) 0.27
0.12
un individuo più abile ha una probabilità maggiore,
rispetto ad un individuo meno abile, di superare 0 (n - s )
ciascun item;
ogni individuo ha una probabilità maggiore di
superare un item facile rispetto ad un item più
difficile
Pn , s bn Pn , s exp n s
log n Pn , s
1 Pn , s ds 1 Pn , s
s
1 exp n s
xn,s = 1 oppure 0 Cenni introduttivi alla Congruenza
Item Response Theory DATI MODELLO
D_1 D_2 ... D_K D_1 D_2 ... D_K
I_1 x1,1 x1,2 ... x1,K
exp n s I_1 P̂1,1 P̂1, 2 ... Pˆ1, K
Pxn ,s 1| ,
1 exp n s Pˆ2, K
I_2 x2,1 x2,2 ... x2,K I_2 P̂2,1 P̂2, 2 ...
Pˆxn ,s 1
exp ˆn ˆs I_3 P̂3,1 P̂3, 2 ... Pˆ3, K
.... ... ... ... ... STIME .... ... ... ... ...
I_H xH,1 xH,2 ... xH,K 1 exp ˆn ˆs I_H PˆH ,1 PˆH , 2 ... PˆH , K
è possibile ottenere una stima ...
della varianza delle risposte riprodotte
wns Pˆns 1 Pˆns
... e può essere ottenuto
... così da ottenere una prima e immediata indicazione sulla capacità del processo di
l’errore standard
misurazione messo in atto di rappresentare efficacemente il tratto latente considerato
per ogni misura stimata...
1 1 ITEM1 ITEM2
2 2
1 1
SE n K SE s H
SE ˆ1 ITEM1 ITEM2
SE ˆ2
w w
ns
ns ?
s 1 n 1
SE ˆ1
SE ˆ2
xn,s = 1 oppure 0 Cenni introduttivi alla Congruenza
Item Response Theory DATI MODELLO
D_1 D_2 ... D_K D_1 D_2 ... D_K
I_1 x1,1 x1,2 ... x1,K
exp n s I_1 P̂1,1 P̂1, 2 ... Pˆ1, K
Pxn ,s 1| ,
1 exp n s Pˆ2, K
I_2 x2,1 x2,2 ... x2,K I_2 P̂2,1 P̂2, 2 ...
Pˆxn ,s 1
exp ˆn ˆs I_3 P̂3,1 P̂3, 2 ... Pˆ3, K
.... ... ... ... ... STIME .... ... ... ... ...
I_H xH,1 xH,2 ... xH,K 1 exp ˆn ˆs I_H PˆH ,1 PˆH , 2 ... PˆH , K
Individui e domande si
La matrice dati osservata possiede le comportano secondo le
CONTROLLO ASSUNTI FORMALI caratteristiche minime necessarie per attese del modello?
MISURAZIONE giungere a delle misure?
Soddisfatta se le righe e le colonne della generica matrice AML possono essere permutate in modo tale che i suoi elementi crescano monotonicamente da sinistra a destra
e dall'alto al basso. In modo tale da generare la matrice A’ML il cui generico elemento p gode delle seguenti proprietà:
1 1
2 2
ens x ns Pˆns w ns Pˆns 1 Pˆns
SE n K
1
SE s H
1
w w
s 1
ns
n 1
ns
Residui
standardizzati
zns
x ns Pˆns
1
Medie quadratiche non ponderate (OUTFIT) w ns2 Medie quadratiche ponderate (INFIT)
w ns
s 1
w ns
n 1
Individui e
Congruenza domande si Cenni introduttivi alla Item Response Theory
DATI MODELLO comportano
secondo le attese
del modello?
H individui (1 ≤ n ≤ H) K item (1 ≤ s ≤ K) Qui con riferimento agli ITEM (e specularmente per gli INDIVIDUI)...
ˆ
2 1
Varianza 1 K
1 K
S
H
delle Stime
SD
2
s
Errore
S s wns
2 Varianza del
MSE
2 2
K Standard Errore Standard s
s 1
n 1 K s 1
Varianza Corretta
SA2 SD2 MSE2 Radice Quadrata della
(delle Stime)
Varianza dell'Er.Std. RMSE MSE2