Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DIPARTIMENTO DI PSICOLOGIA
Bibliografia di base
ANALISI DEI DATI E MISURAZIONE IN PSICOLOGIA (a) L. PEDRABISSI, M. SANTINELLO, I test psicologici, Il Mulino, Bologna, 1997 (Escluso il capitolo
9).
dott.ssa Giorgia Molinengo (b) R. ALBANO, Introduzione all'analisi fattoriale per la ricerca sociale, Quaderni di Ricerca del
Dipartimento di Scienze sociali dell' Università di Torino n°4, giugno 2004.
(c) R. MICELI, Percorsi di ricerca e analisi dei dati , Bollati e Boringhieri, 2001 (capitoli I e VI)
ll corso fornisce le conoscenze teoriche e metodologiche iniziali per la realizzazione e l'utilizzo critico dei test L'esame è orale. Una parte, anche consistente, di domande (del tipo a "scelta multipla") potrà essere
psicologici. formulata in modalità scritta (correzione, valutazione e validità saranno contestuali).
Il contesto generale di riferimento è quello della Teoria Classica dei Test (T.C.T.) accompagnato da brevi cenni sugli Gli studenti degli anni precedenti possono portare all'esame il programma dell'anno di riferimento;
sviluppi più recenti della Item Response Theory (I.R.T.).
l'esame è orale
La prima parte è prevalentemente dedicata all'acquisizione (e/o ripasso) degli elementi di matematica e statistica
indispensabili per lo studio dei processi di misurazione in psicologia e allo studio della Teoria Classica dei Test;
La seconda si concentra prevalentemente sugli aspetti applicativi dei test psicologici (scopi, uso, modalità di
somministrazione, deontologia, interpretazione dei punteggi, etc.)
Il ricevimento studenti si svolge (di norma) il mercoledi pomeriggio previo
appuntamento tramite e-Mail all'indirizzo: g.molinengo@univda.it
1
Questionari e test (3 / 9)
Questionari e test (2 / 9)
Cos'é una INTERROGAZIONE? Affinche' una procedura impersonale occupi lo spazio di un'interrogazione è necessario
appurare che essa garantisca (almeno) un livello di confrontabilità dei voti (punteggi)
- insieme di domande cui l'allievo risponde; analogo (o superiore).....
EQUANIMITA' Una stessa domanda può essere posta in molti modi diversi e il modo di porla (il fraseggio) influenza le risposte
STESSO
DOCENTE Una stessa domanda, posta nello stesso modo può essere compresa in modo diverso da gruppi di persone diversi
Interrogazione ? Test Ad una stessa domanda si può rispondere in maniera diversa in funzione del contesto definito dal questionario
DOCENTI Gli effetti dovuti al contesto sono stati studiati tramite la messa a punto di un ampio disegno Un esempio...
DIVERSI sperimentale in cui una domanda sull'interesse delle persone per la politica (negli U.S.A.)
veniva posta agli intervistati prima e dopo altre domande (Zammuner V. L., 1996, pp. 87-93);
(l'esempio qui presentato è una semplificazione)
PROCEDURA
PROFESSIONALITA' IMPERSONALE
Etc.,etc., ...
Esempio di distorsione indotta dal contesto: la stessa domanda viene posta nell'ambito dello stesso questionario Questionari e test (5 / 9) "Teoria" e "Dati" condividono una stessa natura congetturale
prima e dopo la domanda (B) contestualizzante... <<I dati non esistono al di fuori delle operazioni che il ricercatore compie in rapporto a un
2 DOMANDE determinanto quadro di riferimento teorico>>
DOMANDA "A" DOMANDA "B" (B) contestualizzante;
costringe gli intervistati a <<I cosiddetti "dati" non crescono nei prati e i ricercatori non li raccolgono, essi sono
riflettere su un comportamento piuttosto "costruiti" dal ricercatore stesso attraverso procedure di interpretazione e di
<<Alcune persone seguono le vicende politiche la maggior parte che concretamente denota attribuzione di significato>>
del tempo anche quando non ci sono elezioni imminenti, interesse per le vicende politiche trascrizione (su un qualche
mentre altre persone non sono molto interessate alla politica. Qualche definizione: definisce una qualche supporto) di un "fatto" (risultato
Lei direbbe di seguire le vicende politiche: <<Si ricorda come ha votato il suo rappresentante presso il Parlamento caratteristica dell’entità di un PROCESSO DI
(1) la maggior parte del tempo; in una o due leggi che siano state discusse negli ultimi due anni? (Oggetto) sotto osservazione DATO RILEVAZIONE)
(2) in modo abbastanza frequente; (1) Si; CONCETTO, (Idea),
(3) solo qualche volta; (2) No. COSTRUTTO TEORICO,
(4) quasi mai>> Se si, quale legge ....... come ha votato .... >> TRATTO, PROPRIETA'
insieme di REGOLE (algoritmo,
procedura) che governa la
Campione 1 rilevazione e che permette di
A_B evento semplice, asserto rilevare lo STATO di un oggetto VARIABILE..
analogamente rappresentativi descrittivo intersoggettivamente DEFINIZIONE (o caso) rispetto ad una
della stessa popolazione 2 CAMPIONI (Diverso ordine di presentazione) FATTO condiviso (il valore segnato dalla OPERATIVA proprietà (trasformando
(anche se di numerosità diversa) lancetta della bilancia; l'osservazione in un "fatto")
Campione 2 B_A il contenuto del documento
amministrativo; la risposta scritta
RISULTATI: Risposte alla domanda "A" (interesse per la politica) sul foglio di carta; etc.)
<< [oggettività nella scienza] ... non
implica che lo scienziato si
frequenze Risposte alla Campione 1 Campione 2 frequenze Campione 1 Campione 2 distacchi freddamente dall’oggetto
dei suoi studi, né che egli tratti la
osservate domanda A A_B B_A attese A_B B_A CONCETTO DATO gente come oggetti anziché come
persone. Essa non comporta
neppure che ciò che lo scienziato
Interesse ALTO 654 249 603 300 osserva sia ciò che realmente
accade. Oggettività significa che
(risposte=1 o 2) (72.03%) (55.09%) 66.41% 66.37% delle persone, che avessero
guardato sopra la spalla dello
Interesse BASSO 254 203 ENTITA' (OGGETTO) STATO dell'OGGETTO scienziato mentre faceva
305 152 sotto osservazione (rispetto alla proprietà) l’osservazione,
(risposte=3 o 4) (27.97%) (44.91%) 33.59% 33.62% avrebbero visto le stesse cose>>
(McBurney D.H., 1983, p.19).
2 38.8043 TOTALE 908 452
DEFINIZIONE OPERATIVA
( pr . .0.0001) (100.00%) (100.00%)
2
Questionari e test (6 / 9)
grandezza, generalmente indicata con una delle ultime lettere dell'alfabeto (x, y, z),
(Limitatamente a processi SINCRONICI) Questionari e test (7 / 9) Matrici elementari: "2-vie 1-modo"
TEORIA DEI DATI
che può assumere tutti i valori appartenenti a un determinato insieme e che
rappresenta in generale tutti gli elementi di tale insieme (Cattel, 1940; Coombs, 1964; Carol, Arabie, 1980)
(Km.) Amsterdam Milano Roma Venezia
VARIABILE...
vettori matrice CxV
MUTABILE Insieme (collettivo) di 5 individui x w A Amsterdam 0 1130 1750 1430
sequenza ordinata e codificata di rilevazioni (osservazioni) vettore (colonna) di una matrice dati Alberto 23 M 23 M
Maria 18 F 18 F
Milano 1130 0 630 300
età (proprietà) variabile" x"
Francesca 21 F 21 F Roma 1750 630 0 580
Il processo di rilevazione può riguardare: UNA entità in UN arco temporale
Federico genere(proprietà) variabile" w"
statura 19 M 19 M
Venezia 1430 300 580 0
Anna
Renato ha una statura pari a 1.75 mt. Renato 1.75 19 F 19 F
PIU' entità in PIU' archi temporali PIU' entità in UN arco temporale (processo SINCRONICO)
ident statura genere voto ident D1 D2 D3 ident S1 S2 S3
T0 T1 T2 ..... statura 1 175 M 108 1 1 3 5 1 1 0 1
A ...
Renato 1.75 2 150 F 100 2 2 4 2 2 1 1 0
xA,0 xA,1 xA,2
Maria 1.63 3 183 M 98 3 4 1 3 3 0 0 1
B xB,0 xB,1 xB,2 ...
Giuseppe 1.94 4 ... ... .... 4 ... ... .... 4 ... ... ....
C xC,0 xC,1 xC,2 ... .......... ......
Questionari e test (8 / 9) Un esempio ... MATRICE DATI ELEMENTARE (2 VIE, 2 MODI) Questionari e test (9 / 9) Inoltre le matrici elementari si distinguono...
Le elencherò alcuni comportamenti che le persone adottano per far fronte PRIMARIE PICO
Pensando ai prossimi 5 anni, ad un evento alluvionale con ai pericoli idrogeologici. Pensando ad una tale eventualità, Lei o qualcuno Esempio di matrice derivata (micro macro)
frane e smottamenti che coinvolga la zona in cui abita della sua famiglia ...
quanto è PROBABILE che... ["SI", "NO"] SECONDARIE MICRO
Genere? ["per nulla", "poco", "abbastanza", "molto"] (1) Ha seguito un corso di pronto soccorso?
Età? (1) viabilità interrotta... (2) Tiene in efficienza (e/o in un luogo particolare) radio e torcia
(2) servizi (luce, telefono, acqua, etc.) interrotti... elettrica funzionanti a pile? DERIVATE MACRO
(3) suoi beni ... danneggiati... (3) Ha messo da parte scorte di cibo e acqua?
(4) sua abitazione principale danneggiata... (4) Ha trascritto (in un luogo particolare) i numeri di telefono da
(5) Lei, o persone care, subiscano danni fisici chiamare in caso di emergenza?
.... etc. etc. (9 comportamenti)
3
Livelli di scala delle variabili (1 / 8) Livelli di scala delle variabili (2 / 8)
Il processo di rilevazione può seguire quattro percorsi...
Teoria della
... producendo VARIABILI DIVERSE per quanto riguarda il loro LIVELLO DI SCALA (caratteristiche formali) ... Il PROCESSO DI RILEVAZIONE misurazione
(Stevens, 1946; Torgerson, 1958; Galtung, 1967; Krantz, Luce e altri, 1971; Conti, 1972; Marradi, 1984; Ricolfi, 1985; Miceli, 2001) stabilisce una relazione ...
ELEMENTI ELEMENTI
3 principi della logica classica: SISTEMA EMPIRICO SISTEMA NUMERICO
- unicità del "fundamentum diviosionis" (tutte le categorie in funzione unica proprietà); (tratti o dimensioni)
CLASSIFICAZIONE in
(1) (es. di violazione: << Lei è Maschio o ha 20 anni di età ?)
categorie:
- mutua esclusività (partizione / ricoprimento);
- esaustività (es. uso della categoria "altro") Teoria dei livelli di scala Tecniche e modelli
delle variabili di analisi dei dati
NON-ORDINATE
ORDINATE
(sconnesse)
OPERAZIONE DI RILEVAZIONE UNITA' DI ORIGINE TRASFORMAZIONE LIVELLO DI
MISURA O AMMISSIBILE SCALA
CONTO
(2) ORDINAMENTO di “oggetti” ; attribuzione di rango (rank, ranking); pareggi (tie)
1 CLASSIF IC AZIONE assente assente ---- CATEGORIALE
(transcodifica)
2 ORDINAMENTO assente non (monotona crescente) ORDINALE
(3) CONTEGGIO Numeri interi positivi; frequenze assolute (ASSEGNAZIONE A CATEGORIE convenzionale
y m ( y );
m ( y )
0
ORDINATE) y
3A MISURAZIONE non convenzionale (traslazione) DIFFERENZE
Intesa come: convenzionale y y a
=> modalità di rilevazione quando si dispone di uno strumento e di una unità 3B MISURAZIONE convenzionale convenzionale (affine) INTERVALLI
(4) MISURAZIONE
y b y a ; b 0
=> processo di misura quando si costruisce lo strumento e si definisce l’unità
4 MISURAZIONE convenzionale non (dilatazione) RAPPORTI
convenzionale y b y ; b 0
5 CONTEGGIO non non (identica) ASSOLUTA
convenzionale convenzionale y y
4
Livelli di scala delle variabili (5 / 8) Livelli di scala delle variabili (6 / 8)
LIVELLO DI SCALA INTERVALLI (SCALA DI INTERVALLI) SI NO! LIVELLO DI SCALA INTERVALLI (SCALA DI INTERVALLI)
Livelli di scala delle variabili (7 / 8) LIVELLO DI SCALA RAPPORTI (SCALA DI RAPPORTI) Livelli di scala delle variabili (8 /8)
1 € = 1.32 $; 1 $ = 0.76 €
Schema terminologico riassuntivo dei livelli di scala
(migliaia di $)
ID w Confronti ammessi: Indicando come "livelli" i valori distinti (stati) di una generica variabile....
ID w' SI
(reddito)
A/ B; A / C; B / C; etc... w'=0.76*w
(migliaia di €)
A 3.04 Scala di rappporti
A 4 trasformazione ammessa
DILATAZIONE B 1.52 Scala di intervalli
B 2
(restano costanti i rapporti) Scala di differenze Variabili
C 0
C 0 cardinali
Quantità
D 3 w b w ; dove : b 0 D 2.28
o VARIABILI
E 4.56 L quantitative CONTINUE
E 6 Scala assoluta O
.... .... o
.... .... METRICHE
I conteggio
5
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
VARIABILI CATEGORIALI (distribuzioni di frequenza) K K SERIAZIONE DI FREQUENZE (riduzione in classi di una variabile cardinale)
Fk N
k 1
f k 1
Classi di età
k 1 LIMITI TABULATI --- LIMITI VERI
==> Distribuzione di frequenze (variabile categoriale con K classi) K Cumulative Cumulative
=> ASSOLUTE Fk
=> RELATIVE (o proporzioni) fk = Fk / N
p
k 1
k 100 ETA Frequency Percent Frequency Percent
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
18 27 17.527.5 17.5 età 27.5
28 37 27.537.5 27.5 età 37.5
18-27 73 14.6 73 14.6
=> PERCENTUALI pk = fk * 100 28-37 114 22.8 187 37.4 38 47 37.547.5 37.5 età 47.5
38-47 145 29.0 332 66.4
SAS System 48-57 76 15.2 408 81.6
48 57 47.557.5 47.5 età 57.5
SAS System
58-67 82 16.4 490 98.0 58 67 57.567.5 57.5 età 67.5
Cumulative Cumulative
68-80 10 2.0 500 100.0
Cumulative Cumulative VARC2 Frequency Percent Frequency Percent 68 80 67.580.5 67.5 età 80.5
VARC1 Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ELEMENTARE 80 16.0 80 16.0
LICEO 216 54.0 216 54.0 MEDIA INF. 162 32.4 242 48.4
PROFESS. 123 30.8 339 84.8 MEDIA SUP. 212 42.4 454 90.8
limiti fk
ALTRO 61 15.3 400 100.0 LAUREA 46 9.2 500 100.0
k tabul. veri fk ak dk dk
---------------------------------------------------------- ak
1 18 27 17.527.5 73 10 7.300
2 28 37 27.537.5 114 10 11.400
3 38 47 37.547.5 145 10 14.500
4 48 57 47.557.5 76 10 7.600
5 58 67 57.567.5 82 10 8.200
6 68 80 67.580.5 10 13 0.769
FREQUENZA
AMPIEZZA
DENSITÁ
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione) Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
Operatori monovariati di tendenza centrale (indici di posizione centrale) Variabili ordinali MEDIANA: si calcola su un insieme ORDINATO di valori;
si calcola in modo diverso se la variabile è:
(a) CONTINUA e N è dispari;
=> MODA = il livello della variabile che ricorre con maggiore frequenza; (b) CONTINUA e N è pari;
(c) DISCRETA
=> MEDIANA = il livello cui appartiene il caso al di sopra e al di sotto del quale sta il 50% dei casi;
(a) Variabile continua; N dispari N 1
1 N i
xi
==> il valore che corrisponde all'i-esimo caso del vettore ORDINATO; dove:
=> MEDIA ARIT. = il livello che rappresenta il "centro di gravità" della distribuzione; x 2
N i 1 Es.: x ==> punteggio al test di abilità .......
a 5 1 b 3
Modificando l'ordine delle modalità ==>
b 3 2 a 5
11 1
Diploma Diploma
c 9 3 c 9 i 6
4 e 12
2
d 34
conseguito f % conseguito f %
e 12 5 m 15 La mediana (Me) è pari a 17;
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
LICEO 216 54.0 <== MODA PROFESS. 123 30.8 f 23 6 h 17 pari cioè al valore del 6° elemento
della serie ordinata (individuo "h")
PROFESS. 123 30.8 ALTRO 61 15.3 g 18 7 g 18
i 24 9 i 24
l 31 10 l 31
m 15 11 d 34
6
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione) Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
Intervallo: N N x 1 x 2 x 3 ... x n 1 N
i 1
xi
(b) Variabile continua; N pari
==> si ordinano gli elementi del vettore; 2 2
Variabili cardinali MEDIA ARITMETICA:
x
==> si individua l'intervallo i-esimo in cui cade; N N i 1
==> il valore della mediana si ottiene per "interpolazione"
xN xN Principali proprietà:
1
Me 2 2
N N 2
2
ni ident xi
(1) x
i 1
i x 0 (2) x
i 1
i x min
6 6 x 3 x 4 8 12
1 a 1 i 1; 3 i 4 Me 10 La somma dei QUADRATI DEGLI SCARTI da qualunque valore (a media arit.) è più grande
2 2 2 2
2 b 5
}
3 c 8 Per r = 1 ==> ARITMETICA
1 N r
4 d 12
La mediana (Me=10) è compresa fra il valore 8 e 12
Altre medie; in generale: Mr x ir Per
Per
r
r
= 2 ==> QUADRATICA
= -1 ==> ARMONICA
5 e 23
N i 1 Per r che tende a zero ==> GEOMETRICA
6 f 35
(c) Variabile discreta (raggruppata in classi): => La media aritmetica è meno ROBUSTA della mediana; Es.:
ni x1 x2
==> si individua la classe mediana o l'intervallo mediano;
==> il valore della mediana si ottiene per "interpolazione" 1 100 001
valore "eccentrico" in x2
2 150 150
N
Finf dove (con riferimento alla classe mediana) :
Me x1 200 ;
3 200 200
x 1 200 ;
Me Linf 2 m Linf limite inferiore; fm frequenza; 4 300 300
fm ωm ampiezza; Finf freq. cumulata;
5 250 250
x 2 180.2 ; Me x 2 200 ;
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione) Distribuzioni empiriche (operatori di tendenza centrale e di dispersione) Attribuzione del RANGO: esempi
Altri indici di posizione ===> QUANTILI, (PER)CENTILI, RANGO (PER)CENTILE l'attribuzione di RANGO può avvenire:
- sia attribuendo il RANGO MINORE (1) al VALORE MINORE della serie (R1Vmin),
Definizioni: - sia attribuendo il RANGO MINORE (1) al VALORE MAGGIORE della serie (R1Vmax)
RANGO = numero che esprime la posizione di un valore osservato (o punteggio) nell'ambito
Generalmente, nell'ambito dei test (soprattutto nei test di "massima performance") si usa la regola:
dell'insieme, serie o vettore ORDINATO(!) cui il valore osservato appartiene;
R1Vmax
Una difficoltà nell'attribuzione del rango ai valori osservati (o punteggi) consiste nel comportamento da tenere in
QUANTILE = il valore osservato del vettore ORDINATO (MINMAX) che corrsiponde ad una presenza di valori osservati uguali (pareggi o ties)...
qualsiasi suddivisione in parti dei dati (es: quartili, decili, centili)
senza "pareggi" 10 individui sottoposti al test (x1) di abilità verbale con "pareggi"
(PER)CENTILE = il QUANTILE (quando la suddivisione è operata su 100 parti); in tal modo l'm-esimo RANGO (TIES=HIGH)
N_PROG IDENT x1 RANGO
percentile corrisponde a quel valore osservato, del vettore ORDINATO (MINMAX),
1 a 15 7 RANGO (TIES=LOW)
al di sotto del quale cade l'm-esima percentuale dei valori osservati
2 b 8 10
N_PROG IDENT X1 RANGO RANGO RANGO
3 c 10 9
RANGO PERCENTILE =è la percentuale di valori (in funzione dell'attribuzione di RANGO) che si RANGO (TIES=MEAN)
1 a 5 9.5 9 10
4 d 12 8
trova al di sotto di un dato RANGO (cui corrisponde un dato valore osservato) 2 b 8 7.0 7 7
5 e 19 4
3 c 10 6.0 6 6
6 f 23 2
!! ATTENZIONE !! 4 d 12 5.0 5 5
7 g 24 1
il RANGO PERCENTILE di un valore osservato (o punteggio) è una percentuale N_PROG IDENT X1 RANGO
5 e 19 4.0 4 4
8 h 17 6
un QUANTILE o PERCENTILE è un valore osservato (o punteggio) del vettore di dati 9 i 21 3 1 g 24 1 6 f 23 2.0 2 2
10 l 18 5 2 f 23 2 7 g 24 1.0 1 1
se il risultato ottenuto da Pierino ad un test è superiore a quello dell'80% degli altri individui, 4 e 19 4 9 i 21 3.0 3 3
diremo che Pierino occupa l'80° rango percentile (ovvero l'80% degli inividui sottoposti al test ha 5 l 18 5 10 l 5 9.5 9 10
Ordinando in funzione
6 h 17 6
ottenuto una prestazione peggiore); del RANGO
(R1Vmax) 7 a 15 7
8 d 12 8
l'80° percentile (P80) nella serie di punteggi prodotti dalla somministrazione del test (cui Pierino ha
9 c 10 9
partecipato) è – per esempio – il valore (o punteggio): 33
10 b 8 10
7
SCALE DI MISURA: ESERCITAZIONE SCALE DI MISURA: ESERCITAZIONE
8
Commento sulle misure di posizione
Sintesi
9
Operatori di dispersione
10
Dispersione di una distribuzione
Variabilità metrica
La media (o la mediana), individuano l'elemento “centrale” della
distribuzione, ma non danno informazioni sulla dispersione dei valori
di un insieme di dati.
Per variabili cardinali possiamo calcolare diversi indici. In
particolare possiamo avere:
ESEMPIO
◦ Intervalli di variazione
Gli insiemi di valori di età di 7 studenti Campo di variazione (RANGE)
{A}: {11, 8, 10, 9, 17, 8, 7} Differenza interquartile
B:5, 5, 5, 10, 15, 15, 15
C:10, 10, 10, 10, 10, 10, 10 ◦ Scarti da un valore centrale
Scostamento semplice medio
hanno la stessa media (x = 10), ma
in A un solo soggetto ha 10 anni, in B, 10 è la media, ma la distribuzione Scarto quadratico medio (deviazione standard)
di frequenza si bipartisce tra 2 valori: 5 e 15. Infine in C tutti i valori sono Coefficiente di variazione
uguali a 10, media moda e mediana coincidono: la conoscenza della
media riassume l’intera distribuzione.
11
Scostamento semplice medio
Ripasso… proprietà della media aritmetica
“Media degli scarti assoluti dalla media”
i 1
i 0
“Media degli scarti al quadrato dalla media” È la radice quadrata della varianza.
Poiché la varianza è un indice quadratico non direttamente
Si considera la media come “perno” e si fa la somma degli scarti delle confrontabile con la media.
osservazioni dalla media. La deviazione standard o scarto quadratico medio è un indice
Poiché la somma degli scarti di due valori equidistanti dalla media è espresso nella stessa unità di misura della variabile.
0, gli scarti vengono elevati al quadrato.
devianza
N N
(X X ) i
2
(X X ) i
2
N N
12
Varianza e Deviazione standard
Calcoliamo la varianza e la deviazione standard per la variabile
numero di attacchi di panico riportati in una settimana da 8 Pz X (Xi-Xmedia) (Xi-Xmedia)2
pazienti
1 0 0-3.75=-3.75 14.0625
2 3 3-3.75=-.75 .5625
Soggetto 1 2 3 4 5 6 7 8 3 8 8-3-75=4.25 18.0625
N° attacchi di panico 0 3 8 4 5 5 3 2 4 4 4-3.75=.25 .0625
5 5 5-3.75=1.25 1.5625
6 5 5-3.75=1.25 1.5625
Procedimento: 7 3 3-3.75=-.75 .5625
13
Standardizzazione di variabili cardinali (punti z)
Coefficiente di Variazione 6 individui sono stati sottoposti ad un test di abilità matematica (t) e ad un test di
abilità verbale (y); ci si chiede, ad esempio:
==> Andrea risulta più bravo al test di matematica o a quello di verbalizzazione ?
==> Stessa domanda per Giulia.
ID gruppo Y s
1 A 0.19 Media= 0.412 CV A
2 A 0.45 x T Y
3 A 0.46 s2= 0.05
4 A 0.87 0.223 Marco 52 65 t 57.5 y 66.5
5 A 0.38 s= 0.223 CV A 5.41 Andrea 53 60
6 A 0.122 0.412 st 4.1 st 7.9
Giulia 56 75
Diana 59 81 Il confronto è reso disagevole dal fatto che si hanno
Maggiore variabilita’ in B? NO!!! Simona 60 58 medie e deviazioni standard diverse (o diverse unità di
Luca 65 60 misura)
ID gruppo Y
s
1 B 14.5 Media= 25.6 CVB ZT ZY
2 B 27.5
x Marco -1.34 -0.19
3 B 28 s2 = 144.97 xi x Andrea -1.10 -0.82
4
5
B
B
48.5
24 s= 12.04 CVB
12.04
4.72 zi ; (per 1 i N) Giulia -0.37 1.07
6 B 11.1 25.6 sx Diana 0.37 1.83
Simona 0.61 -1.07
Luca 1.83 -0.82
proprietà : 3
4
2
3
5
2
1
1
1
1
2,25
1,75
1,89
0,96
-0,13
1,31
1,45
0,26
-0,66
-0,78
-0,66
-0,78
n . . . . . . . . . . .
(1) z i 0 ; N
. .
1 5
.
2
. .
3 2,75
.
1,71
.
-1,02
.
1,32
.
-0,44
.
0,15
.
i 1
n
3 2.75
(2) z
i 1
2
i
N;
1.71
0.15
1 n
La standardizzazione è condotta sui casi (righe della matrice) utilizzando le
(3) s 2z
N
(z
i 1
i z)2 1 statistiche di riga
14
INDICI DI FORMA DI UNA DISTRIBUZIONE:
SIMMETRIA E CURTOSI ASIMMETRIA POSITIVA
Si definisce simmetria di una distribuzione di frequenza, la sua
specularità rispetto al proprio asse di simmetria
Moda
In una distribuzione simmetrica media mediana e moda coincidono. A
0.15
0.4
0.10
Media
0.3
0.05
0.2
0.00
0 5 10 15 20 25
0.1
sui valori bassi della distribuzione con una lunga coda sui valori alti
-4 -2 0 2 4
della variabile.
La media è maggiore della moda.
La curva normale è il più importante esempio di curva simmetrica
B
8
C
6
0.6
Media
A
4
0.4
2
B
0.2
0
15
Misura di asimmetria o skewness (Pearson) Misura di asimmetria o skeweness
(Pearson)
Esempio: x’=[1.0 2.0 3.0 4.0 4.5 5.0 5.5 ] N=7
x
2
1 N 3
Distribuzione simmetrica N x
=0 2
1 33
i
i 1
2 1 2
3
32 1.44 2 2.07
N
N xi x
Distribuzione asimmetria + >0 i 1 1 0.17
23 (2.32) 3 12.49
1 0.17 con il segno del momento terzo
Distribuzione asimmetria – <0
1=0 NORMALE
2
1 N 3
1<0 ASIMMETRIA (-) A SINISTRA (VALORI ALTI)
N i x x
2
i 1
x
Distribuzione normale con 2 1 N 4
2=3 x
flessi equidistanti dal valore i
centrale 2 42 N i 1
N x x
2 1 N
2
2
i
Distribuzione leptocurtica (+ 2>3 i 1
appuntita) 4 9.81 9.81
2 1.82
Distribuzione platicurtica (+ 22 (2.32) 2 5.38
2<3
piatta) 2 1.82
x
Misura di curtosi proposta da 1 N 4
2=3 NORMALE
x
Pearson: i
2<3 PLATICURTICA (+ PIATTA)
2 42 N i 1
N x x
2 1 N
2
2
2>3 LEPTOCURTICA (+ APPUNTITA)
i
i 1
16
TAVOLA...
ESERCIZIO 2
Il test di abilità cognitive non verbali NNAT è stato somministrato a
2000 soggetti di classi medie. La distribuzione dei punteggi
grezzi si approssima alla curva normale, la media dei punteggi
grezzi è pari a 20 e la deviazione standard è pari a 4.
Calcolare:
a. Quanti soggetti hanno conseguito un punteggio grezzo inferiore
a 16 e quanti inferiore a 12
ESERCIZIO 2, a ESERCIZIO 2, a
z(16) = -1 z(16) = -1
area a-b:.3413 area a-b:.3413
area che rappresenta i soggetti con punteggio area che rappresenta i soggetti con punteggio
inferiore = area totale sottesa: .50-.3413= .1587 inferiore = area totale sottesa: .50-.3413= .1587
15.87% dei soggetti, che corrisponde a 317 15.87% dei soggetti, che corrisponde a 317
soggetti soggetti
z(12) = -2
area a-b: .4772
area che rappresenta i soggetti con punteggio
inferiore = area totale sottesa: .50-.4772 = .0228
2.28% dei soggetti, che corrisponde a 46 soggetti
17
ESERCIZIO 2, b ESERCIZIO 2, c
b. Quanti soggetti hanno conseguito punteggio grezzo c. Quanti soggetti hanno conseguito punteggi
di almeno 28 grezzi compresi fra 12 e 28
z(28) = +2
z(12) = -2 area a-b= .4772
area a-b: .4772
z(28) = +2 area a-b= .4772
area corrispondente ai soggetti con punteggio di
almeno 28: Area compresa fra z = –2 e z = +2 : .4772
+.4772= .9544
.50 - area a-b = .50-.4772=.0228
18