Sei sulla pagina 1di 18

UNIVERSITA' DEGLI STUDI DI TORINO

DIPARTIMENTO DI PSICOLOGIA

 Bibliografia di base

ANALISI DEI DATI E MISURAZIONE IN PSICOLOGIA (a) L. PEDRABISSI, M. SANTINELLO, I test psicologici, Il Mulino, Bologna, 1997 (Escluso il capitolo
9).
dott.ssa Giorgia Molinengo (b) R. ALBANO, Introduzione all'analisi fattoriale per la ricerca sociale, Quaderni di Ricerca del
Dipartimento di Scienze sociali dell' Università di Torino n°4, giugno 2004.
(c) R. MICELI, Percorsi di ricerca e analisi dei dati , Bollati e Boringhieri, 2001 (capitoli I e VI)

ll corso fornisce le conoscenze teoriche e metodologiche iniziali per la realizzazione e l'utilizzo critico dei test L'esame è orale. Una parte, anche consistente, di domande (del tipo a "scelta multipla") potrà essere
psicologici. formulata in modalità scritta (correzione, valutazione e validità saranno contestuali).
Il contesto generale di riferimento è quello della Teoria Classica dei Test (T.C.T.) accompagnato da brevi cenni sugli Gli studenti degli anni precedenti possono portare all'esame il programma dell'anno di riferimento;
sviluppi più recenti della Item Response Theory (I.R.T.).
l'esame è orale
La prima parte è prevalentemente dedicata all'acquisizione (e/o ripasso) degli elementi di matematica e statistica
indispensabili per lo studio dei processi di misurazione in psicologia e allo studio della Teoria Classica dei Test;
La seconda si concentra prevalentemente sugli aspetti applicativi dei test psicologici (scopi, uso, modalità di
somministrazione, deontologia, interpretazione dei punteggi, etc.)
 Il ricevimento studenti si svolge (di norma) il mercoledi pomeriggio previo
appuntamento tramite e-Mail all'indirizzo: g.molinengo@univda.it

 Il materiale didattico usato dal docente durante il corso (appunti, diapositive,


etc.) verrà reso disponibile agli studenti al termine delle lezioni

Corso di Laurea Triennale in Scienze e Tecniche Psicologiche


(a.a. 2015-2016)

Introduzione (2 / 2) Questionario Questionari e test (1 / 9)


Quiz
Strumenti di rilevazione
 PROGRAMMA DETTAGLIATO DEL CORSO Test composti da...
Intervista
Indagine demoscopica Domande (item; stimoli; agenti elicitanti)
Sondaggio
Survey che producono...
Prima parte (La Teoria Classica dei Test e i suoi fondamenti )
Scale di valutazione
Scale di giudizio Risposte (comportamenti)
• Questionari e test; dalle proprietà alle variabili (cenni di teoria dei dati) Check-list
 Vettori e matrici; algebra delle sommatorie e delle produttorie Inventario
 Teoria dei livelli di scala
prof. Renato Miceli Griglia di codifica
 Distribuzioni empiriche; operatori di tendenza centrale e di dispersione
Reattivo Dati
etc. etc.
 Teoria della probabilità (cenni); principali distribuzioni di probabilità e loro proprietà
 La logica della decisione in statistica, test sulle ipotesi Sono tutti strumenti di rilevazione che si
 Principali misure di relazione bivariata differenziano (almeno) per:
 La Teoria Classica dei Test (attendibilità e validità)
 modalità di somministrazione e/o utilizzo...
 Cenni introduttivi alla Item Response Theory  presenza/assenza di uno (o più) codificatori
 scopi... I Test sono strumenti di MISURA
 oggetto di rilevazione (comportamenti; opinioni...)
 etc.
Seconda parte (La Teoria Classica dei Test: aspetti applicativi)
Test Strumenti di misura  Valutazione abilità raggiunte o potenziali (massima performance)
 Personalità, valori, aspettative, atteggiamenti (tipica performance)
 Definizione e scopi dei test psicologici
 Modalità di somministrazione dei test
 Criteri per la scelta di un test e regole deontologiche
 Interpretazione dei punteggi
 Presentazione di esempi ed esercizi INSIEME DI DOMANDE (STIMOLI) CAPACE
TEST DI FAR EMERGERE RISPOSTE VALUTABILI
E INTERPRETABILI QUANTITATIVAMENTE
SULLA BASE DI CRITERI SPECIFICI E STANDARD
PRESTAZIONALI

1
Questionari e test (3 / 9)
Questionari e test (2 / 9)
Cos'é una INTERROGAZIONE? Affinche' una procedura impersonale occupi lo spazio di un'interrogazione è necessario
appurare che essa garantisca (almeno) un livello di confrontabilità dei voti (punteggi)
- insieme di domande cui l'allievo risponde; analogo (o superiore).....

- le risposte (o i silenzi) sono interpretate e valutate quantitativamente


- dall'insegnante sulla base dei propri criteri e standard di prestazione Comprendere potenzialità e limiti di una tale procedura è indispensabile per
valutare pacatamente l'opportunità o meno del suo utilizzo...

Cosa distingue una interrogazione da un test?


 somministrazione orale o scritta ? Porre domande e registrare
 risposte precodificate o aperte ? le risposte è una cosa
 supporto cartaceo o elettronico ? semplice?
Un lungo percorso può iniziare Ovvero
chiedendosi: I dati "parlano" da soli?
Modalità attraverso cui si ottiene la confrontabilità dei voti (o punteggi)

EQUANIMITA' Una stessa domanda può essere posta in molti modi diversi e il modo di porla (il fraseggio) influenza le risposte

STESSO
DOCENTE Una stessa domanda, posta nello stesso modo può essere compresa in modo diverso da gruppi di persone diversi

Interrogazione ? Test Ad una stessa domanda si può rispondere in maniera diversa in funzione del contesto definito dal questionario

DOCENTI Gli effetti dovuti al contesto sono stati studiati tramite la messa a punto di un ampio disegno Un esempio...
DIVERSI sperimentale in cui una domanda sull'interesse delle persone per la politica (negli U.S.A.)
veniva posta agli intervistati prima e dopo altre domande (Zammuner V. L., 1996, pp. 87-93);
(l'esempio qui presentato è una semplificazione)
PROCEDURA
PROFESSIONALITA' IMPERSONALE
Etc.,etc., ...

Esempio di distorsione indotta dal contesto: la stessa domanda viene posta nell'ambito dello stesso questionario Questionari e test (5 / 9) "Teoria" e "Dati" condividono una stessa natura congetturale
prima e dopo la domanda (B) contestualizzante... <<I dati non esistono al di fuori delle operazioni che il ricercatore compie in rapporto a un
2 DOMANDE determinanto quadro di riferimento teorico>>
DOMANDA "A" DOMANDA "B" (B) contestualizzante;
costringe gli intervistati a <<I cosiddetti "dati" non crescono nei prati e i ricercatori non li raccolgono, essi sono
riflettere su un comportamento piuttosto "costruiti" dal ricercatore stesso attraverso procedure di interpretazione e di
<<Alcune persone seguono le vicende politiche la maggior parte che concretamente denota attribuzione di significato>>
del tempo anche quando non ci sono elezioni imminenti, interesse per le vicende politiche trascrizione (su un qualche
mentre altre persone non sono molto interessate alla politica. Qualche definizione: definisce una qualche supporto) di un "fatto" (risultato
Lei direbbe di seguire le vicende politiche: <<Si ricorda come ha votato il suo rappresentante presso il Parlamento caratteristica dell’entità di un PROCESSO DI
(1) la maggior parte del tempo; in una o due leggi che siano state discusse negli ultimi due anni? (Oggetto) sotto osservazione DATO RILEVAZIONE)
(2) in modo abbastanza frequente; (1) Si; CONCETTO, (Idea),
(3) solo qualche volta; (2) No. COSTRUTTO TEORICO,
(4) quasi mai>> Se si, quale legge ....... come ha votato .... >> TRATTO, PROPRIETA'
insieme di REGOLE (algoritmo,
procedura) che governa la
Campione 1 rilevazione e che permette di
A_B evento semplice, asserto rilevare lo STATO di un oggetto VARIABILE..
analogamente rappresentativi descrittivo intersoggettivamente DEFINIZIONE (o caso) rispetto ad una
della stessa popolazione 2 CAMPIONI (Diverso ordine di presentazione) FATTO condiviso (il valore segnato dalla OPERATIVA proprietà (trasformando
(anche se di numerosità diversa) lancetta della bilancia; l'osservazione in un "fatto")
Campione 2 B_A il contenuto del documento
amministrativo; la risposta scritta
RISULTATI: Risposte alla domanda "A" (interesse per la politica) sul foglio di carta; etc.)
<< [oggettività nella scienza] ... non
implica che lo scienziato si
frequenze Risposte alla Campione 1 Campione 2 frequenze Campione 1 Campione 2 distacchi freddamente dall’oggetto
dei suoi studi, né che egli tratti la
osservate domanda A A_B B_A attese A_B B_A CONCETTO DATO gente come oggetti anziché come
persone. Essa non comporta
neppure che ciò che lo scienziato
Interesse ALTO 654 249 603 300 osserva sia ciò che realmente
accade. Oggettività significa che
(risposte=1 o 2) (72.03%) (55.09%) 66.41% 66.37% delle persone, che avessero
guardato sopra la spalla dello
Interesse BASSO 254 203 ENTITA' (OGGETTO) STATO dell'OGGETTO scienziato mentre faceva
305 152 sotto osservazione (rispetto alla proprietà) l’osservazione,
(risposte=3 o 4) (27.97%) (44.91%) 33.59% 33.62% avrebbero visto le stesse cose>>
(McBurney D.H., 1983, p.19).
 2  38.8043 TOTALE 908 452
DEFINIZIONE OPERATIVA
( pr .  .0.0001) (100.00%) (100.00%)

2
Questionari e test (6 / 9)
grandezza, generalmente indicata con una delle ultime lettere dell'alfabeto (x, y, z),
(Limitatamente a processi SINCRONICI) Questionari e test (7 / 9) Matrici elementari: "2-vie 1-modo"
TEORIA DEI DATI
che può assumere tutti i valori appartenenti a un determinato insieme e che
rappresenta in generale tutti gli elementi di tale insieme (Cattel, 1940; Coombs, 1964; Carol, Arabie, 1980)
(Km.) Amsterdam Milano Roma Venezia
VARIABILE...
vettori matrice CxV
MUTABILE Insieme (collettivo) di 5 individui x w A Amsterdam 0 1130 1750 1430

sequenza ordinata e codificata di rilevazioni (osservazioni)  vettore (colonna) di una matrice dati  Alberto  23 M 23 M
 Maria  18 F 18 F
Milano 1130 0 630 300
   età (proprietà)  variabile" x"      
Francesca  21 F  21 F Roma 1750 630 0 580
Il processo di rilevazione può riguardare:  UNA entità in UN arco temporale
 Federico  genere(proprietà)  variabile" w"      
statura   19 M 19 M
Venezia 1430 300 580 0
 Anna   
Renato ha una statura pari a 1.75 mt.  Renato 1.75 19  F  19 F 

Matrici elementari: "2-vie 2-modi"


 UNA entità in PIU' archi temporali (processo DIACRONICO)
Stefano
(statura) un esempio...
T0 T1 T2 ...
T0 0.50
Relazione ASIMMETRICA di APPARTENENZA (ad una classe di equivalenza) Relazione ASIMMETRICA di DOMINANZA [se = 1]
T1 0.67 Stefano 0.50 0.67 1.05 .......
T2 1.05 (statura)
CxV D1, D2, D3, ... Domande Likert S1, S2, S3, ...
.......... ...... Stimoli Test

 PIU' entità in PIU' archi temporali  PIU' entità in UN arco temporale (processo SINCRONICO)
ident statura genere voto ident D1 D2 D3 ident S1 S2 S3
T0 T1 T2 ..... statura 1 175 M 108 1 1 3 5 1 1 0 1

A ...
Renato 1.75 2 150 F 100 2 2 4 2 2 1 1 0
xA,0 xA,1 xA,2
Maria 1.63 3 183 M 98 3 4 1 3 3 0 0 1
B xB,0 xB,1 xB,2 ...
Giuseppe 1.94 4 ... ... .... 4 ... ... .... 4 ... ... ....
C xC,0 xC,1 xC,2 ... .......... ......

.... .... ... ... ... esempi...


CONDIZIONATA PER COLONNA CONDIZIONATA PER RIGA NON CONDIZIONATA

Questionari e test (8 / 9) Un esempio ... MATRICE DATI ELEMENTARE (2 VIE, 2 MODI) Questionari e test (9 / 9) Inoltre le matrici elementari si distinguono...

Le elencherò alcuni comportamenti che le persone adottano per far fronte  PRIMARIE  PICO
Pensando ai prossimi 5 anni, ad un evento alluvionale con ai pericoli idrogeologici. Pensando ad una tale eventualità, Lei o qualcuno Esempio di matrice derivata (micro  macro)
frane e smottamenti che coinvolga la zona in cui abita della sua famiglia ...
quanto è PROBABILE che... ["SI", "NO"]  SECONDARIE  MICRO
 Genere? ["per nulla", "poco", "abbastanza", "molto"]  (1) Ha seguito un corso di pronto soccorso?
 Età?  (1) viabilità interrotta...  (2) Tiene in efficienza (e/o in un luogo particolare) radio e torcia
 (2) servizi (luce, telefono, acqua, etc.) interrotti... elettrica funzionanti a pile?  DERIVATE  MACRO
 (3) suoi beni ... danneggiati...  (3) Ha messo da parte scorte di cibo e acqua?
 (4) sua abitazione principale danneggiata...  (4) Ha trascritto (in un luogo particolare) i numeri di telefono da
 (5) Lei, o persone care, subiscano danni fisici chiamare in caso di emergenza?
 .... etc. etc. (9 comportamenti)

condizionata condizionata <<NON>>


<<colonna>> <<riga>> condizionata --- Es. di matrice dati DERIVATA (versione elementare):  Tabella di contingenza
_N_ IDENT genere eta d12_3 d12_4 d12_5 d85_1 d85_2 d85_3 d85_4 d85_5
1 31 F 51 2 2 2 1 0 1 1 1
2 35 M 42 1 1 1 0 0 1 1 1 Rappresentazione dei dati individuali (2 variabili - X e Y - categoriali) in forma tabellare:
3 41 F 32 1 1 1 0 0 0 0 0
4 50 F 45 0 0 2 0 0 0 0 1
5 53 M 64 0 0 2 0 0 1 0 0
6 66 F 43 0 1 2 1 0 1 1 1
7 88 F 64 2 1 2 1 1 1 1 1 (frequenze; conteggi)
8 91 F 73 2 0 1 0 0 0 0 0
9
10
104
107
F
M
55
21
1
3
1
1
1
1
0
0
0
0
1
1
1
0
1
1
(esempio : f12  2 )
11
12
132 F 41 1 1 0 0 1 1 0 Ident X Y (esempio : f 21  0)
141 F 41 0 0 0 0 0 0 0 0
13 201 F 20 1 3 2 1 0 1 1 0
14
15
245 F 49 1 1 1 0 0 0 0 0
1 1 2 X \ Y 1 2 .. K Tot.
279 M 33 1 1 1 0 0 1 1 0
16 289 F 70 0 0 0 1 0 1 1 0
17 305 F 43 0 1 2 0 0 1 0 1 2 1 2
18 320 M 41 0 1 0 1 0 1 0 0
1 f11 f12 .. f1K f1+
19 327 F 39 3 3 3 1 0 1 1 0 3 1 1
20 333 M 70 3 3 1 0 0 1 1 1
21 349 F 43 1 1 1 0 1 1 1 0
22 352 M 80 0 0 1 1 1 1 1 0
4 2 3 2 f21 f22 .. f22 f2+
23 383 F 50 1 1 1 1 0 1 1 1
24 396 F 31 0 0 0 1 0 0 0 0 5 3 1
25 418 M 74 1 0 0 0 0 1 0 0
26
... .. .. .. .. ...
27
449
506
M
M
65
69
1
1
2
3
2
3
1
0
0
0
1
1
1
0
1
1
6 3 3
28 550 F 85 0 0 2 0 0 1 1 0
29 581 F 61 2 3 3 1 0 1 1 1 7 H K H fH1 fH2 .. fHK fH+
..... .... .... .... .... .... .... .... .... .... .... ....
… … …
Tot. f+1 f+2 .. f+K f++
Tratto da: N ... ...
R. Miceli, "Gli abitanti della valle del Lys e il rischio idrogeologico",
Indagine psico-sociologica, 2006 (N = 407)

3
Livelli di scala delle variabili (1 / 8) Livelli di scala delle variabili (2 / 8)
Il processo di rilevazione può seguire quattro percorsi...

Teoria della
... producendo VARIABILI DIVERSE per quanto riguarda il loro LIVELLO DI SCALA (caratteristiche formali) ... Il PROCESSO DI RILEVAZIONE misurazione
(Stevens, 1946; Torgerson, 1958; Galtung, 1967; Krantz, Luce e altri, 1971; Conti, 1972; Marradi, 1984; Ricolfi, 1985; Miceli, 2001) stabilisce una relazione ...

ELEMENTI ELEMENTI
3 principi della logica classica: SISTEMA EMPIRICO SISTEMA NUMERICO
- unicità del "fundamentum diviosionis" (tutte le categorie in funzione unica proprietà); (tratti o dimensioni)
CLASSIFICAZIONE in
(1) (es. di violazione: << Lei è Maschio o ha 20 anni di età ?)
categorie:
- mutua esclusività (partizione / ricoprimento);
- esaustività (es. uso della categoria "altro") Teoria dei livelli di scala Tecniche e modelli
delle variabili di analisi dei dati
NON-ORDINATE
ORDINATE
(sconnesse)
OPERAZIONE DI RILEVAZIONE UNITA' DI ORIGINE TRASFORMAZIONE LIVELLO DI
MISURA O AMMISSIBILE SCALA
CONTO
(2) ORDINAMENTO di “oggetti” ; attribuzione di rango (rank, ranking); pareggi (tie)
1 CLASSIF IC AZIONE assente assente ---- CATEGORIALE
(transcodifica)
2 ORDINAMENTO assente non (monotona crescente) ORDINALE
(3) CONTEGGIO Numeri interi positivi; frequenze assolute (ASSEGNAZIONE A CATEGORIE convenzionale
y   m ( y );
m ( y )
 0
ORDINATE) y
3A MISURAZIONE non convenzionale (traslazione) DIFFERENZE
Intesa come: convenzionale y  y  a
=> modalità di rilevazione quando si dispone di uno strumento e di una unità 3B MISURAZIONE convenzionale convenzionale (affine) INTERVALLI
(4) MISURAZIONE
y   b  y  a ; b  0 
=> processo di misura quando si costruisce lo strumento e si definisce l’unità
4 MISURAZIONE convenzionale non (dilatazione) RAPPORTI
convenzionale y   b  y ; b  0 
5 CONTEGGIO non non (identica) ASSOLUTA
convenzionale convenzionale y  y

Livelli di scala delle variabili (4 /8)


Livelli di scala delle variabili (3 / 8)
Qualche esempio...
LIVELLO DI SCALA CATEGORIALE (SCALA NOMINALE) SI SI

Matrice dati ID x Confronti ammessi: ID x' x''


(Genere)
ID x z y w q A M A = B; B  C; B = D; etc... A 1 1
(Genere) (Graduatoria) (punti al test) (reddito) (N° romanzi)
B M B 1 1
A M 2 80 4 3 trasformazione ammessa TRANSCODIFICA
C F (restano costanti le "diversità") C 0 2
B M 6 20 2 0
D M D 1 1
C F 3 40 0 1
E F E 0 2
D M 1 45 3 4
.... .... .... .... ....
E F 4 70 6 6
.... .... .... .... .... ....
LIVELLO DI SCALA ORDINALE (SCALA ORDINALE)
SI SI SI

ID Codice identificativo individui ID z Confronti ammessi: ID z' z'' z'''


(Graduatoria) z'=0.5*z z''=ln(z) z'''=exp(z)
x Genere A < B; B > C;C = E; etc...
A 2 A 1.0 0.69 7.39
z Posizione in graduatoria per l'ammissione ad un corso di specializzazione
B 6 trasformazione ammessa B 3.0 1.79 403.43
y Punteggio grezzo (0-100) al test di "comprensione e lettura" MONOTONA CRESCENTE
C 3 (restano costanti le posizioni d'ordine) C 1.5 1.10 20.09
w Reddito netto mensile (migliaia di Euro)
D 1 D 0.5 0.00 2.72
m z 
q N° romanzi letti negli ultimi 3 mesi
E 4 z   m  z ; dove : 0 E 2.0 1.39 54.60
z
.... .... .... .... .... ...

4
Livelli di scala delle variabili (5 / 8) Livelli di scala delle variabili (6 / 8)
LIVELLO DI SCALA INTERVALLI (SCALA DI INTERVALLI) SI NO! LIVELLO DI SCALA INTERVALLI (SCALA DI INTERVALLI)

Esempio di costanza dei rapporti fra le differenze


ID y Confronti ammessi: ID y' y'' nonostante il cambiamento di "scala" (unità di misura)...
(punti al test) y'=2+0.1*y y''=ln(y)
A 80 (A-B) / (A-C); (A-B) / (B-C); etc...
A 10.0 4.38 Si dispone dei dati relativi alla temperatura media, in gradi Fahrenhheit (F), registrata nella citta X,
B 20 B 4.0 2.30 durante il GIORNO e la NOTTE, in due stagioni: ESTATE e INVERNO...
trasformazione ammessa
C 40 AFFINE C 6.0 3.69
(restano costanti i rapporti fra le differenze)
D 45 D 6.5 3.81 Dati F°
y   a  b  y ; dove : b  0 
E 70 E 9.0 4.25 A ESTATE - GIORNO 86.0 (A – B) / (C –D)
.... .... .... .... .... B ESTATE - NOTTE 50.0
C INVERNO - GIORNO 46.4
86.0  50.0 46.4  39.2  36.0 7.2  5
D INVERNO - NOTTE 39.2

Esempio di costanza dei rapporti fra le differenze


nonostante il cambiamento di "scala" (unità di misura)...

C  F  32 1.8 l’escursione termica (GIORNO-NOTTE) ESTIVA è 5 volte superiore a


quella INVERNALE (!!!)
rapporti fra differenze
(Es.:)
F  C  1.8  32

(A-B) / (A-C) (A-B) / (B-C)


Conversione C°
Y (80-20) / (80-40) = 60 / 40 = +1.50 (80-20) / (20-40)= 60 / (-20) = -3.00
unità di misura
Y' (10-4) / (10-6) = 6 / 4 = +1.50 (10-4) / (4-6) = 6 / (-2) = -3.00 SI (A – B) / (C –D)
A ESTATE - GIORNO 30
Y'' (4.38-2.30) / (4.38-3.69) = 2.08 / 0.69 = +3.01 (4.38-2.30) / (2.30-3.69) = 2.08 / (-1.39) = -1.50 NO! B
C
ESTATE - NOTTE
INVERNO - GIORNO
10
8
30  10 8  4   20 4  5
D INVERNO - NOTTE 4

Livelli di scala delle variabili (7 / 8) LIVELLO DI SCALA RAPPORTI (SCALA DI RAPPORTI) Livelli di scala delle variabili (8 /8)
1 € = 1.32 $; 1 $ = 0.76 €
Schema terminologico riassuntivo dei livelli di scala
(migliaia di $)
ID w Confronti ammessi: Indicando come "livelli" i valori distinti (stati) di una generica variabile....
ID w' SI
(reddito)
A/ B; A / C; B / C; etc... w'=0.76*w
(migliaia di €)
A 3.04 Scala di rappporti
A 4 trasformazione ammessa
DILATAZIONE B 1.52 Scala di intervalli
B 2
(restano costanti i rapporti) Scala di differenze Variabili
C 0
C 0 cardinali
Quantità
D 3 w   b  w ; dove : b  0 D 2.28
o VARIABILI
E 4.56 L quantitative CONTINUE
E 6 Scala assoluta O
.... .... o
.... .... METRICHE
I conteggio

LIVELLO DI SCALA ASSOLUTA (SCALA ASSOLUTA) Ordinamenti


V
Ranghi Scala
o
ID q Confronti ammessi: ID q' SI E Gradi
ordinale
VARIABILI
(N° romanzi) q' = q
A/ B; A / C; B / C; etc... DISCRETE
A 3 A 3 Attribuzione a
L categorie ordinate
B 0 trasformazione ammessa B 0
IDENTICA
C 1 C 1
(restano costanti i rapporti)
L
D 4 D 4 Variabili
E 6
q  q E 6
Categorie
o categoriali
I Classi Scala nominale Politomiche
Dicotomiche
.... .... .... .... o Dummy o Booleane
Modalità

5
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)

VARIABILI CATEGORIALI (distribuzioni di frequenza) K K SERIAZIONE DI FREQUENZE (riduzione in classi di una variabile cardinale)
 Fk  N
k 1
f k 1
Classi di età
k 1 LIMITI TABULATI --- LIMITI VERI
==> Distribuzione di frequenze (variabile categoriale con K classi) K Cumulative Cumulative
=> ASSOLUTE Fk
=> RELATIVE (o proporzioni) fk = Fk / N
p
k 1
k  100 ETA Frequency Percent Frequency Percent
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
18  27 17.527.5 17.5  età  27.5
28  37 27.537.5 27.5  età  37.5
18-27 73 14.6 73 14.6
=> PERCENTUALI pk = fk * 100 28-37 114 22.8 187 37.4 38  47 37.547.5 37.5  età  47.5
38-47 145 29.0 332 66.4
SAS System 48-57 76 15.2 408 81.6
48  57 47.557.5 47.5  età  57.5
SAS System
58-67 82 16.4 490 98.0 58  67 57.567.5 57.5  età  67.5
Cumulative Cumulative
68-80 10 2.0 500 100.0
Cumulative Cumulative VARC2 Frequency Percent Frequency Percent 68  80 67.580.5 67.5  età  80.5
VARC1 Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ELEMENTARE 80 16.0 80 16.0
LICEO 216 54.0 216 54.0 MEDIA INF. 162 32.4 242 48.4
PROFESS. 123 30.8 339 84.8 MEDIA SUP. 212 42.4 454 90.8
limiti fk
ALTRO 61 15.3 400 100.0 LAUREA 46 9.2 500 100.0
k tabul. veri fk ak dk dk 
---------------------------------------------------------- ak
1 18  27 17.527.5 73 10 7.300
2 28  37 27.537.5 114 10 11.400
3 38  47 37.547.5 145 10 14.500
4 48  57 47.557.5 76 10 7.600
5 58  67 57.567.5 82 10 8.200
6 68  80 67.580.5 10 13 0.769

FREQUENZA
AMPIEZZA
DENSITÁ

=> La base dei rettangoli è proporzionale alla ampiezza della classe.


=> L'area dei rettangoli rappresenta la frequenza.
=> L'altezza dei rettangoli indica il numero di osservazioni per ogni
sottoclasse di ampiezza unitaria

Distribuzioni empiriche (operatori di tendenza centrale e di dispersione) Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)

Operatori monovariati di tendenza centrale (indici di posizione centrale) Variabili ordinali  MEDIANA: si calcola su un insieme ORDINATO di valori;
si calcola in modo diverso se la variabile è:
(a) CONTINUA e N è dispari;
=> MODA = il livello della variabile che ricorre con maggiore frequenza; (b) CONTINUA e N è pari;
(c) DISCRETA
=> MEDIANA = il livello cui appartiene il caso al di sopra e al di sotto del quale sta il 50% dei casi;
(a) Variabile continua; N dispari N 1
1 N i
 xi
==> il valore che corrisponde all'i-esimo caso del vettore ORDINATO; dove:
=> MEDIA ARIT. = il livello che rappresenta il "centro di gravità" della distribuzione; x 2
N i 1 Es.: x ==> punteggio al test di abilità .......

ORDINANDO ===> (prestazione peggiore  migliore)

MODA: ident xi ni ident xi

a 5 1 b 3
Modificando l'ordine delle modalità ==>
b 3 2 a 5
11  1
Diploma Diploma
c 9 3 c 9 i 6
4 e 12
2
d 34
conseguito f % conseguito f %
e 12 5 m 15 La mediana (Me) è pari a 17;
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
LICEO 216 54.0 <== MODA PROFESS. 123 30.8 f 23 6 h 17 pari cioè al valore del 6° elemento
della serie ordinata (individuo "h")
PROFESS. 123 30.8 ALTRO 61 15.3 g 18 7 g 18

ALTRO 61 15.3 LICEO 216 54.0 <== MODA 8 f 23


h 17

i 24 9 i 24

l 31 10 l 31

m 15 11 d 34

6
Distribuzioni empiriche (operatori di tendenza centrale e di dispersione) Distribuzioni empiriche (operatori di tendenza centrale e di dispersione)

Intervallo: N N x 1  x 2  x 3  ...  x n 1 N
 i  1
  xi
(b) Variabile continua; N pari
==> si ordinano gli elementi del vettore; 2 2
Variabili cardinali  MEDIA ARITMETICA:
x
==> si individua l'intervallo i-esimo in cui cade; N N i 1
==> il valore della mediana si ottiene per "interpolazione"
xN  xN Principali proprietà:
1
Me  2 2
N N 2
2
ni ident xi
(1)  x
i 1
i  x  0 (2)  x
i 1
i  x   min
6 6 x 3  x 4 8  12
1 a 1  i   1; 3  i  4 Me    10 La somma dei QUADRATI DEGLI SCARTI da qualunque valore (a media arit.) è più grande
2 2 2 2
2 b 5

}
3 c 8 Per r = 1 ==> ARITMETICA
1 N  r
4 d 12
La mediana (Me=10) è compresa fra il valore 8 e 12
Altre medie; in generale: Mr    x ir  Per
Per
r
r
= 2 ==> QUADRATICA
= -1 ==> ARMONICA

5 e 23
 N i 1  Per r che tende a zero ==> GEOMETRICA

6 f 35
(c) Variabile discreta (raggruppata in classi): => La media aritmetica è meno ROBUSTA della mediana; Es.:
ni x1 x2
==> si individua la classe mediana o l'intervallo mediano;
==> il valore della mediana si ottiene per "interpolazione" 1 100 001
valore "eccentrico" in x2
2 150 150
N
 Finf dove (con riferimento alla classe mediana) :
Me  x1   200 ;
3 200 200
x 1  200 ;
Me  Linf  2  m Linf  limite inferiore; fm  frequenza; 4 300 300
fm ωm  ampiezza; Finf  freq. cumulata;
5 250 250
x 2  180.2 ; Me  x 2   200 ;

Distribuzioni empiriche (operatori di tendenza centrale e di dispersione) Distribuzioni empiriche (operatori di tendenza centrale e di dispersione) Attribuzione del RANGO: esempi

Altri indici di posizione ===> QUANTILI, (PER)CENTILI, RANGO (PER)CENTILE l'attribuzione di RANGO può avvenire:
- sia attribuendo il RANGO MINORE (1) al VALORE MINORE della serie (R1Vmin),
Definizioni: - sia attribuendo il RANGO MINORE (1) al VALORE MAGGIORE della serie (R1Vmax)
 RANGO = numero che esprime la posizione di un valore osservato (o punteggio) nell'ambito
Generalmente, nell'ambito dei test (soprattutto nei test di "massima performance") si usa la regola:
dell'insieme, serie o vettore ORDINATO(!) cui il valore osservato appartiene;
R1Vmax
Una difficoltà nell'attribuzione del rango ai valori osservati (o punteggi) consiste nel comportamento da tenere in
 QUANTILE = il valore osservato del vettore ORDINATO (MINMAX) che corrsiponde ad una presenza di valori osservati uguali (pareggi o ties)...
qualsiasi suddivisione in parti dei dati (es: quartili, decili, centili)
senza "pareggi"  10 individui sottoposti al test (x1) di abilità verbale  con "pareggi"

 (PER)CENTILE = il QUANTILE (quando la suddivisione è operata su 100 parti); in tal modo l'm-esimo RANGO (TIES=HIGH)
N_PROG IDENT x1 RANGO
percentile corrisponde a quel valore osservato, del vettore ORDINATO (MINMAX),
1 a 15 7 RANGO (TIES=LOW)
al di sotto del quale cade l'm-esima percentuale dei valori osservati
2 b 8 10
N_PROG IDENT X1 RANGO RANGO RANGO
3 c 10 9
 RANGO PERCENTILE =è la percentuale di valori (in funzione dell'attribuzione di RANGO) che si RANGO (TIES=MEAN)
1 a 5 9.5 9 10
4 d 12 8
trova al di sotto di un dato RANGO (cui corrisponde un dato valore osservato) 2 b 8 7.0 7 7
5 e 19 4
3 c 10 6.0 6 6
6 f 23 2
!! ATTENZIONE !! 4 d 12 5.0 5 5
7 g 24 1
il RANGO PERCENTILE di un valore osservato (o punteggio) è una percentuale N_PROG IDENT X1 RANGO
5 e 19 4.0 4 4
8 h 17 6
un QUANTILE o PERCENTILE è un valore osservato (o punteggio) del vettore di dati 9 i 21 3 1 g 24 1 6 f 23 2.0 2 2

10 l 18 5 2 f 23 2 7 g 24 1.0 1 1

Per esempio: 3 i 21 3 8 h 6 8.0 8 8

 se il risultato ottenuto da Pierino ad un test è superiore a quello dell'80% degli altri individui, 4 e 19 4 9 i 21 3.0 3 3

diremo che Pierino occupa l'80° rango percentile (ovvero l'80% degli inividui sottoposti al test ha 5 l 18 5 10 l 5 9.5 9 10
Ordinando in funzione
6 h 17 6
ottenuto una prestazione peggiore); del RANGO
(R1Vmax) 7 a 15 7
8 d 12 8
 l'80° percentile (P80) nella serie di punteggi prodotti dalla somministrazione del test (cui Pierino ha
9 c 10 9
partecipato) è – per esempio – il valore (o punteggio): 33
10 b 8 10

7
SCALE DI MISURA: ESERCITAZIONE SCALE DI MISURA: ESERCITAZIONE

Colore dei capelli Colore dei capelli Nominale


Altezza in cm Altezza in cm Rapporti
Distanza da casa in km Distanza da casa in km Rapporti
Numero di esami svolti
Numero di esami svolti Assoluta
Età in anni
Età in anni Rapporti
Grado di golosità (da 1 a 5)
Grado di golosità (da 1 a 5) Ordinale
Nazionalità
Nazionalità Nominale
Regione di provenienza
Regione di provenienza Nominale
Tipo di diploma scolastico
Tipo di diploma scolastico Nominale

SCALE DI MISURA: ESERCITAZIONE SCALE DI MISURA: ESERCITAZIONE


Numero di errori in un test Rapporti
Numero di errori in un test
Gerarchia militare Ordinale
Gerarchia militare
Grado di accordo rispetto ad una affermazione Ordinale
Grado di accordo rispetto ad una affermazione
Temperatura in gradi Fahrenheit Intervalli
Temperatura in gradi Fahrenheit
Peso in kg Rapporti
Peso in kg
Peso in libbre Rapporti
Peso in libbre
Ordine di arrivo ad una gara Ordinale
Ordine di arrivo ad una gara
Numero sulla maglia dei componenti di una squadra Nominale
Numero sulla maglia dei componenti di una squadra
Altezza in pollici Rapporti
Altezza in pollici

8
Commento sulle misure di posizione
Sintesi

 La moda si considera come il valore tipico dell'insieme di dati


Tipo di variabile Operatore di tendenza poiché è quello che si presenta più spesso. Non tiene però conto
centrale degli altri valori.

Nominale (genere, gruppo Moda


etnico, stato civile…)  La mediana è quel valore che divide in due una distribuzione,
non è influenzata dai valori estremi eventualmente presenti ma
Ordinale (stato di salute, Moda; Mediana solo dal fatto che essi siano sotto o sopra il centro dell'insieme dei
titolo di studio…) dati

Ad intervalli o a rapporti Moda; Mediana; Media


(quoziente di intelligenza,  La media è generalmente considerata la miglior misura di tendenza
centrale, anche se questo è vero solo quando siamo in presenza di
peso, età…) variabili che si distribuiscono in modo normale (gaussiano). Infatti la
media è maggiormente influenzata dai valori estremi.

Operatori o indici di posizione: Quantili Indici di posizione: Esempio

operatori che dividono la distribuzione in più parti uguali

PERCENTILI: si può dividere la distribuzione in cento parti che contengono P25=Q1


un numero uguale di osservazioni.
La mediana è il 50° percentile. n n’ q q’
Elementare 12 12 6,1 6,1
Media 82 94 41,8 47,9
QUARTILI P50=Q2=Med Diploma 45 139 23 70,9
Laurea 57 196 29,1 100
Dividono la distribuzione in 4 parti uguali. Totale 196 100
Ad esempio il I quartile è la modalità della variabile che lascia alla sua
sinistra il 25% dei casi e alla sua destra il 75%. Il secondo quartile coincide
con la mediana P75=Q3

Calcolo dei quartili:


Q1= (N + 1) / 4
Q2 = 2(N + 1) / 4 = (N + 1) / 2
Q3 = 3 (N + 1) / 4

9
Operatori di dispersione

Operatori di dispersione Producono uno scalare con cui si valuta sinteticamente la


diversità esistente tra le osservazioni.

La VARIABILITA’ di un Variabili nominali:  mutabilità (eterogeneità o omogeneità)


fenomeno è la sua attitudine ad Variabili ordinali: variabilità non metrica
assumere differenti valori
Variabili cardinali:  variabilità metrica

Mutabilità Variabilità metrica


Data una variabile nominale a K modalità,
Calcoliamo la media della variabile età in tre gruppi (A, B, C) di 7
la minima eterogeneità si ha nel caso in cui una sola modalità ha studenti:
frequenza assoluta pari a N
A:11, 8, 10, 9, 17, 8, 7
la massima eterogeneità si ha quando ciascuna modalità ha la stessa Media (A)=10
frequenza pari a N/K. Media (B)=10
B:5, 5, 5, 10, 15, 15, 15 Media (C)=10

Minima eterogeneità C:10, 10, 10, 10, 10, 10, 10


Massima eterogeneità

Canale A Canale B Le 3 distribuzioni sono molto diverse, non basta la media a


N N descrivere le variabili, è necessario calcolare anche la dispersione
Istituto professionale 100 20
Istituto tecnico 0 20 (variabilità metrica)
Istituto artistico 0 20
Istituto magistrale 0 20
Liceo 0 20

10
Dispersione di una distribuzione
Variabilità metrica
La media (o la mediana), individuano l'elemento “centrale” della
distribuzione, ma non danno informazioni sulla dispersione dei valori
di un insieme di dati.
Per variabili cardinali possiamo calcolare diversi indici. In
particolare possiamo avere:
ESEMPIO
◦ Intervalli di variazione
Gli insiemi di valori di età di 7 studenti  Campo di variazione (RANGE)
{A}: {11, 8, 10, 9, 17, 8, 7}  Differenza interquartile
B:5, 5, 5, 10, 15, 15, 15
C:10, 10, 10, 10, 10, 10, 10 ◦ Scarti da un valore centrale
 Scostamento semplice medio
hanno la stessa media (x = 10), ma
in A un solo soggetto ha 10 anni, in B, 10 è la media, ma la distribuzione  Scarto quadratico medio (deviazione standard)
di frequenza si bipartisce tra 2 valori: 5 e 15. Infine in C tutti i valori sono  Coefficiente di variazione
uguali a 10, media moda e mediana coincidono: la conoscenza della
media riassume l’intera distribuzione.

Indicatori elementari di variabilità: Gli scarti da un valore centrale


Campo di variazione o range: differenza tra valore massimo e
valore minimo della distribuzione “Operatori che misurano la variabilità come funzione della
diversità tra ciascun termine della distribuzione e un
W=Xmax-Xmin
suo valore centrale”

1. Scostamento semplice medio


Differenza interquartile: 2. Varianza
3. Scarto quadratico medio o deviazione standard
W’=Q3-Q1 4. Coefficiente di variazione
Semidifferenza interquartile:
W’’= (Q3-Q1)/2

11
Scostamento semplice medio
Ripasso… proprietà della media aritmetica
“Media degli scarti assoluti dalla media”

1. La somma degli scarti dalla media aritmetica è 0:


Poiché la somma degli scarti dalla media è 0, gli scarti
vengono presi in modulo.
x x 
n

i 1
i  0

2. La somma dei quadrati degli scarti dei valori xi dalla loro


media aritmetica è minima :
N
N 2
| X  X |
i
 x
i 1
i  a   min, se a  x
sme  i1
N

Varianza Deviazione standard

“Media degli scarti al quadrato dalla media” È la radice quadrata della varianza.
Poiché la varianza è un indice quadratico non direttamente
Si considera la media come “perno” e si fa la somma degli scarti delle confrontabile con la media.
osservazioni dalla media. La deviazione standard o scarto quadratico medio è un indice
Poiché la somma degli scarti di due valori equidistanti dalla media è espresso nella stessa unità di misura della variabile.
0, gli scarti vengono elevati al quadrato.

devianza

N N

(X  X ) i
2
(X  X ) i
2

Var s2  i1 s  s2  i1

N N

12
Varianza e Deviazione standard
Calcoliamo la varianza e la deviazione standard per la variabile
numero di attacchi di panico riportati in una settimana da 8 Pz X (Xi-Xmedia) (Xi-Xmedia)2
pazienti
1 0 0-3.75=-3.75 14.0625
2 3 3-3.75=-.75 .5625
Soggetto 1 2 3 4 5 6 7 8 3 8 8-3-75=4.25 18.0625
N° attacchi di panico 0 3 8 4 5 5 3 2 4 4 4-3.75=.25 .0625
5 5 5-3.75=1.25 1.5625
6 5 5-3.75=1.25 1.5625
Procedimento: 7 3 3-3.75=-.75 .5625

1) Si calcola la media 8 2 2-3.75=-1.75 3.0625


2) Si calcolano gli scarti dalla media e si elevano al quadrato 39.4995
3) Si fa la sommatoria media= (0+3+8+4+5+5+3+2) / 8 = 3.75
4) Si divide per N e si ottiene la varianza s2 = (39.4995) / 8 = 4.93
5) Si estrae la radice quadrata e si ottiene la deviazione standard
s = 2.22 attacchi di panico

Immaginiamo di avere misurato l’abilità di lettura (Y) con un Coefficiente di Variazione


apposito test di due gruppi (A e B) di 6 soggetti. I dati ottenuti
sono riportati nelle seguenti tabelle. Varianza, deviazione standard, scostamento semplice medio e devianza
In quale dei 2 gruppi c’è maggiore variabilità? sono misure assolute, il loro valore dipende dall’unità di misura delle
variabili.
ID gruppo Y ID gruppo Y Per confrontare la variabilità di distribuzioni espresse con diverse unità di
1 A 0.19 1 B 14.5 misura si può utilizzare il coefficiente di variazione:
2 A 0.45 2 B 27.5
3 A 0.46 3 B 28
4 A 0.87 4 B 48.5
5 A 0.38 5 B 24 s
6 A 0.122 6 B 11.1 CV 
Gruppo B
x
Gruppo A
Media= 0.412 Media= 25.6
Il coefficiente di variazione è un numero puro (indipendente dall’unità di
s2= 0.05 s2= 144.97 misura)
s= 0.223 s= 12.04
Il coefficiente di variazione può essere applicato soltanto a variabili a
livello di scala di rapporti o su scala assoluta
Maggiore variabilità in B? NO!!!

13
Standardizzazione di variabili cardinali (punti z)
Coefficiente di Variazione 6 individui sono stati sottoposti ad un test di abilità matematica (t) e ad un test di
abilità verbale (y); ci si chiede, ad esempio:
==> Andrea risulta più bravo al test di matematica o a quello di verbalizzazione ?
==> Stessa domanda per Giulia.
ID gruppo Y s
1 A 0.19 Media= 0.412 CV A 
2 A 0.45 x T Y
3 A 0.46 s2= 0.05
4 A 0.87 0.223 Marco 52 65 t  57.5 y  66.5
5 A 0.38 s= 0.223 CV A   5.41 Andrea 53 60
6 A 0.122 0.412 st  4.1 st  7.9
Giulia 56 75
Diana 59 81 Il confronto è reso disagevole dal fatto che si hanno
Maggiore variabilita’ in B? NO!!! Simona 60 58 medie e deviazioni standard diverse (o diverse unità di
Luca 65 60 misura)
ID gruppo Y
s
1 B 14.5 Media= 25.6 CVB  ZT ZY
2 B 27.5
x Marco -1.34 -0.19
3 B 28 s2 = 144.97 xi  x Andrea -1.10 -0.82
4
5
B
B
48.5
24 s= 12.04 CVB 
12.04
 4.72 zi  ; (per 1  i  N) Giulia -0.37 1.07
6 B 11.1 25.6 sx Diana 0.37 1.83
Simona 0.61 -1.07
Luca 1.83 -0.82

Quando la standardizzazione è di riga:


Standardizzazione di variabili cardinali (punti z)
deflazione
Data una variabile cardinale con una media e una deviazione standard date, Immaginiamo di aver registrato in matrice le risposte di un collettivo relative al
possiamo trasformare i valori in un’altra variabile che avrà media 0 e varianza 1 gradimento rispetto ai servizi di un comune con una variabile likert a 5 pioli

xi  x Punteggi grezzi Statistiche di riga Punteggi deflazionati


zi  ; (per 1  i  N) Verde
Trasporti Turismo Viabilità pubblico media
Verde
dev.stand Trasporti Turismo Viabilità pubblico
sx 1 3 2 1 5 2,75 1,71 0,15 -0,44 -1,02 1,32
2 4 1 4 3 3 1,41 0,71 -1,41 0,71 0,00

proprietà : 3
4
2
3
5
2
1
1
1
1
2,25
1,75
1,89
0,96
-0,13
1,31
1,45
0,26
-0,66
-0,78
-0,66
-0,78
n . . . . . . . . . . .

(1)  z i  0 ; N
. .
1 5
.
2
. .
3 2,75
.
1,71
.
-1,02
.
1,32
.
-0,44
.
0,15
.

i 1
n
3  2.75
(2) z
i 1
2
i
 N;
1.71
 0.15

1 n
La standardizzazione è condotta sui casi (righe della matrice) utilizzando le
(3) s 2z 
N
 (z
i 1
i  z)2  1 statistiche di riga

14
INDICI DI FORMA DI UNA DISTRIBUZIONE:
SIMMETRIA E CURTOSI ASIMMETRIA POSITIVA
Si definisce simmetria di una distribuzione di frequenza, la sua
specularità rispetto al proprio asse di simmetria
Moda
In una distribuzione simmetrica media mediana e moda coincidono. A

0.15
0.4

0.10
Media
0.3

0.05
0.2

0.00
0 5 10 15 20 25
0.1

A) Distribuzione asimmetrica positiva: le osservazioni sono addensate


0.0

sui valori bassi della distribuzione con una lunga coda sui valori alti
-4 -2 0 2 4
della variabile.
La media è maggiore della moda.
La curva normale è il più importante esempio di curva simmetrica

ASIMMETRIA NEGATIVA Curtosi: misura di quanto una distribuzione è


più appuntita di una normale
Moda
0.8

B
8

C
6

0.6

Media
A
4

0.4
2

B
0.2
0

0.7 0.8 0.9 1.0


0.0

B) Distribuzione asimmetrica negativa: le osservazioni sono addensate sui


-2 -1 0 1 2
valori alti della distribuzione con una lunga coda sui valori bassi della
variabile.
La media è minore della moda. A) Distribuzione normale
B) Distribuzione platicurtica (+ piatta)
C) Distribuzione leptocurtica (+ appuntita)

15
Misura di asimmetria o skewness (Pearson) Misura di asimmetria o skeweness
(Pearson)
Esempio: x’=[1.0 2.0 3.0 4.0 4.5 5.0 5.5 ] N=7

 x 
2
1 N 3

Distribuzione simmetrica N x 
=0 2
 1  33   
i
i 1

 
2  1 2
3

 32  1.44 2 2.07
N

N xi  x 
Distribuzione asimmetria + >0  i 1  1     0.17
 23 (2.32) 3 12.49
 1  0.17 con il segno del momento terzo
Distribuzione asimmetria – <0

1=0 NORMALE
2
1 N 3
 
1<0 ASIMMETRIA (-) A SINISTRA (VALORI ALTI)

Misura di asimmetria proposta da  32  N  xi  x  1>0 ASIMMETRIA (+) A DESTRA (VALORI BASSI)


Pearson:  1  3   i 1 
2  1 N 3

N  i x  x
2

 
 i 1 

Curtosi: misura di quanto una distribuzione è


più appuntita di una normale Misura di curtosi (Pearson)
Esempio: x’=[1.0, 2.0, 3.0, 4.0, 4.5, 5.0, 5.5 ] N=7

 x 
 Distribuzione normale con 2 1 N 4
2=3 x
flessi equidistanti dal valore  i

centrale  2  42  N i 1

 N  x  x  
2  1 N
 2
2

 
i
 Distribuzione leptocurtica (+ 2>3 i 1
appuntita) 4 9.81 9.81
2     1.82
 Distribuzione platicurtica (+  22 (2.32) 2 5.38
2<3
piatta)  2  1.82

 x 
Misura di curtosi proposta da 1 N 4
2=3 NORMALE
x
Pearson:  i
2<3 PLATICURTICA (+ PIATTA)
 2  42  N i 1

 N  x  x  
2  1 N
 2
2
2>3 LEPTOCURTICA (+ APPUNTITA)
 
i
i 1

16
TAVOLA...
ESERCIZIO 2
Il test di abilità cognitive non verbali NNAT è stato somministrato a
2000 soggetti di classi medie. La distribuzione dei punteggi
grezzi si approssima alla curva normale, la media dei punteggi
grezzi è pari a 20 e la deviazione standard è pari a 4.

Calcolare:
a. Quanti soggetti hanno conseguito un punteggio grezzo inferiore
a 16 e quanti inferiore a 12

b. Quanti soggetti hanno conseguito punteggio grezzo di almeno


28

c. Quanti soggetti hanno conseguito punteggi grezzi compresi fra


12 e 28

ESERCIZIO 2, a ESERCIZIO 2, a
z(16) = -1 z(16) = -1
 area a-b:.3413  area a-b:.3413
 area che rappresenta i soggetti con punteggio  area che rappresenta i soggetti con punteggio
inferiore = area totale sottesa: .50-.3413= .1587 inferiore = area totale sottesa: .50-.3413= .1587
 15.87% dei soggetti, che corrisponde a 317  15.87% dei soggetti, che corrisponde a 317
soggetti soggetti

z(12) = -2
 area a-b: .4772
 area che rappresenta i soggetti con punteggio
inferiore = area totale sottesa: .50-.4772 = .0228
 2.28% dei soggetti, che corrisponde a 46 soggetti

17
ESERCIZIO 2, b ESERCIZIO 2, c
b. Quanti soggetti hanno conseguito punteggio grezzo c. Quanti soggetti hanno conseguito punteggi
di almeno 28 grezzi compresi fra 12 e 28

z(28) = +2
z(12) = -2  area a-b= .4772
 area a-b: .4772
z(28) = +2  area a-b= .4772
 area corrispondente ai soggetti con punteggio di
almeno 28: Area compresa fra z = –2 e z = +2 : .4772
+.4772= .9544
.50 - area a-b = .50-.4772=.0228

 95.44 dei soggetti, che corrisponde a 1909


 2.28% dei soggetti, che corrisponde a 46 soggetti soggetti

18

Potrebbero piacerti anche