Sei sulla pagina 1di 13

Avvertenze

Statistica descrittiva Le presenti slides possono essere scaricate dal sito del
Dipartimento solo dagli studenti del corso.
Esse non sostituiscono i libri, costituiscono un ausilio
Prof. Augusto Gnisci allo studio.
Insegnamento di Psicometria
Non possono essere usate per qualsiasi altro scopo.
a.a. 2017-18

E’ vietato eseguire copie o fotocopie del materiale


scaricato.

1 2

Cos’è la statistica? Cos’è la statistica?

Branca della matematica (o insieme di metodi) che STATISTICA INFERENZIALE:


si occupa dei metodi di raccolta e di elaborazione
dei dati aggregati. Parte della statistica il cui obiettivo è verificare le
ipotesi sulla popolazione basandosi sui dati di un
Si distingue in descrittiva e inferenziale. campione (facendo, perciò, ricorso al concetto di
STATISTICA DESCRITTIVA: caso).
Parte della statistica il cui obiettivo è descrivere
campioni in termini di variabili o combinazioni tra Generalizzare i risultati dal campione alla
variabili, mediante indici statistici e distribuzioni popolazione implica un’inferenza e la possibilità
(frequenza, percentuale, media, varianza, …) e di commettere errori. Perciò, la statistica
relative distribuzioni grafiche (grafico a barre, inferenziale si occupa della valutazione
torta, istogramma, …). probabilistica degli errori.
3 4

Statistica descrittiva Statistica descrittiva

3 tecniche di elaborazione dei dati della statistica


descrittiva:
a) rappresentazione dei dati e grafiche
b) misure di tendenza centrale e di variabilità
c) trasformazione dei punteggi

5 6

1
Frequenze, proporzioni e
A) Rappresentazioni dei dati: percentuali
Le distribuzioni di frequenza indicano
quanti soggetti sono presenti in ciascun
livello della variabile.

Convenzione decimali: 0,323 = 0.323 = .323


Cornoldi C. & Colpo G. (1981). La verifica dell’apprendimento della lettura. Firenze: OS. 7 8

A) Rappresentazioni dei dati: A) Rappresentazioni dei dati:

4
3
2
1
0

9 10

A) Rappresentazioni dei dati: A) Rappresentazioni dei dati:


Per variabili (a intervalli e a rapporti) continue (per es., l’età)
La soluzione è raggruppare i soggetti in classi di una certa
ampiezza (trasformare la variabile continua in qualitativa)

4
3
2
1
0

11 12

2
Distribuzioni grafiche: Grafico a barre su frequenze
Le distribuzioni di frequenze, proporzioni o
percentuali vengono spesso rappresentate tramite dei
grafici, per motivi di presentazione, chiarezza,
comprensione e comunicazione.
In ascissa  i livelli della variabile
In ordinata  frequenze o proporzioni o percentuali

ascissa = i livelli della variabile


13
ordinata = frequenze, proporzioni, probabilità, percentuali 14

Grafico a barre su frequenze Grafico a barre su percentuali

123 67.7%
32.3%
58

ascissa = i livelli della variabile


ordinata = frequenze, proporzioni, probabilità, percentuali 15 16

Grafico a torta Grafico a barre e Torta

Legenda:
32.3%

67.7%

17 18

3
Quanto era collaborativo il clima durante la
lezione? Istogramma (variabili continue)
Quando le variabili sono continue si usa il
raggruppamento in classi e il relativo
grafico si chiama istogramma. Si
contraddistingue perché le barre sono
accostate (non sono separate come nel
diagramma a barre).
Oppure si utilizza il poligono di frequenza
(o grafico a linee) le classi sono unite da
una linea spezzata.
19 20

Istogramma e Poligono di frequenza Istogramma e Poligono di frequenza

21 22

Ancora variabili continue: Ancora variabili continue:


A volte, quando le variabili sono continue,
si utilizzano grafici in cui, invece di
raggruppare in classi i soggetti, si lasciano i
valori dell’ascissa continui, la proporzione
dei soggetti viene rappresentata da una
curva e la percentuale dei soggetti, invece di
essere riportata in ordinata, è rappresentata
da un’area (il cui valore è uguale a 1 o a
100%). Area sottostante la curva = 1 (100%)
I soggetti che hanno preso 5 sono i più frequenti
23
e hanno dotto e sopra di sé il 50% dei soggetti 24

4
Distribuzioni di due o più
variabili: Tabelle di contingenza (AxB):
2x2
Frequenze di cella
Si possono rappresentare anche Atteggiamento
distribuzioni di due (o più) variabili
contemporaneamente: Favorevole Contrario Tot.
 Uso di tabelle di contingenza (o incrociate) Frequenze marginali
M 7 3 10 di riga
 che contengono frequenze, proporzioni o
percentuali F 6 2 8
 e che possono anch’esse essere rappresentate
in grafici più complessi Tot. 13 5 18 Frequenze totali o N

Frequenze marginali
25 Pedone R. (2002). Statistica per psicologi.diRoma:
colonna
Carocci 26

Tabelle di contingenza (AxB): Tabelle di contingenza (AxB):

Atteggiamento Atteggiamento

Favorevole Contrario Tot. Favorevole Contrario Tot.

M 7 3 10 M 7 3 10
(55.6%) Percentuali (38.9%) (16.7%) (55.6%) Percentuali
F 6 2 8 marginali di riga semplici di cella
F 6 2 8
(44.4%) (33.3%) (27.8%) (44.4%) (7/18)x100 =38.9%
Tot. 13 5 18 Percentuali Tot. 13 5 18
(72.2%) (27.8%) (100%) marginali di colonna (100%)
Pedone R. (2002). Statistica per psicologi. Roma: Carocci 27 (72.2%) (27.8%) 28

Tabelle di contingenza (AxB): Tabelle di contingenza (AxB):

Atteggiamento Atteggiamento

Favorevole Contrario Tot. Favorevole Contrario Tot.

M 7 3 10 M 7 3 10
(70.0%) (30.0%) (100%) Percentuali (di cella) (53.8%) (60.0%) Percentuali (di cella)
condizionali di riga condizionali di colonna
F 6 2 8 F 6 2 8
(75.0%) (25.0%) (100%) (7/10)x100 =70.0% (46.2%) (40.0%) (7/13)x100 =53.8%
Tot. 13 5 18 Tot. 13 5 18
29 (100%) (100%) 30

5
Tabella di contingenza AxBxC ESERCIZI:
2x2x3
Classe: S: Favorevole Contrario Tot. Prendere la ricerca di Cornoldi & Colpo (1981) in:
 Cornoldi C. & Colpo G. (1981). La verifica
M 7 3 10 dell’apprendimento della lettura. Firenze: OS.
Alta Areni A., Ercolani A.P. & Scalisi T.G. (1994).
F 6 2 8 
Introduzione all’uso della statistica in psicologia.
M 5 2 7 Milano: LED.
Media Esercitarsi a mano
F 8 2 10
Esercitarsi con Excel:
M 2 7 9  inserire dati e manipolarli,
Bassa ricavare grafici di tutti i tipi e interpretarli,
F 9 1 10 
 Esportarli in Word.
Tot. 54 (N) 31 32

B) INDICI DI TENDENZA B) INDICI DI TENDENZA


CENTRALE E VARIABILITÀ: CENTRALE E VARIABILITÀ:
Cos’è una misura di tendenza centrale? Per esempio, la media è una misura di tendenza
Un indice o statistica che rappresenta un insieme di centrale che ci fornisce un’informazione sulla
misure mediante un unico valore. “tendenza” di tutto il gruppo dei soggetti in una
Cos’è misura di variabilità? determinata variabile: di media il campione ha
percepito il clima della lezione con un punteggio
Un indice che rappresenta come e quanto i soggetti di 4,5 (tra abbastanza e molto collaborativo). La
di distribuiscono intorno al valore di tendenza misura di variabilità indica quanto i soggetti sono
centrale. vicini a questo valore: la maggior parte dei
soggetti ha un valore compreso tra 4 e 5 (oppure
La prima riduce tutte le misurazioni su un gruppo tra 3 e 5).
ad un solo indice, la seconda reintroduce la
variabilità dei soggetti. 33 34

Indici di tendenza centrale e variabilità


in relazione al tipo di variabili: SCALE NOMINALI
La misura di tendenza centrale è la moda.
La moda corrisponde alla categoria che ha maggiore
frequenza.

M=58, F=123  Moda?

Se ci sono due categorie con la stessa frequenza si


parla di distribuzione bimodale.

35 36

6
SCALE ORDINALI MEDIANA
La misura di tendenza centrale è la
mediana, la misura di variabilità è la
differenza interquartilica.

La mediana corrisponde a quella categoria


sotto la quale e sopra la quale si trovano lo
stesso numero di soggetti.

37 38

Procedura per il calcolo della


mediana Calcolo della mediana
N dispari:
Una volta ordinati i valori in modo crescente, la a) 4, 3, 6, 2, 1, 7, 4, 5, 8 (N=9)
mediana corrisponde al valore centrale, cioè al valore
che, nella distribuzione ordinata dei punteggi, occupa b) 1, 2, 3, 4, 4, 5, 6, 7, 7, 8
la posizione (N+1)/2 (detta posizione mediana). c) posizione mediana= (n+1)/2 = 10/2 = 5a
Se i valori sono pari, la mediana corrisponde al valore d) Me = 4.
centrale individuato. N pari:
Se i soggetti sono dispari si otterrà un valore decimale a) 4, 3, 6, 2, 1, 7, 4, 7, 5, 8 (N=10)
compreso tra due valori b) 1, 2, 3, 4, 4, 5, 6, 7, 7, 8
 se è una variabile ordinale si dice che la mediana è
compresa tra quei due valori c) posizione mediana = (n+1)/2 = 11/2 = 5.5a
 Se è una variabile metrica si sommano e si divide per due: d) La mediana è compresa tra 4 e 5
il valore ottenuto è la mediana. 39 e) Me = (4+5)/2 = 4.5 40

SCALE QUANTITATIVE: MEDIA


Differenza interquartilica e DEVIAZIONE STANDARD
Media o media aritmetica
La somma di tutti i punteggi presi dai soggetti diviso per il
DI = (Q3 – Q1)/2 numero dei soggetti (si indica con un trattino sopra la lettera).

in cui Q3 terzo quartile e Q1 primo quartile

dove xi sono i valori di tutti i soggetti


e N è il numero totale dei soggetti.
41 42

7
Media per dati raggruppati in
classi discrete Indice di variabilità
N soggetti rispondono ad una domanda con Cerchiamo un indice che abbia le seguenti
caratteristiche:
un punteggio che va da 1 a 3. Gli N=37
Sia riassuntivo (un solo valore per indicare quanto
soggetti si distribuiscono così: i soggetti nel complesso variano dalla media)
“1” = 12 Se i soggetti hanno punteggi uguali, non c’è
“2” = 3 variabilità, quindi l’indice deve essere = 0;
Se i soggetti hanno punteggi molto diversi tra loro
“3” = 22 (e quindi molto diversi dalla media), l’indice deve
essere grande.
Più questi punteggi sono diversi dalla media, più
l’indice deve crescere.
43 44

Resoconto
N = 10,

Devianza (!!!) o Sum of Square (SS) o s2 45 46

Devianza del campione o s2


La somma dei quadrati degli scarti dei soggetti dalla Devianza del campione o s2
media

Ma dipende dal numero dei soggetti (N)


Esprime bene la variazione dei soggetti dalla media: è
zero quando i soggetti hanno punteggi uguali e tende a  Un gruppo di 20 soggetti che ha la stessa variabilità
crescere mano a mano che cresce la diversità tra i di un gruppo di 10 soggetti ha con molta probabilità
soggetti (la diversità con la media). una devianza maggiore di quello di 10 soggetti.
Più piccolo è il suo valore più i soggetti sono concentrati Perciò si utilizza una sua trasformazione detta
intorno alla media, più è grande più i soggetti sono varianza
dispersi intorno alla media.
47 48

8
Varianza del campione Deviazione standard o s
Media dei quadrati degli scarti dei soggetti dalla media È semplicemente la radice quadrata della varianza
esprime la distanza media dei soggetti dalla media

Indica quanto i soggetti sono dispersi intorno alla


media:
Ma è espressa in un’unità di misura al quadrato Se è  0, tutti i soggetti tendono ad avere lo stesso
Perciò si utilizza una sua trasformazione detta punteggio, cioè tendono ad essere distribuiti intorno
deviazione standard alla media
Se  grande, i soggetti tendono ad avere punteggi
49 molto lontani dalla media, cioè sono distribuiti lontano.50

e s indicano media e deviazione standard C) TRASFORMAZIONE DEI


del campione (statistica) DATI
m e s indicano media e deviazione
standard della popolazione (parametri)
e indicano media e deviazione standard
della popolazione stimata a partire da un
campione

51 52

C) Trasformazione dei dati


Quando esprimiamo il punteggio grezzo di un Per effettuare questi confronti correttamente,
soggetto non sempre possiamo confrontarlo
possiamo effettuare delle trasformazioni dei
direttamente col punteggi di altri soggetti.
dati.
Per esempio, quando confrontiamo due soggetti
che sono stati sottoposti a due test diversi, uno in Le principali trasformazioni sono di due tipi:
cui il punteggio massimo è 10, l’altro in cui è 50. A. in punti z (riferimenti: m e s)
Oppure, quando confrontiamo due soggetti di età B. in indici di posizione (percentili, decili, quartili,
diversa che sono sottoposti allo stesso test di … (riferimento: posizione nel gruppo)
capacità.

53 54

9
TRASFORMAZIONE IN PUNTI Z In questo modo, il soggetto:
 se ha 0, il suo punteggio è la media
Si esprime il punteggio grezzo di un soggetto  se ha 1, il suo punteggio è una d.s. sopra la media
prendendo come punto di riferimento la media e  se ha –1, il suo punteggio è una d.s. sotto la media
come unità di misura la deviazione standard.  se ha 0.5, sta mezza d.s. sopra la media
 se ha 3.7, sta quasi 4 d.s. sopra la media
 e così via
Perciò, un punteggio z:
 con un segno + o – indica che il soggetto si colloca
sopra o sotto la media
Esprime per ogni soggetto:  uguale a 0 indica che il soggetto ha preso quanto la
 di quante unità di variabilità (dev. stand.) è composto lo media
scarto del soggetto  di una certa intensità indica quante deviazioni standard
55
è sopra o sotto la media 56

Indipendentemente dai valori di M e s iniziali, la nuova


distribuzione di punteggi z ha sempre M = 0 e s = 1.
A partire da questa trasformazione si possono eseguire altre
trasformazioni lineari dei punteggi, se, per convenienza (es.,
evitare decimali), preferiamo imporre una determinata
media e s: Y = a + b z in cui:
 a = 100 (nuova media) b = 15 (nuova s)  QI
 a = 50 e b = 10  punti Z (maiuscolo)
 se la distribuzione è normale punti Z  punti T

57 58

Distribuzione
normale st.
La distribuzione dei punteggi z trasformati (o di qualsiasi
trasformazione vista finora) è la stessa della variabile originaria.
Perciò, per esempio, se il 60% dei soggetti si colloca tra 6 e 7 nella Caratteristiche:
distribuzione originaria delle x e se, supponiamo, 1.5 e 1.8 sono i a) Simmetrica
punti z corrispondenti a 6 e 7, allora, anche nella distribuzione x b) Asintotica a x
trasformata di punti z ci sarà il 60% dei soggetti tra 1.5 e 1.8. c) Unimodale
d) Due flessi (  s)
Ne consegue che:
e) = Me = Mo
se la variabile originaria (x) ha una distribuzione normale, allora
anche la distribuzione di punteggi ha una distribuzione normale, detta
distribuzione normale standardizzata.

Pedon, p. 198
59 60

10
Se la x è distribuita
normalmente e Uso
se x=7.28 e z=+1, Tavole delle tavole
quanti sono i soggetti
sopra e sotto di lui?
Pedon, pp.476-7
Pedone, p.249
50% + 34.13%=84.13%

61 62

Per z=1.96…si trova un valore di probabilità che


equivale a p=.4750 (47.5%)
Perciò tra –1.96 e +1.96 si trova il 95% dei soggetti
Per z=1.96… (cioè, 47.5% + 47.5%)
Secondo gli statistici, questo livello di probabilità
distingue i punteggi veramente alti o veramente bassi
da quelli medi:
 Se il soggetto ricade in quell’area, si dice non è
significativamente diverso da zero (media);
 se il soggetto ricade fuori dall’area, cioè nel 5%, si dice che
il soggetto è significativamente diverso da zero: a seconda
dei casi è particolarmente basso o particolarmente alto.

63 64

Indici di posizione: Percentili


L’uso degli indici di posizione permette di
confrontare la posizione (o rango) dei soggetti
all’interno di gruppi con numerosità diversa:
-1.96 0 +1.96
95% Per es., se due soggetti sono 5° in due test diversi
2.5% 2.5% ma nel primo test i soggetti sono 5 e nel secondo
Gli statistici hanno stabilito convenzionalmente che:
• -1.96 e 1.96 sono valori critici di z (distinguono soggetti normali
sono 120, arrivare quinti nel primo caso significa
ottenere
da soggetti alti e bassi) perché distinguono il 95% dei soggetti dal 2.5% più alto e dal 2.5% una prestazione pessima (ultimo), nel
più basso secondo casi una prestazione buona (5° su 120).
• il livello che separa il 5% dal 95% viene chiamato livello di significa-
tività e indicato con a = .05. 65 66

11
Indici di posizione: Percentili Procedura per calcolo percentili:
1) si ordinano i Ss (da quello che ha preso il
Si esprime il punteggio di un soggetto in relazione alla punteggio più basso a quello che ha preso il
posizione occupata nella distribuzione (cioè nel gruppo punteggio più alto)
di cui fa parte). In particolare, si calcola la sua posizione 2) si vede che posizione occupa il So (per es., è il
come se il gruppo fosse formato da 100 soggetti. 30° in un distribuzione di 50 Ss)
Se il soggetto è 30° su 50 soggetti, che posizione 3) si vede che posizione il So occuperebbe se ci
occuperebbe se i soggetti fossero 100? fossero non 50 Ss ma 100 Ss.
30° : 50 = x : 100 4) è logico pensare che se il So è 30° su 50 Ss
x = 30/50  100 = 60° sarebbe 60° su 100 Ss.
60° viene detto rango percentile 5) si dice perciò che il So è al 60° percentile.

67 68

Attenzione: Indici di posizione: Quartili


Rango (o posizione) (R): I quartili sono quei valori della distribuzione che
dividono il campione in 4 parti uguali (Q1, Q2 e
 Posizione del soggetto rispetto ad N del gruppo Q3)
Rango percentile (Rp): Q1 (primo quartile): valore al di sotto del quale si
 Posizione del soggetto fingendo che i soggetti trova il 25% dei casi;
siano 100 Q2 (secondo quartile): valore al di sotto del quale
si trova il 50% dei casi;
Percentile (P) o Centile (C):
Q3 (terzo quartile): valore al di sotto del quale si
 Il valore del soggetto corrispondente ad un trova il 75% dei casi.
rango percentile
69 70

Indici di posizione: Decili


I decili sono quei valori della distribuzione che P5 P25 P99
dividono il campione in 10 parti uguali (D1, D2,
…, D9) P10 P20 P30 P40 P50 P60 P70 P80 P90
D1 (primo decile): valore al di sotto del quale si
D1 D2 D3 D4 D5 D6 D7 D8 D9
trova il 10% dei casi;
D2 (secondo decile): valore al di sotto del quale si
trova il 20% dei casi; Q1 Q2 Q3

D9 (nono decile): valore al di sotto del quale si
trova il 90% dei casi.
71 72

12
Attenzione:
Percentili, decili e quartili sono quei valori
al di sotto dei quali cadono determinate
percentuali di soggetti.

73

13

Potrebbero piacerti anche