ESEMPIO
1
La statistica descrittiva Introduzione
•Modalità: ciascuno dei diversi modi con cui un carattere può presentarsi
ESEMPIO
Il carattere Titolo di studio si può presentare nelle seguenti modalità: licenza media,
qualifica professionale, diploma di scuola media superiore, laurea triennale, laurea
specialistica, dottorato.
Il carattere Utilizzo del tempo libero si può presentare nelle seguenti modalità: riposo,
letture varie, cinema e teatro, discoteche, bar e pub, attività sportive, visite a musei o
mostre, ecc.
2
La statistica descrittiva Caratteri qualitativi e quantitativi
Continuo (intervalli di
numeri reali): ad esempio
l’altezza o il peso.
3
La statistica descrittiva Le distribuzioni di frequenze
• I dati di un’indagine statistica possono essere raccolti in una distribuzione di frequenze (assolute o
relative) nella quale ogni modalità xi del carattere è associata a un numero fi, la sua frequenza assoluta,
che indica quante volte quel carattere compare.
f
• Frequenza relativa: pi i = (T : totale delle
osservazioni) T
In forma percentuale: pi (percentuale) = pi 100%
x1 f1 p1 x: carattere
xi: modalità del carattere
x2 f2 p2
fi: frequenze assolute
pi: frequenze relative
… … …
xn fn pn
4
La statistica descrittiva Rappresentazione grafica
5
La statistica descrittiva Rappresentazione grafica
6
La statistica descrittiva Rappresentazione grafica
7
La statistica descrittiva Rappresentazione grafica
8
La statistica descrittiva Sintesi dei dati
Indici di posizione
Indici di variabilità
Varianza σ2
9
La statistica descrittiva Le medie ferme
Si dice media aritmetica semplice fra n numeri x1, x2, ……., xn il rapporto M fra la loro somma ed n;
x1 + x2 + ……., + xn Σ
i=1
x i
M= =
n n
ESEMPIO
Un’azienda ha raccolto i dati relativi al numero di ore di lavoro mensili complessive dei dipendenti.
mese 1 2 3 4 5 6 7 8 9 10 11 12
N. ore 12360 15865 15940 15758 16075 16124 15635 4520 15942 16214 16120 15658
176211
Calcoliamo il numero medio di ore lavoro mensili. M= = 14684,25
12
La media aritmetica può essere calcolata solo per dati di tipo quantitativo.
10
La statistica descrittiva Le medie ferme
Se i dati di una variabile statistica si presentano con una certa frequenza per calcolare il valor medio si
usa la media ponderata.
Una media in cui ogni dato ha un suo peso (rappresentato dalla sua frequenza) si dice ponderata.
Se f1, f2, …… fn sono le frequenze delle modalità x1, x2, …… xn, la media aritmetica M(x) è data dalla
formula
M(x) = = n
f1 + f2 + … fn
Σ
i=1
f i
11
La statistica descrittiva Le medie ferme
ESEMPIO
0 50 0
1 120 120
2 300 600
3 250 750
4 190 760
5 60 300
6 20 120
7 10 70
2720
M= = 2,72
1000
12
La statistica descrittiva Le medie ferme
Nel caso di una distribuzione per classi, il calcolo della media viene fatto sostituendo ciascuna classe con
il suo termine centrale, ottenuto calcolando la semisomma dei valori estremi.
Maschi Maschi
Altezze Valori centrali
Freq. Prodotti Freq. Prodotti
176 240
Altezza media dei maschi: M = = 176,24 (cm)
1000
168 270
Altezza media delle femmine: M = = 168,27 (cm)
1000
13
La statistica descrittiva Le medie ferme
Si chiama scarto dalla media la differenza fra il valore osservato e la media stessa.
Dati cioè gli n valori x1, x2, …… xn, gli scarti dalla loro media M sono i valori
x1 – M, x2 – M, ……., xn – M
• Se si considerano i quadrati degli scarti, cioè (x1 – M)2, (x2 – M)2 ….., (xn – M)2, la somma dei
quadrati degli scarti della media aritmetica è minima (rispetto a una qualunque altra media).
14
La statistica descrittiva Le medie ferme
• Media geometrica semplice MG fra n numeri positivi x1, x2, ….., xn: radice n-esima del loro prodotto.
ESEMPIO
6
MG = √3 6 9 15 24 36 ≈ 11,32
15
La statistica descrittiva Le medie ferme
F
MG = √(x1)f1 (x2)f2, ….., (xn) fn
ESEMPIO
30
x f MG = √53 69 812 106 ≈ 7,32
5 3
6 9
8 12 Nel caso di distribuzioni per classi si trova prima il
10 6 valore centrale della classe e poi si effettua il calcolo
della media ponderata.
TOTALE (F) 30
16
La statistica descrittiva Le medie ferme
• Media quadratica semplice MQ fra n numeri i x1, x2, x3 ….., xn: radice quadrata della media aritmetica
dei quadrati dei dati.
ESEMPIO
Dati i numeri 3, 5, 7, 9, 12
MQ = √ 32 + 52 + 72 + 92 + 122
5
≈ 7,85
17
La statistica descrittiva Le medie ferme
√
x12 f1 + x22f2 +…..+ xn2fn
• Nel caso di una media ponderata: MQ =
f1 + f2 +…… fn
Nel caso di distribuzioni per classi si usa il termine centrale di ogni classe.
ESEMPIO
x f
5 3
6 9
8 12
10 6
TOTALE (F) 30
MQ = √ 52 3 + 62 9 + 82 12 + 102 6
30
=
√ 1767
30
≈ 7,67
18
La statistica descrittiva Le medie ferme
• Media armonica semplice MA fra due numeri x1, x2, ….., xn: reciproco della media aritmetica dei
reciproci dei dati.
1 n
MA = =
1 1 1 1 1 1
+ + …. + + + …. +
x 1 x2 xn x1 x2 xn
n
f1 + f2 + ….. + fn
MA =
f1 f2 fn
+
x1 x2 + …. +
xn
19
La statistica descrittiva Le medie ferme
ESEMPIO
x f
5 3
6 9
30
8 12 MA = ≈ 7,14
10 6
3 9 12 6
+ + +
5 6 8 10
TOTALE (F) 30
Tutte le medie finora definite si possono calcolare solo per dati di tipo quantitativo.
20
La statistica descrittiva Le medie lasche
Si dice moda (valore modale) di una distribuzione di frequenze, il termine, se esiste, cui corrisponde la
massima frequenza nella distribuzione.
• Una distribuzione può avere più di un termine modale o può non averne (distribuzione in cui ogni
modalità ha la stessa frequenza).
21
La statistica descrittiva Le medie lasche
Nel caso in cui una distribuzione sia per classi, si parla di classe modale.
22
La statistica descrittiva Le medie lasche
• Mediana Me di una distribuzione è il termine che, disposti i dati in ordine crescente o decrescente,
occupa il posto centrale.
• Se i termini fra cui calcolare il valore mediano sono n e n è dispari, la mediana è il valore che occupa il
n+1
posto 2 ; se n è pari, tutti i punti dell’intervallo [x2n , x2n+1 ] sono valori mediani; di solito si assume
il termine centrale di questo intervallo.
ESEMPIO
23
La statistica descrittiva Le medie lasche
Se i valori della distribuzione hanno un loro peso, bisogna calcolare le frequenze cumulate (frequenze
relative a una data modalità uguali alla somma delle frequenze di tutte le modalità minori o uguali a esse).
ESEMPIO
1 2 2
2 8 10
3 12 22
4 6 28
5 2 30
TOTALE (F) 30
Consideriamo adesso la metà del totale delle frequenze (30 : 2 = 15); poiché n = 30, quindi è pari, il
valore mediano è il termine centrale dell’intervallo [x15, x16] ed è quindi necessario trovare quali sono
questi elementi.
continua
24
La statistica descrittiva Le medie lasche
Allora, 2 posti sono occupati dalla modalità 1, 8 posti sono occupati dalla modalità 2 (in totale abbiamo 10
posti, cioè il valore della colonna delle frequenze cumulate in corrispondenza della seconda modalità), 12
sono i posti occupati dalla modalità 3 (in totale abbiamo contato 22 posti, cioè abbiamo superato la
metà); quindi il quindicesimo e il sedicesimo posto sono occupati entrambi dalla modalità 3.
La mediana della distribuzione è quindi il valore centrale dell’intervallo [3, 3], cioè Me = 3.
n+1
Nel caso in cui n è dispari, la mediana corrisponde all’elemento di posto ; per trovarlo basta
2
cercare nella colonna delle frequenze cumulate il primo numero che è maggiore o uguale di tale valore e
25
La statistica descrittiva Le medie lasche
ESEMPIO
Ricoveri Freq. Assol. Freq. cumulate
La metà delle osservazioni è 1000 e quindi per
arrivare alla mediana dobbiamo contare le prime
1000 persone disposte in ordine crescente di
[0-4] 732 732
numero di ricoveri subiti; poiché il valore 1000 e
il valore 1001 delle frequenze cumulate cadono [5-9] 928 1660
nella seconda classe, possiamo dire che la [10-14] 264 1924
classe mediana è la [5 – 9].
[15-19] 56 1980
[20-24] 12 1992
Il valore mediano si calcola poi con la formula:
[25-30] 8 2000
A (2
N
−F ) TOTALE (F) 2000
Me = i +
f
N: numero totale osservazioni
Nel nostro caso:
F: frequenza cumulata fino alla mediana esclusa
f: frequenza della classe mediana
5 (1000 − 732)
Me = 5 + = 6,44 ≈ 6 A: ampiezza della classe mediana
928 i: estremo inferiore della classe mediana
26
La statistica descrittiva Le misure di sisperione
Per avere informazioni su come i dati di una indagine statistica si distribuiscono attorno ai valori di sintesi
e quindi poter confrontare distribuzioni, si studiano gli indici di variabilità.
• Campo di variabilità di un insieme di n dati numerici x1, x2, ….. xn: differenza tra il valore massimo
e il valore minimo degli xi.
ESEMPIO
80 80 85 90 85 60 90 95 95 80 85 115
Il campo di variabilità di questi dati è dato da 115 – 60 = 55; se basassimo le nostre considerazioni
solo su questo valore, saremmo portati a dire che in quel gruppo di persone vi è un’alta variabilità
fra i dati, mentre in realtà, osservando meglio, si nota che la maggior parte di essi (tranne due) si
distribuiscono in un ambito più ristretto compreso fra 80 e 95. Questo è un indice poco sensibile che
è grandemente influenzato dai valori esterni.
27
La statistica descrittiva Le misure di dispersione
• Scarto quadratico medio o deviazione standard σ: media quadratica degli scarti dalla media
aritmetica M.
σ=
√ Σ (xi – M)2
i=1
n
Nel caso di dati semplici
σ=
√ Σ {(xi – M)2 fi }
i=1
n
Σ fi
i=1
Nel caso di dati ponderati con pesi fi
28
La statistica descrittiva Le misure di dispersione
ESEMPIO
Ad otto gruppi di persone è stato chiesto di provare due tipi particolari di shampoo che indicheremo
con A e B, e di sceglierne quindi uno. Gli esiti di questa scelta sono riportati nella seguente tabella.
A 15 12 10 8 11 18 20 10
B 15 12 24 12 14 2 10 18
Sommando le preferenze accordate ai due prodotti, sia A che B ne hanno totalizzate 104.
104
Mediamente = 13 voti da ciascun gruppo
8
continua
29
La statistica descrittiva Le misure di dispersione
ESEMPIO
15 2 4 12 -1 1
112 -1 1 12 -1 1
10 -3 9 24 11 121
8 -5 25 12 -1 1
11 -2 4 14 1 1
18 5 25 2 -11 121
20 7 49 10 -3 9
10 -3 9 18 5 25
√
8
√ Σ (x – 13)2 Σ (x – 13)
√
2
√
126 i 280
σA = i=1 i
= = 3,969 σB = i=1
= = 5,916
8 8 8 8
30