Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1 - LEZIONE - Concetti Statistici Di Base - 2°anno 2010-2011
1 - LEZIONE - Concetti Statistici Di Base - 2°anno 2010-2011
A.A. 20010/2011
Corso di Statistica 2
TESTO CONSIGLIATO
Lantieri PB, Risso D, Ravera G
(nuova edizione)
FENOMENI COLLETTIVI
Per fenomeno si intende tutto ciò che appare direttamente
o indirettamente ai sensi dell’intelletto.
LE VARIABILI DIPENDENTI,
INDIPENDENTI E LE COSTANTI
La variabile è il carattere misurato che noi osserviamo.
QUALITATIVI QUANTITATIVI
CARATTERE QUALITATIVO
In generale, per i carattere qualitativi le modalità si
identificano con attributi, aggettivi e denominazioni varie
specificanti le proprietà dell’unità statistica a cui si riferiscono.
I caratteri qualitativi si dividono in
CARATTERE QUANTITATIVO
I caratteri quantitativi si manifestano con modalità
esprimibili mediante numeri o valori.
QUALITATIVI QUANTITATIVI
CARATTERI
QUALITATIVI QUANTITATIVI
sconnessi ordinati
uguaglianza e disuguaglianza SI SI SI
ordinamento NO SI SI
addizione e sottrazione NO NO SI
Corso di Statistica 3
Modalità
Corso di Statistica 3
… … … … … … … … …
Esempio 1 – Tabella dei dati (o matrice dei dati) contenente 3 variabili (età,
sesso, consumo di medicine) osservate su 5 soggetti (le unità
statistiche)
1 46 F 1
2 52 F 1
3 21 M 0
4 30 F 2
5 39 M 3
Corso di Statistica 3
1 1 1978 27 1
2 2 1987 18 0
3 2 1965 40 3
4 1 1975 30 1
5 2 1968 37 2
Corso di Statistica 3
LA SOMMATORIA
∑X
i =1
i
∑x
i =1
i = x1 + x2 + ...... + xn −1 + xn
Corso di Statistica 3
ESEMPIO
Il carattere Y rappresenta il Reddito. Conosciamo i
redditi mensili di un individuo, il reddito annuo in
formule è dato da
12
X Annuo = ∑ xi = x1 + x2 + ...... + x11 + x12
i =1
con i che indica i mesi
Corso di Statistica 3
MESI REDDITO MENSILE Xi
Gennaio 1000 € x1
Febbraio 1000 € x2
Marzio 1000 € x3
Aprile 1000 € x4
Maggio 1000 € x5
Giugno 1000 € x6
Luglio 1000 € x7
Agosto 1000 € x8
Settembre 1000 € x9
Ottobre 1000 € x10
Novembre 1000 € x11
Dicembre 1000 € x12
12
REDDITO TOTALE ANNUO 12000 €
∑x
i =1
i
12
X Annuo = ∑xi = x1 + x2 + ...... + x11 + x12 =
i =1
∑k = N ⋅k
i =1
∑ (kX ) = k X
i =1
i 1 + kX 2 + ... + kX N −1 + kX N =
N
= k ( X 1 + ... + X N ) = k ∑ X i
i =1
Corso di Statistica 3
∑(X
i =1
i + Yi ) = ∑ X i + ∑ Yi
i =1 i =1
N N
∑(X
i =1
i − k ) = (X 1 − k ) + ... + ( X n − k ) = ∑ X i − Nk
i =1
∑(X Y ) = X Y + X Y
i =1
i i 1 1 2 2 + ... + X N −1YN −1 + X N YN
Corso di Statistica 3
∑( X −Y ) = ∑( X )=
2 2
− 2 XY + Y 2
= ∑ X − 2∑ XY + ∑ Y
2 2
Corso di Statistica 3
CORSO DI STATISTICA
Dott. Laura Perrotta
- Le distribuzioni -
A.A. 2007/2008
Corso di Statistica 3
DISTRIBUZIONE PER UNITÀ
(O DISTRIBUZIONE UNITARIA)
In generale un distribuzione indica come le modalità si
distribuiscono nelle unità del collettivo.
Paziente 1 M 27 60
Paziente 2 M 41 75
Paziente 3 F 65 68
Paziente 4 F 53 56
Paziente 5 M 38 70
Paziente 6 M 42 73
Corso di Statistica 3
18 29°,30° 25 4°,11°,12°,23°,37°,38°
19 2°,31° 26 20°,21°,28°,39°
20 7°,32° 27 13°,19°,27°,40°
21 14°,15°,33° 28 17°,18°,25°
22 8°,16°,34° 29
23 3°,22°,24°,35°,36° 30 6°,26°
24 1°,5°,9°,10°
Corso di Statistica 3
Sesso Paziente
Maschio 1°,2°,5°,6°
Femmina 3°,4°
Corso di Statistica 3
DISTRIBUZIONI DI FREQUENZE
Il numero delle unità che appartengono ad una classe è detto
frequenza assoluta della classe, o frequenza assoluta delle
unità che presentano la modalità X, o più brevemente
frequenza assoluta della modalità X.
DISTRIBUZIONI DI FREQUENZE
Associando ad ogni classe la sua frequenza assoluta si ottiene una
distribuzione di frequenze del collettivo secondo i caratteri
considerati
18 2 25 6
19 2 26 4
20 2 27 4
21 3 28 3
22 3 29
23 5 30 2
24 4 Totale 40
Corso di Statistica 3
DISTRIBUZIONI IN CLASSI
Quando la variabile è quantitativa a carattere continuo, può risultare
utile ridurre il numero delle modalità assunte dalla variabile suddividendo
l’intervallo di variazione in intervalli più piccoli, o classi di frequenza,
in ciascuno dei quali si raccolgono tutte le misure che cadono al suo
interno. I dati così organizzati costituiscono una particolare distribuzione
di frequenze definita distribuzione in classi.
Esempio 1
Classe Peso (Kg) Numero dei Frequenze
pazienti percentuali
I 40 ├ 45 4 5,6
II 45 ├ 50 11 14,0
III 50 ├ 55 32 26,2
IV 55 ├ 60 30 32,7
V 60 ├ 65 14 13,1
VI 65 ├ 70 5 4,7
VII 70 ├ 75 2 3,7
70 ≤ x < 75
L’ampiezza della classe è data dalla differenza tra i confini di una classe
45-40=5, 50-45=5, …
Corso di Statistica 3
Esempio 2
Tab. 12 - Casi di morte per uno specifico tumore in una provincia, suddivisi per
•Una volta stabilite le unità che sono uguali tra loro, queste
vengono considerate come un unico gruppo;
In sintesi:
la suddivisione in classi delle unità della popolazione
si attua riconoscendo quale modalità dei caratteri considerati è
presente in ciascuna unità della popolazione e raggruppando le
unità uguali.
Corso di Statistica 3
LE FREQUENZE
ASSOLUTE RELATIVE E PERCENTUALI
FREQUENZE ASSOLUTE
La frequenza assoluta è puramente descrittiva.
ni
rappresentata la frequenza assoluta corrispondente
alla i-esima modalità.
FREQUENZE RELATIVE
Le frequenze assolute non consentono di confrontare
due collettivi con numerosità differente rispetto ad uno
stesso carattere.
FREQUENZE RELATIVE
f 1, f 2,..., fi,..., fk
n1 n2 ni nk
f 1 = , f 2 = ,..., fi = ,..., fk =
n n n n
0 ≤ f 1 ≤ 1,0 ≤ f 2 ≤ 1,...,0 ≤ fi ≤ 1,...,0 ≤ fk ≤ 1
k
f 1 + f 2 + ... + fi + ... + fk ⇒ ∑f
i =1
i = 1
Corso di Statistica 3
FREQUENZA PERCENTUALE
FREQUENZE PERCENTUALI
p1, p 2,..., pi,..., pk
n1 n2 ni nk
p1 = × 100, p 2 = × 100,..., pi = × 100,..., pk = × 100
n n n n
0 ≤ p1 ≤ 100,0 ≤ p 2 ≤ 100,...,0 ≤ pi ≤ 100,...,0 ≤ pk ≤ 100
k
p1 + p 2 + ... + pi + ... + pk ⇒ ∑p
i =1
i= 100
Corso di Statistica 3
x1 n1 f1 p1
x2 n2 f2 p2
… … … …
xk nk fk pk
Totale n 1 100
Corso di Statistica 3
X CARATTERE
x1 , x2 ,..., xk MODALITA’ DEL CARATTERE
N NUMEROSITA’ DEL COLLETTIVO
n1 , n2 ,..., nk FREQUENZE ASSOLUTE
ni = f i ⋅ N ∀i =1,2,..., k
f1 , f 2 , ... , f i , ..., f k FREQUENZE RELATIVE
ni
fi = ∀i =1,2,..., k
N
p1 , p2 , ..., pi , ..., pk FREQUENZE PERCENTUALI
ni
pi = f i ⋅100 = ⋅100 ∀i =1,2,..., k
N
Corso di Statistica 3
x1 n1 f1 p1
x2 n2 f2 p2
… … … …
xk nk fk pk
Totale n 1 100
Corso di Statistica 3
FREQUENZE CUMULATE
Prendiamo in considerazione la distribuzione di frequenza
dei tifosi della Roma per titolo di studio.
Qual è il numero di tifosi romanisti che possiedono al
massimo la licenza media?
Totale 20.509
Corso di Statistica 3
Paziente 2 M 41 70 75 7,1
Paziente 3 F 65 68 68 0,0
Paziente 4 F 53 63 56 -11,1
Paziente 5 M 38 72 70 -2,8
Paziente 6 M 42 84 73 -13,1
Qf - Qi 60 − 58
Formula : ×100 ⇒ ×100 = 3,4
Qi 58
Tab. 10 - Numero di dimessi per regione per gli anni 2002 e 2003
(numeri assoluti, variazioni assolute e percentuali)
Degenza Ordinaria
Regione Dimessi Variazioni assolute Variazioni %
A.A. 2010/2011
GLI INDICI DI TENDENZA CENTRALE
•Lo scopo della statistica è di evidenziare determinate situazioni
ricavandole da un insieme di osservazioni e da un collettivo di misure.
MEDIA ARMONICA
IL VALORE INTERMEDIO
Il valore intermedio tra due misure estreme è pari a:
x1 + xn
2
(operatore simile al calcolo del valore centrale delle classi)
∑x i
µ =m=x= i =1
n
Tab. 1 - Distribuzione dei mesi secondo le ore di straordinario effettuate
da un infermiere di un ospedale
∑x i
Formula della media aritmetica
µ =m = x = i =1
per distribuzioni unitarie
n
12
∑x i
10 + 12 + 11 + 5 + 7 + 10 + 5 + 0 + 7 + 10 + 7 + 12 96
µ= =
i =1
= =8
n 12 12
∑xn i i
k
µ= i =1
= ∑ xifi
n i =1
∑xn i i
x1n1 +x 2 n 2 +x 3 n 3 +... +xknk
µ= i=
1
= =
n n
n1 n2 nk
=x1 +x 2 +... +xk =
n n n
k
=x1 f 1 +x 2 f 2 +... +xkfk = ∑xifi
i=
1
Esempio di calcolo della media aritmetica mediante la
formula k
∑xn i i
µ=i =1
n
0 1 x1 n1
5 2 x2 n2
7 3 x3 n3
10 3 x4 n4
11 1 x5 n5
12 2 x6 n6
Totale 12 Totale n
APPLICAZIONE DELLA FORMULA
∑x n i i
k
= ∑xifi
Formula della media aritmetica
µ= i =1
per distribuzioni di frequenza
n i =1
∑ xn i i
0 × 1 + 5 × 2 + 7 × 3 + 10 × 3 + 11×1 + 12 × 2 96
µ= i =1
= = =8
n 12 12
0 1 0,083
5 2 0,167
7 3 0,250
10 3 0,250
11 1 0,083
12 2 0,167
Totale 12 1
APPLICAZIONE DELLA FORMULA
∑x n i i
k
= ∑xifi
Formula della media aritmetica
µ= i =1
per distribuzioni di frequenza
n i =1
k
µ = ∑ xifi =
i =1
∑ xn i i
0 ×1 + 5 × 2 + 7 × 3 + 10 × 3 + 11× 1 + 12 × 2 96
µ= i =1
= = =8
n 12 12
k
µ = ∑ xifi = 0 × 0,083 + 5 × 0,167 + 7 × 0,250 + 10 × 0,250 + 11× 0,083 + 12 × 0,167 = 8
i =1
1° Esempio di calcolo della media aritmetica in una distribuzione in classi
∑x n i i
152 × 2 + 157 × 6 + ... + 182 × 7 304 + 942 + ... + 1.274
µ= i =1
= = =
n 82 82
13 .909
= = 169 ,62
82
2° Esempio di calcolo della media aritmetica in una distribuzione in
classi
71× 3 + 74 × 4 + 77 × 22 + ... + 95 × 4
µ= = 83,9
310
Corso di Statistica 3
Esercizio 1 (a.b.c.)
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta,
registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse,
(a) si dica se e’quantitativa o qualitativa, discreta o continua.
(b) dopo aver definito opportunamente le classi di modalita’, calcolare
(c) le frequenze assolute e le frequenze relative;
(d) la media aritmetica di X;
(e) la moda, la mediana.
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghezza in cm 1 2 2 3 4 1 2 1 3 2
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2
∑x i ∑x 1 + 2 + 2 + 3 + 4 +1 + 2 +1 + 3 + 2
i
µ= i =1
= =
i =1
= 2,1
N 10 10
n 4
∑x n i i ∑x ⋅n i i
(1× 3) + (2 × 4) + (3 × 2) + ( 4 ×1)
µ= i =1
= i =1
= = 2,1
N 10 10
n 4
µ = ∑ xi f i = ∑ xi f i = (1× 0,3) + (2 × 0,4) + (3 × 0,2) + (4 × 0,1) = 2,1
i =1 i =1
PROPRIETA’ FONDAMENTALI DELLA
MEDIA ARITMETICA
1. La somma di tutti gli scarti dalla media aritmetica è nulla
n
∑(x i −µ) =0
i=1 2
n
π , π , … , π è data da
1 2 k
Totale 3 45
27 + 21 + 30
MEDIA ARITMETICA µ= = 26
3
27 ×1,2 + 21 ×1,2 + 30 ×0,6
MEDIA ARITMETICA PONDERATA µ= = 25 ,2
1,2 +1,2 + 0,6
LA MEDIA GEOMETRICA
n
MG = n x1 ⋅ x 2 ⋅ ... ⋅ xn = n ∏x i
i =1
f1 fn
MG = x1 ⋅ ...... ⋅ xn
N
Consideriamo tre
valori
n
MG = n x1 ⋅ x 2 ⋅ ... ⋅ xn = n ∏x i =
i =1
n
MA = n
1
∑
i=1 xi
MA ≤MG ≤µ
dove il caso di uguaglianza vale solo nel caso in cui le osservazioni
siano tutte uguali.
SCHEMA DI UTILIZZO DEGLI INDICI DI TENDENZA
CENTRALE RISPETTO ALLA TIPOLIGIA DI CARATTERE
Caratteri Caratteri
quantitativi qualitativi
Medie Aritmetica si no
analitiche Geometrica si no
Armonica si no
Indici di Moda si si
posizione Mediana si si
Quantili si si
INDICI DI POSIZIONE
Moda
Mediana
Quantili
LA MODA
La moda è un indice di tendenza centrale che individua il
gruppo o il dato che compare con maggior frequenza
∆1
moda = L1 + ∆1+ ∆ 2 × c
0 1 0,083
5 2 0,167
7 3 0,250
10 3 0,250
11 1 0,083
12 2 0,167
Totale 12 1
∆∆
1− 2
[(92 −53 ) +(92 −71 )]
4° Esempio di calcolo della classe modale in una distribuzione in
classi (classi con ampiezze diverse)
Tab. 6 - Strutture di degenza classificate in base al numero di posti letto
Numero posti letto Frequenza Ampiezza della Densità di
assoluta classe frequenza
26-50 251 25 10,04
51-100 368 50 7,36
101-150 288 50 5,76
151-200 159 50 3,18
201-300 304 100 3,04
301-500 173 200 0,87
501-800 99 300 0,33
Se n è dispari si avrà n +1
una sola posizione mediana
2
n
Se n è pari si avranno 2
due posizioni mediane n
+1
2
La mediana è data dal “valore/modalità/classe” corrispondente
alla posizione mediana (o alle posizioni mediane).
LA MEDIANA PER CARATTERI QUALITATIVI:
1 54 M Nessun titolo …
2 57 F Laurea …
3 62 F Laurea …
4 46 F Nessun titolo …
5 39 F Diploma …
6 54 M Licenza elementare …
7 57 F Licenza elementare …
8 60 M Nessun titolo …
9 51 F Licenza media …
n = 9 (numerodispari)
Paziente Titolo di studio Posizione Titolo di studio
IN ORDINE CRESCENTE
3 Laurea 3Nessun titolo
4 Nessun titolo 4 Licenza elementare
5 Diploma 5 Licenza elementare
6 Licenza elementare 6 Licenza media
7 Licenza elementare 7 Diploma
8 Nessun titolo 8 Laurea
9 Licenza media 9 Laurea
n = 9 (numero dispari)
n +1 9 +1
= =5 ⇒ La mediana è " LICENZA ELEMENTARE "
2 2
2° Esempio di calcolo della mediana (carattere qualitativo)
1 54 M Basso …
2 57 F Basso …
3 62 F Alto …
4 46 F Medio …
5 39 F Medio …
6 54 M Basso …
7 57 F Medio …
8 60 M Medio …
9 51 F Alto …
10 54 F Alto …
n = 10 (numeropari)
Paziente Livello Creatininemia Posizione Livello Creatininemia
1 Basso
1 Basso
2 Basso
2 Basso
IN ORDINE CRESCENTE
3 Basso
3 Alto
4Medio
4 Medio
5Medio
5 Medio
6Medio
6 Basso
7Medio
7 Medio
8 Alto
8 Medio
9 Alto
9 Alto
10 Alto
10 Alto
n = 10 (numero pari)
n 10
= =5 ⇒ la modalità corrispondente é " Medio"
2 2
n 10
+1 = +1 = 6 ⇒ la modalità corrispondente é " Medio"
2 2
1 54 M Buono …
2 57 F Buono …
3 62 F Ottimo …
4 46 F Ottimo …
5 39 F Normale …
6 54 M Basso …
7 57 F Discreto …
8 60 M Buono …
9 51 F Discreto …
10 54 F Basso …
n = 10 (numeropari)
Paziente Umore Posizione Umore
1 Buono 1 Basso
2 Buono 2 Basso
3 Ottimo 3 Normale
4 Ottimo 4 Discreto
5 Normale 5 Discreto
6 Basso 6 Buono
7 Discreto 7 Buono
8 Buono 8 Buono
9 Discreto 9 Ottimo
10 Basso 10 Ottimo
n = 10 (numero pari)
n 10
= =5 ⇒ la modalità corrispondente é " Discreto"
2 2
n 10
+1 = +1 = 6 ⇒ la modalità corrispondente é " Buono"
2 2
Diploma 3.093
Laurea 1.160
Totale 20.509
Titolo di studio Frequenza Frequenza assoluta
assoluta cumulata
Nessun titolo 1.862 1.862
1.862
Licenza elementare 9.903 11.765
1.862 + 9.903
Licenza media 4.491 16.256
1.862 + 9.903 + 4.491
Diploma 3.093 19.349
…
Laurea 1.160 20.509
Totale 20.509
n + 1 20.509 + 1
= = 10.255 ⇒ La mediana è " LICENZA ELEMENTARE "
2 2
La modalità “licenza elementare” è la mediana.
La mediana della distribuzione è la modalità relativa al dato statistico che
nell’ordinamento stabilito occupa il posto di mezzo.
LA MEDIANA PER CARATTERI QUANTITATIVI:
n
− fcum
mediana = L1 + 2 ×c
fmed
2 F 56 90 95
3 F 48 80 130
4 F 48 85 85
5 M 50 70 95
6 F 54 70 85
7 M 58 65 100
8 M 67 90 130
9 F 61 90 85
Posizione PA sistolica
(mmHg)
1 85
IN ORDINE CRESCENTE
2 85
50% 3 85
4 95
5 95
6 100
7 110
50% 8 130
9 130
n +1 9 +1
= =5 “95” è la modalità mediana
2 2
6° Esempio di calcolo della mediana nel caso di
una distribuzione in classi
Classi peso Valore centrale Frequenza Frequenza
assoluta cumulata
[69,5 – 72,5) 71 3 3
[72,5 – 75,5) 74 4 7
[75,5 – 78,5) 77 22 29
[78,5 – 81,5) 80 53 82
[81,5 – 84,5) 83 92 174
[84,5 – 87,5) 86 71 245
[87,5 – 90,5) 89 46 291
[90,5 – 93,5) 92 15 306
[93,5 – 96,5) 95 4 310
Totale 310
n
− fcum 155 − 82
mediana = L1 + 2 × c = 81,5 + × 3 = 83,9
fmed 92
Corso di Statistica 3
Esercizio 1 (e.)
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta,
registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse,
(a). si dica se e’quantitativa o qualitativa, discreta o continua.
(b). dopo aver definito opportunamente le classi di modalita’, calcolare
(c) le frequenze assolute e le frequenze relative;
(d) la media aritmetica di X;
(e) la moda, la mediana.
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2
(e)
Moda = 2
1_curva simmetrica
CORSO DI STATISTICA 2
Dott. Laura Perrotta
- Lezione 3 - Gli indici di dispersione -
A.A. 2006/2007
Corso di Statistica
INDICI DI DISPERSIONE
∑x i
50 + 50 + 50 + 50 + 50
( Tab.1) µ = i =1
= = 50 ( Tab.2 ) µ = 20 + ... + 80 = 50
n 5 5
166,00
168,00
170,00
172,00
174,00
176,00
178,00
cm 180,00
PIEMO NTE
VALLE
D'AOSTA
Media italiana
LOMBARDIA
VENETO
Corso di Statistica
LIGURIA
EMILIA RO MAG NA
TOSCANA
UMBRIA
MARCHE
LAZIO
ABRUZZO
MOLISE
CAMPANIA
Grafico 1 - Stature degli iscritti nelle liste di leva dei nati nell’anno 1969
PUGLIA
BASIL ICATA
CALABRIA
SICILIA
SARDEG NA
Corso di Statistica
OSSERVAZIONE
INTERVALLO DI VARIAZIONE
(o RANGE)
L’intervallo di variazione è la più elementare misura di
dispersione riferita ai dati quantitativi ed è calcolato come
differenza tra il valore più alto e quello più basso di una serie di dati.
Min = 70
Max = 90
Range = 20
Corso di Statistica
• DEVIANZA
• VARIANZA
• DEVIAZIONE STANDARD
VARIABILITA’ COMPLESSIVA
La variabilità complessiva è costituita dall’insieme degli
scarti di tutte le misure dalla media.
Per la proprietà delle medie la somma degli scarti dalla media
è nulla a causa della compensazione tra scarti positivi e
negativi.
Utilizzando l’artificio del valore assoluto, possiamo
considerare l’entità dello scarto senza tener conto del segno
negativo.
La variabilità complessiva è data da:
∑| X −m|
Nota: calcolare gli N(N-1) / 2 scarti tra tutte le osservazioni diventa troppo
laborioso
Corso di Statistica
∑| X i i −m|
N
Che costituisce il più elementare indice di dispersione con
significato statistico, poco considerato per via dell’artifizio del
valore assoluto
Corso di Statistica
DEVIANZA
In alternativa al valore assoluto si ricorre al quadrato degli
scarti dalla media e si perviene alla formula della devianza:
( )
( ∑ X )
2
∑i i ∑i i
2 i
X − m = X 2
− i
N
DEV ( X ) ≥ 0
Corso di Statistica
Domanda:
40 + 40 + 50 + ... + 55
µ1 = = 50 µ 2 = 50
70
∑ ( xi − µ ) = ( 40 − 50 ) + ( 40 − 50 ) + ( 50 − 50 ) + ... + ( 55 − 50 ) = 10 .620
n 2 2 2 2 2
i =1
∑ ( xi − µ ) = ( 50 − 50 ) + ( 60 − 50 ) + ... + ( 55 − 50 ) = 1.050
n 2 2 2 2
i =1
Corso di Statistica
VARIANZA
Definiamo varianza il rapporto tra la devianza e il
numero delle osservazioni:
∑ (X i − m)
2
σ 2
= i
N
Corso di Statistica
VARIANZA CAMPIONARIA
In campo biostatistico si preferisce utilizzare la formula della
varianza campionaria
∑ (X i − m)
2
S 2
= i
N −1
Per N molto grande è ininfluente ai fini del risultato della
varianza dividere per N o N-1.
Per N molto piccolo se dividiamo la devianza per N-1 rispetto
a N otterremo una varianza campionaria maggiore rispetto a
quella semplice.
DEVIAZIONE STANDARD
La variabilità deve essere associata alla tendenza centrale per
fornire una descrizione completa di un fenomeno.
Il valore della varianza deriva dal quadrato degli scarti dalla media
ed ha un ordine di grandezza differente dal dato originale.
Per un problema di interpretazione del dato è conveniente
esprimere la variabilità con lo stesso ordine di grandezza delle
medie: trasformiamo la varianza sotto il segno di radice e
otteniamo la
( )
n
2
∑ iX − m
Deviazione standard o
scarto quadratico medio
σ= i =1
σ
CV% = ⋅100
µ
Corso di Statistica
1_Esempio di confronto tra variabilità
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 50 75 100
2 F 47 90 95
3 F 74 88 97
4 F 40 86 94
5 M 61 84 95
∑x i
75 + 90 + 88 + 86 + 84 70 + ... + 75
µ1 = i =1
= = 84 ,6 µ2 = = 80
n 5 5
∑ ( xi − µ)
n 2
σ1 = i =1
=
( 75 − 84 ,6 ) +2 ( 90 − 84 ,6 ) 2 + ( 88 − 84 ,6) 2 + ( 86 − 84 ,6) 2 + ( 84 − 84 ,6) 2 = 5,8
n 5
σ2 =
( 70 − 80 ) 2 + ( 90 − 80 ) 2 + ( 80 − 80 ) 2 + ( 85 − 80 ) 2 + ( 75 − 80 ) 2 = 7,9
5
Corso di Statistica
2 F 37 80 10
3 F 63 70 9
4 M 41 90 5
5 M 36 100 13
∑x i
85 + 80 + 70 + 90 + 100 8 + 10 + 9 + 5 + 13
µ1 = i =1
= = 85 µ2= =9
n 5 5
∑ ( xi − µ )
n 2
σ1= i =1
=
( 85 − 85) + 2 ( 80 − 85) 2 + ( 70 − 85) 2 + ( 90 − 85) 2 + (100− 85) 2 = 11,18
n 5
σ2=
( 8 − 9) 2 + (10 − 9) 2 + ( 9 − 9) 2 + ( 5 − 9) 2 + (13 − 9) 2 = 2,91
5
Corso di Statistica
σ1 11,18
(1) CV% = ⋅100 = ⋅100 = 13,15%
µ1 85
σ2 2,91
(2) CV% = ⋅100 = ⋅100 = 32,39%
µ2 9
1 62 1 30 - La moda è 62
2 39 2 39
5 54 5 47
∑a i
30 +39 +46 +... +70
µ= i =1
= =56 ,6
6 68 6 52 n 20
7 63 7 53
- La mediana è 60,5
8 62 8 54
n 20
9 67 9 57 = =10
2 2
10 30 10 60
60 +61
11 66 11 61
⇒ =60 ,5
2
12 46 12 62 n 20
+1 = +1 =11
13 67 13 62 2 2
14 70 14 62
15 60 15 63
16 57 16 66
17 62 17 67
18 47 18 67
19 52 19 68
20 61 20 70
Corso di Statistica
2 39 2 39
Mediana = 60,5
3 46 3 46
μ = 56,6
4 53 4 46
11 66 11 61
∑ ( ai − µ )
n 2
12 46 12 62
σ= i =1
=
13 67 13 62 n
14 70 14 62
=
( 30 − 56,6) 2 + ( 39 − 56,6) 2 + ... + ( 70 − 56,6) 2 =
15 60 15 63 20
16 57 16 66
=
( − 26,6) 2 + ( −17,6) 2 + ... + (13,4) 2 =
17 62 17 67
20
18 47 18 67
707 ,6 + 309 ,8 + ... + 179,6
19 52 19 68 = = 10,63
20
20 61 20 70