Sei sulla pagina 1di 39

Corso di Statistica

I Facoltà di Medicina e Chirurgia

CORSO DI STATISTICA
Dott.sa Laura Perrotta
- Esercizi -

A.A. 2009/2010
Corso di Statistica
ESERCIZIO 1: Di seguito sono riportati i livelli di colesterolo
di un individuo, rilevati giornalmente nell’arco di tre
settimane:

Livelli di XiLivelli di Xi
colesterolo colesterolo Calcolare:
1 giorno 49 12 giorno 19
2 giorno 48 13 giorno 21 •La media aritmetica dei
3 giorno 41 14 giorno 19 livelli di colesterolo
4 giorno 35 15 giorno 13
5 giorno 36 16 giorno 16 •La devizione standard
6 giorno 32 17 giorno 12
7 giorno 28 18 giorno 13
•La mediana
8 giorno 31 19 giorno 8
9 giorno 27 20 giorno 2
10 giorno 23 21 giorno 8
11 giorno 19
Corso di Statistica

La media aritmetica dei livelli di colesterolo è data


dall’espressione analitica:

4 94 84 13 53 63 22 83 12 72 31 91 92 11 91 31 61 21 38 2 8
2 1
La media aritmetica è pari a m = 23,81
Corso di Statistica

La deviazione standard o scarto quadratico medio dei livelli


di colesterolo si calcola applicando la seguente formula:

Deviazione standard = σ = 13.8


Corso di Statistica
Per il calcolo della mediana “per prima cosa” si dispongono
i dati in ordine crescente
Livelli di XiLivelli di Xi La mediana è il valore che
colesterolo colesterolo
bipartisce la distribuzione dei
20 giorno 210 giorno 23
dati, poiché i dati sono in
19 giorno 89 giorno 27 numero dispari (n = 21) il
21 giorno 87 giorno 28 posto centrale è dato da:
17 giorno 128 giorno 31
15 giorno 136 giorno 32 (n +1) / 2 = 22 / 2 = 11
18 giorno 134 giorno 35
16 giorno 165 giorno 36 Per tanto la mediana è data
11 giorno 193 giorno 41 dal valore che occupa l’11°
12 giorno 192 giorno 48 posto:
14 giorno 191 giorno 49
Me = 21
13 giorno 21
Corso di Statistica
2 - Calcolare le frequenze percentuali della seguente distribuzione e
rappresentarla graficamente
Tab. 2 - Distribuzione dei pazienti per sesso

Frequenze Frequenze
assolute percentuali

Maschi 14 70,0
Femmi 6 30,0
ne
Totale 20 100,0

Grafico 1 - Distribuzione dei pazienti per sesso


1
00
9
0
8
0
7
0
6
0
5
0
4
0
3
0
2
0
1
0
0
m
as
chi fe
m m
in
e
Corso di Statistica

Tab. 4 - Distribuzione dei pazienti per classi di età


Frequenze Frequenze
assolute percentuali
30-34 1 5,0

35-39 1 5,0

40-44 0 0,0

45-49 3 15,0

50-54 3 15,0

55-59 1 5,0

60-64 6 30,0

65-69 4 20,0

70-74 1 5,0

Totale 20 100,0
Corso di Statistica

Grafico 2 - Distribuzione dei pazienti per classi di età

0
30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74
Corso di Statistica

codice paziente età Posizione età


Calcolare moda, media e mediana,
1 62 1 30 range e deviazione standard
2 39 2 39 dell’età dei seguenti pazienti
3 46 3 46

4 53 4 46

5 54 5 47
- La moda è 62
6 68 6 52

7 63 7 53
- La media aritmetica è 56,6
8 62 8 54
n
9 67 9 57 ∑a i
30 +39 +46 +... +70
10 30 10 60 µ= i =1
= =56 ,6
n 20
11 66 11 61

12 46 12 62 - La mediana è 60,5
13 67 13 62 n 20
= =10
14 70 14 62 2 2
15 60 15 63 60 +61
⇒ =60 ,5
16 57 16 66
2
n 20
17 62 17 67 +1 = +1 =11
2 2
18 47 18 67

19 52 19 68

20 61 20 70
Corso di Statistica

codice paziente età Posizione età INDICI DI TENDENZA CENTRALE


Moda = 62
1 62 1 30

2 39 2 39
Mediana = 60,5
3 46 3 46
μ = 56,6
4 53 4 46

5 54 5 47 INDICI DI VARIABILIT A'


6 68 6 52 minimo = 30
7 63 7 53 massimo = 70
8 62 8 54 range = 40
9 67 9 57 deviazione st. = 10,63
10 30 10 60

11 66 11 61
∑ ( ai − µ )
n 2

12 46 12 62
σ= i =1
=
13 67 13 62 n
14 70 14 62
=
( 30 − 56,6) 2 + ( 39 − 56,6) 2 + ... + ( 70 − 56,6) 2 =
15 60 15 63 20
16 57 16 66
=
( − 26,6) 2 + ( −17,6) 2 + ... + (13,4) 2 =
17 62 17 67
20
18 47 18 67
707 ,6 + 309 ,8 + ... + 179,6
19 52 19 68 = = 10,63
20
20 61 20 70
Corso di Statistica

Descriptive Statistics: età


N Valid 20
Missing 0
Mean 56,6
Median 60,5
Mode 62
Std. Deviation 10,6346
Range 40
Minimum 30
Maximum 70
Corso di Statistica

codice peso (Kg) Posizione peso


paziente (Kg)

1 56,7 1 46,0
- La moda è 65
2 90,6 2 51,9

3 65,0 3 53,5
- La media aritmetica è 73,98
4 106,0 4 56,7
n
5 68,0 5 65,0 ∑a i
46,0 + 51,9 + ... + 106 ,0
6 65,0 6 65,0 µ= i =1
= = 73,98
n 20
7 86,0 7 65,0

8 74,0 8 68,0
- La mediana è 74,7
9 78,8 9 69,5
n 20
10 46,0 10 74,0 = = 10
2 2
11 83,7 11 75,4
74 + 75,4
12 95,5 12 78,8 ⇒ = 74,7
2
13 87,0 13 80,8
n 20
14 51,9 14 81,3
+1 = +1 = 11
2 2
15 75,4 15 83,7

16 53,5 16 86,0

17 81,3 17 87,0

18 69,5 18 90,6

19 80,8 19 95,5

20 65,0 20 106,0
Corso di Statistica

codice peso (Kg) Posizione peso


paziente (Kg)
INDICI DI TENDENZA CENTRALE
1 56,7 1 46,0
Moda = 65
2 90,6 2 51,9
Mediana = 74,7
3 65,0 3 53,5
μ = 73,98
4 106,0 4 56,7

5 68,0 5 65,0
INDICI DI VARIABILITA'
6 65,0 6 65,0
minimo = 46
7 86,0 7 65,0
massimo = 106
8 74,0 8 68,0
range = 60
9 78,8 9 69,5
deviazione st. = 15,53
10 46,0 10 74,0

11 83,7 11 75,4

∑ ( ai − µ )
n 2
12 95,5 12 78,8

13 87,0 13 80,8 σ= i =1
=
n
14 51,9 14 81,3

=
( 46,0 − 73,98) 2 + ( 51,9 − 73,98) 2 + ... + (106,0 − 73,98) 2 =
15 75,4 15 83,7
20
16 53,5 16 86,0

17 81,3 17 87,0 =
( − 27,98) 2 + ( − 22,08) 2 + ... + ( 32,02) 2 = 15,53
20
18 69,5 18 90,6

19 80,8 19 95,5

20 65,0 20 106,0
Corso di Statistica
Tab. 7 - Distribuzione dei pazienti per classi di peso
Classi peso Frequenza assoluta

[69,5 – 72,5) 3
[72,5 – 75,5) 4
[75,5 – 78,5) 22
[78,5 – 81,5) 53
[81,5 – 84,5) 92
[84,5 – 87,5) 71
[87,5 – 90,5) 46
[90,5 – 93,5) 15
[93,5 – 96,5) 4
Totale

Calcolare:

- Indici di tendenza centrale


- Indici di variabilità
Corso di Statistica

Classi peso Frequenza assoluta Valore centrale

[69,5 – 72,5) 3 71
[72,5 – 75,5) 4 74
[75,5 – 78,5) 22 77
[78,5 – 81,5) 53 80
[81,5 – 84,5) 92 83
[84,5 – 87,5) 71 86
[87,5 – 90,5) 46 89
[90,5 – 93,5) 15 92
[93,5 – 96,5) 4 95
Totale 310
k

∑x n i i
71 ×3 + 74 × 4 + 77 × 22 + ... + 95 × 4
µ= i =1
= = 83,9
n 310
Corso di Statistica

Classi peso Frequenza assoluta Valore centrale


[69,5 – 72,5) 3 71
[72,5 – 75,5) 4 74
[75,5 – 78,5) 22 77
[78,5 – 81,5) 53 80
[81,5 – 84,5) 92 83
[84,5 – 87,5) 71 86
[87,5 – 90,5) 46 89
[90,5 – 93,5) 15 92
[93,5 – 96,5) 4 95
Totale 310

- classe modale = [81,5 - 84,5 )

92 −53
- moda = L1 + ∆ ×c =81 ,5 +
1
×3 =83 ,4
∆∆
1− 2
[(92 −53 ) +(92 −71 )]
Corso di Statistica

Classi peso Frequenza Valore centrale Frequenza


assoluta cumulata
[69,5 – 72,5) 3 71 3
[72,5 – 75,5) 4 74 7
[75,5 – 78,5) 22 77 29
[78,5 – 81,5) 53 80 82
[81,5 – 84,5) 92 83 174
[84,5 – 87,5) 71 86 245
[87,5 – 90,5) 46 89 291
[90,5 – 93,5) 15 92 306
[93,5 – 96,5) 4 95 310
Totale 310

n 310
= = 155 - classe mediana = [81,5 - 84,5 )
2 2 n
n 310 − fcum 155 − 82
+1 = +1 = 156 - mediana = L1 + 2 × c = 81,5 + ×3 = 83,9
2 2 fmed 92
Corso di Statistica

Classi peso Frequenza Valore Frequenza


assoluta centrale cumulata

[69,5 – 72,5) 3 71 3 INDICI DI TENDENZA CENTRALE


Classe modale = [ 81,5 - 84,5)
[72,5 – 75,5) 4 74 7
Moda = 83,4
[75,5 – 78,5) 22 77 29 Classe mediana = [ 81,5 - 84,5)
Mediana = 83,9
[78,5 – 81,5) 53 80 82 μ = 83,9
[81,5 – 84,5) 92 83 174

[84,5 – 87,5) 71 86 245 classe inferiore = [69,5 – 72,5)


classe superiore = [93,5 – 96,5)
[87,5 – 90,5) 46 89 291
ampiezza classe =3
[90,5 – 93,5) 15 92 306 deviazione st. = 7,25

[93,5 – 96,5) 4 95 310


∑ ( xi − µ ) ni
n 2

Totale 310 σ= i =1
=
n

=
( 71 − 83,9) 2 ⋅ 3 + ( 74 − 83,9) 2 ⋅ 4 + ... + ( 95 − 83,9) 2 ⋅ 4 =
310
= 7,25
Corso di Statistica

Tab. 8 - Strutture di degenza classificate in base al numero di posti letto


Numero posti letto Frequenza assoluta
26-50 251
51-100 368
101-150 288
151-200 159
201-300 304
301-500 173
501-800 99
Totale 1.642

Calcolare:

- Media aritmetica
- Classe modale
Corso di Statistica

Numero posti letto Frequenza Valore


assoluta centrale
26-50 251 38
51-100 368 75,5
101-150 288 125,5
151-200 159 175,5
201-300 304 250,5
301-500 173 400,5
501-800 99 650,5
Totale 1.642

∑ xn i i
38 × 251 + 75,5 × 368 + 125,5 × 288 + ... + 650,5 × 99
µ= i =1
= = 189,53
n 1.642
Corso di Statistica

Numero posti letto Frequenza Ampiezza della Densità di


assoluta classe frequenza
26-50 251 25 10,04
51-100 368 50 7,36
101-150 288 50 5,76
151-200 159 50 3,18
201-300 304 100 3,04
301-500 173 200 0,87
501-800 99 300 0,33
Totale 1.642

- classe modale = 26 - 50
Corso di Statistica

9 - Determinare per quale gruppo di pazienti la variabile “PA diastolica”


presenta una maggiore dispersione. Come indice di dispersione utilizzare
la deviazione standard.
1_gruppo
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 50 75 100
2 F 47 90 95
3 F 74 88 97
4 F 40 86 94
5 M 61 84 95

2_gruppo
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 28 70 110
2 F 45 90 95
3 F 50 80 130
4 F 63 85 85
5 M 80 75 95
Corso di Statistica
1_gruppo
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 50 75 100
2 F 47 90 95
3 F 74 88 97
4 F 40 86 94
5 M 61 84 95

2_gruppo
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 28 70 110
2 F 45 90 95
3 F 50 80 130
4 F 63 85 85
5 M 80 75 95

∑a i
75 +90 +88 +86 +84
µ1 = i =1
= = 84 ,6
n 5
n

∑a i
70 +... +75
µ2 = i =1
= = 80
n 5
Corso di Statistica
1_gruppo
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 50 75 100
2 F 47 90 95
3 F 74 88 97
4 F 40 86 94
5 M 61 84 95

2_gruppo
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 28 70 110
2 F 45 90 95
3 F 50 80 130
4 F 63 85 85
5 M 80 75 95
µ1 = 84 ,6 µ2 = 80

∑ ( ai − µ)
n 2

σ1 = i =1
=
( 75 − 84 ,6) +2 ( 90 − 84 ,6) 2 + ( 88 − 84 ,6 ) 2 + ( 86 − 84 ,6 ) 2 + ( 84 − 84 ,6 ) 2 = 5,8
n 5

∑( ai − µ)
n
2

σ2 = i =1
=
( 70 − 80 ) 2 + ( 90 − 80 ) 2 + ( 80 − 80 ) 2 + ( 85 − 80 ) 2 + ( 75 − 80 ) 2 = 7,9
n 5
Corso di Statistica
1_gruppo
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 50 75 100
2 F 47 90 95
3 F 74 88 97
4 F 40 86 94
5 M 61 84 95

2_gruppo
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 28 70 110
2 F 45 90 95
3 F 50 80 130
4 F 63 85 85
5 M 80 75 95

La variabile “PAdiastolica” presenta una maggiore dispersione per il secondo


gruppo di pazienti risultando

σ1 <σ 2
Corso di Statistica

10 - Determinare quale variabile tra Glicemia e Calcemia presenta una


maggiore dispersione. Come indice di dispersione utilizzare la deviazione
standard.

Paziente Sesso Età Glicemia Calcemia


(mg/100ml) (mg/100ml)
1 M 50 85 8

2 F 37 80 10

3 F 63 70 9

4 M 41 90 5

5 M 36 100 13
Corso di Statistica

Paziente Sesso Età Glicemia Calcemia


(mg/100ml) (mg/100ml)
1 M 50 85 8

2 F 37 80 10

3 F 63 70 9

4 M 41 90 5

5 M 36 100 13

∑a i
85 + 80 + 70 + 90 + 100
µ1 = i =1
= = 85
n 5
n

∑a i
8 + 10 + 9 + 5 + 13
µ2 = i =1
= =9
n 5
Corso di Statistica

Paziente Sesso Età Glicemia Calcemia


(mg/100ml) (mg/100ml)
1 M 50 85 8

2 F 37 80 10

3 F 63 70 9

4 M 41 90 5

5 M 36 100 13

∑ ( ai − µ )
n 2

σ1= i =1
=
( 85 − 85) + 2 ( 80 − 85) 2 + ( 70 − 85) 2 + ( 90 − 85) 2 + (100− 85) 2 = 11,18
n 5

∑ ( ai − µ )
n 2

σ2= i =1
=
( 8 − 9) 2 + (10 − 9) 2 + ( 9 − 9) 2 + ( 5 − 9) 2 + (13− 9) 2 = 2,91
n 5
Corso di Statistica

Glicemia µ1 = 85 mg/100ml
σ 1 = 11,18 mg/100ml

Calcemia µ 2 = 9 mg/100ml
σ 2 = 2,91 mg/100ml

σ1 11,18
(1) CV% = ⋅100 = ⋅100 = 13,15 %
µ1 85
σ2 2,91
(2) CV% = ⋅100 = ⋅100 = 32 ,39 %
µ2 9

Confrontando i coefficienti di variazione la variabile calcemia


presenta una maggiore dispersione rispetto alla variabile
glicemia
Corso di Statistica

11 - Data la distribuzione percentuale della popolazione


residente in età di 6 anni o più per grado di istruzione ai
censimenti 1971 1981
Laurea Diploma Media Elementare – alfabeti Analfabeti
inferiore senza titolo
1971 1.8 6.9 14.7 71.4 5.2

1981 2.8 11.5 23.8 58.8 3.1

Per i dati relativi al censimento del 1971 fare un’opportuna


Rappresentazione grafica.
Calcolare la variazione percentuale relativa alla modalità
Laurea [R. 55,5%]
Corso di Statistica

12 – Un azienda ha promosso una selezione per


l’assunzione di diplomati che abbiano conseguito alla
maturità una votazione superiore a 50. Le votazioni
riportate alla maturità da 20 candidati sono le seguenti:

52 51 54 60 60 56 56 54 54 55
52 58 56 51 52 55 58 60 53 52

 Rappresentare la distribuzione di frequenza dei 20


candidati utilizzando le seguenti classi:
51-53; 54-55; 56-58; 59-60;
 Rappresentare graficamente la distribuzione;
 Calcolare la media aritmetica, la moda e la mediana.
[ R: M:54.95; Mo: 52, 54, 56, 60; Me: 54.5;]
Corso di Statistica

13 – In un ospedale prestano servizio 91 infermieri dislocati


in 7 reparti, come indicato nella seguente tabella:

Reparti Infermieri Determinare


Cardiologia 6 il numero medio di
infermieri per reparto,
Pediatria 9
la varianzae
Chirurgia 11 la devianza
Medicina 12
Ortopedia 15 [R: M.=13; Var.= 5,066;
Dev.= 25.66;]
Oncologia 17
Psichiatria 21
Corso di Statistica

14 – Tra gli iscritti ad una Asl, al 31/12/2004, si sono


verificati dei casi di malformazione cardiovascolare in
soggetti minori di 18 anni, come rappresentato in tabella.

Totale
Popolazione < 18 anni 58.035
Casi di malformazione cardiovascolari 527

Calcolare il tasso di prevalenza, incidenza, durata e letalità


tenendo conto che al 31/12/2005 il numero dei casi di
malformazione cardiovascolare è di 598 e a causa di questa
malformazione si sono verificati 6 decessi.
Corso di Statistica

 Prevalenza = Malati/Popo.Tot . K = 9.08 %0

 Incidenza = Non malati/Pop sana . K = 1.23 %0

 Durata = Prevalenza / Incidenza = 7 anni

 Letalità= Morti per malformaz.caridovasc./casi di


malformaz.cardiovasc . k = 11.38 %0

 Nuovi malati =598-527


 Popolazione sana = 58035 – 52 = 57508
Corso di Statistica
Tab. 1 - Tabella dei dati contenente 8 variabili (sesso, età, ...) osservate su 20 soggetti con
scompenso cardiaco. Specificare per ogni carattere la tipologia.
codice paziente sesso età fumo insufficienza peso (Kg) altezza PA sistolica PA diastolica
renale (cm) (mmHg) (mmHg)

1f 62no si 56,7 150 105 70


2m 39 si si 90,6 183 110 70
3m 46 sino 65,0 174 110 90
4m 53 si si 106,0 170 90 70
5f 54no no 68,0 160 130 90
6m 68no si 65,0 170 110 70
7m 63 si si 86,0 170 110 80
8m 62no si 74,0 164 90 60
9m 67 si si 78,8 172 85 65
10f 30no no 46,0 160 85 60
11m 66 sino 83,7 168 95 65
12m 46 sino 95,5 184 85 50
13m 67 si si 87,0 180 120 70
14f 70no no 51,9 163 105 70
15m 60 sino 75,4 175 85 60
16m 57 si si 53,5 168 100 67
17m 62 si si 81,3 172 110 50
18f 47no si 69,5 175 100 70
19f 52no no 80,8 159 115 80
20m 61 si si 65,0 174 100 60
Corso di Statistica
Tab. 1 - Tabella dei dati contenente 8 variabili (sesso, età, ...) osservate su 20 soggetti con
scompenso cardiaco
codice paziente sesso età fumo insufficienza peso (Kg) altezza PA sistolica PA diastolica
renale (cm) (mmHg) (mmHg)

1f 62no si 56,7 150 105 70


2m 39 si si 90,6 183 110 70
3m 46 sino 65,0 174 110 90
4m 53 si si 106,0 170 90 70
5f 54no no 68,0 160 130 90
6m 68no si 65,0 170 110 70
7m 63 si si 86,0 170 110 80
8m 62no si 74,0 164 90 60
9m 67 si si 78,8 172 85 65
10f 30no no 46,0 160 85 60
11m 66 sino 83,7 168 95 65
12m 46 sino 95,5 184 85 50
13m 67 si si 87,0 180 120 70

= carattere qualitativo
14f 70no no 51,9 163 105 70
15m 60 sino 75,4 175 85 60
16m 57 si si 53,5 168 100 67
17m 62 si si 81,3 172 110 50
18f 47no si 69,5 175 100 70
19f 52no no 80,8 159 115 80
20m 61 si si 65,0 174 100 60
Corso di Statistica

15 – Calcolare tutti gli indici di dispersione e


dire in quale gruppo c’è maggiore variabilità

Gruppo A 35 33 32 19 38 34 31 35 40
Gruppo B 21 35 20 25 36 25 30 15 18

Indici di dispersione Gruppo A Gruppo B


Media 33 25
Devianza 284 436
Varianza 35,5 54,5
Deviazione Standard 5,958188 7,382412
Coefficiente di Variazione 18,05511 29,52965

Nel gruppo B c’è maggiore variabilità


Corso di Statistica

16 – I ricoverati di un reparto di degenza in 4 mesi


consecutivi sono risultati rispettivamente: 21, 28,
24, 32. Calcolare media aritmetica, geometrica
armonica

 Media aritmetica: …= (21+28+24+32) / 4= 26,25

 Media geometrica: …= R.4-rta [21*28*24*32] = 25,92

 Media armonica: …= 4 / [(1/21)+(1/28)+(1/24)+(1/32)]


=25,60
Corso di Statistica
17 – Ai primi di gennaio sono stati rilevati 2726 casi di
disturbi psichici in una comunità costituita da 73228
individui. Alla fine dell’anno i casi sono risultati 3058.
Calcolare tasso di prevalenza e il tasso di incidenza dei
disturbi psichici in quella comunità. Calcolare il tasso di
composizione per età sapendo che gli individui con età
superiore ai 60 anni sono 50126.

 Prevalenza =(2727 / 73228)*1000=37,2 ‰


 Incidenza = [(3058 – 2716) / (73228 – 2726) ] * 1000 = 4,7‰
 Composizione per età = individui con età < 60 anni * k=
individui con età > 60 anni
 = [(73228 – 50126) / 50126 ]*1000= 460,8

Ogni 1000 abitanti con età superiore ai 60 anni troviamo 460


individui con età inferiore ai 60 anni.