Sei sulla pagina 1di 146

Corso di Statistica

I Facoltà di Medicina e Chirurgia

CORSO DI STATISTICA MEDICA


Dott.sa Laura Perrotta
- Lezione 1: Concetti introduttivi, nozioni di base, distribuzioni, medie analitiche -

A.A. 20010/2011
Corso di Statistica 2

PROGRAMMA DEL CORSO DI STATISTICA


 Concetti introduttivi, nozioni di base.
 Distribuzioni, medie analitiche.
 Indici di posizione e indici di dispersione.
 Le rappresentazioni grafiche e i rapporti statistici.
 La statistica epidemiologica.
 Cenni di calcolo delle probabilità e distribuzioni di
probabilità.
 Inferenza statistica: stima dei parametri.
 Inferenza statistica: verifica delle ipotesi.
 Esercitazioni.
Corso di Statistica 2

TESTO CONSIGLIATO
Lantieri PB, Risso D, Ravera G
(nuova edizione)

“Statistica medica per le professioni


sanitarie”
McGraw-Hill Libri Italia srl: Milano
Corso di Statistica 2

OBIETTIVI DEL CORSO


Il Corso di Statistica Medica si propone l’obiettivo di fornire
allo studente:
Conoscenza approfondita della statistica descrittiva

Capacità di calcolare gli indicatori di sintesi e saperne


interpretare i risultati

Capacità di rappresentare graficamente un fenomeno oggetto di


studio e raccogliere in tabelle i dati grezzi rilevati

Leggere e comprendere la statistica inferenziale, la statistica


applicata all’epidemiologia e i rapporti statistici

Comprendere e applicare le tecniche di valutazione statistica


coinvolte nella prevenzione, nella diagnosi e nella gestione
dell’assistenza sanitaria.
Corso di Statistica 2

CONCETTI INTRODUTTIVI, NOZIONI


DI BASE E DISTRIBUZIONI

“La statistica è la tecnica che ha come scopo la


conoscenza quantitativa dei fenomeni collettivi”

La statistica applicata all’epidemiologia ha lo


scopo di individuare tipo, frequenza, modalità di
distribuzione e ruolo dei fattori causali di un
determinato evento nelle popolazioni.
Corso di Statistica 2

FENOMENI COLLETTIVI
Per fenomeno si intende tutto ciò che appare direttamente
o indirettamente ai sensi dell’intelletto.

I fenomeni si suddividono in due categorie:

 Misurabili: le manifestazioni del fenomeno sono


direttamente misurabili (il peso, l’altezza, la pressione
arteriosa,…)

 Enumerabili: le manifestazioni vengono identificate


attraverso un conteggio (numero di fratelli, numero dei
ricoveri,…)
Corso di Statistica 3

LE VARIABILI DIPENDENTI,
INDIPENDENTI E LE COSTANTI
La variabile è il carattere misurato che noi osserviamo.

Superfice corporea = 0,7 ⋅ (Peso in kg)0, 4 ⋅ (Altezza in cm)0, 7

• le variabili indipendenti sono peso e altezza


• la variabile dipendente è la sup. corporea
(poiché dipende dai valori che assumono le variabili
indipendenti)
• 0,7 è la costante moltiplicativa
Corso di Statistica 3

E’ opportuno pensare ad un intervallo entro il quale si


possono identificare tutti i possibili valori ottenuti dalle
misurazioni.

Il campo di esistenza è l’insieme di tutte le possibili le


modalità con cui si può manifestare un carattere.

L’ intervallo di variabilità anche chiamato campo di


esistenza o rango viene definito dal valore max e min rilevati.
L’intervallo di variabilità si definisce:
 Dominio se riguarda la variabile indipendente
esempio: l’altezza di un individuo può variare tra 15cm circa e i 300cm al
massimo; il peso tra (0,01 – 600)kg
 Codominio se riguarda la variabile dipendente
esempio:il campo di esistenza della variabile superficie corporea può
assumere solo valori positivi
Corso di Statistica 3

CONCETTI GENERALI DI STATISTICA


DESCRITTIVA
 L’unità statistica è l’oggetto dell’osservazione di ogni fenomeno
individuale che costituisce il fenomeno collettivo.

 La popolazione (o universo o collettivo statistico) è l’insieme


di tutte le unità statistiche delle manifestazioni del fenomeno
collettivo che si vuole studiare.

 Il campione è una parte delle popolazione, casuale e


rappresentativo, oggetto di indagine.

 I caratteri sono aspetti dei fenomeni oggetto di studio. Ciascun


carattere è presente in ogni unità con una determinata modalità.

 La modalità indica il tipo di manifestazione del fenomeno


collettivo, le modalità sono tra loro esaustive.
Corso di Statistica 3

CLASSIFICAZIONE DEI CARATTERI

QUALITATIVI QUANTITATIVI

Ordinati Sconnessi Continui Discreti


Corso di Statistica 3

CARATTERE QUALITATIVO
In generale, per i carattere qualitativi le modalità si
identificano con attributi, aggettivi e denominazioni varie
specificanti le proprietà dell’unità statistica a cui si riferiscono.
I caratteri qualitativi si dividono in

 ORDINATI: esprimono giudizi di valore o situazioni


ordinabili per graduatoria
Esempio stato di salute:migliorato/stazionario/peggiorato, gradi
militari, codici di arrivo pronto soccorso: bianco,verde giallo e rosso.

 SCONNESSI: le modalità non sono ordinabili in maniera


univoca
Esempio sesso: uomo/donna, colore occhi, stato civile:
celibe/coniugato/divorziato/vedovo.
Corso di Statistica 3

CARATTERE QUANTITATIVO
I caratteri quantitativi si manifestano con modalità
esprimibili mediante numeri o valori.

In generale, un carattere quantitativo è detto

 continuo se, comunque si fissino due valori (entro


l’intervallo in cui il carattere è osservabile), tutti i valori
intermedi possono essere assunti come modalità del
carattere, cioè quando assume valori tra due unità
consecutive.
nsecutive

 discreto quando utilizziamo i conteggi per rappresentare


le modalità
Corso di Statistica 3

Carattere quantitativo Le modalità numeriche prevedono


CONTINUO l’uso di decimali
Esempio la temperatura corporea di un individuo può assumere valori
compresi tra 36 e 37gradi, quali 36,2; 36,7; 36,9 C°

Carattere quantitativo Le modalità numeriche vengono


DISCRETO espresse esclusivamente da
numeri interi
Esempio numero di figli:1,2,3,…; oppure il numero di ricoveri
giornalieri effettuato in un reparto ospedaliero: 1,2,…,15, 16;ma non
può verificarsi di avere un figlio e ½ oppure di effettuare 15ricoveri e ½
Corso di Statistica 3

CLASSIFICAZIONE DEI CARATTERI

QUALITATIVI QUANTITATIVI

Ordinati Sconnessi Continui Discreti

anno di corso, luogo di nascita, numero di figli, peso,


livello di istruzione, sesso, statura,
di ricoveri
gradi militari stato civile, temperatura
nazionalità, corporea
professione
Corso di Statistica 3

RELAZIONI O OPERAZIONI FRA LE MODALITÀ

CARATTERI

QUALITATIVI QUANTITATIVI

sconnessi ordinati

uguaglianza e disuguaglianza SI SI SI

ordinamento NO SI SI

addizione e sottrazione NO NO SI
Corso di Statistica 3

LA DETERMINAZIONE DELLE MODALITÀ DI UN


CARATTERE
Le modalità di ogni carattere non sono a priori definibili in
modo univoco o oggettivo; la loro determinazione è in genere
frutto di una scelta fra diverse possibilità, dipendendo
sia dal problema oggetto di studio sia dal soggetto che lo
esamina ed anche dal collettivo su cui si deve indagare.
Carattere Modalità
Colore dei capelli 1) Biondi, Rossi, Castani, Neri, Grigi, Bianchi
2) Chiari, Scuri, Grigi, Bianchi
3) …
Statura 1) 168, 169, 170, 171, …
2) minore di 165, compreso tra 165 e 175, maggiore
di 175
3) …
Corso di Statistica 3

1° Carattere 2° Carattere 3° Carattere

Sesso Data di Insorgenza Età …


nascita sintomatologica

Paziente 1 M 19/09/95 19/10/97 15 …


1° Unità statistica
Paziente 2 F 19/12/86 01/05/99 24 …
2° Unità statistica

Paziente 3 M 07/11/94 01/01/97 16 …


3° Unità statistica
Paziente 4 M 15/04/80 01/06/86 30 …
4° Unità statistica
… … … … …

Paziente 10 F 13/03/89 27/11/90 22 …


10° Unità statistica

Modalità
Corso di Statistica 3

Tavola 1 - Pazienti affetti da sindromi depressive, secondo il sesso,


l’età ed alcune variabili psicofisiche

Sesso Età Peso Colesterolo Cortisolo Appetito Pessimismo Umore


totale plasmatico

Paziente 1 M 27 60 260 14,5 Buono 1 1

Paziente 2 M 41 75 320 20,5 Scarso 1 2

Paziente 3 F 65 68 172 17,2 Discreto 3 0

Paziente 4 F 53 56 245 14,9 Buono 2 2

… … … … … … … … …

Paziente n M 42 73 380 8,0 Buono 0 1


Corso di Statistica 3

Esempio 1 – Tabella dei dati (o matrice dei dati) contenente 3 variabili (età,
sesso, consumo di medicine) osservate su 5 soggetti (le unità
statistiche)

Paziente Età Sesso Consumo


medicine

1 46 F 1

2 52 F 1

3 21 M 0

4 30 F 2

5 39 M 3
Corso di Statistica 3

Esempio 2 – Tabella dei dati (o matrice dei dati) contenente 4 variabili


(sesso,anno di nascita, età, N. figli) osservate su 5 soggetti (le
unità statistiche)

Soggetti Sesso Anno di Età N. figli


nascita

1 1 1978 27 1

2 2 1987 18 0

3 2 1965 40 3

4 1 1975 30 1

5 2 1968 37 2
Corso di Statistica 3

LA SOMMATORIA

Se indichiamo con X i una generica misura e con


N il numero di misure, per indicarne la
somma è conveniente assumere la formula in
simboli (utilizzando la lettera greca sigma ∑):
n

∑X
i =1
i

Da leggersi: sommatoria di X per i che va da 1 a N

∑x
i =1
i = x1 + x2 + ...... + xn −1 + xn
Corso di Statistica 3

ESEMPIO
Il carattere Y rappresenta il Reddito. Conosciamo i
redditi mensili di un individuo, il reddito annuo in
formule è dato da
12
X Annuo = ∑ xi = x1 + x2 + ...... + x11 + x12
i =1
con i che indica i mesi
Corso di Statistica 3
MESI REDDITO MENSILE Xi
Gennaio 1000 € x1
Febbraio 1000 € x2
Marzio 1000 € x3
Aprile 1000 € x4
Maggio 1000 € x5
Giugno 1000 € x6
Luglio 1000 € x7
Agosto 1000 € x8
Settembre 1000 € x9
Ottobre 1000 € x10
Novembre 1000 € x11
Dicembre 1000 € x12
12
REDDITO TOTALE ANNUO 12000 €
∑x
i =1
i

12
X Annuo = ∑xi = x1 + x2 + ...... + x11 + x12 =
i =1

= (1000 +1000 + ..... +1000 +1000 ) € = 12000 €


Corso di Statistica 3

PROPRIETA’ DELLE SOMMATORIE


 Se K è una costante; la sommatoria di una
costante è uguale a n volte la costante stessa
N

∑k = N ⋅k
i =1

 Se K è una costante moltiplicativa; la costante


può essere portata fuori dalla sommatoria
N

∑ (kX ) = k X
i =1
i 1 + kX 2 + ... + kX N −1 + kX N =

N
= k ( X 1 + ... + X N ) = k ∑ X i
i =1
Corso di Statistica 3

 La sommatoria di una somma algebrica è


uguale alla somma algebrica delle sommatorie
N N N

∑(X
i =1
i + Yi ) = ∑ X i + ∑ Yi
i =1 i =1
N N

∑(X
i =1
i − k ) = (X 1 − k ) + ... + ( X n − k ) = ∑ X i − Nk
i =1

 La sommatoria del prodotto di due variabili è


uguale alla somma dei prodotti delle singole
coppie di termini delle variabili
N

∑(X Y ) = X Y + X Y
i =1
i i 1 1 2 2 + ... + X N −1YN −1 + X N YN
Corso di Statistica 3

Per calcolare la sommatoria di un espressione


algebrica, si sviluppa inizialmente l’espressione
e successivamente l’operazione di sommatoria

∑( X −Y ) = ∑( X )=
2 2
− 2 XY + Y 2

= ∑ X − 2∑ XY + ∑ Y
2 2
Corso di Statistica 3

I Facoltà di Medicina e Chirurgia

CORSO DI STATISTICA
Dott. Laura Perrotta
- Le distribuzioni -

A.A. 2007/2008
Corso di Statistica 3
DISTRIBUZIONE PER UNITÀ
(O DISTRIBUZIONE UNITARIA)
In generale un distribuzione indica come le modalità si
distribuiscono nelle unità del collettivo.

Una distribuzione per unità è una distribuzione in cui per


ogni unità è indicata la modalità con la quale ciascun
carattere si presenta.

Distribuzione semplice 1 carattere

Distribuzione doppia 2 caratteri

Distribuzione tripla 3 caratteri


… …

Distribuzione m-upla m caratteri


Corso di Statistica 3

Tab. 1 - Distribuzione degli studenti iscritti al 2°anno di Medicina e Chirurgia,


nell’a.a. 2001-02, secondo il voto riportato all’esame di statistica.
Voto Voto Voto Voto

Studente 1 24 Studente 11 25 Studente 21 26 Studente 31 19

Studente 2 19 Studente 12 25 Studente 22 23 Studente 32 20

Studente 3 23 Studente 13 27 Studente 23 25 Studente 33 21

Studente 4 25 Studente 14 21 Studente 24 23 Studente 34 22

Studente 5 24 Studente 15 21 Studente 25 28 Studente 35 23

Studente 6 30 Studente 16 22 Studente 26 30 Studente 36 23

Studente 7 20 Studente 17 28 Studente 27 27 Studente 37 25

Studente 8 22 Studente 18 28 Studente 28 26 Studente 38 25

Studente 9 24 Studente 19 27 Studente 29 18 Studente 39 26

Studente 10 24 Studente 20 26 Studente 30 18 Studente 40 27


Corso di Statistica 3

Tab. 2 - Distribuzione dei pazienti affetti da sindromi depressive ricoverati


al Policnico Umberto I, secondo il sesso, l’età e il peso.

Sesso Età Peso

Paziente 1 M 27 60

Paziente 2 M 41 75

Paziente 3 F 65 68

Paziente 4 F 53 56

Paziente 5 M 38 70

Paziente 6 M 42 73
Corso di Statistica 3

SUDDIVISIONE DI UNA POPOLAZIONE


IN CLASSI

La suddivisione in classi delle unità della popolazione si


attua riconoscendo quale modalità dei caratteri considerati
è presente in ciascuna unità della popolazione e
raggruppando le unità uguali.
Corso di Statistica 3

Tab. 3 - Suddivisione in classi, secondo il voto riportato all’esame di


statistica,
del collettivo degli studenti iscritti al 2°anno di Medicina e Chirurgia,
nell’a.a. 2001-02 (Vedi Tab. 1).
Voto Studente Voto Studente

18 29°,30° 25 4°,11°,12°,23°,37°,38°

19 2°,31° 26 20°,21°,28°,39°

20 7°,32° 27 13°,19°,27°,40°

21 14°,15°,33° 28 17°,18°,25°

22 8°,16°,34° 29

23 3°,22°,24°,35°,36° 30 6°,26°

24 1°,5°,9°,10°
Corso di Statistica 3

Tab. 4 - Suddivisione in classi secondo il sesso dei pazienti affetti da


sindromi depressive ricoverati al Policnico Umberto I (Vedi Tab. 3).

Sesso Paziente

Maschio 1°,2°,5°,6°

Femmina 3°,4°
Corso di Statistica 3

DISTRIBUZIONI DI FREQUENZE
Il numero delle unità che appartengono ad una classe è detto
frequenza assoluta della classe, o frequenza assoluta delle
unità che presentano la modalità X, o più brevemente
frequenza assoluta della modalità X.

Voto Studente Frequenza assoluta


18 29°,30° 2
19 2°,31° 2
…. …
24 1°,5°,9°,10° 4
25 4°,11°,12°,23°,37°,38° 6
…. …
29 0
30 6°,26° 2
Corso di Statistica 3

DISTRIBUZIONI DI FREQUENZE
Associando ad ogni classe la sua frequenza assoluta si ottiene una
distribuzione di frequenze del collettivo secondo i caratteri
considerati

Tab. 5 - Distribuzione di frequenze degli studenti iscritti al 2°anno di Medicina


e Chirurgia, nell’a.a. 2001-02, secondo il voto riportato all’esame di statistica
Voto N. di Studenti Voto N. di Studenti

18 2 25 6
19 2 26 4
20 2 27 4
21 3 28 3
22 3 29
23 5 30 2
24 4 Totale 40
Corso di Statistica 3

DISTRIBUZIONI semplici, doppie, … , m-uple


Se la suddivisione in classi è fatta rispetto ad un unico carattere
la distribuzione di frequenze è detta semplice, se i caratteri
rispetto ai quali è fatta la suddivisione in classi sono due, tre, … ,
m, la distribuzione di frequenze è denominata doppia, tripla, … ,
m-upla.

Tab. 6 - Distribuzione doppia secondo i caratteri sesso e vizio del


fumo degli studenti iscritti al 1° anno della facoltà di medicina
Vizio del fumo
Sesso Fumano Non fumano Totale
Donna 3 2 5
Uomo 2 5 7
Totale 5 7 12
Corso di Statistica 3

DISTRIBUZIONI IN CLASSI
Quando la variabile è quantitativa a carattere continuo, può risultare
utile ridurre il numero delle modalità assunte dalla variabile suddividendo
l’intervallo di variazione in intervalli più piccoli, o classi di frequenza,
in ciascuno dei quali si raccolgono tutte le misure che cadono al suo
interno. I dati così organizzati costituiscono una particolare distribuzione
di frequenze definita distribuzione in classi.

Tab. 7 - Distribuzione di frequenze degli studenti iscritti al 2°anno di Medicina


e Chirurgia, nell’a.a. 2001-02, secondo il voto riportato all’esame di statistica
Voto N. di Studenti
18 – 20 6
21 – 23 11
24 – 26 14
27 – 30 9
Totale 40
Corso di Statistica 3

Esempio 1
Classe Peso (Kg) Numero dei Frequenze
pazienti percentuali
I 40 ├ 45 4 5,6

II 45 ├ 50 11 14,0

III 50 ├ 55 32 26,2

IV 55 ├ 60 30 32,7

V 60 ├ 65 14 13,1

VI 65 ├ 70 5 4,7

VII 70 ├ 75 2 3,7

70 ≤ x < 75
L’ampiezza della classe è data dalla differenza tra i confini di una classe
45-40=5, 50-45=5, …
Corso di Statistica 3

Esempio 2
Tab. 12 - Casi di morte per uno specifico tumore in una provincia, suddivisi per

classi di età secondo il criterio ISTAT


Età (anni) Decessi
<1 0
1-4 0
5-14 0
15-24 0
25-34 1
35-44 0
45-54 3
55-64 1
65-74 6
75-84 3
≥85 2
Totale 16
Corso di Statistica 3

Criteri generali per organizzare una


distribuzione in classi
 Identificare il campo o l’intervallo di variazione, determinato dalla
differenza tra il valore più grande e il più piccolo.
 Suddividere il campo di variazione in un numero conveniente di
classi a seconda del numero di dati.
 Una tabella con un numero troppo elevato di classi differisce poco
dalla tabella originale; un numero troppo basso di classi dilata troppo
l’ampiezza delle classi, con una possibile perdita di informazione.
 Gli intervalli di classe, se possibile, devono essere di uguale
ampiezza.

In generale una distribuzione in classi determina la perdita di una parte


delle informazioni fornite dai dati originali, ma in compenso si trae
notevole vantaggio dalla migliore visione di insieme che ne deriva.
Corso di Statistica 3

SUDDIVISIONE DI UNA POPOLAZIONE IN CLASSI


•Quali che siano i caratteri presi in considerazione, rispetto ad
essi è possibile sempre stabilire se due unità sono uguali o
diverse;

•Una volta stabilite le unità che sono uguali tra loro, queste
vengono considerate come un unico gruppo;

•Ripetendo ciò per tutte le unità, la popolazione viene ad


essere suddivisa in sottopopolazioni usualmente dette classi

In sintesi:
la suddivisione in classi delle unità della popolazione
si attua riconoscendo quale modalità dei caratteri considerati è
presente in ciascuna unità della popolazione e raggruppando le
unità uguali.
Corso di Statistica 3

DISTR. PER UNITA’ DISTR. DI FREQUENZE

Casi Sesso Data di nascita Insorgenza Età …


sintomatologica
Paziente 1 m 19/09/95 19/10/97 2 …
Paziente 2 f 19/12/86 01/05/99 12 …
Paziente 3 m 07/11/94 01/01/97 2 …
Paziente 4 m 15/04/80 01/06/86 6 …
… … … … … …
Paziente 47 f 13/03/89 27/11/90 2 …

Distribuzione dei pazienti per sesso


Frequenze Frequenze Frequenze
assolute relative percentuali
Maschi 28 0,596 59,6
Femmine 19 0,404 40,4
Totale 47 1 100,0
Corso di Statistica 3

LE FREQUENZE
ASSOLUTE RELATIVE E PERCENTUALI

 Si definisce frequenza assoluta (o semplice) il


conteggio del numero di volte che si presenta ciascuna
modalità da una mutabile oppure ciascun valore di una
variabile.

 Quel valore che si ottiene dividendo la frequenza


assoluta per la numerosità totale è la frequenza relativa.

 La frequenza percentuale indica quante volte la


modalità si manifesta su una casistica di 100
osservazioni. Si ottiene moltiplicando la frequenza
relativa per 100.
Corso di Statistica 3

FREQUENZE ASSOLUTE
La frequenza assoluta è puramente descrittiva.

Viene indica con n1 , n2 ,..., ni ,... nk


0 ≤ ni ≤ N con i = 1,..., k

ni
rappresentata la frequenza assoluta corrispondente
alla i-esima modalità.

ilNnumero totale di osservazioni effettuate.


k
n1 + n2 + ... + ni + ... + nk −1 + nk = ∑ ni = N
i =1
Corso di Statistica 3

FREQUENZE RELATIVE
 Le frequenze assolute non consentono di confrontare
due collettivi con numerosità differente rispetto ad uno
stesso carattere.

 Senza alterare la composizione interna si può ridurre


ogni collettivo ad avere numerosità complessiva pari a 1
utilizzando le frequenze relative,cioè considerare
accanto ad ogni distribuzione quella costituita da una
sola unità e vedere quale parte di questa riguarda
ciascuna unità.

 In generale il concetto di frequenza deriva


dall’impostazione di una proporzione tra le frequenze:
Corso di Statistica 3

Per ricavare la quota che verrebbe 400.239 : 1 = 11.243 : X ossia


a competere alla febbre tifoide si X = 11.243 : 400.239 *1 = 0,0281
deve risolvere la seguente
proporzione: frequenza numerosità frequenza
assoluta totale relativa

Tab. 8 – Casi denunciati di alcune malattie infettive soggette a denuncia


obbligatoria, anno 1969.
Casi denunciati
Malattie Dati assoluti Frequenze relative
Febbre tifoide 11.243 0,0281
Infezione da paratifi 962 0,0024
Dissenteria bacillare amebica e amebiasi 59 0,0001
Pertosse 17.732 0,0443
Scarlattina 9.848 0,0246
Tetano 429 0,0011
Varicella 36.623 0,0915
Morbillo 68.245 0,1705
Epatopatie acute primitive (infettive) 53.774 0,1344
Parotite epidemica 40.949 0,1023
Anchilostomiasi 324 0,0008
Influenza 160.051 0,3999
Totale 400.239 1
Corso di Statistica 3

FREQUENZE RELATIVE
f 1, f 2,..., fi,..., fk

n1 n2 ni nk
f 1 = , f 2 = ,..., fi = ,..., fk =
n n n n
0 ≤ f 1 ≤ 1,0 ≤ f 2 ≤ 1,...,0 ≤ fi ≤ 1,...,0 ≤ fk ≤ 1
k
f 1 + f 2 + ... + fi + ... + fk ⇒ ∑f
i =1
i = 1
Corso di Statistica 3

FREQUENZA PERCENTUALE

 In generale il concetto di frequenza è il rapporto tra la


quantità relativa ad una modalità e l’ammontare
complessivo.

 E’ consuetudine ridursi anche a collettivi di 100 unità.


Per far ciò basta moltiplicare per 100 ogni frequenza
relativa. Si ha così la frequenza percentuale detta
anche,semplice-mente, percentuale.
Corso di Statistica 3

Per ricavare la quota che verrebbe 400.239 : 100 = 11.243 : X ossia


a competere alla febbre tifoide si
deve risolvere la seguente X = 11.243 : 400.239 * 100 = 2,81
proporzione: frequenza numerosità frequenza
assoluta totale relativa

Tab. 8 – Casi denunciati di alcune malattie infettive soggette a denuncia


obbligatoria, anno 1969.
Malattie Dati Frequenze Frequenze
assoluti relative percentuali
Febbre tifoide 11.243 0,0281 2,81
Infezione da paratifi 962 0,0024 0,24
Dissenteria bacillare amebica e amebiasi 59 0,0001 0,01
Pertosse 17.732 0,0443 4,43
Scarlattina 9.848 0,0246 2,46
Tetano 429 0,0011 0,11
Varicella 36.623 0,0915 9,15
Morbillo 68.245 0,1705 17,05
Epatopatie acute primitive (infettive) 53.774 0,1344 13,44
Parotite epidemica 40.949 0,1023 10,23
Anchilostomiasi 324 0,0008 0,08
Influenza 160.051 0,3999 39,99
Totale 400.239 1 100
Corso di Statistica 3

FREQUENZE PERCENTUALI
p1, p 2,..., pi,..., pk
n1 n2 ni nk
p1 = × 100, p 2 = × 100,..., pi = × 100,..., pk = × 100
n n n n
0 ≤ p1 ≤ 100,0 ≤ p 2 ≤ 100,...,0 ≤ pi ≤ 100,...,0 ≤ pk ≤ 100
k
p1 + p 2 + ... + pi + ... + pk ⇒ ∑p
i =1
i= 100
Corso di Statistica 3

IMPOSTAZIONE FORMALE DELLA


TRATTAZIONE DELLE FREQUENZE E DELLE
PERCENTUALI
Simbologia a cui fare riferimento per una trattazione generale
dei problemi delle frequenze assolute, relative e percentuali.
Una distribuzione semplice secondo il carattere X può essere
rappresentata nel modo seguente:
Carattere X Dati Frequenze Frequenze
assoluti relative percentuali

x1 n1 f1 p1
x2 n2 f2 p2
… … … …
xk nk fk pk
Totale n 1 100
Corso di Statistica 3

X CARATTERE
x1 , x2 ,..., xk MODALITA’ DEL CARATTERE
N NUMEROSITA’ DEL COLLETTIVO
n1 , n2 ,..., nk FREQUENZE ASSOLUTE
ni = f i ⋅ N ∀i =1,2,..., k
f1 , f 2 , ... , f i , ..., f k FREQUENZE RELATIVE
ni
fi = ∀i =1,2,..., k
N
p1 , p2 , ..., pi , ..., pk FREQUENZE PERCENTUALI
ni
pi = f i ⋅100 = ⋅100 ∀i =1,2,..., k
N
Corso di Statistica 3

Malattie Dati Frequenze Frequenze


assoluti relative percentuali

Febbre tifoide 11.243 0,0281 2,81


Infezione da paratifi 962 0,0024 0,24
… … … …
Influenza 160.051 0,3999 39,99
Totale 400.239 1 100

X Dati Frequenze Frequenze


assoluti relative percentuali

x1 n1 f1 p1
x2 n2 f2 p2
… … … …
xk nk fk pk
Totale n 1 100
Corso di Statistica 3

FREQUENZE CUMULATE
Prendiamo in considerazione la distribuzione di frequenza
dei tifosi della Roma per titolo di studio.
Qual è il numero di tifosi romanisti che possiedono al
massimo la licenza media?

Esempio 1 - distribuzione di frequenza dei tifosi della Roma per


titolo di studio
Titolo di studio Frequenza assoluta
Nessun titolo 1.862
Licenza elementare 9.903
Licenza media 4.491
Diploma 3.093
Laurea 1.160
Totale 20.509
Corso di Statistica 3

Per il calcolo delle frequenze assolute cumulate si procedere


sommando (cumulando) alla frequenza corrispondente alla
modalità considerata le frequenze delle modalità precedenti alla
modalità considerata.

Titolo di studio Frequenza Frequenza assoluta


assoluta cumulata
Nessun titolo 1.862 1.862 1.862

Licenza elementare 9.903 11.765 1.862 + 9.903

Licenza media 4.491 16.256 1.862 + 9.903 + 4.491

Diploma 3.093 19.349



Laurea 1.160 20.509

Totale 20.509
Corso di Statistica 3

Il numero di romanisti che al massimo possiede la licenza


media è dato dalla somma del numero di tifosi che non hanno
nessun titolo (1862), più quelli con la licenza elementare
(9903) e la licenza media(4491).
Se ripetiamo tale operazione per tutte le modalità otteniamo
la distribuzione cumulate delle frequenze

Titolo di studio Frequenza Frequenza Frequenza Frequenze Frequenze


assoluta assoluta relativa relative cumulate cumulate
cumulata percentuali
Nessun titolo 1.862 1.862 0,09 0.09 9
Licenza 9.903 11.765 0,48 0.57 57
elementare
Licenza media 4.491 16.256 0,22 0.79 79
Diploma 3.093 19.349 0,15 0.94 94
Laurea 1.160 20.509 0,06 1.00 100
Totale 20.509 1,00
Corso di Statistica 3
Esempio
Prendiamo in considerazione la distribuzione degli impiegati
civili della Stato secondo la qualifica funzionale. Possiamo
chiederci quale è il numero degli impiegati che hanno una
qualifica inferiore o uguale alla IV. Costruiamo la distribuzione
delle frequenze assolute cumulate
Qualifica funzionale Numero degli impiegati n Frequenze assolute cumulate N
II 58.038 58.038
III 308.249 366.287
IV 287.707 653.994
V 71.974 725.968
VI 52.323 778.200
VII 28.081 806.281
VIII 12.259 818.540
Totale 818.540
VARIAZIONI PERCENTUALI
Esempio di calcolo di variazioni percentuali
Sesso Età Peso a inizio Peso a Variazioni %
cura fine cura di peso
Paziente 1 M 27 58 60 3,4

Paziente 2 M 41 70 75 7,1

Paziente 3 F 65 68 68 0,0

Paziente 4 F 53 63 56 -11,1

Paziente 5 M 38 72 70 -2,8

Paziente 6 M 42 84 73 -13,1

Qf - Qi 60 − 58
Formula : ×100 ⇒ ×100 = 3,4
Qi 58
Tab. 10 - Numero di dimessi per regione per gli anni 2002 e 2003
(numeri assoluti, variazioni assolute e percentuali)
Degenza Ordinaria
Regione Dimessi Variazioni assolute Variazioni %

2002 2003 2002-2003 2002-2003

Toscana 526.007 495.905 -30.102 -5,7%

Umbria 130.004 125.863 -4.141 -3,2%

Marche 231.261 215.835 -15.426 -6,7%

Lazio 884.463 868.218 -16.245 -1,8%

Totale 1.771.735 1.705.821 -65.914 -3,7%

Fonte: Ministero della Salute


I Facoltà di Medicina e Chirurgia

CORSO DI STATISTICA MEDICA


Dott.sa Laura Perrotta
- Indici di tendenza centrale -

A.A. 2010/2011
GLI INDICI DI TENDENZA CENTRALE
•Lo scopo della statistica è di evidenziare determinate situazioni
ricavandole da un insieme di osservazioni e da un collettivo di misure.

•Le tabelle e le rappresentazioni grafiche di un fenomeno costituiscono


un notevole strumento di illustrazione e di divulgazione ma non di
sintesi dell’informazione.

•Le misure di tendenza centrale servono per individuare il valore


intorno al quale i dati sono raggruppati.

• La tendenza centrale è la misura più appropriata per sintetizzare


l’insieme delle osservazioni se una distribuzione di dati dovesse
essere descritta con un solo valore.

• Le medie costituiscono una prima indicazione della dimensione del


fenomeno pur comportando una perdita di informazione.
Il dato di sintesi deve soddisfare alcune condizioni:

•deve essere compreso tra il valore più piccolo e quello più


grande

•deve identificarsi, in qualche modo, con i valori più frequenti


localizzati al centro delle misure quando sono ordinabili.

Il calcolo delle medie va distinto per il tipo di variabile utilizzata:


 Le medie analitiche (di calcolo):
la cui applicazione è ammessa solo per misure quantitative;
il loro calcolo si basa sul concorso di tutte le unità: per esempio la media
aritmetica

 Gli indici di posizione (lasche):


sono l’unica sintesi possibile in caso di classificazioni ordinali
e qualitative;
sono identificate in ragione di particolari posizioni ordinali nella successione
crescente o decr. di tutte le modalità: moda, mediana, quantili
MEDIE ANALITICHE INDICI DI POSIZIONE

VALORE INTERMEDIO MODA

MEDIA ARITMETICA MEDIANA

MEDIA GEOMETRICA QUANTILI

MEDIA ARMONICA
IL VALORE INTERMEDIO
Il valore intermedio tra due misure estreme è pari a:

x1 + xn
2
(operatore simile al calcolo del valore centrale delle classi)

Nota: questo indice trascura tutti i valori escluso il max e il


min; se i due valori estremi risultano molto scostati dal
complesso delle osservazioni, il valore ottenuto non
rispecchia la centralità dell’insieme
LA MEDIA ARITMETICA SEMPLICE

E’ l’indice di tendenza più usato, rappresenta il


valore da attribuire a ciascuna delle misure come se
fossero tutte uguali.

Dal momento che esprime la tendenza centrale si


può ipotizzare che la maggior parte dei risultati è
concentrata su tale valore
MEDIA ARITMETICA PER
DISTRIBUZIONI UNITARIE
Si ottiene come la sommatoria di tutte le osservazioni (xi) divisa per il
loro numero (N):
Indichiamo le singole osservazioni con x1; x2; …; xi;… xn; :

∑x i

µ =m=x= i =1
n
Tab. 1 - Distribuzione dei mesi secondo le ore di straordinario effettuate
da un infermiere di un ospedale

Ore di lavoro Ore di lavoro


straordinario straordinario
Gennaio 10 Gennaio x1
Febbraio 12 Febbraio x2
Marzo 11 Marzo x3
Aprile 5 Aprile …
Maggio 7 Maggio …
Giugno 10 Giugno …
Luglio 5 Luglio …
Agosto 0 Agosto …
Settembre 7 Settembre …
Ottobre 10 Ottobre …
Novembre 7 Novembre …
Dicembre 12 Dicembre xn
Totale 96 Totale 96
APPLICAZIONE DELLA FORMULA
n

∑x i
Formula della media aritmetica
µ =m = x = i =1
per distribuzioni unitarie
n

12

∑x i
10 + 12 + 11 + 5 + 7 + 10 + 5 + 0 + 7 + 10 + 7 + 12 96
µ= =
i =1
= =8
n 12 12

L’infermiere ha fatto in media 8 ore di straordinario al mese


MEDIA ARITMETICA PER DISTRIBUZIONI
DI FREQUENZE
k

∑xn i i
k
µ= i =1
= ∑ xifi
n i =1

∑xn i i
x1n1 +x 2 n 2 +x 3 n 3 +... +xknk
µ= i=
1
= =
n n
n1 n2 nk
=x1 +x 2 +... +xk =
n n n
k
=x1 f 1 +x 2 f 2 +... +xkfk = ∑xifi
i=
1
Esempio di calcolo della media aritmetica mediante la
formula k

∑xn i i

µ=i =1
n

Tab. 2 - Distribuzione dei mesi secondo le ore di straordinario effettuate


da un infermiere di un ospedale
Ore di lavoro Frequenza X Frequenza
straordinario assoluta assoluta

0 1 x1 n1
5 2 x2 n2
7 3 x3 n3
10 3 x4 n4
11 1 x5 n5
12 2 x6 n6
Totale 12 Totale n
APPLICAZIONE DELLA FORMULA

∑x n i i
k
= ∑xifi
Formula della media aritmetica
µ= i =1
per distribuzioni di frequenza
n i =1

∑ xn i i
0 × 1 + 5 × 2 + 7 × 3 + 10 × 3 + 11×1 + 12 × 2 96
µ= i =1
= = =8
n 12 12

n indica la numerosità totale delle osservazioni;


K indica il numero di classi
Esempio di calcolo della media aritmetica mediante la
formula
k
µ = ∑xifi
i =1

Tab. 3 - Distribuzione dei mesi secondo le ore di straordinario effettuate


da un infermiere di un ospedale
Ore di lavoro straordinario Frequenza Frequenza
assoluta relativa

0 1 0,083
5 2 0,167
7 3 0,250
10 3 0,250
11 1 0,083
12 2 0,167
Totale 12 1
APPLICAZIONE DELLA FORMULA

∑x n i i
k
= ∑xifi
Formula della media aritmetica
µ= i =1
per distribuzioni di frequenza
n i =1

k
µ = ∑ xifi =
i =1

= 0 × 0,083 + 5 × 0,167 + 7 × 0,250 + 10 × 0,250 + 11× 0,083 + 12 × 0,167 = 8


Tab. 1 - Distribuzione dei mesi secondo le Tab. 2 - Distribuzione dei mesi secondo le
ore di straordinario effettuate da un infermiere ore di straordinario effettuate da un infermiere
di un ospedale di un ospedale
Ore di lavoro
straordinario Ore di lavoro straordinario Frequenza Frequenza
assoluta relativa
Gennaio 10
0 1 0,083
Febbraio 12
5 2 0,167
Marzo 11
7 3 0,250
Aprile 5
10 3 0,250
Maggio 7
11 1 0,083
Giugno 10
12 2 0,167
Luglio 5
Totale 12 1
Agosto 0
Settembre 7
Ottobre 10 12
Novembre 7
∑x i
10 + 12 + 11 + 5 + 7 + 10 + 5 + 0 + 7 + 10 + 7 + 12 96
Dicembre 12
µ= i =1
= = =8
Totale 96 n 12 12
6

∑ xn i i
0 ×1 + 5 × 2 + 7 × 3 + 10 × 3 + 11× 1 + 12 × 2 96
µ= i =1
= = =8
n 12 12
k
µ = ∑ xifi = 0 × 0,083 + 5 × 0,167 + 7 × 0,250 + 10 × 0,250 + 11× 0,083 + 12 × 0,167 = 8
i =1
1° Esempio di calcolo della media aritmetica in una distribuzione in classi

Classe (cm) Frequenze


assolute
ni
150-154 2
155-159 6
160-164 11
165-169 18
170-174 25
175-179 13
180-184 7
82
Classe (cm) Frequenze Valore centrale
assolute della classe
ni xi xi * n i

150-154 2 152 304


155-159 6 157 942
160-164 11 162 160 +164 1.782
=
2
165-169 18 167 3.006
170-174 25 172 4.300
175-179 13 177 2.301
180-184 7 182 1.274
tot 82 13.909
k

∑x n i i
152 × 2 + 157 × 6 + ... + 182 × 7 304 + 942 + ... + 1.274
µ= i =1
= = =
n 82 82
13 .909
= = 169 ,62
82
2° Esempio di calcolo della media aritmetica in una distribuzione in
classi

Tab. 4a – Distribuzione di frequenze del peso (Kg) di una casistica di 310


soggetti affetti da diabete manifesto
Classi peso Frequenza assoluta
[69,5 – 72,5) 3
[72,5 – 75,5) 4
[75,5 – 78,5) 22
[78,5 – 81,5) 53
[81,5 – 84,5) 92
[84,5 – 87,5) 71
[87,5 – 90,5) 46
[90,5 – 93,5) 15
[93,5 – 96,5) 4
Totale 310
Tab. 4b – Distribuzione di frequenze del peso (Kg) di una casistica di 310
soggetti affetti da diabete manifesto
Classi peso Frequenza assoluta Valore centrale
[69,5 – 72,5) 3 71
[72,5 – 75,5) 4 74
[75,5 – 78,5) 22 77
[78,5 – 81,5) 53 80
[81,5 – 84,5) 92 83
[84,5 – 87,5) 71 86
[87,5 – 90,5) 46 89
[90,5 – 93,5) 15 92
[93,5 – 96,5) 4 95
Totale 310

71× 3 + 74 × 4 + 77 × 22 + ... + 95 × 4
µ= = 83,9
310
Corso di Statistica 3
Esercizio 1 (a.b.c.)
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta,
registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse,
(a) si dica se e’quantitativa o qualitativa, discreta o continua.
(b) dopo aver definito opportunamente le classi di modalita’, calcolare
(c) le frequenze assolute e le frequenze relative;
(d) la media aritmetica di X;
(e) la moda, la mediana.
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghezza in cm 1 2 2 3 4 1 2 1 3 2

(a) Il carattere X = “lunghezza in cm delle foglie di menta” è quantitativa continua;


(b) Scelte come classi di modalità: (1; 2; 3; 4) cm
(c) le frequenze assolute e frequenze relative le sono rappresentate in tabella;
X (modalità) n (frequenze assolute) f (frequenze relative)
1 3 0,3
2 4 0,4
3 2 0,2
4 1 0,1
Tot 10 1
Corso di Statistica 3
Esercizio 1 (d)
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta,
registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse,
(a). si dica se e’quantitativa o qualitativa, discreta o continua.
(b). dopo aver definito opportunamente le classi di modalita’, calcolare
(c) le frequenze assolute e le frequenze relative;
(d) la media aritmetica di X;
(e) la moda, la mediana.

Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2

Media Aritmetica: 2,1

può essere calcolata in 3 modi differenti


Corso di Statistica 3

(d) Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° Xi ni fi


Lunghez. in cm 1 2 2 3 4 1 2 1 3 2 1 3 0,3
2 4 0,4
3 2 0,2
4 1 0,1
Tot 10 1
N 10

∑x i ∑x 1 + 2 + 2 + 3 + 4 +1 + 2 +1 + 3 + 2
i
µ= i =1
= =
i =1
= 2,1
N 10 10

n 4

∑x n i i ∑x ⋅n i i
(1× 3) + (2 × 4) + (3 × 2) + ( 4 ×1)
µ= i =1
= i =1
= = 2,1
N 10 10

n 4
µ = ∑ xi f i = ∑ xi f i = (1× 0,3) + (2 × 0,4) + (3 × 0,2) + (4 × 0,1) = 2,1
i =1 i =1
PROPRIETA’ FONDAMENTALI DELLA
MEDIA ARITMETICA
1. La somma di tutti gli scarti dalla media aritmetica è nulla
n

∑(x i −µ) =0
i=1 2
n

2. La somma dei quadrati degli scarti, ∑(x i −a )


i=1

qualunque sia a, assume il suo minimo per a =µ


3. Indicato con a1 il valore più piccolo della distribuzione e
con an quello più grande, si ha
x1 ≤ µ ≤ xn
ossia la media aritmetica è non esterna all’intervallo (a1, an )
La media aritmetica è la più nota e facile da calcolare.

Viene sempre utilizzata salvo che in presenza di:

• dati non quantitativi

• misure di ordine di grandezza molto diverse


es. 0,8 7 58 124

• valori estremi molto scostati o indeterminati


es. 28 34 22,5 299

• valori estremi indeterminati o infiniti


es. 9 6 4 7 >100

• distribuzioni di frequenza con classi aperte


MEDIA ARITMETICA PONDERATA

E’ una media aritmetica che attribuisce ad ogni valore un peso o


importanza diversa. Nei casi più semplici il peso è costituito dalla
frequenza dei singoli valori, in altri frangenti è determinato
dall’importanza che si vuole o si deve attribuire a ciascun valore.
In generale la media aritmetica dei valori x , x , … , x con i pesi
1 2 k

π , π , … , π è data da
1 2 k

x1π 1 + x 2π 2 + ...+ xkπ k


µ=
π 1 + π 2 + ...+ π k
Esempio di calcolo della media aritmetica ponderata

Corso integrato di Voto Crediti Ore


Infermieristica materno-infantile

Pediatria generale e specialistica 27 1,2 18

Ginecologia ed ostetricia 21 1,2 18

Infermieristica pediatrica e neonatale 30 0,6 9

Totale 3 45

27 + 21 + 30
MEDIA ARITMETICA µ= = 26
3
27 ×1,2 + 21 ×1,2 + 30 ×0,6
MEDIA ARITMETICA PONDERATA µ= = 25 ,2
1,2 +1,2 + 0,6
LA MEDIA GEOMETRICA

Si preferisce utilizzare la media geometrica per i dati


distribuiti su diversi ordini di grandezza e quando i dati
appaiono legati tra loro da un fattore moltiplicativo
(esempio di successione geometrica del fattore
moltiplicativo 2: 2, 4, 8, 16, 32, 64…).

La media geometrica non è altro che la radice ennesima


del prodotto delle N osservazioni.
MEDIA GEOMETRICA PER
DISTRIBUZIONI UNITARIE

n
MG = n x1 ⋅ x 2 ⋅ ... ⋅ xn = n ∏x i
i =1

La media geometrica della distribuzione unitaria x1,x2,…,xn ,


in cui le x1,x2,…,xn sono tutte positive, è la radice n-esima del
prodotto x1,x2,…,xn
MEDIA GEOMETRICA PER
DISTRIBUZIONI IN CLASSI

f1 fn
MG = x1 ⋅ ...... ⋅ xn
N

Si utilizza in caso di distribuzioni in classi o


osservazioni ripetute
Nota: la media geometrica non ha significato in presenza
di valori nulli o negativi
Esempio di applicazione della media geometrica

Consideriamo tre
valori

10, 100, 1000


10 + 100 + 1000 1110
µ= = = 370
3 3

n
MG = n x1 ⋅ x 2 ⋅ ... ⋅ xn = n ∏x i =
i =1

= 3 10 ⋅10 2 ⋅103 = 3 10 ⋅100 ⋅1000 = 100


MEDIA ARMONICA
La media armonica è definita come il reciproco della
media aritmetica dei reciproco delle misure.

n
MA = n
1

i=1 xi

La media armonica della quantità a1,a2,…,an è l’inverso della


media aritmetica degli inversi 1 1 1
, ,...,
x1 x 2 xn

Tale media trova una applicazione nella valutazione dei tempi di


reazione o di risposta (in prove di sopravvivenza post operatoria).
In genere si utilizza per i fenomeni che dovrebbero preferibilmente
esaurirsi in un arco di tempo definito.
RELAZIONI TRA LE MEDIE ANALITICHE

Tra le medie aritmetica, geometrica e armonica, calcolate su una


stessa serie di misure, esiste la relazione:

MA ≤MG ≤µ
dove il caso di uguaglianza vale solo nel caso in cui le osservazioni
siano tutte uguali.
SCHEMA DI UTILIZZO DEGLI INDICI DI TENDENZA
CENTRALE RISPETTO ALLA TIPOLIGIA DI CARATTERE

Caratteri Caratteri
quantitativi qualitativi
Medie Aritmetica si no
analitiche Geometrica si no
Armonica si no
Indici di Moda si si
posizione Mediana si si
Quantili si si
INDICI DI POSIZIONE

In presenza di misure non quantitative non è possibile


applicare le medie analitiche.

In alternativa sono state introdotte le medie di posizione:

 Moda

 Mediana

 Quantili
LA MODA
La moda è un indice di tendenza centrale che individua il
gruppo o il dato che compare con maggior frequenza

Per caratteri la moda è la modalità che si


qualitativi: presenta con maggior frequenza

Per caratteri la moda è il valore che si


presenta con maggior frequenza
quantitativi:
 La moda è l’indice di tendenza centrale che minimizza le
perdite di informazioni.
 In alcune distribuzioni può accedere che siano presenti
una o più mode all’aumentare del numero di
osservazioni:
distribuzioni unimodale, bimodale, plurimodale
 Per le distribuzioni in classi di uguale ampiezza, si
calcola la classe modale come segue:

∆1
moda = L1 + ∆1+ ∆ 2 × c

Dove: L1 = confine inferiore della classe modale


c = ampiezza della classe modale
∆1 = differenza tra la frequenza della classe modale e la precedente
∆ 2 = differenza tra la frequenza della classe modale e la successiva

 Nel caso di distribuzioni in classi di diversa ampiezza


la classe modale è quella con la più alta densità di
frequenza
(la frequenza assoluta in rapporto all’ampiezza della classe)
1° Esempio di calcolo della moda (carattere qualitativo)

Cause di morte Frequenze assolute


Tumori 315
Malattie sistema circolatorio 418
Malattie sistema respiratorio 82
Malattie sistema digerente 49
Non definite 19
Accidentali 57

La moda è “Malattie sistema circolatorio”


2° Esempio di calcolo della moda (carattere quantitativo)

Tab. 5 - Distribuzione dei mesi secondo le ore di straordinario effettuate


da un infermiere di un ospedale
Ore di lavoro straordinario Frequenza Frequenza
assoluta relativa

0 1 0,083
5 2 0,167
7 3 0,250
10 3 0,250
11 1 0,083
12 2 0,167
Totale 12 1

La prima moda è “7”, la seconda moda è “10”


3° Esempio di calcolo della classe modale e della moda in una
distribuzione in classi (classi della stessa ampiezza)
Classi peso Frequenza assoluta Valore centrale
[69,5 – 72,5) 3 71
[72,5 – 75,5) 4 74
[75,5 – 78,5) 22 77
[78,5 – 81,5) 53 80
[81,5 – 84,5) 92 83
[84,5 – 87,5) 71 86
[87,5 – 90,5) 46 89
[90,5 – 93,5) 15 92
[93,5 – 96,5) 4 95
Totale 310

- classe modale = [81,5 - 84,5 )

- moda = L1 + ∆ ×c =81 ,5 + 92 −53


×3 =83 ,4
1

∆∆
1− 2
[(92 −53 ) +(92 −71 )]
4° Esempio di calcolo della classe modale in una distribuzione in
classi (classi con ampiezze diverse)
Tab. 6 - Strutture di degenza classificate in base al numero di posti letto
Numero posti letto Frequenza Ampiezza della Densità di
assoluta classe frequenza
26-50 251 25 10,04
51-100 368 50 7,36
101-150 288 50 5,76
151-200 159 50 3,18
201-300 304 100 3,04
301-500 173 200 0,87
501-800 99 300 0,33

La classe modale apparente è “51-100” 99


0,33 =
300
La classe modale corretta è “26-50”
Individuare la moda nelle seguenti rappresentazioni grafiche:
LA MEDIANA

La mediana per definizione occupa il valore centrale


in una serie ordinata di dati.

Le osservazioni vengono separate dal valore


mediano in due parti numericamente uguali, il 50%
con valori inferiori e il 50% con valori superiori.

La mediana non risente dei valori estremi di una


serie ordinata ed è preferita in tali casi alla media
aritmetica.
Il procedimento di calcolo della mediana

passa per 3 fasi:

1. ordinamento dei dati in modo crescente

2. calcolo della posizione della mediana

3. identificazione del valore corrispondente a tale


posizione
Per il calcolo della posizione mediana bisogna tener
conto della numerosità delle osservazioni n

Se n è dispari si avrà n +1
una sola posizione mediana 
 2

 n
Se n è pari si avranno  2
due posizioni mediane n
 +1
2
La mediana è data dal “valore/modalità/classe” corrispondente
alla posizione mediana (o alle posizioni mediane).
LA MEDIANA PER CARATTERI QUALITATIVI:

1. Nel caso di distribuzioni qualitative unitarie:


 dopo aver ordinato i dati, se la numerosità delle
osservazioni è dispari, la mediana è data dalla modalità
corrispondente alla posizione mediana
 quando la numerosità del collettivo è dato da un
numero pari, se i due posti centrali sono occupati da
dati relativi ad una stessa modalità, questa è la
mediana; altrimenti le modalità relative ai due dati che
occupano i posti centrali sono dette “modalità mediane”

1. Nel caso di distribuzioni di frequenza, le modalità sono


già ordinate, quindi si procede all’identificazione della
classe mediana, nella quale cade l’osservazione mediana,
avvalendosi delle frequenze cumulate della distribuzione.
1° Esempio di calcolo della mediana (carattere qualitativo)

Paziente Età Sesso Titolo di studio …

1 54 M Nessun titolo …
2 57 F Laurea …
3 62 F Laurea …
4 46 F Nessun titolo …
5 39 F Diploma …
6 54 M Licenza elementare …
7 57 F Licenza elementare …
8 60 M Nessun titolo …
9 51 F Licenza media …

n = 9 (numerodispari)
Paziente Titolo di studio Posizione Titolo di studio

1 Nessun titolo 1 Nessun titolo


2 Laurea 2Nessun titolo

IN ORDINE CRESCENTE
3 Laurea 3Nessun titolo
4 Nessun titolo 4 Licenza elementare
5 Diploma 5 Licenza elementare
6 Licenza elementare 6 Licenza media
7 Licenza elementare 7 Diploma
8 Nessun titolo 8 Laurea
9 Licenza media 9 Laurea

n = 9 (numero dispari)

n +1 9 +1
= =5 ⇒ La mediana è " LICENZA ELEMENTARE "
2 2
2° Esempio di calcolo della mediana (carattere qualitativo)

Paziente Età Sesso Livello Creatininemia …

1 54 M Basso …
2 57 F Basso …
3 62 F Alto …
4 46 F Medio …
5 39 F Medio …
6 54 M Basso …
7 57 F Medio …
8 60 M Medio …
9 51 F Alto …
10 54 F Alto …

n = 10 (numeropari)
Paziente Livello Creatininemia Posizione Livello Creatininemia
1 Basso
1 Basso
2 Basso
2 Basso

IN ORDINE CRESCENTE
3 Basso
3 Alto
4Medio
4 Medio
5Medio
5 Medio
6Medio
6 Basso
7Medio
7 Medio
8 Alto
8 Medio
9 Alto
9 Alto
10 Alto
10 Alto

n = 10 (numero pari)
n 10
= =5 ⇒ la modalità corrispondente é " Medio"
2 2

n 10
+1 = +1 = 6 ⇒ la modalità corrispondente é " Medio"
2 2

La Mediana è " Medio"


3° Esempio di calcolo della mediana (carattere qualitativo)

Paziente Età Sesso Umore …

1 54 M Buono …
2 57 F Buono …
3 62 F Ottimo …
4 46 F Ottimo …
5 39 F Normale …
6 54 M Basso …
7 57 F Discreto …
8 60 M Buono …
9 51 F Discreto …
10 54 F Basso …

n = 10 (numeropari)
Paziente Umore Posizione Umore

1 Buono 1 Basso
2 Buono 2 Basso
3 Ottimo 3 Normale
4 Ottimo 4 Discreto
5 Normale 5 Discreto
6 Basso 6 Buono
7 Discreto 7 Buono
8 Buono 8 Buono
9 Discreto 9 Ottimo
10 Basso 10 Ottimo

n = 10 (numero pari)
n 10
= =5 ⇒ la modalità corrispondente é " Discreto"
2 2

n 10
+1 = +1 = 6 ⇒ la modalità corrispondente é " Buono"
2 2

Le modalità medianesono " Discreto"e " Buono"


4° Esempio di calcolo della mediana (carattere qualitativo) in una
distribuzione di frequenza

Titolo di studio Frequenza assoluta

Nessun titolo 1.862

Licenza elementare 9.903

Licenza media 4.491

Diploma 3.093

Laurea 1.160

Totale 20.509
Titolo di studio Frequenza Frequenza assoluta
assoluta cumulata
Nessun titolo 1.862 1.862
1.862
Licenza elementare 9.903 11.765
1.862 + 9.903
Licenza media 4.491 16.256
1.862 + 9.903 + 4.491
Diploma 3.093 19.349

Laurea 1.160 20.509

Totale 20.509

n = 20.509 (numero dispari)

n + 1 20.509 + 1
= = 10.255 ⇒ La mediana è " LICENZA ELEMENTARE "
2 2
La modalità “licenza elementare” è la mediana.
La mediana della distribuzione è la modalità relativa al dato statistico che
nell’ordinamento stabilito occupa il posto di mezzo.
LA MEDIANA PER CARATTERI QUANTITATIVI:

1. Nel caso di una serie di misure singole e ordinate


(o caratteri continui)
 per n dispari la mediana
corrisponde al valore in posizione n +1
2
 per n pari la mediana
si colloca tra le due posizioni centrali ne n
+1
(si parla di modalità mediane) 2 2

il valore mediano viene calcolato come media


aritmetica dei valori corrispondenti a queste due
posizioni
2. Per le distribuzioni in classi si identifica la classe
mediana; nel caso di classi di uguali ampiezza
si calcola il valore mediano tra quelli compresi
nell’intervallo di classe utilizzando la formula:

n
− fcum
mediana = L1 + 2 ×c
fmed

L1 = confine inferiore della classe mediana


c = ampiezza della classe mediana
fcum = frequenza cumulata delle classi che precedono la classe mediana
fmed = frequenza della classe mediana
5° Esempio di calcolo della mediana (carattere quantitativo)

Paziente Sesso Età PA diastolica PA sistolica


(mmHg) (mmHg)
1 M 63 70 110

2 F 56 90 95

3 F 48 80 130

4 F 48 85 85

5 M 50 70 95

6 F 54 70 85

7 M 58 65 100

8 M 67 90 130

9 F 61 90 85
Posizione PA sistolica
(mmHg)
1 85

IN ORDINE CRESCENTE
2 85
50% 3 85

4 95

5 95

6 100

7 110
50% 8 130

9 130

n +1 9 +1
= =5 “95” è la modalità mediana
2 2
6° Esempio di calcolo della mediana nel caso di
una distribuzione in classi
Classi peso Valore centrale Frequenza Frequenza
assoluta cumulata
[69,5 – 72,5) 71 3 3
[72,5 – 75,5) 74 4 7
[75,5 – 78,5) 77 22 29
[78,5 – 81,5) 80 53 82
[81,5 – 84,5) 83 92 174
[84,5 – 87,5) 86 71 245
[87,5 – 90,5) 89 46 291
[90,5 – 93,5) 92 15 306
[93,5 – 96,5) 95 4 310
Totale 310
n
− fcum 155 − 82
mediana = L1 + 2 × c = 81,5 + × 3 = 83,9
fmed 92
Corso di Statistica 3
Esercizio 1 (e.)
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta,
registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse,
(a). si dica se e’quantitativa o qualitativa, discreta o continua.
(b). dopo aver definito opportunamente le classi di modalita’, calcolare
(c) le frequenze assolute e le frequenze relative;
(d) la media aritmetica di X;
(e) la moda, la mediana.
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2

(e)
Moda = 2

Mediana: dopo aver ordinato in senso crescente le unità


Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 1 1 2 2 2 2 3 3 4

calcoliamo le due posizioni mediane n/2 = 5 (n/2)+1 = 6,


al posto 5 e 6 corrispondono i valori 2 e 2,
Trattandosi di un carattere qualitativo si fa la media aritmetica
dei due valori mediani: Me= 2
I QUANTILI
I quantili sono un’estensione della mediana. I quantili
suddividono la distribuzione in q distribuzioni parziali,
aventi ognuno la q-esima parte della numerosità totale.

I più utilizzati sono sono i :

Percentili/Centili con q = 100


Decili con q = 10
Quartili con q = 4

Il quartile divide la distribuzione in quattro parti, aventi


ognuna il 25% della numerosità
I° Quartile ripartisce la distribuzione in due distribuzioni, la
prima costituita dal 25% della distribuzione complessiva,
l’altra dal 75%

2° Quartile coincide con la Mediana

3° Quartile ripartisce la distribuzione in due distribuzioni, la


prima costituita dal 75% della distribuzione complessiva,
l’altra dal 25%

Il procedimento di calcolo è simile al calcolo della mediana:

Quartili Decili Percentili


i
i
Qi = ⋅ ( N + 1)
i
Di = ⋅ ( N + 1) Pi = ⋅ ( N + 1)
4 10 10
RELAZIONI TRA INDICI DI TENDENZA
CENTRALE
Le possibili relazioni tra i valori medi di una distribuzione dipendono
dalla sua forma e nel caso di una distribuzione unimodale si
presentano tre casi:

1_curva simmetrica

media = moda = mediana

2_curva obliqua a destra, con asimmetria positiva (a destra)

moda < mediana < media

3_In una curva obliqua a sinistra, con asimmetria negativa (a


sinistra)

media < mediana < moda


RELAZIONI TRA INDICI DI TENDENZA CENTRALE
INDICI DI TENDENZA CENTRALE E LORO
UTILIZZAZIONE
IN RELAZIONE ALLA SCALA DI MISURA DEI DATI
INDICI DI TENDENZA
CENTRALE UTILIZZABILI

Qualitativi sconnessi moda

Qualitativi ordinati indici di posizione

Quantitativi medie analitiche, indici di posizione


Corso di Statistica

I Facoltà di Medicina e Chirurgia

CORSO DI STATISTICA 2
Dott. Laura Perrotta
- Lezione 3 - Gli indici di dispersione -

A.A. 2006/2007
Corso di Statistica

INDICI DI DISPERSIONE

Gli indici di dispersione sono indici che danno una


misura della variabilità dei termini della distribuzione
rispetto ad una media.

Un indice di tendenza centrale non è sufficiente, infatti,


a descrivere completamente un fenomeno.

Indici di tendenza centrale e indici di dispersione


devono essere associati per fornire un’informazione
completa.

Gli indici di dispersione sono sempre associati ad una


media per indicare la variabilità intorno ad essa.
Corso di Statistica

Tab. 1 Non c’è dispersione rispetto alla variabile età

Paziente Sesso Età PA diastolica PA sistolica


(mmHg) (mmHg)
1 M 50 70 110
2 F 50 90 95
3 F 50 80 130
4 F 50 85 85
5 M 50 70 95

C’è dispersione rispetto alla variabile età


Tab. 2
Paziente Sesso Età PA diastolica PA sistolica
(mmHg) (mmHg)
1 M 20 70 110
2 F 20 90 95
3 F 50 80 130
4 F 80 85 85
5 M 80 70 95
n

∑x i
50 + 50 + 50 + 50 + 50
( Tab.1) µ = i =1
= = 50 ( Tab.2 ) µ = 20 + ... + 80 = 50
n 5 5
166,00
168,00
170,00
172,00
174,00
176,00
178,00
cm 180,00

PIEMO NTE

VALLE
D'AOSTA

Media italiana
LOMBARDIA

TRENTINO ALTO ADIGE

VENETO
Corso di Statistica

FRIUL I VENEZIA GIUL IA

LIGURIA

EMILIA RO MAG NA

TOSCANA

UMBRIA

MARCHE

LAZIO

ABRUZZO

MOLISE

CAMPANIA
Grafico 1 - Stature degli iscritti nelle liste di leva dei nati nell’anno 1969

PUGLIA

BASIL ICATA

CALABRIA

SICILIA

SARDEG NA
Corso di Statistica

OSSERVAZIONE

Indici di tendenza centrale e indici di dispersione si


completano a vicenda, tenendo però conto del fatto che:

• una media da sola non è in grado di esprimere


compiutamente un fenomeno

• un indice di variabilità da solo perde significato in quanto


gli viene a mancare il punto di riferimento
Corso di Statistica

INTERVALLO DI VARIAZIONE
(o RANGE)
L’intervallo di variazione è la più elementare misura di
dispersione riferita ai dati quantitativi ed è calcolato come
differenza tra il valore più alto e quello più basso di una serie di dati.

intervallo di variazione = valore più alto – valore più basso


(o Range)

I due valori estremi (max e min) forniscono l’indicazione del dominio


della variabile e indicano un primo approccio descrittivo
Corso di Statistica

Paziente Sesso Età PA diastolica PA sistolica


(mmHg) (mmHg)
1 M 20 70 110
2 F 20 90 95
3 F 50 80 130
4 F 80 85 85
5 M 80 70 95

L’intervallo di variazione calcolato per la variabile PA diastolica è


il seguente 90 – 70 = 20

Min = 70
Max = 90
Range = 20
Corso di Statistica

INDICI DI VARIABILITA’ ASSOLUTA


PER MISURE QUANTITATIVE

• SCARTO MEDIO SEMPLICE ASSOLUTO

• DEVIANZA

• VARIANZA

• DEVIAZIONE STANDARD

Sono gli indicatori statistici di fondamentale importanza per


la statistica descrittiva
Corso di Statistica

VARIABILITA’ COMPLESSIVA
 La variabilità complessiva è costituita dall’insieme degli
scarti di tutte le misure dalla media.
 Per la proprietà delle medie la somma degli scarti dalla media
è nulla a causa della compensazione tra scarti positivi e
negativi.
 Utilizzando l’artificio del valore assoluto, possiamo
considerare l’entità dello scarto senza tener conto del segno
negativo.
 La variabilità complessiva è data da:

∑| X −m|
Nota: calcolare gli N(N-1) / 2 scarti tra tutte le osservazioni diventa troppo
laborioso
Corso di Statistica

SCARTO MEDIO SEMPLICE ASSOLUTO


Se rapportiamo la variabilità complessiva al numero delle
osservazioni otteniamo lo scarto medio semplice assoluto

∑| X i i −m|
N
Che costituisce il più elementare indice di dispersione con
significato statistico, poco considerato per via dell’artifizio del
valore assoluto
Corso di Statistica

DEVIANZA
In alternativa al valore assoluto si ricorre al quadrato degli
scarti dalla media e si perviene alla formula della devianza:

( )
( ∑ X )
2

∑i i ∑i i
2 i
X − m = X 2
− i
N

Definita come la somma dei quadrati degli scarti dalla media

La devianza è sempre maggiore o uguale di zero e costituisce


il numeratore della varianza

DEV ( X ) ≥ 0
Corso di Statistica

Domanda:

Di fronte a due serie di misure di una stessa variabile con


medie uguali, ma devianze diverse, la devianza della
prima serie è maggiore perché i suoi dati sono più
dispersi o semplicemente perché il numero degli scarti è
più elevato?
Corso di Statistica

Paziente Sesso Età PA diastolica PA sistolica


(mmHg) (mmHg)
1 M 40 70 110
2 F 40 90 95
3 F 50 80 130
… … … … …
70 M 55 70 95

Paziente Sesso Età PA diastolica PA sistolica


(mmHg) (mmHg)
1 M 50 75 100
2 F 60 90 95
3 F 75 88 97
4 F 40 86 94
5 M 25 84 95

40 + 40 + 50 + ... + 55
µ1 = = 50 µ 2 = 50
70
∑ ( xi − µ ) = ( 40 − 50 ) + ( 40 − 50 ) + ( 50 − 50 ) + ... + ( 55 − 50 ) = 10 .620
n 2 2 2 2 2

i =1

∑ ( xi − µ ) = ( 50 − 50 ) + ( 60 − 50 ) + ... + ( 55 − 50 ) = 1.050
n 2 2 2 2

i =1
Corso di Statistica

La devianza non contiene l’informazione del numero di


osservazioni N utilizzate nel calcolo

VARIANZA
Definiamo varianza il rapporto tra la devianza e il
numero delle osservazioni:

∑ (X i − m)
2

σ 2
= i
N
Corso di Statistica

Paziente Sesso Età PA diastolica PA sistolica


(mmHg) (mmHg)
1 M 40 70 110
2 F 40 90 95
3 F 50 80 130
… … … … …
70 M 55 70 95

Paziente Sesso Età PA diastolica PA sistolica


(mmHg) (mmHg)
1 M 50 75 100
2 F 60 90 95
3 F 75 88 97
4 F 40 86 94
5 M 25 84 95

µ 1 = 50 dev1 = 10.620 Var 1 = 151,71


µ 2 = 50 dev2 = 1.050 Var 2 = 210

La seconda distribuzione per età presenta una


maggiore dispersione intorno alla media
Corso di Statistica

VARIANZA CAMPIONARIA
In campo biostatistico si preferisce utilizzare la formula della
varianza campionaria

∑ (X i − m)
2

S 2
= i
N −1
 Per N molto grande è ininfluente ai fini del risultato della
varianza dividere per N o N-1.
 Per N molto piccolo se dividiamo la devianza per N-1 rispetto
a N otterremo una varianza campionaria maggiore rispetto a
quella semplice.

Le N-1 osservazioni costituiscono i gradi di libertà, cioè le


osservazioni indipendenti nel calcolo della varianza.
Corso di Statistica

DEVIAZIONE STANDARD
 La variabilità deve essere associata alla tendenza centrale per
fornire una descrizione completa di un fenomeno.
 Il valore della varianza deriva dal quadrato degli scarti dalla media
ed ha un ordine di grandezza differente dal dato originale.
 Per un problema di interpretazione del dato è conveniente
esprimere la variabilità con lo stesso ordine di grandezza delle
medie: trasformiamo la varianza sotto il segno di radice e
otteniamo la

( )
n
2
∑ iX − m
Deviazione standard o
scarto quadratico medio
σ= i =1

che rappresenta la dispersione di una serie di dati


Corso di Statistica

INDICE DI VARIABILITA’ RELATIVA:


COEFFICIENTE DI VARIAZIONE
Il coefficiente di variazione è un indice numerico puro
che si ottiene mettendo in rapporto la deviazione
standard con la media. Si esprime come percentuale
ed è adatto a confronti tra situazioni diverse.

σ
CV% = ⋅100
µ
Corso di Statistica
1_Esempio di confronto tra variabilità
Paziente Sesso Età PA diastolica PA sistolica (mmHg)
(mmHg)
1 M 50 75 100
2 F 47 90 95
3 F 74 88 97
4 F 40 86 94
5 M 61 84 95

Paziente Sesso Età PA diastolica PA sistolica (mmHg)


(mmHg)
1 M 28 70 110
2 F 45 90 95
3 F 50 80 130
4 F 63 85 85
5 M 80 75 95
n

∑x i
75 + 90 + 88 + 86 + 84 70 + ... + 75
µ1 = i =1
= = 84 ,6 µ2 = = 80
n 5 5

∑ ( xi − µ)
n 2

σ1 = i =1
=
( 75 − 84 ,6 ) +2 ( 90 − 84 ,6 ) 2 + ( 88 − 84 ,6) 2 + ( 86 − 84 ,6) 2 + ( 84 − 84 ,6) 2 = 5,8
n 5

σ2 =
( 70 − 80 ) 2 + ( 90 − 80 ) 2 + ( 80 − 80 ) 2 + ( 85 − 80 ) 2 + ( 75 − 80 ) 2 = 7,9
5
Corso di Statistica

2_Esempio di confronto tra variabilità


Paziente Sesso Età Glicemia Calcemia
(mg/100ml) (mg/100ml)
1 M 50 85 8

2 F 37 80 10

3 F 63 70 9

4 M 41 90 5

5 M 36 100 13

∑x i
85 + 80 + 70 + 90 + 100 8 + 10 + 9 + 5 + 13
µ1 = i =1
= = 85 µ2= =9
n 5 5

∑ ( xi − µ )
n 2

σ1= i =1
=
( 85 − 85) + 2 ( 80 − 85) 2 + ( 70 − 85) 2 + ( 90 − 85) 2 + (100− 85) 2 = 11,18
n 5

σ2=
( 8 − 9) 2 + (10 − 9) 2 + ( 9 − 9) 2 + ( 5 − 9) 2 + (13 − 9) 2 = 2,91
5
Corso di Statistica

Glicemia µ1 = 85 mg/100ml σ 1 = 11,18 mg/100ml


Calcemia µ 2 = 9 mg/100ml σ 2 = 2,91 mg/100ml

σ1 11,18
(1) CV% = ⋅100 = ⋅100 = 13,15%
µ1 85
σ2 2,91
(2) CV% = ⋅100 = ⋅100 = 32,39%
µ2 9

Confrontando i coefficienti di variazione risulta più variabile


la calcemia
Corso di Statistica

codice paziente età Posizione età

1 62 1 30 - La moda è 62
2 39 2 39

3 46 3 46 - La media aritmetica è 56,6


4 53 4 46 n

5 54 5 47
∑a i
30 +39 +46 +... +70
µ= i =1
= =56 ,6
6 68 6 52 n 20
7 63 7 53
- La mediana è 60,5
8 62 8 54
n 20
9 67 9 57 = =10
2 2
10 30 10 60
60 +61
11 66 11 61
⇒ =60 ,5
2
12 46 12 62 n 20
+1 = +1 =11
13 67 13 62 2 2
14 70 14 62

15 60 15 63

16 57 16 66

17 62 17 67

18 47 18 67

19 52 19 68

20 61 20 70
Corso di Statistica

codice paziente età Posizione età INDICI DI TENDENZA CENTRALE


Moda = 62
1 62 1 30

2 39 2 39
Mediana = 60,5
3 46 3 46
μ = 56,6
4 53 4 46

5 54 5 47 INDICI DI VARIABILIT A'


6 68 6 52 minimo = 30
7 63 7 53 massimo = 70
8 62 8 54 range = 40
9 67 9 57 deviazione st. = 10,63
10 30 10 60

11 66 11 61
∑ ( ai − µ )
n 2

12 46 12 62
σ= i =1
=
13 67 13 62 n
14 70 14 62
=
( 30 − 56,6) 2 + ( 39 − 56,6) 2 + ... + ( 70 − 56,6) 2 =
15 60 15 63 20
16 57 16 66
=
( − 26,6) 2 + ( −17,6) 2 + ... + (13,4) 2 =
17 62 17 67
20
18 47 18 67
707 ,6 + 309 ,8 + ... + 179,6
19 52 19 68 = = 10,63
20
20 61 20 70