Sei sulla pagina 1di 64

Corso di Statistica

I Facoltà di Medicina e Chirurgia

CORSO DI STATISTICA
Dott.sa Laura Perrotta
- Lezione 3 - Indici di tendenza centrale -

A.A. 2010/2011
Corso di Statistica

GLI INDICI DI TENDENZA CENTRALE


•Lo scopo della statistica è di evidenziare determinate situazioni
ricavandole da un insieme di osservazioni e da un collettivo di misure.

•Le tabelle e le rappresentazioni grafiche di un fenomeno costituiscono


un notevole strumento di illustrazione e di divulgazione ma non di
sintesi dell’informazione.

•Le misure di tendenza centrale servono per individuare il valore


intorno al quale i dati sono raggruppati.

• La tendenza centrale è la misura più appropriata per sintetizzare


l’insieme delle osservazioni se una distribuzione di dati dovesse
essere descritta con un solo valore.

• Le medie costituiscono una prima indicazione della dimensione del


fenomeno pur comportando una perdita di informazione.
Corso di Statistica

GLI INDICI DI TENDENZA CENTRALE


 L’obiettivo degli indici tendenza è di sintetizzare le informazioni
contenute nelle misure.

 La sintesi porta una perdita di informazione.

 La scelta dell’indice deve cadere su quello che minimizza la


perdita di informazione pur rappresentando correttamente un
insieme di manifestazioni di una stessa variabile.

 Il dato di sintesi deve soddisfare alcune condizioni:

 deve essere compreso tra il valore più piccolo e quello più grande

 deve identificarsi, in qualche modo, con i valori più frequenti


localizzati al centro delle misure quando sono ordinabili.
Corso di Statistica

Il calcolo delle medie va distinto per il tipo di variabile


utilizzata:

 Le medie analitiche (di calcolo):


la cui applicazione è ammessa solo per misure
quantitative;
il loro calcolo si basa sul concorso di tutte le unità: per
esempio la media aritmetica

 Gli indici di posizione (lasche):


sono l’unica sintesi possibile in caso di
classificazioni ordinali e qualitative;
sono identificate in ragione di particolari posizioni ordinali
nella successione crescente o decr. di tutte le modalità:
moda, mediana, quantili
Corso di Statistica

MEDIE ANALITICHE INDICI DI POSIZIONE

VALORE INTERMEDIO MODA

MEDIA ARITMETICA MEDIANA

MEDIA GEOMETRICA QUANTILI

MEDIA ARMONICA
Corso di Statistica

IL VALORE INTERMEDIO
Il valore intermedio tra due misure estreme è pari a:

x1 + xn
2
(operatore simile al calcolo del valore centrale delle classi)

Nota: questo indice trascura tutti i valori escluso il max e il


min; se i due valori estremi risultano molto scostati dal
complesso delle osservazioni, il valore ottenuto non
rispecchia la centralità dell’insieme
Corso di Statistica

LA MEDIA ARITMETICA SEMPLICE

E’ l’indice di tendenza più usato, rappresenta il


valore da attribuire a ciascuna delle misure come se
fossero tutte uguali.

Dal momento che esprime la tendenza centrale si


può ipotizzare che la maggior parte dei risultati è
concentrata su tale valore
Corso di Statistica

MEDIA ARITMETICA PER


DISTRIBUZIONI UNITARIE
Si ottiene come la sommatoria di tutte le osservazioni (xi)
divisa per il loro numero (N).
Indichiamo le singole osservazioni con x1; x2; …; xi;… xn; :

∑x i

µ =m=x= i =1
n
Corso di Statistica

Tab. 1 - Distribuzione dei mesi secondo le ore di straordinario effettuate


da un infermiere di un ospedale

Ore di lavoro Ore di lavoro


straordinario straordinario
Gennaio 10 Gennaio x1
Febbraio 12 Febbraio x2
Marzo 11 Marzo x3
Aprile 5 Aprile …
Maggio 7 Maggio …
Giugno 10 Giugno …
Luglio 5 Luglio …
Agosto 0 Agosto …
Settembre 7 Settembre …
Ottobre 10 Ottobre …
Novembre 7 Novembre …
Dicembre 12 Dicembre xn
Totale 96 Totale 96
Corso di Statistica

APPLICAZIONE DELLA FORMULA


n

∑x i
Formula della media aritmetica
µ =m = x = i =1
per distribuzioni unitarie
n

12

∑x i
10 + 12 + 11 + 5 + 7 + 10 + 5 + 0 + 7 + 10 + 7 + 12 96
µ= =
i =1
= =8
n 12 12

L’infermiere ha fatto in media 8 ore di straordinario al mese


Corso di Statistica

MEDIA ARITMETICA PER DISTRIBUZIONI


DI FREQUENZE
k

∑xn i i
k
µ= i =1
= ∑ xifi
n i =1

∑xn i i
x1n1 +x 2 n 2 +x 3 n 3 +... +xknk
µ= i=
1
= =
n n
n1 n2 nk
=x1 +x 2 +... +xk =
n n n
k
=x1 f 1 +x 2 f 2 +... +xkfk = ∑xifi
i=
1
Corso di Statistica

Esempio di calcolo della media aritmetica mediante la


formula k

∑xn i i

µ=i =1
n

Tab. 2 - Distribuzione dei mesi secondo le ore di straordinario effettuate


da un infermiere di un ospedale
Ore di lavoro Frequenza X Frequenza
straordinario assoluta assoluta

0 1 x1 n1
5 2 x2 n2
7 3 x3 n3
10 3 x4 n4
11 1 x5 n5
12 2 x6 n6
Totale 12 Totale n
Corso di Statistica

APPLICAZIONE DELLA FORMULA

∑x n i i
k
= ∑xifi
Formula della media aritmetica
µ= i =1
per distribuzioni di frequenza
n i =1

∑ xn i i
0 × 1 + 5 × 2 + 7 × 3 + 10 × 3 + 11×1 + 12 × 2 96
µ= i =1
= = =8
n 12 12

n indica la numerosità totale delle osservazioni;


K indica il numero di classi
Corso di Statistica

Esempio di calcolo della media aritmetica mediante la


formula
k
µ = ∑xifi
i =1

Tab. 3 - Distribuzione dei mesi secondo le ore di straordinario effettuate


da un infermiere di un ospedale
Ore di lavoro straordinario Frequenza Frequenza
assoluta relativa

0 1 0,083
5 2 0,167
7 3 0,250
10 3 0,250
11 1 0,083
12 2 0,167
Totale 12 1
Corso di Statistica

APPLICAZIONE DELLA FORMULA

∑x n i i
k
= ∑xifi
Formula della media aritmetica
µ= i =1
per distribuzioni di frequenza
n i =1

k
µ = ∑ xifi =
i =1

= 0 × 0,083 + 5 × 0,167 + 7 × 0,250 + 10 × 0,250 + 11× 0,083 + 12 × 0,167 = 8


Corso di Statistica
Tab. 1 - Distribuzione dei mesi secondo le Tab. 2 - Distribuzione dei mesi secondo le
ore di straordinario effettuate da un infermiere ore di straordinario effettuate da un infermiere
di un ospedale di un ospedale
Ore di lavoro
straordinario Ore di lavoro straordinario Frequenza Frequenza
assoluta relativa
Gennaio 10
0 1 0,083
Febbraio 12
5 2 0,167
Marzo 11
7 3 0,250
Aprile 5
10 3 0,250
Maggio 7
11 1 0,083
Giugno 10
12 2 0,167
Luglio 5
Totale 12 1
Agosto 0
Settembre 7
Ottobre 10 12
Novembre 7
∑x i
10 + 12 + 11 + 5 + 7 + 10 + 5 + 0 + 7 + 10 + 7 + 12 96
Dicembre 12
µ= i =1
= = =8
Totale 96 n 12 12
6

∑ xn i i
0 ×1 + 5 × 2 + 7 × 3 + 10 × 3 + 11× 1 + 12 × 2 96
µ= i =1
= = =8
n 12 12
k
µ = ∑ xifi = 0 × 0,083 + 5 × 0,167 + 7 × 0,250 + 10 × 0,250 + 11× 0,083 + 12 × 0,167 = 8
i =1
Corso di Statistica

1° Esempio di calcolo della media aritmetica in una distribuzione in classi

Classe (cm) Frequenze


assolute
ni
150-154 2
155-159 6
160-164 11
165-169 18
170-174 25
175-179 13
180-184 7
82
Corso di Statistica

Classe (cm) Frequenze Valore centrale


assolute della classe
ni xi xi * n i

150-154 2 152 304


155-159 6 157 942
160-164 11 162 160 +164 1.782
=
2
165-169 18 167 3.006
170-174 25 172 4.300
175-179 13 177 2.301
180-184 7 182 1.274
13.909
k

∑x n i i
152 × 2 + 157 × 6 + ... + 182 × 7 304 + 942 + ... + 1.274
µ= i =1
= = =
n 82 82
13 .909
= = 169 ,62
82
Corso di Statistica
2° Esempio di calcolo della media aritmetica in una distribuzione in
classi

Tab. 4a – Distribuzione di frequenze del peso (Kg) di una casistica di 310


soggetti affetti da diabete manifesto
Classi peso Frequenza assoluta
[69,5 – 72,5) 3
[72,5 – 75,5) 4
[75,5 – 78,5) 22
[78,5 – 81,5) 53
[81,5 – 84,5) 92
[84,5 – 87,5) 71
[87,5 – 90,5) 46
[90,5 – 93,5) 15
[93,5 – 96,5) 4
Totale 310
Corso di Statistica

Tab. 4b – Distribuzione di frequenze del peso (Kg) di una casistica di 310


soggetti affetti da diabete manifesto
Classi peso Frequenza assoluta Valore centrale
[69,5 – 72,5) 3 71
[72,5 – 75,5) 4 74
[75,5 – 78,5) 22 77
[78,5 – 81,5) 53 80
[81,5 – 84,5) 92 83
[84,5 – 87,5) 71 86
[87,5 – 90,5) 46 89
[90,5 – 93,5) 15 92
[93,5 – 96,5) 4 95
Totale 310

71× 3 + 74 × 4 + 77 × 22 + ... + 95 × 4
µ= = 83,9
310
Corso di Statistica

PROPRIETA’ FONDAMENTALI DELLA


MEDIA ARITMETICA
1. La somma di tutti gli scarti dalla media aritmetica è nulla
n

∑(x i −µ) =0
i=1 2
n

2. La somma dei quadrati degli scarti, ∑(x i −a )


i=1

qualunque sia il valore a, assume il suo minimo per a =µ

3. Indicato con a1 il valore più piccolo della distribuzione e


con an quello più grande, si ha
x1 ≤ µ ≤ xn
ossia la media aritmetica è non esterna all’intervallo (a1, an )
Corso di Statistica

La media aritmetica è la più nota e facile da calcolare.

Viene sempre utilizzata salvo che in presenza di:

• dati non quantitativi

• misure di ordine di grandezza molto diverse


es. 0,8 7 58 124

• valori estremi molto scostati o indeterminati


es. 28 34 22,5 299

• valori estremi indeterminati o infiniti


es. 9 6 4 7 >100

• distribuzioni di frequenza con classi aperte


Corso di Statistica

MEDIA ARITMETICA PONDERATA

E’ una media aritmetica che attribuisce ad ogni valore un peso o


importanza diversa. Nei casi più semplici il peso è costituito dalla
frequenza dei singoli valori, in altri frangenti è determinato
dall’importanza che si vuole o si deve attribuire a ciascun valore.
In generale la media aritmetica dei valori x , x , … , x con i pesi
1 2 k

π , π , … , π è data da
1 2 k

x1π 1 + x 2π 2 + ...+ xkπ k


µ=
π 1 + π 2 + ...+ π k
Corso di Statistica

Esempio di calcolo della media aritmetica ponderata

Corso integrato di Voto Crediti Ore


Infermieristica materno-infantile

Pediatria generale e specialistica 27 1,2 18

Ginecologia ed ostetricia 21 1,2 18

Infermieristica pediatrica e neonatale 30 0,6 9

Totale 3 45

27 + 21 + 30
MEDIA ARITMETICA µ= = 26
3
27 ×1,2 + 21 ×1,2 + 30 ×0,6
MEDIA ARITMETICA PONDERATA µ= = 25 ,2
1,2 +1,2 + 0,6
Corso di Statistica 3
Esercizio 1 (d)
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta,
registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse,
(a). si dica se e’quantitativa o qualitativa, discreta o continua.
(b). dopo aver definito opportunamente le classi di modalita’, calcolare
(c) le frequenze assolute e le frequenze relative;
(d) la media aritmetica di X;
(e) la moda, la mediana.

Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2

Media Aritmetica: 2,1

può essere calcolata in 3 modi differenti


Corso di Statistica 3

(d) Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° Xi ni fi


Lunghez. in cm 1 2 2 3 4 1 2 1 3 2 1 3 0,3
2 4 0,4
3 2 0,2
4 1 0,1
Tot 10 1
N 10

∑x i ∑x 1 + 2 + 2 + 3 + 4 +1 + 2 +1 + 3 + 2
i
µ= i =1
= =
i =1
= 2,1
N 10 10

n 4

∑x n i i ∑x ⋅n i i
(1× 3) + (2 × 4) + (3 × 2) + ( 4 ×1)
µ= i =1
= i =1
= = 2,1
N 10 10

n 4
µ = ∑ xi f i = ∑ xi f i = (1× 0,3) + (2 × 0,4) + (3 × 0,2) + (4 × 0,1) = 2,1
i =1 i =1
Corso di Statistica

LA MEDIA GEOMETRICA

Si preferisce utilizzare la media geometrica per i dati


distribuiti su diversi ordini di grandezza e quando i dati
appaiono legati tra loro da un fattore moltiplicativo
(esempio di successione geometrica del fattore
moltiplicativo 2: 2, 4, 8, 16, 32, 64…).

La media geometrica non è altro che la radice ennesima


del prodotto delle N osservazioni.
Corso di Statistica

MEDIA GEOMETRICA PER


DISTRIBUZIONI UNITARIE

n
MG = n x1 ⋅ x 2 ⋅ ... ⋅ xn = n ∏x i
i =1

La media geometrica della distribuzione unitaria x1,x2,…,xn ,


in cui le x1,x2,…,xn sono tutte positive, è la radice n-esima del
prodotto x1,x2,…,xn
Corso di Statistica

MEDIA GEOMETRICA PER


DISTRIBUZIONI IN CLASSI

f1 fn
MG = x1 ⋅ ...... ⋅ xn
N

Si utilizza in caso di distribuzioni in classi o


osservazioni ripetute
Nota: la media geometrica non ha significato in presenza
di valori nulli o negativi
Corso di Statistica

Esempio di applicazione della media geometrica

Consideriamo tre
valori

10, 100, 1000


10 + 100 + 1000 1110
µ= = = 370
3 3

n
MG = n x1 ⋅ x 2 ⋅ ... ⋅ xn = n ∏x i =
i =1

= 3 10 ⋅10 2 ⋅103 = 3 10 ⋅100 ⋅1000 = 100


Corso di Statistica

MEDIA ARMONICA
La media armonica è definita come il reciproco della
media aritmetica dei reciproci delle misure.

n
MA = n
1

i=1 xi

La media armonica della quantità a1,a2,…,an è l’inverso della


media aritmetica degli inversi 1 1 1
, ,...,
x1 x 2 xn

Tale media trova una applicazione nella valutazione dei tempi di


reazione o di risposta (in prove di sopravvivenza post operatoria).
In genere si utilizza per i fenomeni che dovrebbero preferibilmente
esaurirsi in un arco di tempo definito.
Corso di Statistica

RELAZIONI TRA LE MEDIE ANALITICHE

Tra le medie aritmetica, geometrica e armonica, calcolate su una


stessa serie di misure, esiste la relazione:

MA ≤MG ≤µ
dove il caso di uguaglianza vale solo nel caso in cui le osservazioni
siano tutte uguali.
Corso di Statistica

SCHEMA DI UTILIZZO DEGLI INDICI DI TENDENZA


CENTRALE RISPETTO ALLA TIPOLIGIA DI CARATTERE

Caratteri Caratteri
quantitativi qualitativi
Medie Aritmetica si no
analitiche Geometrica si no
Armonica si no
Indici di Moda si si
posizione Mediana si si
Quantili si si
Corso di Statistica

INDICI DI POSIZIONE

In presenza di misure non quantitative non è possibile


applicare le medie analitiche.

In alternativa sono state introdotte le medie di posizione:

 Moda

 Mediana

 Quantili
Corso di Statistica

LA MODA
La moda è un indice di tendenza centrale che individua il
gruppo o il dato che compare con maggior frequenza

Per caratteri la moda è la modalità che si


qualitativi: presenta con maggior frequenza

Per caratteri la moda è il valore che si


presenta con maggior frequenza
quantitativi:
 La moda è l’indice di tendenza centrale che minimizza le
perdite di informazioni.
 In alcune distribuzioni può accedere che siano presenti
una o più mode all’aumentare del numero di
osservazioni:
distribuzioni unimodale, bimodale, plurimodale
Corso di Statistica

 Per le distribuzioni in classi di uguale ampiezza, si


calcola la classe modale come segue:

∆1
moda = L1 + ∆1+ ∆ 2 × c

Dove: L1 = confine inferiore della classe modale


c = ampiezza della classe modale
∆1 = differenza tra la frequenza della classe modale e la precedente
∆ 2 = differenza tra la frequenza della classe modale e la successiva

 Nel caso di distribuzioni in classi di diversa ampiezza


la classe modale è quella con la più alta densità di
frequenza
(la frequenza assoluta in rapporto all’ampiezza della classe)
Corso di Statistica

1° Esempio di calcolo della moda (carattere qualitativo)

Cause di morte Frequenze assolute


Tumori 315
Malattie sistema circolatorio 418
Malattie sistema respiratorio 82
Malattie sistema digerente 49
Non definite 19
Accidentali 57

La moda è “Malattie sistema circolatorio”


Corso di Statistica

2° Esempio di calcolo della moda (carattere quantitativo)

Tab. 5 - Distribuzione dei mesi secondo le ore di straordinario effettuate


da un infermiere di un ospedale
Ore di lavoro straordinario Frequenza Frequenza
assoluta relativa

0 1 0,083
5 2 0,167
7 3 0,250
10 3 0,250
11 1 0,083
12 2 0,167
Totale 12 1

La prima moda è “7”, la seconda moda è “10”


Corso di Statistica

3° Esempio di calcolo della classe modale e della moda in una


distribuzione in classi (classi della stessa ampiezza)
Classi peso Frequenza assoluta Valore centrale
[69,5 – 72,5) 3 71
[72,5 – 75,5) 4 74
[75,5 – 78,5) 22 77
[78,5 – 81,5) 53 80
[81,5 – 84,5) 92 83
[84,5 – 87,5) 71 86
[87,5 – 90,5) 46 89
[90,5 – 93,5) 15 92
[93,5 – 96,5) 4 95
Totale 310

- classe modale = [81,5 - 84,5 )

- moda = L1 + ∆ ×c =81 ,5 + 92 −53


×3 =83 ,4
1

∆∆
1− 2
[(92 −53 ) +(92 −71 )]
Corso di Statistica
4° Esempio di calcolo della classe modale in una distribuzione in
classi (classi con ampiezze diverse)
Tab. 6 - Strutture di degenza classificate in base al numero di posti letto
Numero posti letto Frequenza Ampiezza della Densità di
assoluta classe frequenza
26-50 251 25 10,04
51-100 368 50 7,36
101-150 288 50 5,76
151-200 159 50 3,18
201-300 304 100 3,04
301-500 173 200 0,87
501-800 99 300 0,33

La classe modale apparente è “51-100” 99


0,33 =
300
La classe modale corretta è “26-50”
Corso di Statistica

Individuare la moda nelle seguenti rappresentazioni grafiche:


Corso di Statistica

LA MEDIANA

La mediana per definizione occupa il valore centrale


in una serie ordinata di dati.

Le osservazioni vengono separate dal valore


mediano in due parti numericamente uguali, il 50%
con valori inferiori e il 50% con valori superiori.

La mediana non risente dei valori estremi di una


serie ordinata ed è preferita in tali casi alla media
aritmetica.
Corso di Statistica

Il procedimento di calcolo della mediana

passa per 3 fasi:

1. ordinamento dei dati in modo crescente

2. calcolo della posizione della mediana

3. identificazione del valore corrispondente a tale


posizione
Corso di Statistica

Per il calcolo della posizione mediana bisogna tener


conto della numerosità delle osservazioni n

Se n è dispari si avrà n +1
una sola posizione mediana 
 2

 n
Se n è pari si avranno  2
due posizioni mediane n
 +1
2
La mediana è data dal “valore/modalità/classe” corrispondente
alla posizione mediana (o alle posizioni mediane).
Corso di Statistica

LA MEDIANA PER CARATTERI QUALITATIVI:

1. Nel caso di distribuzioni qualitative unitarie:


 dopo aver ordinato i dati, se la numerosità delle
osservazioni è dispari, la mediana è data dalla modalità
corrispondente alla posizione mediana
 quando la numerosità del collettivo è dato da un
numero pari, se i due posti centrali sono occupati da
dati relativi ad una stessa modalità, questa è la
mediana; altrimenti le modalità relative ai due dati che
occupano i posti centrali sono dette “modalità mediane”

1. Nel caso di distribuzioni di frequenza, le modalità sono


già ordinate, quindi si procede all’identificazione della
classe mediana, nella quale cade l’osservazione mediana,
avvalendosi delle frequenze cumulate della distribuzione.
Corso di Statistica

1° Esempio di calcolo della mediana (carattere qualitativo)

Paziente Età Sesso Titolo di studio …

1 54 M Nessun titolo …
2 57 F Laurea …
3 62 F Laurea …
4 46 F Nessun titolo …
5 39 F Diploma …
6 54 M Licenza elementare …
7 57 F Licenza elementare …
8 60 M Nessun titolo …
9 51 F Licenza media …

n = 9 (numerodispari)
Corso di Statistica

Paziente Titolo di studio Posizione Titolo di studio

1 Nessun titolo 1 Nessun titolo


2 Laurea 2Nessun titolo

IN ORDINE CRESCENTE
3 Laurea 3Nessun titolo
4 Nessun titolo 4 Licenza elementare
5 Diploma 5 Licenza elementare
6 Licenza elementare 6 Licenza media
7 Licenza elementare 7 Diploma
8 Nessun titolo 8 Laurea
9 Licenza media 9 Laurea

n = 9 (numero dispari)

n +1 9 +1
= =5 ⇒ La mediana è " LICENZA ELEMENTARE "
2 2
Corso di Statistica

2° Esempio di calcolo della mediana (carattere qualitativo)

Paziente Età Sesso Livello Creatininemia …

1 54 M Basso …
2 57 F Basso …
3 62 F Alto …
4 46 F Medio …
5 39 F Medio …
6 54 M Basso …
7 57 F Medio …
8 60 M Medio …
9 51 F Alto …
10 54 F Alto …

n = 10 (numeropari)
Corso di Statistica

Paziente Livello Creatininemia Posizione Livello Creatininemia


1 Basso
1 Basso
2 Basso
2 Basso

IN ORDINE CRESCENTE
3 Basso
3 Alto
4Medio
4 Medio
5Medio
5 Medio
6Medio
6 Basso
7Medio
7 Medio
8 Alto
8 Medio
9 Alto
9 Alto
10 Alto
10 Alto

n = 10 (numero pari)
n 10
= =5 ⇒ la modalità corrispondente é " Medio"
2 2

n 10
+1 = +1 = 6 ⇒ la modalità corrispondente é " Medio"
2 2

La Mediana è " Medio"


Corso di Statistica

3° Esempio di calcolo della mediana (carattere qualitativo)

Paziente Età Sesso Umore …

1 54 M Buono …
2 57 F Buono …
3 62 F Ottimo …
4 46 F Ottimo …
5 39 F Normale …
6 54 M Basso …
7 57 F Discreto …
8 60 M Buono …
9 51 F Discreto …
10 54 F Basso …

n = 10 (numeropari)
Corso di Statistica

Paziente Umore Posizione Umore

1 Buono 1 Basso
2 Buono 2 Basso
3 Ottimo 3 Normale
4 Ottimo 4 Discreto
5 Normale 5 Discreto
6 Basso 6 Buono
7 Discreto 7 Buono
8 Buono 8 Buono
9 Discreto 9 Ottimo
10 Basso 10 Ottimo

n = 10 (numero pari)
n 10
= =5 ⇒ la modalità corrispondente é " Discreto"
2 2

n 10
+1 = +1 = 6 ⇒ la modalità corrispondente é " Buono"
2 2

Le modalità medianesono " Discreto"e " Buono"


Corso di Statistica

4° Esempio di calcolo della mediana (carattere qualitativo) in una


distribuzione di frequenza

Titolo di studio Frequenza assoluta

Nessun titolo 1.862

Licenza elementare 9.903

Licenza media 4.491

Diploma 3.093

Laurea 1.160

Totale 20.509
Corso di Statistica

Titolo di studio Frequenza Frequenza assoluta


assoluta cumulata
Nessun titolo 1.862 1.862
1.862
Licenza elementare 9.903 11.765
1.862 + 9.903
Licenza media 4.491 16.256
1.862 + 9.903 + 4.491
Diploma 3.093 19.349

Laurea 1.160 20.509

Totale 20.509

n = 20.509 (numero dispari)

n + 1 20.509 + 1
= = 10.255 ⇒ La mediana è " LICENZA ELEMENTARE "
2 2
La modalità “licenza elementare” è la mediana.
La mediana della distribuzione è la modalità relativa al dato statistico che
nell’ordinamento stabilito occupa il posto di mezzo.
Corso di Statistica

LA MEDIANA PER CARATTERI QUANTITATIVI:

1. Nel caso di una serie di misure singole e ordinate


(o caratteri continui)
 per n dispari la mediana
corrisponde al valore in posizione n +1
2
 per n pari la mediana
si colloca tra le due posizioni centrali n e n
+1
(si parla di modalità mediane) 2 2

il valore mediano viene calcolato come media


aritmetica dei valori corrispondenti a queste due
posizioni
Corso di Statistica

2. Per le distribuzioni in classi si identifica la classe


mediana; nel caso di classi di uguali ampiezza
si calcola il valore mediano tra quelli compresi
nell’intervallo di classe utilizzando la formula:

n
− fcum
mediana = L1 + 2 ×c
fmed

L1 = confine inferiore della classe mediana


c = ampiezza della classe mediana
fcum = frequenza cumulata delle classi che precedono la classe mediana
fmed = frequenza della classe mediana
Corso di Statistica

5° Esempio di calcolo della mediana (carattere quantitativo)

Paziente Sesso Età PA diastolica PA sistolica


(mmHg) (mmHg)
1 M 63 70 110

2 F 56 90 95

3 F 48 80 130

4 F 48 85 85

5 M 50 70 95

6 F 54 70 85

7 M 58 65 100

8 M 67 90 130

9 F 61 90 85
Corso di Statistica

Posizione PA sistolica
(mmHg)
1 85

IN ORDINE CRESCENTE
2 85
50% 3 85

4 95

5 95

6 100

7 110
50% 8 130

9 130

n +1 9 +1
= =5 “95” è la modalità mediana
2 2
Corso di Statistica

6° Esempio di calcolo della mediana nel caso di


una distribuzione in classi
Classi peso Valore centrale Frequenza Frequenza
assoluta cumulata
[69,5 – 72,5) 71 3 3
[72,5 – 75,5) 74 4 7
[75,5 – 78,5) 77 22 29
[78,5 – 81,5) 80 53 82
[81,5 – 84,5) 83 92 174
[84,5 – 87,5) 86 71 245
[87,5 – 90,5) 89 46 291
[90,5 – 93,5) 92 15 306
[93,5 – 96,5) 95 4 310
Totale 310
n
− fcum 155 − 82
mediana = L1 + 2 × c = 81,5 + × 3 = 83,9
fmed 92
Corso di Statistica 3
Esercizio 1 (e.)
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta,
registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse,
(a). si dica se e’quantitativa o qualitativa, discreta o continua.
(b). dopo aver definito opportunamente le classi di modalita’, calcolare
(c) le frequenze assolute e le frequenze relative;
(d) la media aritmetica di X;
(e) la moda, la mediana.
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2

(e)
Moda = 2

Mediana: dopo aver ordinato in senso crescente le unità


Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 1 1 2 2 2 2 3 3 4

calcoliamo le due posizioni mediane n/2 = 5 (n/2)+1 = 6,


al posto 5 e 6 corrispondono i valori 2 e 2,
Trattandosi di un carattere qualitativo si fa la media aritmetica
dei due valori mediani: Me= 2
Corso di Statistica

I QUANTILI
I quantili sono un’estensione della mediana. I quantili
suddividono la distribuzione in q distribuzioni parziali,
aventi ognuno la q-esima parte della numerosità totale.

I più utilizzati sono sono i :

Percentili/Centili con q = 100


Decili con q = 10
Quartili con q = 4

Il quartile divide la distribuzione in quattro parti, aventi


ognuna il 25% della numerosità
Corso di Statistica

I° Quartile ripartisce la distribuzione in due distribuzioni, la


prima costituita dal 25% della distribuzione complessiva,
l’altra dal 75%

2° Quartile coincide con la Mediana

3° Quartile ripartisce la distribuzione in due distribuzioni, la


prima costituita dal 75% della distribuzione complessiva,
l’altra dal 25%

Il procedimento di calcolo è simile al calcolo della mediana:

Quantili Decili Percentili


i
i
Qi = ⋅ ( N + 1)
i
Di = ⋅ ( N + 1) Pi = ⋅ ( N + 1)
4 10 10
Corso di Statistica

RELAZIONI TRA INDICI DI TENDENZA


CENTRALE
Le possibili relazioni tra i valori medi di una distribuzione dipendono
dalla sua forma e nel caso di una distribuzione unimodale si
presentano tre casi:

1_curva simmetrica

media = moda = mediana

2_curva obliqua a destra, con asimmetria positiva (a destra)

moda < mediana < media

3_In una curva obliqua a sinistra, con asimmetria negativa (a


sinistra)

media < mediana < moda


Corso di Statistica

RELAZIONI TRA INDICI DI TENDENZA CENTRALE


 Le code (estremi della
distribuzione) sono uguali;

 La coda di destra è più lunga


di quella di sinistra;

 La coda di sinistra è più


lunga di quella di destra.
Corso di Statistica
INDICI DI TENDENZA CENTRALE E LORO
UTILIZZAZIONE
IN RELAZIONE ALLA SCALA DI MISURA DEI DATI
INDICI DI TENDENZA
CENTRALE UTILIZZABILI

Qualitativi sconnessi moda

Qualitativi ordinati indici di posizione

Quantitativi medie analitiche, indici di posizione