Sei sulla pagina 1di 65

Misure di tendenza centrale

Prof. Elizana Petrela


Misure di tendenca centrale
• La caracteristica più studiata di una serie di dati è il
suo centro; il punto in cui le osservazioni tendono a
raccogliersi.

• Consentono di sintetizzare un insieme di misure


tramite un unico valore “rappresentativo”.

• sono indicatori che riassumono o descrivono i dati e


dipendono dal grado di misurazione dei dati in
oggetto.
Misure di tendenca centrale

Media Mediana Moda


x (Me) (Mo)
Mediana

• Corrisponde al valore che occupa la


posizione centrale in una distribuzione
ordinata, il valore al di sopra o al di sotto
del quale, sta il 50% dei casi.
• È definita come il 50 percentile di una serie
di misurazioni
Mediana
• In una distribuzione di frequenza, la posizione
della mediana si ottiene:

n +1
Me =
2

N numero di osservazioni
Mediana
• Mediana non e sensibile al valore di ciascuna
misuracione.
• È l’indice di tendenza centrale, insieme alla
moda, per i dati qualitativi misurati su scala
ordinale.
• Scala di misura: ordinale, a intervalli, a
rapporti
Mediana

• Per casi dispari, la mediana a un valore corrispondente al


caso individuato

• Per casi pari, la mediana è la media di due valori centrali,


l’osservazione corrispondente a n/2 ad a [n/2+1].
Esempio (casi dispari)
Presumiamo che i valori degli anticorpi IgG siano
stati registrati in alcuni pazienti con Covid-19:

0, 16, 3, 9, 24, 45, 33.

Calcolate la mediana.
Esempio (casi dispari)
Prima di tutto ordiniamo i valori dal più piccolo
al più grande.
0, 3, 9, 16, 24, 33, 45.
n +1
n Valore
= 7 di Me=16 Me =
2
n +1 7 +1
Me = = =4
2 2 Posicione di mediana è
4
Esempio (casi dispari)

0, 3, 9, 16, 24, 33, 45.

n=7
Posizione di Me=4

Valore di Me=16
Esempio (casi pari)
Presumiamo che i valori degli anticorpi IgG siano
stati registrati in alcuni pazienti con Covid-19:

0, 16, 3, 9, 11, 24, 45, 33.

Calcolate la mediana.
Esempio (casi pari)
Prima di tutto ordiniamo i valori dal più piccolo
al più grande.

0, 3, 9, 11, 16, 24, 33, 45. n +1


Me =
n=8
2
n +1 8 +1
Me = = = 4,5
2 2
Esempio (casi pari)
Prima di tutto ordiniamo i valori dal più piccolo
al più grande. n = 8 Me=4,5
Posizione 5

0, 3, 9, 11, 16, 24, 33, 45.

Posizione 4 Valore di Me=(11+16)/2=27/2=


13.5
La moda (Mo)
• Corrisponde al valore più frequente nella
distribuzione osservata (valore modale).
• La moda puo essere utillizzata come misura di
sintesi per tutti i tipi di dati.
• E’ l’unico indice di tendenza centrale per i dati
qualitativi misurati su scala nominale.
• In una serie di valori possono esserci 0, uno,
due o più modi.
La moda
Peso (kg) fr

10 2

15 5

20 3

25 2
La moda
Peso (kg) fr

La distribuzione di
10 2
frequenza si dice
unimodale quando la 15 5
moda è unica
20 3

25 2

La Moda è 15, l’unico valore con la


frequenza più elevata (fr=5)
La moda
Peso (kg) fr

10 2

15 5

20 3

25 5
La moda
La distribuzione di Peso (kg) fr
frequenza si dice
bimodale quando la moda 10 2
è definita da due valori
15 5

20 3

25 5

La Moda è 15 e 25, due valori con la


frequenza più elevata (fr=5)
La moda
Peso (kg) fr

10 5

15 5

20 5

25 5

Nessuna Moda, tutti i valori hanno la stessa


frequenza (fr=5) !!!!
frfr Illustrazione grafica

0
1 moda due nessuna
La media aritmetica

La media aritmetica è data dalla somma delle misure


osservate diviso il numero delle osservazioni fatte (totale
dei casi)

x=
 x
n
x - osservazioni;
n - numero totale dei casi osservati.
Σ - sommatoria
La media aritmetica
• È l’indicatore di tendenza centrale, insieme a
moda e mediana, per i dati quantitativi
misurati su scale metriche.

• Scala di misura: a intervalli, a rapporti


Esempio
Supponiamo che i numeri:
2; 3; 3,5; 4; 5,5
siano i pesi (in kg) di cinque bambini. La media


è:
x
x=
n

x=
 x (2 + 3 + 3,5 + 4 + 5,5)
= = 3,6kg
n 5
Media
Media di distribuzione di frequenza :

x=
 ( xf )
n

x - osservazioni
f – frequenza;
n – numero totale.
Esempio
Glicemia (mg/dl) (x) fr
80 2
85 4
90 3
95 2
100 3
110 2

Fr – frequenza
Glicemia (mg/dl) (x) fr
80 2
85
90
4
3 x=
 ( xf )
95 2 n
100 3
110 2
 =16
Glicemia (mg/dl) (x) fr
80 2


85 4
( xf )
90 3
x=
95 2 n
100 3
110 2
 =16

n =16, totale dei casi


x=
 ( xf )
n
Glicemia (mg/dl) (x) Fr (f) xf
80 2 80 x 2 =160
85 4
90 3
95 2
100 3
110 2
Shuma  =16
Glicemia (mg/dl) (x) fr xf
80 2 80 x 2 =160
85 4 340
90 3 270
95 2 190
100 3 300
110 2 220
Totale  =16
Glicemia (mg/dl) (x) fr xf
80 2 160
85 4 340
90 3 270
95 2 190
100 3 300
110 2 220
Shuma  =16 =1480

x=
 ( xf ) 1480
= = 92,5mg / dl
n 16
Media armonica

_ n
Xh = --------------------------
1 + 1 + .... + 1
x1 x2 xn
Media geometrica

n
Xgj = x1. x2.x3. ...... .xn

n
Xgj = (x1 f1). (x2f2).(x3f3). ...... . (xnfn)
Confrontro media e mediana

Media Mediana
• è unica in un intervallo • è unica in un intervallo di
di valori; valori;
• Non è stabile rispetto ai • è stabile rispetto ai valori
valori estremi, è estremi, Non è
influenzata dai valori influenzata dai valori
delle osservazioni delle osservazioni;
• è più stabile passando da • Non è stabile, varia
un campione allʼaltro maggiormente passando
da un campione allʼaltro,
Esercizio
Peso (kg) Numero di casi
15 2
18 5
20 3
25 1

• Moda ?
• Mediana e il suo valore?
• Media aritmetica?
Moda
Peso (kg) Numero di casi
15 2
18 5
20 3
25 1

• Moda = 18 (fr=5)
Mediana
Peso (kg) Numero di casi
15 2
2+5=7
18 5
20 3
25 1
Totale (N) 11

n + 1 11 + 1
Me = = =6
2 2
Valore di Me=18
Persone Peso
1 15
2 15
3 18
4 18
5 18
6 18
7 18
8 20
9 20
10 20
11 25
persone peso
1 15
2 15
3 18
4 18
5 18
6 18
7 18
8 20
9 20
10 20
11 25
Persone Peso fr
1 15
2
2 15
3 18
4 18
5 18 5
6 18
7 18
8 20
9 20 3
10 20
11 25 1
Persone Peso fr
1 15
2
2 15
3 18
4 18 2+5=7
5 18 5
6 18
7 18
8 20
9 20 3
10 20
11 25 1

Valore di Me=18
Media
Peso (kg) Numero di
casi


15 2
( xf )
18 5 x=
n
20 3

25 1

Totale (Σ) 11
Media
Peso (kg) Numero di
x casi (fr) xfr


15 2
15*2=30 ( xfr)
18 5 x=
90 n
20 3
60
25 1
25

Totale (Σ) 11 205

x=
 ( xf ) 205
= = 18.63kg
n 11
Misure di dispersione/ indicatori di
variazione
Per confrontare tra loro due o più popolazioni, o le
variazioni della stessa popolazione in diversi periodi, non
basta aver raccolto i dati e averli riuniti in tabelle di
frequenza, è necessario determinare misure di sintesi
numerica (media, mediana, moda, quantili) attorno a cui i
dati si “addensano” e calcolare in che misura ciò accade,
ovvero studiare la variabilità dei dati (range, varianza,
coefficiente di variazione).
Se non ci fosse variabilità all’interno di una popolazione,
non ci sarebbe bisogno della statistica. Una singola unità
sarebbe sufficiente a descrivere l’intera popolazione.
Misure di dispersione/ indicatori di variazione

• La variazione è espressa attraverso indicatori che


rappresentano il livello di scostamento dei dati
caratteristici, dalla dimensione media del fenomeno
analizzato.
• Gli indicatori di variazione sono utilizzati per scoprire lo
sviluppo e le regolarità distributive del fenomeno
analizzato.
• Loro riflettono la massa e attraverso di esse si può
presentare l'influenza di vari fattori sul fenomeno in analisi.
• Più piccoli sono gli indicatori di variazione, più accurato e
realistico è il valore della media aritmetica generata da
questi dati.
Misure di dispersione
Assoluto Relativo
1. Campo di variacione 1. Coeficiente di variazione
(range) (CV)
2. Campo di variazione
interquartile (range
interquartile)
3. Varianca e
4. Deviazione standard
Campo di variazione (range)

• È utilizzato per descrivere la variabilita in una


serie di dati

• Il campo di variazione o range di un gruppo di


misurazioni e difinito come la differenza tra
l’oservazione più grande e quella piu picolo.
Range

Peso (kg) Numero di


casi
15 2 Il range per i dati
del peso è:
18 5

20 3 25 – 15 = 10 kg
25 1

Totale (Σ) 11
Campo di variazione (range)
• È utilizzato per descrivere la variabilita in una
serie di dati
• Il campo di variazione o range di un gruppo di
misurazioni e difiniti come la differenza tra
l’oservazione più grande e quella piu picola.
• La sua utilita e limitata, esso considera solo i
valori estremi di una serie di dati, e non la
maggioranza delle osservazioni.
Il range è molto sensibile a valori eccezionalmente
grandi o piccoli.

Peso (kg) Numero di Peso (kg) Numero di


casi casi
15 2 3 2

18 5 18 5

20 3 20 3

25 1 50 1

R= 25 – 15 = 10 kg R= 50 – 3 = 47 kg
Percentile
• percentile è la percentuale dei dati pari o
inferiore
nr di osservazioni inf eriore a (x )
P( x ) = 100
n

Esercizio 15, 17, 18, 21, 34, 39, 41, 45, 47, 56, 56, 61 n=12

P(39) = 100 = 41,6  42%


Percentile (39)=??? 5
12
Percentile
• In statistica, un percentile (o un centile) è un
tipo di quantile che divide la distribuzione di
probabilità data, o campione, in 100 intervalli
di uguale dimensione; ciò consente di
analizzare i dati in termini percentuali.

• P75 = ¾(n+1)
• P25 = ¼ (n+1)
Quartili
I quartili sono queli valori che dividono la distribuzione in 4 parti
ognuna con lo stesso numero di osservazioni e sono: primo quartile Q1,
mediana Q2 e terzo quartile Q3

25% 25% 25% 25%

Min Q1 Q2 Q3 Max

Per determinare i quartili possiamo considerare le due parti dei dati


ottenute dal calcolo della mediana e trovare in ognuna la mediana una
volta eliminato il valore della mediana.
Il primo e il terzo quartile individuano un intervallo centrale che contiene il
50% delle unità statistiche e che misura la dispersione dei valori centrali
del collettivo osservato attorno alla mediana, che vienne chiamato Range
interquartile.
Range interquartile (RI)
• Il RI e calcolato sottraendo il P25 dei dati dal
P75, e comprende, il 50% delle osservazioni
centrali

RI= P75- P25


Range intequartile
50%

25% 25% 25% 25%

Min Q1 Q2 Q3 Max
• In une serie di dati, in quale posizione esiste il
percentile del 25%?

Valore di posiz ( x ) =
percentile( x)
(n + 1)
100

Valore di posiz (25) =


25
(n + 1)
100
Valore posiz (25) = (n + 1)
1
4
15, 15, 18, 18, 18, 18, 18, 20, 20, 20, 25 n=11

Valore (P25)= 25% (11+1)=1/4*12=3 Pozicione di


P25

Valore (P25)= 18
La varianza e la deviazione standard

La varianza è definita come il quadrato della deviazione standard e misura


l’entità della dispersione dei dati dalla media.
Maggiore è il suo valore e minore è la capacità della media di rappresentare
tutte le osservazioni, maggiore risulta la perdita di informazione che essa
comporta.

L’unità di misura della varianza è il quadrato di quella della variabile per


questo motivo e per facilitarne l’interpretazione si utilizza la deviazione
standard: .
Varianca e Deviazione standard
• La Varianca da una misura dell’entita della variabilità o
dispersione dalla media di une campione

 ( − )2
S = 2 x
n −1
x

 (x− x )
2
SD = 2
n −1
Deviazione standard (SD)
• La SD di una serie di datti è la radice quadrata della varianza.

• La misura di dispersione più comunemente utilizzata è la


deviazione standard perché ha la stessa unità di misura della
media ed insieme ad essa rappresentano i due parametri
chiave delle distribuzioni teoriche di probabilità.
Deviazione standard

 ( x − x )2
Quando n < 30 SD =
n −1

 (x − x )
2
n>30
SD =
n

In un set di dati osservati, il termine x + SD, rappresenta una


deviazione standard inferiore e superiore alla media
Deviazione standard
(per i dati ragrupati)

• Quando n < 30
 (x − x )
2
fr
SD =
n −1

 ( x − x )2
fr
Quando n>30 SD =
n
Importante!!!

• Minore è la deviazione standard più le osservazioni sono


omogenee e concentrate intorno alla media.

• se SD è piccolo, significa che le osservazioni sono omogenee


(loro tendono ad avvicinarsi alla media).

• SD grande, presenta una maggiore variabilita.


Variabilità

Deviazione standard
piccola

Deviazione standard grande

Media
Coefficiente di variazione
Confrontare due deviazioni standard provenienti da due serie di dati
non ha molto senso dato che potrebbero avere unità di misura
differente, ad esempio due distribuzioni con s molto simili non hanno
necessariamente un’analoga dispersione. A tal proposito si utilizza il
coefficiente di variazione CV che mette in relazione la deviazione
standard con la sua media:

SD
CV = 100%
x
CV esprime l’ampiezza percentuale di s rispetto a x è utile per
confrontare serie di dati differenti.
Coefficiente di variazione

• CV è un indicatore relativo, che esprime la


dimensione relativa del rapporto tra SD e media
SD
CV = 100%
x

• Più piccolo è il CV, più omogeneo sono i dati, cioè


l'influenza di fattori esterni è molto piccola.

Potrebbero piacerti anche