Sei sulla pagina 1di 39

Misure di Sintesi

➢ Indici di Posizione

➢ Indici di Dispersione o Variabilità

➢ Indici di Forma

lezione 3
slide 1
Indici di Posizione
Una misura di posizione, o tendenza centrale, fornisce
informazioni sull’individuo “tipo”, esprime la posizione del centro
ideale su cui gravitano gli elementi della distribuzione, ci dice
dove si concentrano le osservazioni.

➢ Media – per dati quantitativi

➢ Mediana - per dati quantitativi e qualitativi ordinali

➢ Moda - per dati quantitativi e qualitativi

lezione 3
slide 2
Caratteristiche Generali delle Medie

➢ Conservazione dell’unità di misura

➢ Monotonia

➢ Consistenza

➢ Internalità

lezione 3
slide 3
Medie Razionali e di Posizione

non richiedono
Medie di
operazioni
posizione o algebriche sulle
lasche modalità, ma risultano
da particolari elementi
della distribuzione

calcolate con operazioni


Medie algebriche sulle modalità,
razionali o richiedono dei caratteri
algebriche quantitativi e risultano dal
concorso di TUTTI i valori
assunti dalla variabile

lezione 3
slide 4
Media Aritmetica
Distribuzioni per Unità

La media aritmetica di un insieme di n valori x1, x2, … xn


di un carattere quantitativo X è data da:

1 n
x = (x1 + x2 + ... + xn ) =  xi = M
1
n n i =1

La media campionaria è la media delle misure del campione.

lezione 3
slide 5
Media Aritmetica
Distribuzioni per Unità
Tempo impiegato per raggiungere il posto di lavoro
tempo impiegato (min.) tempo impiegato (min.)
giorno auto metro giorno auto metro
1 23 22 7 28 24
2 32 24 8 33 28
3 44 22 9 45 32
4 21 33 10 34 31
5 36 26 11 29 37
6 30 31 12 31 24

Media (auto) = (23+32+44+21+36+30+28+33+45+34+29+31)/12 =


= 386/12 = 32,17

Media (metro) = (22+24+22+33+26+31+24+28+32+31+37+24)/12 =


= 334/12 = 27,83

lezione 3
slide 6
Media Aritmetica
Distribuzioni di Frequenza

Se del carattere X conosciamo la sua distribuzione


di frequenza, la media sarà data da:

1 k
x = (n1 x1 + n2 x2 + ... + nk xk ) =  n j x j
1
n n j =1

oppure utilizzando le frequenze relative


k
x = ( f1 x1 + f 2 x2 + ... + f k xk ) =  f j x j
j =1

lezione 3
slide 7
Media Aritmetica
Distribuzioni di Frequenza
n° difetti ni
1 k
x = (n1 x1 + n2 x2 + ... + nk xk ) =  n j x j
x1=0 4 1
x2=1 3
n n j =1
x3=2 4
x4=3 5
x5=4 2
Media (difetti) = (0*4+1*3+2*4+3*5+4*2+5*2)/20 =
= 44/20 = 2,2
x6=5 2
20
oppure
n° difetti fi
𝑘
x1=0 0,2
x2=1 0,15
𝑥lj = 𝑓1 𝑥1 + 𝑓2 𝑥2 +. . . +𝑓𝑘 𝑥𝑘 = ෍ 𝑓𝑗 𝑥𝑗
𝑗=1
x3=2 0,2
x4=3 0,25
x5=4 0,1
Media (difetti) = (0*0,2+1*0,15+2*0,2+3*0,25+4*0,1+5*0,1) =
= 2,2
x6=5 0,1
1

lezione 3
slide 8
Media Aritmetica
Distribuzioni di Frequenza in Classi

Nel caso di una distribuzione di frequenze per un carattere X


suddiviso in classi, possiamo approssimare la media
utilizzando il valore centrale della classe cj

1 k k
x   n jc j =  f jc j
n j =1 j =1

lezione 3
slide 9
Media Aritmetica
Distribuzioni di Frequenza in Classi
Prezzi di farmaci e quantità acquistate da un ospedale
CLASSE CENTRO CLASSE FREQUENZA

Prezzo a Valore Numero Ammontare


confezione centrale confezioni carattere
(€) cj (migliaia)
20 – 30 25 11 25*11 = 275,0

30 – 35 32,5 5 32,5*5 = 162,5

35 – 40 37,5 15 37,5*15 = 562,5

40 – 50 45 9 45*9 = 405,0

Totale 40 1.405

MEDIA = 1.405/40 = 35,72 € (a confezione)


valore approssimato

lezione 3
slide 10
Media Aritmetica Ponderata

La media aritmetica ponderata di un insieme di n valori


osservati di un carattere quantitativo X con pesi p non
negativi, è data da:
k

x1 p1 + x2 p2 + ... + xk pk
x p
j =1
j j

x= =
p1 + p2 + ... + pk k

p
j =1
j

lezione 3
slide 11
Proprietà della Media
Internalità: la media è sempre compresa tra il valore minimo
e il massimo della distribuzione:
𝑥𝑚𝑖𝑛 ≤ 𝑀 ≤ 𝑥𝑀𝐴𝑋
Omogeneità: moltiplicando per una costante c i termini di
una distribuzione anche la media risulta moltiplicata per la
stessa costante (invariante al variare dell’unità di misura).

Traslativa: addizionando (o sottraendo) una costante c ai


termini di una distribuzione la stessa costante sarà aggiunta (o
sottratta) alla media aritmetica.

lezione 3
slide 12
Proprietà della Media

La somma degli scarti al quadrato dei valori da una costante c


è minima quando c è uguale alla media aritmetica:
n
(
 i = min
x − c )2
per c = x
i =1

Associativa: se un collettivo viene suddiviso in L sottoinsiemi


disgiunti, allora la media aritmetica generale si può ottenere
come media ponderata delle medie dei sottoinsiemi con pesi
uguali alle loro numerosità

lezione 3
slide 13
Proprietà della Media
La somma dei valori osservati è uguale al valore medio
moltiplicato per il numero di unità:
n
(x1 + x2 + ... + xn ) =  xi = nx
i =1

La somma delle differenze tra i valori osservati e la loro media


aritmetica, ossia la somma degli scarti dalla media, è pari a
zero:
n

 (x − x ) = 0
i =1
i

lezione 3
slide 14
Considerazioni sulla Media
La Media aritmetica dipende da tutti i valori osservati e quindi
risente dei valori estremi (valori anomali).

La Media aritmetica sintetizza la distribuzione di un carattere


con un solo valore.

La Media aritmetica si può calcolare solo su dati quantitativi.


n

 ()
In generale si parla di operatore media: i =1
n

lezione 3
slide 15
Media Troncata (Trimmed Mean)

La trimmed mean è la media aritmetica calcolata su una


fissata percentuale di valori centrali di un insieme di dati.
Elimina l’influenza dei valori anomali.
Ad esempio nella trimmed mean al 50% si escludono il 25%
dei valori più piccoli e il 25% dei valori più grandi.

Esempio:
Con valori del carattere (3, 5, 5, 6, 8, 9, 11, 150) la trimmed
mean al 50% sarà ottenuta escludendo i due valori più piccoli
e i due più grandi. Essa sarà pari a:
x50% = (5+6+8+9)/4 = 28/4 = 7

lezione 3
slide 16
Moda
Tipologia di farmaco n° reparti Frequenze %

Antidolorifico 100 25%


La moda
Antibiotico 200 50%
è la modalità
Antiblastico 80 20% prevalente
Altro 20 5% del carattere
Totale 400 100%

Consumi n° Consumi n° Ampiezza Densità


ml.(€) reparti ml.(€) reparti classe frequenza

10 20 5 – 25 100 20 100/20 = 5
12 80 25 - 35 90 10 90/10 = 9
31 90
35 - 60 210 25 210/25 = 8.4
40 140
Totale 400
52 70
Totale 400

lezione 3
slide 17
Considerazioni sulla Moda

La moda fornisce informazioni solo su una modalità del


carattere.

La moda dipende solo dalle frequenze.

La moda acquista validità solo se vi è una netta prevalenza


di una modalità/intensità.

La moda si calcola su tutti i tipi di caratteri.

lezione 3
slide 18
Mediana
È la modalità presentata dall’unità centrale del
collettivo. Essa divide il collettivo in due sottoinsiemi
di uguale numerosità: uno con modalità di ordine più
basso e l’altro con modalità di ordine più alto.

Il calcolo della mediana è possibile solo per caratteri


quantitativi o qualitativi ordinabili.

La mediana non è sensibile alla presenza di valori


anomali.
Una importante proprietà della mediana è la seguente:
n
 xi − c è minimo per c = M e .
i=1

lezione 3
slide 19
Calcolo della Mediana in una tabella per unità
1. Ordinare le unità in modo non decrescente;
2. Individuare la posizione in graduatoria dell’unità centrale:
• se n è dispari, la posizione è (n+1)/2
• se n è pari si hanno due unità centrali con posizione
n/2 e n/2 +1;
3. Se n è dispari, la mediana è la modalità presentata
dall’unità centrale, ossia:
Med = x (n+1)/2
1. Se n è pari si hanno due mediane date dalle modalità
delle due unità centrali, possiamo considerare come
mediana la media dei valori delle due unità centrali, ossia:
Med = [x n/2+ x (n/2)+1 ]/2

lezione 3
slide 20
Calcolo della Mediana
in una Tabella di Frequenza
Se il carattere è sintetizzato in una tabella di frequenza,
bisogna:

▪ Ordinare sempre i dati in ordine crescente

▪ Calcolare le frequenze CUMULATE

▪ Guardando le frequenze cumulate individuare la misura o


modalità che si lascia a destra il n/2 o il 50% dei valori

▪ Tale misura o modalità sarà la mediana

lezione 3
slide 21
Calcolo della Mediana
in una Tabella di Frequenza
Se il carattere è sintetizzato in una tabella di frequenza,
guardando le frequenze cumulare assolute:

▪ Se Ci-1< n/2< Ci allora la mediana sarà pari ad xi

▪ Se Ci-1= n/2< Ci allora la mediana sarà pari a (xi-1+xi)/2

Guardando le frequenze cumulare relative

▪ Se Fi-1< 0,5< Fi allora la mediana sarà pari ad xi

▪ Se Fi-1= 0,5< Fi allora la mediana sarà pari a (xi-1+xi)/2

lezione 3
slide 22
Esempio Calcolo della Mediana
in una Tabella di Frequenza
Se il carattere è sintetizzato in una tabella di frequenza, la
bisogna:

FREQUENZE SEMPLICI FREQUENZE CUMULATE


Voto Assolute Relative Percentuali Assolute Relative Percentuali
xi ni fi pi Ni Fi Pi
18 4 0,2 20,0% 4 0,2 20,0%
20 3 0,15 15,0% 7 0,35 35,0%
22 4 0,2 20,0% 11 0,55 55,0%
24 5 0,25 25,0% 16 0,8 80,0%
27 2 0,1 10,0% 18 0,9 90,0%
28 2 0,1 10,00% 20 1 100%
20

lezione 3
slide 23
Esempio Calcolo della Mediana
in una Tabella di Frequenza
Se il carattere è sintetizzato in una tabella di frequenza, la
bisogna:

FREQUENZE SEMPLICI FREQUENZE CUMULATE


Voto Assolute Relative Percentuali Assolute Relative Percentuali
xi ni fi pi Ni Fi Pi
18 4 0,2 20,0% 4 0,2 20,0%
20 3 0,15 15,0% 7 0,35 35,0%
22 3 0,15 15,0% 10 0,50 50,0%
24 6 0,3 30,0% 16 0,8 80,0%
27 2 0,1 10,0% 18 0,9 90,0%
28 2 0,1 10,0% 20 1 100%
20

lezione 3
slide 24
Calcolo della Mediana
in una Tabella di Frequenza per Classi

Se il carattere è suddiviso in classi, si può ottenere un


valore ben approssimato tramite la formula:

 0 ,5 − Fm −1 
Me  Inf m +   Δm
 Fm − Fm −1 

in cui si assume implicitamente l’ipotesi che nella classe


mediana le unità siano distribuite uniformemente

lezione 3
slide 25
Esempio

 0,5 − 0 ,22 
Me  5 +    5 = 5 + 3,59 = 8,59
 0,61 − 0 ,22 

classi 0-1 1-5 5-10 10-20 20-30 Totale


n 7 18 45 25 20 115

classi 0-1 1-5 5-10 10-20 20-30

Nj 7 25 70 95 115

Fj 0,06 0,22 0,61 0,83 1,00

 0,5 − Fm−1 
Me  Inf m +   Δm
 Fm − Fm−1 

lezione 3
slide 26
Confronto tra Media e Mediana

lezione 3
slide 27
Confronto tra Media e Mediana

lezione 3
slide 28
Proporzione
La proporzione è la più importante statistica descrittiva
relativa a una variabile categorica.

La proporzione di una data categoria è pari al numero di


osservazione che rientrano in quella categoria diviso il totale
delle osservazioni.

n di osservazioni nella categoria


pˆ =
n  totale di osservazioni

La proporzione può anche essere vista in termini di media


aritmetica.

lezione 3
slide 29
Proporzione

lezione 3
slide 30
Indici di Dispersione

Una misura di dispersione mostra quanto sono diversi tra loro


gli individui di un campione o di una popolazione.

Indica quanto le osservazioni sono disperse rispetto ad un


punto di riferimento (di solito la media).

➢ Deviazione Standard

➢ Differenza Interquartile

lezione 3
slide 31
Differenza Interquartile
Il primo quartile (Q1) è il valore che lascia, una volta ordinati i dati,
alla sua destra il 25% dei dati e alla sua sinistra il restante 75%. Può
anche essere visto come la mediana della prima metà dei dati.

Il terzo quartile (Q3) è il valore che lascia, una volta ordinati i dati,
alla sua destra il 75% dei dati e alla sua sinistra il restante 25%. Può
anche essere visto come la mediana della seconda metà dei dati.

La differenza interquartile (o intervallo interquartile) è


l’intervallo di variazione della metà centrale dei dati. È la differenza
tra il terzo quartile ed il primo quartile. È un indice di dispersione non
analitico.

IQR = Q3 − Q1

lezione 3
slide 32
Esempio Calcolo Mediana e Quartili

lezione 3
slide 33
Box - Plot
Il box-plot o diagramma a scatola è un diagramma che
permette di visualizzare la mediana, i quartile, valori estremi
e l’intervallo interquartile.

Q1 Me Q3
valore minimo o valore massimo o
estremo inferiore estremo superiore
valore anomalo

50%

25% 25%

lezione 3
slide 34
Alcune Formule Alternative

 (x )−  (x)  (x )− n x
n n n n

 ( xi − x ) 2 2 2 2 2
i i
i =1 i =1 i =1 i =1
sˆ 2 = = =
n −1 n −1 n −1

2
 n 
 ( )−  ( )  ( )  ( )  ( )  (x )
n n n n n n

 ( xi − x ) xi  x
2 2
xi2 x 2
xi2 2
2
 i =1   nx 
i
2
 =
2 i =1
= i =1 i =1
= i =1
−  = i =1
−  = i =1
−x =
n n n  n  n  n n
 
 
 

= MEDIA dei quadrati – quadrato della MEDIA

lezione 3
slide 35
Operazioni Aritmetiche – Traslazione
Traslare significa addizionare (o sottrarre) una costante c a tutte le
rilevazioni effettuate. Ossia si crea una nuova variabile z = x + c

Se la media di x èx allora la media di z sarà: z =x + c

Se la deviazione standard di x è sx allora la deviazione standard di z


sarà: sz = sx

Se la varianza di x è s2x allora la varianza di z sarà: s2z = s2x

Se la mediana di x è Mex allora la mediana di z sarà: Mez = Mex + c

Se l’ intervallo interquartile di x è IQRx allora l’intervallo interquartile di


z sarà: IQRz = IQRx

lezione 3
slide 36
Operazioni Aritmetiche – Riscalo
Riscalare significa moltiplicare (o dividere) per una costante c a tutte le
rilevazioni effettuate. Ossia si crea una nuova variabile z = cx

Se la media di x èx allora la media di z sarà: z = cx

Se la deviazione standard di x è sx allora la deviazione standard di z


sarà: sz = c sx

Se la varianza di x è s2x allora la varianza di z sarà: s2z = c2 s2x

Se la mediana di x è Mex allora la mediana di z sarà: Mez = c Mex

Se l’ intervallo interquartile di x è IQRx allora l’intervallo interquartile di


z sarà: IQRz = c IQRx

lezione 3
slide 37
Esempio
Immaginiamo di rilevare la variabile “temperatura corporea in °C” su di
un campione di studenti di questa aula, di seguito alcuni indici di sintesi
espressi in gradi Celsius (°C): Media = 36,8°C Mediana = 36,6°C
Dev. St. = 2°C Int. Interq. = 2,3°C
Varianza = 4°C

Se volessi esprimere tali valori in gradi Fahrenheit (°F) è sufficiente


conoscere la relazione che lega le due scale, ossia: °F = (9/5)°C + 32

È come se avessimo traslato la variabile iniziale “temperatura


corporea in °C” di una costante=32 e riscalato per una costante=9/5

I nuovi valori, espressi in °F sono facilmente calcolabili:

Media (°F) = (9/5)36,8+32 = 98,24°F Mediana (°F) = (9/5)36,6+32 = 97,88°F


Dev. St. (°F) = (9/5)2 = 3,6°F Int. Interq. (°F) = (9/5)2,3 = 4,14°F
Varianza (°F) = (9/5)24 = 12,98°F

lezione 3
slide 38
Standardizzazione
Standardizzare una variabile X significa sottrarre ad ogni valore la
media della variabile e dividere tutto per la sua deviazione standard.

Data una variabile X con media μ e varianza σ2, la variabile


standardizzata Z=(X-μ)/σ, ossia la variabile X va traslata per la
propria media e riscalata per la deviazione standard.

Una variabile standardizzata ha SEMPRE media nulla e varianza


unitaria, ossia Z(0,1)

X −
Z=

lezione 3
slide 39

Potrebbero piacerti anche