Sei sulla pagina 1di 16

Lezione 4

Lezione 4
MEDIA ARITMETICA
Questo indice di posizione è il più usato per ottenere informazioni sull’ordine
di grandezza di una variabile quantitativa, tanto che se si parla di media senza
aggiungere un aggettivo, si fa riferimento alla media aritmetica.
L’espressione “valore medio” si utilizza anche nel linguaggio comune, per cui si
sente parlare di reddito medio, voto medio, età media, così come sono comuni
frasi del tipo "le donne in media vivono più degli uomini" o "i neonati maschi
pesano in media più delle femmine".

Si tratta di una media di tipo analitico, il cui calcolo richiede operazioni di tipo
algebrico e può quindi essere calcolata solo per variabili quantitative.

Insieme alla moda e alla mediana, descritte nella lezione precedente, fa parte
dei cosiddetti indici della tendenza centrale, che tendono tutti a posizionarsi al
centro della distribuzione, così da dare un’informazione sull’ordine di
grandezza della variabile.

La sua formula assume forme diverse a seconda di come sono organizzati i dati
raccolti.

1) SEQUENZA DI VALORI
Considerata la sequenza degli n valori
x1, x2, …, xn
rilevati su n unità per una variabile quantitativa X, la sua media, indicata con i
simboli equivalenti 𝑚, 𝑚𝑥 , 𝑥̅ , è data da

1
Lezione 4

𝑛
1
𝑚 = 𝑚𝑥 = 𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1

dove la quantità ∑𝑛𝑖=1 𝑥𝑖 , data dalla somma di tutte le intensità rilevate, è detta
ammontare della variabile.

Esempio
Considerata la successiva sequenza di voti ottenuti al liceo da uno studente

6 7 8 7 7 6 9 6

il voto medio risulta pari a 56/8=7

2) DISTRIBUZIONE DI FREQUENZA
Se i dati raccolti sono organizzati in una distribuzione di frequenza, come quella
considerata nell’esempio successivo,

X Frequenza assoluta
1 4
2 3
3 2
4 1
10

la media si ottiene sempre dividendo l’ammontare della variabile per il numero


di unità considerate, ma il calcolo dell’ammontare si effettua in modo più rapido
tenendo presente che ciascun valore cj assunto dalla variabile si presenta nj
volte, per cui

2
Lezione 4

1
𝑚 = 𝑚𝑥 = 𝑥̅ = × (1 × 4 + 2 × 3 + 3 × 2 + 4 × 1) = 2
10

La formula per calcolare la media per una distribuzione di frequenza espressa


mediante frequenze assolute è quindi

𝑘
1
𝑚 = 𝑚𝑥 = 𝑥̅ = ∑ 𝑐𝑗 𝑛𝑗
𝑛
𝑗=1

Se nella distribuzione comparissero le frequenze relative, invece delle


frequenze assolute, la media aritmetica si otterrebbe dalla formula seguente

𝑚 = 𝑚𝑥 = 𝑥̅ = ∑ 𝑐𝑗 𝑓𝑗
𝑗=1

𝑛𝑗
dato che 𝑓𝑗 = .
𝑛

ESERCIZIO
Considerata la seguente distribuzione, se ne calcoli la media
X Frequenza relativa
-1 0.1
0 0.2
1 0.5
2 0.2
1.0
Applicando la formula precedente si ottiene
𝑥̅ = −1 × 0.1 + 0 × 0.2 + 1 × 0.5 + 2 × 0.2 = 0.8

3
Lezione 4

3) DISTRIBUZIONE IN CLASSI
Quando la distribuzione è espressa mediante classi di valori, non si conosce la
vera distribuzione della variabile all’interno di ciascuna classe, per cui la media
può essere calcolata solo in modo approssimato.
Considerata per esempio la distribuzione seguente

Classi di valori Frequenza relativa


-1 – 1 0.1
1–4 0.4
4–7 0.4
7–9 0.1
1.0

Si può solo affermare che il 10% delle unità presenta un valore della variabile
compreso fra (-1, 1], il 40% un valore compreso fra (1, 4] e così via.

Per poter calcolare la media occorre sostituire a ciascun intervallo un singolo


valore che rappresenti nel miglior modo possibile l’intervallo stesso e la
soluzione più naturale consiste nello scegliere il suo valore centrale, ottenuto
sommando gli estremi dell’intervallo e dividendo il risultato per due.
Per calcolare la media per l’esempio precedente si considera quindi la tabella
successiva, che nella prima colonna contiene i valori centrali delle diverse
classi.
Valore centrale Frequenza relativa
0.0 0.1
2.5 0.4
5.5 0.4
8.0 0.1
1.0

4
Lezione 4

La media adesso può essere calcolata nel modo visto in precedenza e risulta
𝑥̅ = 0 × 0.1 + 2.5 × 0.4 + 5.5 × 0.4 + 8 × 0.1 = 4

In generale, indicando con 𝑐̅𝑗 il valore centrale della generica classe, le formule
per calcolare la media per una distribuzione espressa mediante frequenze
assolute o relative sono quindi

𝑘
1
𝑚 = 𝑚𝑥 = 𝑥̅ = ∑ 𝑐̅𝑗 𝑛𝑗
𝑛
𝑗=1
𝑘

𝑚 = 𝑚𝑥 = 𝑥̅ = ∑ 𝑐̅𝑗 𝑓𝑗
𝑗=1

ESERCIZIO
Si calcoli la media sulla distribuzione successiva
Classi di valori densità
-3 – -1 0.05
-1 – 1 0.15
1– 5 0.10
5 – 10 0.04

Occorre determinare le frequenze relative e i valori centrali delle classi


Valore centrale Frequenza relativa
-2.0 0.1
0.0 0.3
3.0 0.4
7.5 0.2
1.0

𝑥̅ = −2 × 0.1 + 0 × 0.3 + 3 × 0.4 + 7.5 × 0.2 = 2.5

5
Lezione 4

MEDIA PONDERATA
In alcuni casi il calcolo della media va effettuato attribuendo un certo “peso” ai
valori della variabile. Questo peso serve per misurare l’importanza che si vuole
attribuire a ciascun valore.
Un esempio tipico di media ponderata si ha quando si vuole calcolare il voto
medio per esami universitari a cui sono associati un numero di CFU variabile.

Esempio
Se si considerano i voti seguenti
Voto 24 26 28
CFU 4 4 8

La media dei voti ponderati con i crediti corrisponde a

1
𝑚𝑥 = 𝑥̅ = (24 × 4 + 26 × 4 + 28 × 8)=26.5
16

dove, come si vede, l’ammontare della variabile va diviso per la somma dei pesi
(e non per il numero di esami).

Dati gli n valori xi della variabile X a cui sono attribuiti rispettivamente i pesi pi,
la formula generica della media ponderata risulta
∑𝑛𝑖=1 𝑥𝑖 × 𝑝𝑖
𝑚𝑥 =
∑𝑛𝑖=1 𝑝𝑖

6
Lezione 4

PROPRIETÀ DELLA MEDIA ARITMETICA

- Prima proprietà (proprietà di internalità)


Considerata la sequenza ordinata delle osservazioni x(i) di X, la media 𝑥̅ è

sempre interna all’intervallo (o campo) di variazione Ω𝑥 = [𝑥(1) , 𝑥(𝑛) ].

Questo vuol dire che il risultato della media non può mai essere minore della
più piccola intensità rilevata, né maggiore dell’intensità più grande.

Dimostrazione
Per ogni i = 1, 2, ..., n vale la disuguaglianza 𝑥𝑖 ≤ 𝑥(𝑛) per cui, effettuando la
media su ciascun termine della disuguaglianza, si ottiene
𝑛 𝑛
1 1
∑ 𝑥𝑖 ≤ ∑ 𝑥(𝑛)
𝑛 𝑛
𝑖=1 𝑖=1

Il primo termine corrisponde alla media della X, il secondo è la media di una


costante, che corrisponde alla costante stessa, per cui risulta
𝑥̅ ≤ 𝑥(𝑛)
In modo analogo, dalla disuguaglianza 𝑥𝑖 ≥ 𝑥(1) per ogni i = 1, 2, ..., n risulta
𝑛 𝑛
1 1
∑ 𝑥𝑖 ≥ ∑ 𝑥(1)
𝑛 𝑛
𝑖=1 𝑖=1

Il primo termine corrisponde sempre alla media della X, il secondo è sempre la


media di una costante, per cui si ottiene
𝑥̅ ≥ 𝑥(1)
Risulta quindi verificata la seguente disuguaglianza
𝑥(1) ≤ 𝑥̅ ≤ 𝑥(𝑛)

7
Lezione 4

- Seconda proprietà
L’ammontare complessivo di una variabile quantitativa X rilevata su n unità
corrisponde a n volte la sua media, ossia, in simboli
𝑛

∑ 𝑥𝑖 = 𝑛𝑥̅
𝑖=1

Questa uguaglianza non necessita di alcuna dimostrazione, dato che deriva


direttamente dalla formula della media.
In base a questa proprietà si può concludere che la media aritmetica di una
variabile è quel particolare valore che, sostituito a ciascuna delle osservazioni
effettivamente rilevate, lascia inalterato l'ammontare della variabile ossia, in
altri termini, “equiripartisce” l’ammontare della variabile fra le n unità.
Il reddito medio rappresenta quel reddito, uguale per ciascuno, che lascia
inalterato il reddito complessivo.

- Terza proprietà (proprietà di linearità)


La media di una trasformazione lineare corrisponde alla trasformazione lineare
della media.
Data la sequenza delle n osservazioni xi (per i =1, 2, …, n) di una variabile X, sia
𝑥̅ la sua media. Effettuando una trasformazione lineare della X, del tipo
Y = a + bX
la media della Y risulta uguale a 𝑦̅ = 𝑎 + 𝑏𝑥̅ .

8
Lezione 4

Per dimostrare di questa proprietà si parte dalla definizione di media della Y e


si effettuano le opportune sostituzioni, tenendo presente che dalla relazione
lineare esistente fra X e Y risulta che i singoli valori di Y sono una
trasformazione lineare dei valori assunti dalla X, ossia
𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 per ogni i =1, 2, …, n

Dimostrazione
La media della variabile Y corrisponde, per definizione, a
𝑛
1
𝑦̅ = ∑ 𝑦𝑖
𝑛
𝑖=1

Sostituendo al posto della generica 𝑦𝑖 la sua espressione in funzione di X si ha


𝑛
1
𝑦̅ = ∑(𝑎 + 𝑏𝑥𝑖 )
𝑛
𝑖=1

Aprendo la parentesi si ha
𝑛 𝑛
1 𝑏
𝑦̅ = ∑ 𝑎 + ∑ 𝑥𝑖
𝑛 𝑛
𝑖=1 𝑖=1

dove la costante b è stata portata fuori dalla sommatoria.


Il primo termine a destra del segno di uguaglianza è la media di una costante,
mentre il secondo corrisponde al prodotto fra la costante b e la media della X,
per cui risulta
𝑦̅ = 𝑎 + 𝑏𝑥̅

9
Lezione 4

Esercizi
1) Se la media di n temperature misurate in gradi fahrenheit (F) è risultata pari
a 41, la temperatura media espressa in gradi centigradi (C) si ottiene tenendo
presente la relazione esistente fra le due scale di misura
5
𝐶 = (𝐹 − 32)
9
La temperatura media in gradi centigradi 𝑐̅ si ottiene quindi dalla temperatura
media in gradi fahrenheit 𝑓 ̅ mediante la seguente espressione
5
𝑐̅ = (𝑓 ̅ − 32) = 5
9

2) Considerata la cosiddetta variabile scarto, data dalla differenza fra la


variabile e la sua media, se ne calcoli il valore medio.
Si tratta di calcolare la media della seguente trasformazione lineare
Y = X−𝑥̅
che è quindi un caso particolare della generica trasformazione lineare
Y = a + bX
ottenuta ponendo a = −𝑥̅ e b = 1.
Si può quindi utilizzare il risultato generale appena dimostrato
𝑦̅ = 𝑎 + 𝑏𝑥̅
sempre effettuando le medesime sostituzioni, per cui
𝑦̅ = 𝑎 + 𝑏𝑥̅ = −𝑥̅ + 1 × 𝑥̅ = −𝑥̅ + 𝑥̅ = 0
La media della variabile scarto è sempre uguale a zero (e, quindi, è pari a zero
anche la somma dei suoi n valori). La variabile scarto assume valori
𝑦𝑖 = 𝑥𝑖 − 𝑥̅
che risultano positivi o negativi a seconda che la i-esima osservazione sia
maggiore o minore di 𝑥̅ .

10
Lezione 4

- Quarta proprietà
Considerata la sequenza delle n osservazioni xi (per i =1, 2, …, n) relativa a una
variabile X di media 𝑥̅ , la somma dei quadrati degli scarti dalla media è un
minimo.

Questo significa che, se si calcolasse la somma dei quadrati degli scarti da un


valore diverso dalla media, si otterrebbe un risultato sempre maggiore.
L’importanza di questa proprietà sarà più chiara quando si passerà a studiare la variabilità
di una variabile e, più in particolare, la sua varianza.

Questa dimostrazione si effettua utilizzando un paio di “trucchi”, comuni in


molte dimostrazioni, che consistono
1) nel sommare e nel sottrarre una stessa quantità
2) nell’ottenere un binomio per calcolarne il quadrato

Dimostrazione
Considerato un valore c ≠ 𝑥̅ , si deve dimostrare che vale la seguente
disuguaglianza
𝑛 𝑛

∑(𝑥𝑖 − 𝑥̅ )2 ≤ ∑(𝑥𝑖 − 𝑐)2


𝑖=1 𝑖=1

Considerato il termine a destra del segno di disuguaglianza, si aggiunge e si


sottrae all’interno della parentesi tonda la media di X ottenendo
𝑛 𝑛

∑(𝑥𝑖 − 𝑐)2 = ∑(𝑥𝑖 − 𝑥̅ + 𝑥̅ − 𝑐)2


𝑖=1 𝑖=1

A questo punto si utilizzano delle parentesi per ottenere un binomio, ossia

11
Lezione 4

𝑛 𝑛

∑(𝑥𝑖 − 𝑐)2 = ∑[(𝑥𝑖 − 𝑥̅ ) + (𝑥̅ − 𝑐)]2


𝑖=1 𝑖=1

Sviluppando il quadrato del binomio si ottiene


𝑛 𝑛

∑(𝑥𝑖 − 𝑐)2 = ∑[(𝑥𝑖 − 𝑥̅ )2 + (𝑥̅ − 𝑐)2 + 2(𝑥𝑖 − 𝑥̅ )(𝑥̅ − 𝑐)]


𝑖=1 𝑖=1

e, distribuendo la somma, risulta


𝑛 𝑛 𝑛 𝑛

∑(𝑥𝑖 − 𝑐)2 = ∑(𝑥𝑖 − 𝑥̅ )2 + ∑(𝑥̅ − 𝑐)2 + 2 ∑(𝑥𝑖 − 𝑥̅ )(𝑥̅ − 𝑐)


𝑖=1 𝑖=1 𝑖=1 𝑖=1

dove la quantità (𝑥̅ − 𝑐) è una costante rispetto alla sommatoria per cui si può
scrivere

Adesso è sufficiente esaminare i diversi termini ottenuti:


- la quantità che compare nel rettangolo azzurro corrisponde alla somma dei
quadrati dalla media
- la quantità che compare nel rettangolo giallo corrisponde alla somma della
costante (𝑥̅ − 𝑐) elevata al quadrato, ossia a 𝑛(𝑥̅ − 𝑐)2 che è sempre ≥0
- la quantità riportata nel rettangolo rosso corrisponde al prodotto della
costante 2(𝑥̅ − 𝑐) per la somma della variabile scarto che, come si è visto nel
corso di questa lezione, è sempre pari a zero.

12
Lezione 4

Concludendo: la disuguaglianza da cui si è partiti può essere scritta come


indicato di seguito
𝑛 𝑛

∑(𝑥𝑖 − 𝑥̅ )2 ≤ ∑(𝑥𝑖 − 𝑥̅ )2 + 𝑛(𝑥̅ − 𝑐)2


𝑖=1 𝑖=1

e risulta chiaro che il termine a sinistra è sempre minore del termine a destra,
a meno che la costante c sia esattamente uguale alla media 𝑥̅

- Quinta proprietà (proprietà associativa)


Considerate n unità statistiche suddivise in g gruppi distinti per i quali è noto il
valore della media e il numero delle unità che li compongono, la media generale
𝑥̅ della variabile X corrisponde alla media delle medie dei gruppi, ponderate con
le numerosità corrispondenti.

In alcune circostanze reali le n unità statistiche possono essere suddivise in g


gruppi distinti (come nel caso di maschi e femmine o suddividendo le persone
in occupate e disoccupate o se si distinguono i lavoratori a seconda del settore
di attività economica).
Per esempio: considerato l’ultimo appello di statistica, si supponga di conoscere
il numero di studenti che hanno superato l’esame a seconda del sesso, il voto
medio ottenuto dalle le studentesse e il voto medio ottenuto dagli studenti. In
questo caso il voto medio generale in statistica corrisponde alla media dei due
voti medi ponderata con le numerosità dei due sessi.

13
Lezione 4

Per questa dimostrazione risulta utile individuare ciascuna osservazione


mediante due diversi indici:
- uno per indicare il gruppo di appartenenza
- un altro per indicare la posizione dell’osservazione all’interno del gruppo a cui
appartiene

Dimostrazione
Per questa dimostrazione è conveniente indicizzare le n osservazioni relative
alla variabile quantitativa X mediante due indici: nella generica 𝑥𝑖ℎ la lettera h
indica che tale osservazione appartiene all’h-esimo gruppo, mentre la lettera i
indica che si tratta della i-esima osservazione di quel gruppo.
Gli estremi dei due indici risultano perciò i seguenti:
h = 1, 2, …, g (dove g è il numero totale dei gruppi)
i =1, 2, …, nh (dove nh è la numerosità complessiva dell’h-esimo gruppo)

La media generale 𝑥̅ della X corrisponde all’ammontare complessivo della


variabile calcolato sommando tutte le n osservazioni e per poter sommare tutte
le osservazioni occorre considerare una doppia sommatoria, una per l’indice i
e una per l’indice h.
Si ha cioè
𝑛ℎ 𝑔
1
𝑥̅ = ∑ ∑ 𝑥𝑖ℎ
𝑛
𝑖=1 ℎ=1

Si possono scambiare le due sommatorie, per cui

14
Lezione 4

𝑔 𝑛ℎ
1
𝑥̅ = ∑ ∑ 𝑥𝑖ℎ
𝑛
ℎ=1 𝑖=1

dove la quantità
𝑛ℎ

∑ 𝑥𝑖ℎ
𝑖=1

corrisponde alla somma di tutte le osservazioni nell’h-esimo gruppo, ossia


all’ammontare della variabile all’interno dell’h-esimo gruppo.
Dato che l’ammontare della variabile corrisponde al prodotto della media per
la numerosità (come si è visto nel corso di questa lezione), se si indica con 𝑥̅ℎ la
media della X nell’h-esimo gruppo, risulta

𝑛ℎ

∑ 𝑥𝑖ℎ = 𝑥̅ℎ 𝑛ℎ
𝑖=1

Vale quindi la seguente uguaglianza

𝑛ℎ 𝑔 𝑔
1 1
𝑥̅ = ∑ ∑ 𝑥𝑖ℎ = ∑ 𝑥̅ℎ 𝑛ℎ
𝑛 𝑛
𝑖=1 ℎ=1 ℎ=1

che corrisponde alla media ponderata delle medie 𝑥̅ℎ dei g gruppi, in cui i pesi
corrispondono alla numerosità dei gruppi stessi, dato che
𝑔

∑ 𝑛ℎ = 𝑛
ℎ=1

15
Lezione 4

Esercizio
Su un gruppo di 1000 impiegati di un’azienda 400 sono donne e 600 sono
uomini. Sapendo che il salario medio delle donne è pari a 1750 euro mentre il
salario medio degli uomini è 1950, determinare il salario medio di tutti gli
impiegati.
Il risultato cercato è (1750×400+1950×600)/1000=1870

16

Potrebbero piacerti anche