Sei sulla pagina 1di 2

PROGETTO LAUREE SCIENTIFICHE

PROGETTO MIGRAZIONI
IIS VITTORIO EMANUELE II RUFFINI - GENOVA

SCHEDA 5
VARIABILI QUANTITATIVE IV

¾ Indici di dispersione
Esaminiamo i principali.

In alcuni contesti si usa una definizione leggermente differente di varianza, dove al denominatore si sostituisce n con (n-1).

Osserviamo che nel caso in cui i dati osservati siano numerosi, le due definizioni coincidono.
Anche la varianza può essere espressa utilizzando la distribuzione della variabile X:

La varianza può essere scritta in modo più semplice per i calcoli, svolgendo il quadrato del binomio e ottenendo come
risultato la differenza fra la media dei quadrati dei dati e il quadrato della media

La varianza gode di alcune proprietà importanti


1. la varianza è sempre positiva;
2. σ2 vale 0 se e solo se la variabile è costante, cioè i dati osservati coincidono con un unico valore (la media).
Queste proprietà spiegano perché la varianza misura quanto la variabile osservata si discosta dal suo valor medio. In
particolare tanto è maggiore la varianza tanto più la variabile è dispersa, mentre valori bassi della varianza corrispondono a
variabili con valori maggiormente concentrati attorno alla media.
La radice quadrata positiva della varianza è detta scarto quadratico medio (o deviazione standard). Osserviamo che se i
dati sono espressi in kg, la varianza sarà in kg2, mentre lo scarto sarà ancora in kg. Quindi, entrambi gli indici risentiranno
della scelta delle unità di misura. Spesso si usa lo scarto quadratico medio come indice di dispersione invece della varianza
proprio perché ha lo stessa unità di misura dei dati.

Vale al seguente relazione fra lo scarto quadratico medio e l’intervallo di variazione:

NB: Esistono altri modi (poco utilizzati e meno efficaci da un punto di vista matematico) per misurare la “distanza” fra la
variabile e la sua media. Ad esempio, si può definire lo scarto assoluto medio

Come abbiamo già osservato, lo scarto medio (senza i valori assoluti) vale sempre 0.

Esempio 4: Con i dati dell’esempio 1 da XLSTAT→-Descrizione dei dati →–Statistiche descrittive si ottiene

No. di
Campione osservazioni Media Varianza (n)
Età 509 23,5 81,4
1 1
Graficamente più la varianza è grande più il dotplot risulta “schiacciato” o disperso, più la varianza è piccola più il dotplot
risulta “concentrato” su pochi valori.
Esempio 5: Riprendiamo gli esempi 1 e 2 della scheda 2, relativi ai due campioni di 18 studenti stranieri dei corsi serali
tecnici e professionali e confrontiamoli con un terzo campione di 18 studenti del corso tecnico diurno.
Mostriamo come variano la posizione e la forma della distribuzione dei dati al variare dei valori numerici della media e della
varianza.
n. ordine Campione 1- Campione 2-prof. Campione 3-
tecnico serale pomer. tecnico diurno
classe età classe età classe età
1 4 37 3 21 2 17
2 3 20 1 19 1 17
3 1 18 1 20 1 17
4 2 21 1 27 4 19
5 1 30 1 19 2 18
6 1 31 3 19 3 19
7 2 22 1 27 2 16
8 1 20 3 18 1 19
9 1 19 1 19 5 19
10 3 21 2 21 2 20
11 3 20 2 20 1 16
12 5 25 1 27 2 19
13 3 20 3 21 3 19
14 1 19 1 19 5 20
15 5 28 1 26 1 15
16 2 20 4 20 1 16
17 2 23 5 44 1 15
18 4 21 1 32 1 18

variabile media varianza


X1 23.1 26.6
X2 23.3 42.2
X3 18.1 3.5
Osserviamo che X1 e X2 hanno circa la stessa media, ma varianze diverse; invece la variabile X3 ha media inferiore e
varianza decisamente più bassa. Queste differenze sono ben visibili nella forma dei dotplot.

Scattergram (X1)

15 20 25 30 35 40

X1

Scattergram (X2)

15 20 25 30 35 40 45

X2

Scattergram (X3)

15 16 17 18 19 20 21

X3

2 2

Potrebbero piacerti anche