Sei sulla pagina 1di 23

- DISTRIBUZIONE DELLE FREQUENZE, ISTOGRAMMA E INDICI SINTETICI

RIASSUNTO DELLA DISTRIBUZIONE : le distribuzioni che abbiamo osservato sono diverse fra loro in virtù di
una o più caratteristiche. La statistica descrittiva descrive le distribuzioni sulla base di indici: tendenza
centrale, variabilità e forma; rispetto alla forma parliamo di asimmetria e curtosi.

LE MEDIE = osservando le distribuzioni di frequenza e gli istogrammi si può avere un’idea approssimativa
della magnitudine (o ordine di grandezza) della variabile che è stata osservata. Le misure di tendenza
centrale, dette anche medie, permettono di individuare una modalità che sia rappresentativa dell’intera
distribuzione e che sia quindi in grado di offrire una misura più o meno rappresentativa dell’ordine di
grandezza della variabile osservata. Da un punto di vista grafico, pensando all’istogramma, la tendenza
centrale si può interpretare come il punto di ancoraggio della distribuzione rispetto all’asse delle ascisse,
che rappresenta il supporto della variabile. Esistono molte misure di tendenza centrale (o medie): ciascuna
media gode di specifiche proprietà in base alle quali siamo in grado di interpretarne il significato, di capire
in che modo cattura la magnitudine della variabile osservata.
DEFINIZIONE generale di MEDIA = “noi siamo così arrivati, per le medie, a formulare che valgono per un
numero qualunque di termini (pari o dispari), comunque disposti, subordinatamente alla condizione che il
risultato sia intermedio fra i termini estremi”. L’internalità è la condizione necessaria ma anche sufficiente
per assumere che una “media di più quantità è una nuova quantità compresa tra la più piccola e la più
grande di quelle prese in considerazione”.

TENDENZA CENTRALE: MEDIA DI POSIZIONE = le medie di posizione individuano una particolare modalità in
base alla posizione che essa occupa nella serie ordinata.

Si definisce MODA la modalità che si presenta con la frequenza massima. Per individuare la moda bisogna
raggruppare le classi in modalità omogenee; la classe più numerosa prende nome di classe modale. Nel
caso di caratteri qualitativi, nominali o ordinali, la moda coincide con la modalità che si presenta con la
frequenza più alta. Nel caso delle variabili continue: si identifica la classe modale e al suo interno si
identifica una sola modalità scegliendo il valore centrale della classe oppure si procede utilizzando una
proporzione.
- Avendo definito la moda come quella modalità che si presenta con la frequenza più alta all’interno della
distribuzione e ricordando che qualsiasi numero diverso da 0 elevato a 0 è uguale a 1, possiamo verificare
che: la somma degli scarti alla potenza 0 rispetto ad un indice di tendenza centrale M è minima solo se
l’indice a cui si fa riferimento è la moda.

TENDENZA CENTRALE: MEDIE DI POSIZIONE

Si definisce MEDIANA la modalità che presenta l’unità statistica che occupa la posizione centrale nella serie
ordinata. Per individuare la mediana: si ordinano le modalità in modo crescente; si individua la posizione
centrale; la modalità dell’unità statistica che occupa la posizione centrale è la mediana. Non bisogna
confondere la mediana con la posizione mediana: nel caso di caratteri ordinali la mediana corrisponde
necessariamente ad una modalità osservata. Nel caso di variabili continue con modalità raggruppate in
classi: si identifica la classe mediana ossia quella che contiene l’unità centrale e all’interno della classe
mediana si identifica una sola modalità utilizzando la regola della proporzione.
QUARTILI DELLA DISTRIBUZIONE

Utilizzando un principio analogo a quello per la mediana, possiamo definire altre modalità notevoli che
corrispondono a specifici livelli della funzione di ripartizione: definiamo come quartili le modalità che
dividono in 4 parti uguali la serie ordinata.

Con lo stesso principio possiamo ripartire la distribuzione in 10 parti uguali attraverso i decili o in 100 parti
uguali utilizzando i percentili. È possibile suddividere una distribuzione in un qualsiasi punto utilizzando il
generico quantile.
TENDENZA CENTRALE: INDICI ANALITICI

Le misure di tendenza centrale basate sulle medie di posizione non richiedono calcoli analitici per la loro
determinazione, è necessario individuare la modalità o la classe corrispondente e registrarne le modalità.
Invece, le misure di tendenza centrale basate su medie analitiche presuppongono una sintesi delle modalità
osservate attraverso una funzione matematica. Poiché gli operatori aritmetici sono una prerogativa
esclusiva delle variabili quantitative, queste ultime sono le uniche che ammettono le medie analitiche. Le
medie analitiche si distinguono in medie lasche (che prendono in considerazione solo alcune specifiche
modalità) e medie ferme (che considerano tutte le modalità osservate).
Fra tutte le misure di tendenza centrale, analitiche e di posizione, la media aritmetica per le proprietà di cui
gode occupa una posizione di rilievo.
LE PROPRIETÀ DELLA MEDIA ARITMETICA
MEDIA ARITMETICA PER DATI IN CLASSI: riprendiamo la distribuzione delle frequenze relativa alle altezze

L’impiego delle sole misure di tendenza centrale non ci permette di distinguere fra situazioni che possono
essere molto differenti tra loro. Cosa osserviamo considerando una serie di 5 osservazioni in 3 diversi casi:

LA VARIABILITÀ DEI CARATTERI STATISTICI


La variabilità di un fenomeno è la sua attitudine ad assumere differenti modalità. Possiamo indicare quali
proprietà deve avere una misura di variabilità:

MISURE DI MUTUA VARIABILITÀ

Il modo più logico per confrontare tra loro le modalità di una serie o distribuzione consiste nel fare dei
confronti fra tutte le modalità prese a due a due; ciò significa che bisogna considerare gli scarti fra tutte le
possibili coppie. È evidente che la necessità di dover effettuare delle sottrazioni fra le modalità implica che
tali misure si possono determinare solo per caratteri trasferibili ossia solo per le variabili. Non sono pochi i
problemi in cui tali tipi di misure di variabilità vengono impiegate: sono in grado di valutare in modo
efficace la condizione di diseguaglianza all’interno di una distribuzione.
INDICI DI FORMA: ASIMMETRIA

Una distribuzione di frequenza si definisce asimmetrica se priva di un asse di simmetria, un asse rispetto al
quale la distribuzione si può rappresentare in due parti speculari. Vari criteri e relativi indici sono utili per
misurare il grado di asimmetria di una distribuzione.

Potrebbero piacerti anche