Sei sulla pagina 1di 3

Quinta lezione statistica

INDICI STATISTICI
- Dopo aver raccolto dati sperimentali, è possibile sintetizzarne la “distribuzione” mediante
indici che la caratterizzano. Ci sono due tipi di indici:
1) Indici di tendenza centrale (come siamo posizionati)
2) Indici di dispersione (ci danno l’idea di quanto di dati siano lontani tra loro).
- Gli indici di tendenza centrale individuano il centro della distribuzione delle frequenze, cioè
il valore centrale attorno al quale gli altri valori sono distribuiti. Riassumono e descrivono i dati
e dipendono dalla scala di misura dei dati in oggetto.
Vengono utilizzati per individuare un insieme di dati statistici. Generalmente si tende ad avere
una perdita di informazioni nella rappresentazione sintetica, perciò è fondamentale scegliere un
indice che minimizzi la perdita di informazione ma che comunque rappresenti correttamente le
informazioni raccolte. Il dato di sintesi deve avere le seguenti caratteristiche:
 Compreso tra un minimo e massimo,
 Deve minimizzare la perdita di informazione,
 Essere rappresentativo
 Identificarsi con i valori più frequenti.

Esempio: nella tabella si riporta la glicemia di 10 pz.

Per calcolare gli indici, devo rielaborare le informazioni: per avere un dato aggregato,
identifichiamo delle classi di valore; prendo quindi la glicemia e la raggruppo in classi,
stabilendo un intervallo di 10 tra un valore e l’altro:

Glicemia classi valori di frequenza frequenza


Paziente classe
(mg/100cc) glicemia assoluta relativa
1 103 100-110 70-80 1 10%
2 97 90-100 80-90 2 20%
3 90 80-90 90-100 4 40%
4 119 110-120 100-110 2 20%
5 107 100-110 110-120 1 10%
6 71 70-80 10 100%
7 94 90-100
8 81 80-90
9 92 90-100
10 96 90-100
Identifico quindi nella cosiddetta “frequenza assoluta”, cioè il numero di pazienti che hanno
quel determinato valore di glicemia. Tradotto, sistemo la glicemia del paziente in base alla
classe che ho stabilito. Un’altra utile elaborazione delle frequenze è quella cumulata, che
rappresentano le somme parziali delle frequenze fino alla modalità corrente (= somma delle
frequenze assolute di tutte le classi precedenti).

Significa quindi che il 30% dei miei pazienti ha glicemia tra 70 e 90, oppure il 70% dei pazienti
ha glicemia tra 70 e 100. Si rappresentano attraverso gli istogrammi.

- In statistica, si chiamano medie quei valori che offrono una sintesi di un insieme di dati.
Vengono anche dette indici di posizione o indicatori di posizione o indici di tendenza centrale.
Si distinguono due tipologie di medie:
1) Medie di posizione: considerano solo certi valori e in generale NON si ottengono
manipolando matematicamente i dati (es. moda e mediana)
2) Medie algebriche: considerano tutti i valori che si ricavano applicando formule
matematiche (es. media aritmetica, media geometrica e media armonica).
Qualunque sia la media, essa è SEMPRE espressa nella medesima unità di misura delle
modalità da cui si è ricavata.
- Su dati quantitativi (altezza media ad esempio) è possibile eseguire operazioni di calcolo. La
più semplice elaborazione è il valore medio tra due misure estreme  MEDIE ANALITICHE:
X1 + Xn
2

- La media aritmetica semplice è quel valore che avrebbero tutte le osservazioni se non ci fosse
la variabilità (casuale o sistemica). Più precisamente è quel valore che sostituito a ciascun degli
N dati ne fa rimanere costante la somma. Quindi dato un insieme di N elementi si dice media
aritmetica semplice di N numeri il numero che si ottiene dividendo la loro somma per N. si
traduce nella seguente formula:
N
X1 + X2 + ... Xn ∑ Xi
i=1

X= N oppure N

Se riprendiamo l’esempio della glicemia: x = 950/10 = 95 mg/100cc


Quando alcuni valori rilevati NON sono singoli, nella sommatoria devono essere considerati
per il numero di volte che si presentano; equivale a moltiplicare ciascuno per la propria
frequenza.
- Si dice media aritmetica pesata (o ponderata) di N numeri dove i pesi fi sono le frequenze
assolute di ogni modalità.
Es: riportiamo i tempi di sopravvivenza (in mesi) di 19 pazienti con cancro all’addome:
Mes i di
F requenza (fi) fi * x i fi * xi
s opravvivenz a (x i)
8,5 2 8,5 * 2 17
9,2 4 9,2 * 4 36,8
7,3 8 7,3 * 8 58,4
6,8 2 6,8 * 2 13,6
10,1 3 10,1 * 3 30,3
T otale 19 156,1

La formula e il risultato sono:

- Attenzione: la media ponderata non va intesa come puro artificio di semplificazione del
calcolo; al contrario, il suo impiego è indispensabile in alcune situazioni per le quali la media
semplice diventerebbe ingannevole.
Esempio: la media della mortalità in Italia (intesa come N deceduti su 1000 abitanti) non può
essere calcolata come media semplice perché verrebbero messe sullo stesso piano regioni molto
abitate con altre con meno abitanti. Per tale calcolo, deve essere applicata la media ponderata,
attribuendo a ciascuna regione il peso rappresentato dal numero di abitanti.

Potrebbero piacerti anche