Sei sulla pagina 1di 6

FONDAMENTA PER LA CHIMICA ANALITICA 2- Le basi della statistica

M. Forina

2 - LE BASI DELLA STATISTICA


La prima opera con il trattamento sistematico della probabilità, base della statistica, il Liber de ludo
aleae, fu scritta dal pavese Gerolamo Cardano nel 1526.

2.1 - ESPERIMENTI RANDOM, POPOLAZIONE, CAMPIONE

Le discipline sperimentali, quale è la chimica, sono fondate su di esperimenti, il risultato dei quali
è, a seconda dei casi:
a) una (o piu) grandezza fisica misurata
b) una (o piu) grandezza chimica calcolata da una (o piu) grandezza fisica misurata
c) un conteggio (quante volte si e osservato un fatto particolare)
d) una figura.

Generalmente il risultato dell'esperimento (misura, conteggio, figura) varia ripetendo l'esperimento,


anche se lo sperimentatore ha posto la massima cura nelle ripetizioni, effettuandole in condizioni
uniformi, vale a dire con accurato controllo di tutti i parametri che lo sperimentatore pensa possano
influenzare il risultato.
Il risultato è espresso da variabili, che possono essere qualitative, nominali (p.e. freddo/caldo,
bianco/nero) o ordinali (p.e., gelido, freddo, tiepido, caldo, bollente, rovente) o quantitative
(relative, p.e. 1.24 metri, espresse dal rapporto con una unita di misura, o assolute, p.e. 1240
volte).
Gli esperimenti con queste caratteristiche di variabilità del risultato sono detti ESPERIMENTI a
CASO o esperimenti random. In essi, nonostante il controllo esercitato dall'operatore, permangono
alcune fonti di variabilità che determinano la differenza del risultato da ripetizione a ripetizione.

I fattori di variabilità possono essere:


a) non noti, non controllabili
b) noti, non controllabili
c) noti, parzialmente controllabili
d) noti, perfettamente controllabili
e) noti, controllabili ma non controllati
f) noti, controllati a valori (livelli) differenti.

L'ultimo caso corrisponde ad esperimenti che vengono effettuati per studiare determinati fattori.

5
FONDAMENTA PER LA CHIMICA ANALITICA 2- Le basi della statistica
M. Forina

Il caso precedente (e) ha fattori che potrebbero essere controllati, ma il loro controllo si presenta
difficoltoso o antieconomico e pertanto viene omesso.
Un esperimento a caso deve essere descritto accuratamente, nelle sue operazioni, nella
indicazione dei fattori che sono controllati, del livello e della incertezza con cui sono
controllati, nel dettaglio del rilevamento del risultato.

La descrizione dell’esperimento è annotata nel Quaderno di Laboratorio; alla data e alla


descrizione delle operazioni e alle informazioni relative ai fattori controllati, è sempre bene
aggiungere la indicazione di fattori ambientali (temperatura ambiente, umidita, luminosità,
presenza di vibrazioni/rumori) anche se si ritiene che essi non abbiano effetto sull’esperimento.
Un Quaderno di Laboratorio ben tenuto è uno strumento prezioso, perché permette di ricostruire
l’esperimento anche dopo molto tempo.
Se si omette il controllo di anche un solo parametro, o se si introduce il controllo di un parametro in
precedenza non fissato, o se si altera il livello di controllo, o la accuratezza di controllo, la
variabilità del risultato può aumentare o diminuire: è stato cambiato l'esperimento a caso.
Un esperimento a caso può essere teoricamente ripetuto infinite volte: queste infinite ripetizioni
costituiscono la famiglia, la popolazione infinita delle possibili ripetizioni. In realtà un esperimento
viene ripetuto un numero limitato di volte; queste ripetizioni costituiscono un campione statistico
o semplicemente campione (da non confondere con il campione in senso chimico) estratto dalla
popolazione infinita.
Si rammentino bene queste due definizioni: popolazione e campione.
La popolazione corrisponde al livello teorico, il campione è reale; il campione rappresenta la
popolazione.

Quali che siano gli esperimenti, lo sperimentatore deve conoscere molto bene quale è la
popolazione che i suoi campioni rappresentano. Attribuire i risultati ad una popolazione
diversa, in generale più ampia, di quella da cui sono estratti i campioni è un errore molto
comune e molto grave.

Per esempio, se si è ripetuta su di aliquote diverse di vino dalla stessa bottiglia di Verdicchio la
determinazione del grado alcoolico, non si deve attribuire il risultato alla popolazione del vino
Verdicchio, ma solo a quella costituita dalle aliquote della bottiglia. Se si sono analizzati per il
grado alcoolico dieci campioni di Verdicchio, non si deve attribuire il risultato alla popolazione dei
vini bianchi.
Poiché il risultato (o EVENTO) di un esperimento a caso varia da ripetizione a ripetizione, il
risultato è caratterizzato da una IRREGOLARITÀ, che impedisce di formulare ipotesi certe sul

5
FONDAMENTA PER LA CHIMICA ANALITICA 2- Le basi della statistica
M. Forina

risultato di una singola ripetizione. Tuttavia, operando con un campione costituito da un numero
relativamente grande di ripetizioni, si individuano aspetti che permettono di trarre conclusioni meno
incerte di quanto appaia a prima vista. La valutazione della incertezza relativa al risultato di un
esperimento a caso e la sua diminuzione sono tra i principali obiettivi della statistica.
Non tutti gli esperimenti sono casuali.
P.e. se noi contiamo più volte il numero di gambe dello stesso tavolo otteniamo sempre il valore 4.
Il risultato del conteggio e determinato.

Il risultato di molti esperimenti è costituito da una parte deterministica e da una casuale.

P.e., se noi misuriamo il peso di un recipiente contenente acqua noteremo una graduale
diminuzione dovuta all'evaporazione. Supponendo che l’evaporazione sia costante nel tempo si
avrà: p(t) = p0 – kt + e

- kt, effetto dell'evaporazione, è deterministico, mentre l’errore di misura, e, è totalmente casuale.

Variabili quali p(t) sono studiate controllando l’effetto deterministico, come variabili
condizionate.

2.2 - FREQUENZA ASSOLUTA E RELATIVA, VARIABILI CASUALI

Si consideri l'esperimento a caso E descritto come segue:

1) lo sperimentatore lancia un DADO cubico, di materiale fisicamente omogeneo, avente sulle


sei facce le figure A, B, C, D, E, F.

2) il lancio avviene da un'altezza di 1 metro (± 5 cm), lasciando cadere il dado dalla mano
chiusa su di un tavolo di legno.

3) il risultato e rappresentato dalla figura che appare sulla faccia del dado rivolta verso l'alto,
quando il movimento del dado si è arrestato.

Questo esperimento e caratterizzato da un numero limitato, discreto, di possibili risultati, sei.

5
FONDAMENTA PER LA CHIMICA ANALITICA 2- Le basi della statistica
M. Forina

Associamo un indice ad ogni possibile evento:

Indice Risultato
1 A
2 B
3 C
4 D
5 E
6 F

Introduciamo ora le prime definizioni di terminologia statistica:

N indichi il numero delle ripetizioni, o numerosità del campione;


ni indichi il numero delle volte, tra le N, in cui si è verificato l'evento con indice i; ni è la
FREQUENZA ASSOLUTA del risultato con indice i.
fi = ni /N e la FREQUENZA RELATIVA o semplicemente FREQUENZA del risultato con indice i.
La frequenza relativa può essere espressa in forma percentuale, come 100 fi %.

Supponiamo di avere effettuato 20 ripetizioni dell'esperimento. La Tabella seguente raccoglie il


risultato delle ripetizioni, il campione costituito dai 20 eventi osservati.
Tabella 2-1- Risultati di 20 ripetizioni dell'esperimento "Lancio di un dado"

Indice della Evento Indice


ripetizione osservato dell'evento
1 A 1
2 D 4
3 F 6
4 E 5
5 E 5
6 A 1

7 C 3

8 B 2

9 A 1

10 F 6

11 E 5

12 D 4

5
FONDAMENTA PER LA CHIMICA ANALITICA 2- Le basi della statistica
M. Forina

13 F 6

14 B 2

15 F 6

16 F 6

17 D 4

18 D 4

19 E 5

20 E 5

L'evento A è stato osservato 3 volte (frequenza assoluta); la frequenza relativa è 0.15 (= 3/20), la
frequenza percentuale è del 15%.
La Tabella totale delle frequenze è la seguente:

Indice Frequenza
Frequenza
dell'evento assoluta
1 3 0.15
2 2 0.10
3 1 0.05
4 4 0.20
5 5 0.25
6 5 0.25

La somma delle frequenze assolute deve dare il numero N delle ripetizioni; la somma delle
frequenze relative deve dare 1.
Quando un esperimento ha come risultato un numero quel numero rappresenta uno dei possibili
valori della variabile random che descrive quell'esperimento. Anche esperimenti non descritti da un
numero possono essere ricondotti a esperimenti con risultati numerici, mediante una opportuna
convenzione, quale quella utilizzata poco sopra associando ad ogni figura sul dado un indice
dell'evento.
Un esperimento può essere descritto da una variabile casuale (Esperimento univariato), da due
variabili (Esperimento bivariato), o da più variabili (Esperimento multivariato).
Per esempio, quando il risultato dell’esperimento è una figura, per esprimere il risultato in forma
numerica, la figura viene decomposta in punti luminosi (PIXEL), e ogni punto ha un valore che
indica il suo colore. I pixel su di un normale schermo di calcolatore sono almeno 300000.
In un primo tempo ci limiteremo a trattare gli esperimenti univariati.

5
FONDAMENTA PER LA CHIMICA ANALITICA 2- Le basi della statistica
M. Forina

Si noti come la definizione di esperimento in statistica sia differente da quella che siamo portati ad
utilizzare nell'ambiente sperimentale.

In laboratorio si pone l'accento sulla parte sperimentale dell'esperimento stesso. Nel caso
dell'esperimento "lancio di un dado" siamo abituati a considerare solo i punti:
1) lo sperimentatore lancia un DADO cubico, di materiale fisicamente omogeneo, avente sulle
sei facce le figure A, B, C, D, E, F.
2) il lancio avviene da una altezza di 1 metro (± 5 cm), lasciando cadere il dado dalla mano
chiusa su di un tavolo di legno.
Pertanto viene trascurata o considerata ovvia la parte concettuale.

Ma alla stessa parte sperimentale possono corrispondere diversi esperimenti in senso statistico.
Infatti io posso lanciare due volte un dado ed avere:
a) due ripetizioni dell'esperimento "lancio di un dado", già descritto;
b) una sola ripetizione dell'esperimento univariato: "lancio di due dadi con risultato espresso
come somma dei due valori facciali";
c) una sola ripetizione dell'esperimento bivariato: "lancio di due dadi con risultato espresso da
due variabili random, la prima fornita dal valore facciale del dado lanciato per primo, la
seconda dal valore del dado lanciato per secondo".
Ad una stessa operazione base (parte sperimentale) corrispondono piu esperimenti e lo studio dei
tre casi e sensibilmente differente. Pertanto la definizione di esperimento statistico deve essere
completa, rigorosa.
È importante notare come l'esempio precedente ci indichi che taluni esperimenti (esperimenti
composti) possano essere considerati come la combinazione di altri esperimenti (esperimenti
semplici o elementari).