Sei sulla pagina 1di 29

Terza parte del corso:

STATISTICA
IN CHIMICA
ANALITICA
1
Analisi statistica dei dati

Durante l’esecuzione di un’analisi chimica (vale per qualsiasi


misura sperimentale) si commettono inevitabilmente degli errori
(dovuti al fatto che “la perfezione non è di questo mondo”), per cui
il risultato che si ottiene è diverso dal "valore vero".

Tali errori sono di tre tipi:

1) errori grossolani
2) errori sistematici
3) errori casuali

1) errori grossolani: errori dovuti ad inesperienza o scarsa


cura da parte dell’operatore.
Per esempio:
Errori di distrazione, di trascrizione (di valori numerici), di calcolo.

2
Analisi statistica dei dati
Errori dei metodi di analisi
Gli errori grossolani sono quindi evitabilissimi.
Le altre due categorie di errori, invece, non possono in genere
essere evitati ma solo ridotti:
2) errori sistematici:

errori che, ripetendo la misura, si ripresentano costanti,


stessa entità e stesso “segno” (cioè sempre in eccesso o
sempre in difetto).

Per esempio: strumentazione difettosa (bilancia analitica, o


matraccio, o buretta, o pipetta) che misura costantemente valori
maggiori (o minori) di quelli veri, standard primari impuri, ecc.

3) errori casuali (o accidentali):


errori che, ripetendo la misura, si presentano ogni volta con
entità e segno differente.
3
Analisi statistica dei dati
Errori dei metodi di analisi
Per esempio, strumentazione difettosa (bilancia analitica, o
matraccio, o buretta, o pipetta) che però misura valori
casualmente maggiori (o minori) di quelli veri.
Altra fonte di errori casuali: anche senza difetti, gli strumenti
hanno una propria incertezza (o risoluzione).
Esempio: bilancia analitica a 4 cifre ha risoluzione = 0.0001 g.
Per cui, se il peso di un oggetto è 3.0007 g, lui in realtà pesa
qualunque valore (casuale!) tra 3.00065 e 3.00075 g

Anche la vetreria ha una propria risoluzione:


buretta con tacche ogni 0.1 mL ha risoluzione = 0.05 mL
Pipette e matracci hanno risoluzione = circa 0.1% rispetto a
volume misurato. Ad esempio, pipetta da 20 mL ha risoluzione =
0.02 mL (% esatta dipende da caso a caso. Esiste vetreria di “classe A”
e di “classe B”, la prima costa di più ma ha risoluzione migliore).
Esempio: volume di un matraccio da 100 mL è in realtà un volume
4
qualsiasi (casuale) compreso tra 99.9 e 100.1 mL
Analisi statistica dei dati
Errori dei metodi di analisi

Di fatto, ogni metodo analitico è sempre affetto da errori


sistematici e casuali

Eliminarli non si può. Ridurli sì, ma è necessario “spendere di


più”!

Si spende di più per ridurre gli errori solo se la maggior


spesa è motivata rispetto all’uso che si deve fare del
risultato dell’analisi.
È sbagliato dire a priori: si devono ridurre gli errori a
qualsiasi costo.
L’analisi non deve necessariamente avere la massima
esattezza e precisione possibile, spesso ci si può
“accontentare”.
5
Analisi statistica dei dati
Errori dei metodi di analisi

Entità degli errori casuali e sistematici di un metodo di analisi ne


definisce due caratteristiche:

Errori casuali ridotti: metodo preciso (errori casuali rilevanti:


metodo impreciso).
Precisione indica la presenza di errori casuali ridotti.
Errori sistematici ridotti: metodo esatto (errori sistematici
rilevanti: metodo inesatto).
Esattezza indica la presenza di errori sistematici ridotti.

Un risultato molto vicino al valore vero è "accurato".


Accuratezza (oppure bias) non è di un metodo d'analisi ma di
un risultato dell'analisi, ed indica la sua prossimità col valore
vero.
6
Analisi statistica dei dati
Errori dei metodi di analisi
Similitudine col "tiro a segno“.

Tiro a segno è come "metodo di analisi": c'è "strumento" (fucile,


mirino), "reagenti" (proiettili), risultati (colpi che arrivano sul
bersaglio), e analista (tiratore) che deve fare operazioni
(caricare fucile, appoggiare calcio, prendere mira, premere
grilletto).

7
Analisi statistica dei dati
Errori dei metodi di analisi

Qui “metodo” è affetto da


errori casuali

Possibili errori casuali:


miopia
mano tremante
folate di vento
cartucce difettose
8
Analisi statistica dei dati
Errori dei metodi di analisi

Qui “metodo” è affetto da


errori sistematici

Possibili errori sistematici:


mirino male allineato
errato uso del mirino
canna fucile storta
vento (sempre costante)
9
Analisi statistica dei dati
Errori dei metodi di analisi

molti errori molti errori


casuali sistematici

molti errori
pochi errori casuali
sia casuali
pochi errori sistematici
che sistematici
Analisi statistica dei dati
Errori dei metodi di analisi

metodo esatto metodo preciso


ma impreciso ma inesatto
misure accurate o misure inaccurate
inaccurate

metodo esatto metodo inesatto


e preciso e impreciso
misure accurate misure inaccurate
11
Analisi statistica dei dati
Trattamento degli errori sistematici

Similitudine del tiro a segno => metodi di analisi chimica.

Innanzitutto: operatore può accorgersi di errori sistematici


guardando il bersaglio!

errori
sistematici
Analogamente, nei metodi di analisi la presenza di errori
sistematici può essere evidenziata analizzando campioni a
contenuto noto di analita.
12
Analisi statistica dei dati
Trattamento degli errori sistematici
Poi, se vi sono errori sistematici, è necessario identificarne la
causa per “eliminarli” (= ridurli fino al livello di accettabilità).

Nel tiro a segno, si controllano tutte le possibili cause (mirino


male allineato, errato uso del mirino, canna fucile storta, vento).

Stessa strategia coi metodi di analisi chimica: se è stata


appurata la presenza di errori sistematici, si devono individuare
e controllare le possibili cause (tarature, controllo qualità).

13
Analisi statistica dei dati
Trattamento degli errori casuali

Se vi sono solo errori casuali e si facesse media dei tiri (un


"baricentro"), questa tenderebbe a cadere sul centro del
bersaglio.

media dei tiri

errori
casuali
Lo stesso capita nei metodi di analisi: se vi sono solo errori
casuali, media di misure ripetute tende a cadere sul valore vero.

14
Analisi statistica dei dati
Trattamento degli errori casuali

Si può dimostrare che:


la media di n misure ripetute tende al valore vero (indicato con
m) se n → ∞
Se metodo è rapido ed economico (per es. titolazioni), si fanno
misure ripetute dello stesso campione, e il valore medio che si
ottiene è la stima migliore del valore vero.

1 n
x   xi
n i 1
Ciò non è vero se ci sono errori sistematici: in tal caso x ≠ m
Per un metodo analitico:
PRIMA si “eliminano” gli errori sistematici con tarature.
POI si può utilizzare il metodo, eseguendo misure ripetute e
calcolando media che “annulla” (?) gli errori casuali. 15
Analisi statistica dei dati
Trattamento degli errori casuali

x  m con n   Se n < ∞, media non è (salvo casi


fortuiti) uguale al valore vero m.

Quanto ci si può "fidare" della media se n è piccolo?

Ce lo dice la statistica, disciplina che "prevede" la probabilità


di determinati eventi.

Affinché la statistica possa fare previsioni, si deve sapere qual è


la distribuzione delle probabilità degli eventi (es. per il tiro di
un dado è distribuzione rettangolare, per due dadi triangolare,
ecc.), cioè il modo con cui si distribuiscono gli eventi.

16
Analisi statistica dei dati
La stima del valore vero
d(P) d(P)

16.7%
100% 50%

0 1 2 3 4 5 6 7 8 tiro del dado 0 1 2 3 4 5 6 7 8

Esempio col tiro di 1 dado: area sottesa all'intera curva di


distribuzione (rettangolo) dà la probabilità cumulativa che
avvengano tutti gli eventi = per definizione 100%
Area sottesa ad un sottogruppo di eventi dà la probabilità che
avvengano quegli eventi.
Esempi: tirando dado, uscirà numero maggiore o uguale a 4 con
probabilità del 50%
Uscirà 2 con probabilità del 16.7%

17
Analisi statistica dei dati
La stima del valore vero
Distribuzione delle probabilità per misure sperimentali chimico-
analitiche:

Quasi sempre è la distribuzione gaussiana, o normale:

x = risultati sperimentali, per


es. concentrazioni, in questo
d(P) caso centrati a 0.11 M
(ascissa del centro dipende
da caso a caso). Valore
centrale, se vi sono solo
errori casuali, = valore
0.00 0.05 0.10 0.15 0.20 vero.
x
18
Analisi statistica dei dati
La stima del valore vero

d(P) Caratteristiche di una


distribuzione gaussiana:

0.00 0.05 0.10 0.15 0.20


x

1) Andamento a massimo. Quindi i valori di xi vicini al valore


vero (0.11 nell'esempio) possono essere ottenuti con maggiore
probabilità rispetto ai valori lontani.
2) Distribuzione simmetrica, cioè è equamente probabile
ottenere valori maggiori e valori minori del valore vero.
3) Probabilità di ottenere un certo valore xi cala
all'aumentare della distanza dal valore vero (centrale). Però,
probabilità non scende mai a zero.

19
Analisi statistica dei dati
La stima del valore vero
4) Distribuzione gaussiana è caratterizzata da certa larghezza.
Poiché l’area complessiva è sempre costante (100%), se
distribuzione è più larga deve essere più bassa.

d(P) d(P)

0.00 0.05 0.10 0.15 0.20 0.00 0.05 0.10 0.15 0.20
x x

distribuzione "larga" distribuzione "stretta"

Nella distribuzione larga c'è probabilità maggiore che si


ottengano valori lontani dal valore vero.

20
Analisi statistica dei dati
La stima del valore vero

d(P) d(P)

0.00 0.05 0.10 0.15 0.20 0.00 0.05 0.10 0.15 0.20
x x

distribuzione "larga": distribuzione "stretta":


metodo con elevati metodo con ridotti errori
errori casuali casuali
Larghezza della distribuzione gaussiana è correlata
all'entità degli errori casuali:
maggiori sono errori casuali, più diviene probabile ottenere
risultati lontani da valore vero, e quindi più è larga la
distribuzione. Minori sono errori casuali, più è stretta la
distribuzione.
21
Analisi statistica dei dati
La stima del valore vero

distribuzione gaussiana distribuzione gaussiana


"larga": metodo con "stretta": metodo con
elevati errori casuali ridotti errori casuali

22
Analisi statistica dei dati
La stima del valore vero
Larghezza di distribuzione gaussiana è s, è chiamata
deviazione standard, o scarto tipo.
(s misura metà larghezza ad altezza circa del 60%)

d(P)
s

0.00 0.05 0.10 0.15 0.20


x

23
Analisi statistica dei dati
La stima del valore vero

s e valore centrale (vero) m definiscono univocamente una


distribuzione gaussiana:
1  x m 
2

1   i 
2 s 
d ( P)  e
2s 2

Integrando formula, per qualsiasi intervallo di x, si ricava


probabilità di ottenere valori di x compresi nell’intervallo dato.

conoscendo s e m, si può prevedere con quale probabilità


si otterranno certi valori sperimentali xi piuttosto che altri.

24
Analisi statistica dei dati
La stima del valore vero
Probabilità di ottenere valori compresi tra m – s e m + s : 68.3%.
Esempio: m = 0.11 e s = 0.02: 68.3% di probabilità di ottenere
valori sperimentali compresi tra 0.09 e 0.13

d(P)

68.3%

0.00 0.05 0.10 0.15 0.20


x

25
Analisi statistica dei dati
La stima del valore vero
Probabilità di ottenere valori compresi tra m – 2s e m + 2s : 95.5%.
Nell’esempio di prima (m = 0.11, s = 0.02), si ha 95.5% di
probabilità di ottenere valori sperimentali compresi tra 0.07 e
0.15

d(P)

95.5%

0.00 0.05 0.10 0.15 0.20


x
26
Analisi statistica dei dati
La stima del valore vero
s e m si possono stimare a partire dal set sperimentale di
misure ripetute.
Per stimare m si calcola la media x (che appunto è la stima
migliore del valore vero).
Per stimare s si usano le proprietà algebriche della distribuzione
gaussiana, per le quali si ha:
n

s, stima di s , =

 ix  x 2

i 1
n 1

27
Analisi statistica dei dati
La stima del valore vero
Esercizio. Si fanno 4 misure ripetute di un metodo di
analisi. I valori di CA ottenuti sono (M): 0.1104, 0.1154,
0.1199, 0.1091. Stimare m e s.
Stima del valore vero: media
0.1104  0.1154  0.1199  0.1091
x = 0.1137 M
4
Stima della deviazione standard:
n

 x  x 
2

i 1
i

0.1104  0.1137 2  0.1154  0.1137 2  0.1199  0.1137 2  0.1091  0.1137 2
n 1 3

s = 0.0049 M (dare sempre le unità di misura!)


s ha le stesse unità di misura degli xi

28
n
Quasi ogni calcolatrice scientifica
 x  x 
2
i
deviazione è in grado di eseguire
s i 1
standard automaticamente il calcolo di s
n 1
29