Sei sulla pagina 1di 115

TRATTAMENTO DEI DATI ANALITICI TRATTAMENTO DEI DATI ANALITICI

I compiti del chimico analista vanno oltre la I compiti del chimico analista vanno oltre la
corretta esecuzione di una metodica analitica.
Sono altrettanto importanti i passi successivi: p p
Registrazione accurata dei dati sperimentali e corretta
esecuzione dei calcoli esecuzione dei calcoli
Scelta del valore migliore qualora la stessa determinazione sia
stata eseguita piu volte g p
Valutazione dei risultati ottenuti e calcolo dei limiti probabili
dellerrore che poi vanno indicati insieme al risultato
Elaborazione di una strategia per controllare le fonti di errore e
migliorare cos la qualit delle prestazioni analitiche
COSA VUOL DIRE FARE
STATISTICA
Quando si fanno affermazioni del tipo:
il profitto di questa classe in media il profitto di questa classe in media
sufficiente;
questanno sono di moda le vacanze di q
tipo agrituristico
si fanno affermazioni di tipo statistico.
STATISTICA STATISTICA
La statistica si occupa della
-raccolta,
-classificazione
-analisi dei dati
che esprimono aspetti di fenomeni collettivi scelti
come oggetto di studio e che si manifestano negli gg g
elementi di un determinato insieme.
Scopo della statistica quello di descrivere questi Scopo della statistica quello di descrivere questi
fenomeni o di individuare regolarit di
comportamento in essi. p
Indagine statistica Indagine statistica
Raccolta dei dati
Spoglio e p g
trascrizione dei dati
Elaborazione dei
d ti dati
Elaborazione dei dati Elaborazione dei dati
i d i d i Rappresentazione dei dati
(grafici) (grafici)
perch con limmagine si riesce a dare
un quadro generale della situazione un quadro generale della situazione
indagata riuscendo a dare informazioni
facilmente rapidamente comprensibili facilmente, rapidamente comprensibili.
Quali grafici?
Istogrammi, diagrammi a torta, grafici
cartesiani, cartogrammi, ecc.
Istogramma
1^A
1^B
Diagramma a torta
Matem
7,5
1^C
Matem
Italiano
Inglese
Scienze
7
24%
28%
Scienze
6,5
6
22%
5,5
Matem. Ingl ese
26%
Cartogramma
Diagramma cartesiano
6,8
7
6,4
6,6
6
6,2
1 2 3 4 1 2 3 4
Anno scolastico
Indici Statistici Indici Statistici
Per sintetizzare i dati ed evidenziare
una certa caratteristica:
I di i di t d t l Indici di tendenza centrale
Indici di dispersione Indici di dispersione
La media La media
Non esiste una sola media buona per
ogni occasione, ma esistono pi g , p
medie e verr scelta la pi adatta a
mettere in evidenza la situazione mettere in evidenza la situazione
cercata.
La media
Gli obiettivi che ci si prefigge nel calcolo di
di i l d una media sono sostanzialmente due:
1) sostituire a pi dati rilevati un solo
numero che dia per una efficace
rappresentazione del fenomeno dato;
esprimere lordine di grandezza o
tendenza centrale dellinsieme dei dati
relativi a un fenomeno. Tale ordine di
grandezza pu a volte sfuggire perch i g p gg p
dati sono spesso differenti fra loro.
La Media La Media
A questo punto bisogna dare dei criteri q p g
pratici per calcolare tale valor medio; i pi
importanti, quindi quelli pi usati, sono i
ti seguenti:
a) si pu calcolare il valor medio come
funzione matematica dei dati rilevati e
i t l i l di di liti in tal caso si parla di media analitica;
si possono ordinare i dati rilevati e
tt l di i l i ll ottenere la media in relazione alla
posizione che occupa fra essi e in tal caso
si parla di media di posizione si parla di media di posizione.
La media aritmetica La media aritmetica
La media aritmetica semplice M di n valori La media aritmetica semplice M di n valori
il rapporto fra la loro somma e il loro numero n:
x =
E
i=1
N
x
i
n
( )
...
2 1
+ + + x x x
M
n
n
( )
6 5 8 5
,..., ,
2 1
2 1
=
l i ti i D ti
n
x x x M
n
n
24 6 5 8 5
6 , 5 , 8 , 5 :
+ + +
valori seguenti i Dati
6
4
24
4
6 5 8 5
= =
+ + +
= M
La media aritmetica ponderata La media aritmetica ponderata
Quando ciascuna modalit si presenta con una certa
frequenza o peso, pi vantaggioso calcolare la
media aritmetica considerando le frequenze (assolute
o relative): in tal caso si parla di media aritmetica o relative): in tal caso si parla di media aritmetica
ponderata perch ogni valore entra nella media con il
suo peso, cio la sua frequenza. suo peso, o a sua eque a
La media aritmetica ponderata M di n valori :
( )
n n
n x n x n x
x x x M
+ + +
=
...
2 2 1 1
( )
n
n n n n dove
n
x x x M
+ + + =
= ,..., ,
2 1
n
n n n n dove + + + = ...
2 1
Calcolo della media
ponderata
Voto Allievi
6
24
3 8 5 7 8 6 5 5 3 4
=
+ + + +
= M
(modalit) (frequenza)
4 3
24
4 3
5 5
6 8
7 5 7 5
8 3
Attenzione! Attenzione!
Non sempre il calcolo della media aritmetica
rappresenta in modo significativo linsieme dei
valori a cui si riferisce. Per esempio, assegnati
i l i i valori:
6
48 6 7 5 5 6 7 6 5
6 7 6 5 6 7 6 5 )
+ + + + + + +
M
48 10 10 9 9 2 3 3 2
6
8 8
6 , 7 , 6 , 5 , 6 , 7 , 6 , 5 )
+ + + + + + +
= = = M a
24 13 2 1 1 3 1 2 1
6
8
48
8
10 10 9 9 2 3 3 2
10 , 10 , 9 , 9 , 2 , 3 , 3 , 2 )
+ + + + + + +
= =
+ + + + + + +
= M b
3
8
24
8
13 2 1 1 3 1 2 1
13 , 2 , 1 , 1 , 3 , 1 , 2 , 1 ) = =
+ + + + + + +
= M c
opportuno allora definire altri valori medi opportuno allora definire altri valori medi
che non siano frutto di calcolo matematico,
ma che siano individuati in base alla loro ma che siano individuati in base alla loro
posizione nella sequenza dei valori
osservati osservati.
Tali medie si dicono medie di posizione le
pi utilizzate sono: pi utilizzate sono:
La moda
La mediana
La MODA La MODA
Moda di un
fenomeno la
Voto
(modalit)
Allievi
(frequenza) fenomeno la
modalit con
f i
(modalit) (frequenza)
4 3
frequenza pi
elevata.
5 5
6 8
Mo 6
6 8
7 5
Mo = 6
7 5
8 3
La MEDIANA La MEDIANA
di l l d Mediana: il valore divisorio in quanto
bipartisce la successione dei dati in due
l l l gruppi ugualmente numerosi; il valore
che taglia in due parti uguali la
di ib i d i d i di i i il distribuzione dei dati ordinati, cio il
termine preceduto e seguito dallo stesso
di d i numero di dati.
Mediana Me di n valori ordinati
i d d t in modo non decrescente :
Esempio: dati i valori ordinati:
1, 2, 2, 3, 4, 5, 6 Me = 3
Se n dispari la mediana il valore centrale
Se n pari la mediana la media dei due Se n pari la mediana la media dei due
valori centrali
La variabilit
Il calcolo della media ci permette di sintetizzare p
una quantit di dati, ma dallaltro riduce
linformazione racchiudendo tanti valori in un
solo dato, rende simili situazioni che proprio
simili non sono.
1^prova 2^prova 3^prova 4^prova 5^prova MEDIA
Allievo 1 3 4 5 9 9 6
Allievo 2 6 6 6 6 6 6
Allievo 3 2 4 7 8 9 6
Per ridurre la perdita di informazioni, si ricorre Per ridurre la perdita di informazioni, si ricorre
allo studio della variabilit del fenomeno.
Variabilit la tendenza di un fenomeno ad
assumere modalit diverse fra loro. assu e e oda t d e se a o o
La variabilit pu essere rappresentata
graficamente mediante il diagramma di g a a d a d g d
dispersione.
Diagramma di dispersione Diagramma di dispersione
9
6
7
8
Allievo 1
3
4
5
6
Allievo 2
Allievo 3
2
3
0 1 2 3 4 5
Prove
Indici statistici di
variabilit
Campo di variazione o range R
Varianza
Scarto quadratico medio Scarto quadratico medio
.
Permettono di valutare le disuguaglianze Permettono di valutare le disuguaglianze
dei dati rilevati in relazione al loro
scostamento o dispersione da una media scostamento o dispersione da una media.
Campo di variazione o range R di
un insieme di valori osservati la un insieme di valori osservati la
differenza fra il valore massimo e il
l i i valore minimo:
R= x
max
- x
min
Attenzione tale indice presenta due grossi difetti:
1) dipende esclusivamente dai valori massimo e
minimo registrati, senza considerare i valori minimo registrati, senza considerare i valori
intermedi;
2) su di esso influisce pesantemente la presenza
anche di un solo valore anomalo.
2 5 7 6 7 6 5 6 7 6 5 ) R a
8 2 10 10 , 10 , 9 , 9 , 2 , 3 , 3 , 2 )
2 5 7 6 , 7 , 6 , 5 , 6 , 7 , 6 , 5 )
= =
= =
R b
R a
12 1 13 13 , 2 , 1 , 1 , 3 , 1 , 2 , 1 )
, , , , , , , )
= = R c
Altri indici di variabilit, pi raffinati, si
possono trovare utilizzando un altro
criterio,cio la variabilit rispetto a un centro
che pu essere la media.
La varianza La varianza
La varianza la media aritmetica degli scarti
dalla media al quadrato
2
(sigma quadrato) dalla media al quadrato, o
2
(sigma quadrato).
( ) ( ) ( )
2 2
2
2
1
2
+ + + M x M x M x ( ) ( ) ( )
2 2 2 2
...
2 1
2
+ + +
= o
n
M x M x M x
n
( ) ( ) ( ) ( )
8
5
2
2
6 9
2
6 5
2
6 4
2
6 3
2
: allievo 1 Es. =
+ + +
= o
5
1^prova 2^prova 3^prova 4^prova 5^prova MEDIA Vari anza 1 prova 2 prova 3 prova 4 prova 5 prova MEDIA Vari anza
Allievo 1 3 4 5 9 9 6
8
Allievo 2 6 6 6 6 6 6
0
Allievo 2 6 6 6 6 6 6
0
Allievo 3 2 4 7 8 9 6
8,5
Scarto quadratico medio Scarto quadratico medio
Lo scarto quadratico medio o o deviazione
standard la radice quadrata (positiva) della standard la radice quadrata (positiva) della
varianza.
( ) ( ) ( )
n
M x M x M x
n
2 2
2
2
1
2
... + + +
= = o o
n
sqm o
1^prova 2^prova 3^prova 4^prova 5^prova
MEDIA Vari anza
sqm o
Devi azi one
standard
Allievo 1
3 4 5 9 9 6
8 2 83
e o
3 4 5 9 9 6
8 2,83
Allievo 2
6 6 6 6 6 6
0 0,00
Allievo 3
2 4 7 8 9 6
8,5 2,92
Normalizzazione
La normalizzazione unoperazione statistica
che permette di mettere a confronto distribuzioni p
diverse.
Avendo due prove il cui punteggio grezzo Avendo due prove il cui punteggio grezzo
massimo raggiungibile dagli studenti diverso,
30 nella prima prova e 45 nella seconda prova, 30 nella prima prova e 45 nella seconda prova,
non permette di confrontare i risultati ottenuti.
Per superare questo inconveniente ricorro alla p q
normalizzazione.
Essa si basa su una proporzione: Essa si basa su una proporzione:
( Punti studente) : ( p.ti totali) = ( P.ti studente normalizzati) : 100
Normalizzazione
Allievi
Punti 1^
prova
Punti 1^
prova
P.ti 1^p
normalizzati
P.ti 2^p
normalizzati
A1 25 40 83,3 88,9
A2 15 43 50,0 95,6
A3 28 38 93 3 84 4 A3 28 38 93,3 84,4
A4 19 33 63,3 73,3
A5 22 31 73,3 68,9
A6 30 20 100,0 44,4
A7 27 26 90,0 57,8
A8 18 45 60 0 100 0 A8 18 45 60,0 100,0
Per A1 I p 25 : 30 = x : 100 x = 25/30x100 = 83 3 Per A1 I p. 25 : 30 = x : 100 x = 25/30x100 = 83,3
II p. 40 : 45 = x : 100 x = 40/45x100 = 88,9
Come leggere i risultati gg
Nella tabella successiva sono riportati i dati Nella tabella successiva sono riportati i dati
relativi alla media, alla deviazione
standard, al valore minimo e massimo, alla , ,
mediana e alla moda. Vediamo come
leggere questi dati aiutandoci con le
definizioni di tali valori statistici ed un
esempio di risultati ottenuti da una scuola.
I t i li ti 100 l I punteggi sono normalizzati a 100: la
scala di riferimento ha come valore minimo
0 (le risposte a tutti i quesiti della prova 0 (le risposte a tutti i quesiti della prova
sono errate) e come valore massimo 100
(le risposte a tutti i quesiti della prova sono (le risposte a tutti i quesiti della prova sono
corrette).
Media
Dev.
standard
Min. Max. Moda
Mediana
20 0 98 2 73 3
scuola 59,3 16,9
20,0 98,2 73,3
61,3
-Media (o punteggio medio) Media (o punteggio medio)
la somma dei punteggi ottenuti dagli studenti diviso il numero
totale degli stessi. Una media elevata indica la presenza nella
scuola di elevate competenze al contrario una media bassa scuola di elevate competenze, al contrario una media bassa
indica la presenza di scarse competenze nella scuola.
Nell'esempio la Media (o punteggio medio) 59,3;
Moda -Moda
il punteggio ottenuto pi frequentemente dagli studenti,
nell'esempio la scuola ha ottenuto come valore modale 73,3.
O b l 0 00 l Ovvero tra tutti i punteggi possibili tra 0 e 100, tale punteggio
quello ottenuto da pi studenti.
-Mediana
il punteggio in corrispondenza del quale gli studenti vengono
esattamente divisi in due parti uguali. Nell'esempio la mediana
corrisponde a 61,3 e indica che il 50% degli studenti ha ottenuto o po d a 6 ,3 d a 50 d g ud a o u o
un punteggio inferiore a 61,3% e che il restante 50% ha ottenuto
un punteggio superiore al 61,3;
Media
Dev.
standard
Min. Max. Moda
Mediana
standard
scuola 59,3 16,9
20,0 98,2 73,3
61,3
-Minimo
E' il punteggio pi basso ottenuto dagli studenti. Nell'esempio il
punteggio minimo 20,0; punteggio minimo 20,0;
-Massimo
E' il punteggio pi alto ottenuto dagli studenti. Nell'esempio il
punteggio massimo 98,2; p gg , ;
-Deviazione standard
una misura della dispersione del punteggio intorno al punteggio
medio. Un basso valore della deviazione standard indica che
i punteggi sono concentrati intorno alla media e che le
competenze degli studenti sono omogenee; al contrario
una deviazione standard alta indica che le competenze
degli studenti sono disomogenee. Nel nostro esempio,
aggiungendo e sottraendo al punteggio medio (59,3) la
deviazione standard (16,9) si ottiene un intervallo (42,4 - 76,2) in
i i t il 68% d li t d ti A l t i d cui si trova il 68% degli studenti. Analogamente aggiungendo e
sottraendo 2 volte la deviazione standard si ottiene un intervallo
(25,5 - 93,1) in cui si trova il 95% degli studenti.
Confronto con il campione
nazionale
Nel confronto tra i dati della scuola e
quelli del campione nazionale si dovr
tener conto dellerrore di campionamento. p
Esempio: se la scuola ha M = 80 e la
media del campione M 70 con un media del campione M
c
= 70 con un
errore di 10, il dato della scuola non si
discosta significativamente dal dato del discosta significativamente dal dato del
campione
80 70 10
Coefficiente di variazione Coefficiente di variazione
Il coeff.di variazione dato dal
rapporto tra deviazione standard e pp
media moltiplicato per 100.
Se supera una certa percentuale %
indica una variablit eccessiva, fuori
ai parametri di normalita. ai parametri di normalita .
Lerrore sperimentale e la sua valutazione nelle determinazioni analitiche L errore sperimentale e la sua valutazione nelle determinazioni analitiche
Ogni misura presenta una qualche incertezza, chiamata errore sperimentale
Risultati di 6 determinazioni replicate del ferro in campioni acquosi di una
soluzione standard contenente 20,00 ppm di Fe(III).
GLI ERRORI NELLANALISI CHIMICA GLI ERRORI NELLANALISI CHIMICA
Ogni analisi chimica (ogni misurazione!) affetta da errori sperimentali.
35
Ogni analisi chimica (ogni misurazione!) affetta da errori sperimentali.
Gli errori sperimentali si combinano tra loro in modo da rendere ogni nuova misura
pi o meno diversa dalla precedente.
Lincertezza della misura sperimentale non pu mai essere eliminata completamente
perci il valore vero di una quantit sempre sconosciuto.
Tuttavia, spesso pu essere valutata l'entit probabile dell'errore.
possibile definire i limiti entro cui il valore vero di una quantit misurata cade con
un dato livello di probabilit un dato livello di probabilit.
E sempre indispensabile effettuare una stima dellaffidabilit dei dati sperimentali
anche se la stima dellaccuratezza dei dati sperimentali non sempre facile
Ogni volta che collezioniamo i risultati di unanalisi necessario
stimarne precisione ed accuratezza
Una delle domande a cui rispondere prima di cominciare un'analisi : "qual il
stimarne precisione ed accuratezza
Dati con precisione ed accuratezza ignote sono privi di significato
massimo errore tollerabile nel risultato. La risposta a questo quesito determina il
tempo richiesto per il lavoro: nessuno pu permettersi di produrre dati che siano
pi accurati di quanto occorra.
DEFINIZIONI
36
Sia dato un insieme di misure x
1
, x
2
,x
N
.

Media:
N
x
x
i
i
=
Mediana: avendo ordinato le misure in ordine crescente o decrescente
N
N pari la mediana la media della coppia centrale dei valori
N dispari la mediana il valore centrale
Nel caso delle misure: 10, 10, 12, 13, 13, 13, 15, 18, 25, 26, 26, 27,
28, 28, 35
la media 19,93 e la mediana 18.
Media aritmetica o media
x
N

di N valori
sperimentali
x
x
i
i
=1
sperimentali
N
x
i
=
1
x
1 18,45 E 111,52
media
, ,
2 18,53
N
6
3 18,58 media 18,59
media
4 18,63
5 18,65 18,30 18,40 18,50 18,60 18,70
6 18,68
Mediana
Il risultato centrale dei dati replicati ordinati
Nel caso di un numero pari di dati replicati si calcola la
media della coppia centrale media della coppia centrale
x
1 18,45 E 111,52
mediana
2 18,53
N
6
3 18,58 media 18,59
media
4 18,63 mediana 18,61
5 18,65
6 18 68
18,30 18,40 18,50 18,60 18,70
6 18,68
Precisione
La dispersione dei valori misurati
intorno al valore medio
Descrive il grado di riproducibilit delle misure ed Descrive il grado di riproducibilit delle misure ed
una valutazione dell accordo dei dati ottenuti.
Grandezze utilizzate per indicare la precisione di una
serie di dati replicati (MISURANO la dispersione dei dati
ottenuti e permettono di definire i limiti probabili
dellerrore associato al risultato):
d i i d d deviazione standard
varianza
coefficiente di variazione
Accuratezza
Rappresenta lo scostamento tra il valore misurato ed il
valore vero o accettato
I lt i t i i i d ll b t d ll d t il In altri termini una misura della bont dellaccordo tra il
risultato, x
i
, o il valore medio dei risultati di unanalisi, ed il
valore vero o supposto tale, x
t
.
X
t
= valore vero. Risultato che possiede un certo numero di cifre significative
E espressa in termini di errore assoluto o errore relativo
Errore assoluto: oppure
t i
x x E =
t
x x E =
Errore relativo: oppure
t
t
r
x
x x
E

= 100
x
x x
E
t
t
r

=
t t
41
Precisione: bont dellaccordo tra i risultati di misurazioni
successive.
Accuratezza: bont dellaccordo tra il risultato, x
i
, o il valore medio
dei risultati di unanalisi, ed il valore vero o supposto tale, x
t
.
-
N Non
-
-
-
N
accurato
n
preciso
- -
-
-
Non
accurato
ma
preciso
-
p p
Accurato
- -
-
-
ma
non
preciso
-
-
-
-
Accurato
e
preciso
Tipi di errori nei dati Tipi di errori nei dati
sperimentali p
Errore sistematico o errore determinato: un errore ricorrente (riproducibile) che pu
essere rivelato e corretto (strumentazione non tarata, errori di metodo, errore personali) e
influenza laccuratezza dei risultati ACCURATEZZA: indica la vicinanza della misura al influenza l accuratezza dei risultati ACCURATEZZA: indica la vicinanza della misura al
valore vero (accettato)
Errore casuale o indeterminato: deriva dalleffetto prodotto da una serie di variabili
i ll ( l l i ll bili i i i i l i ib i i) incontrollate (e talvolta incontrollabili: variazioni temperatura e tensione elettrica, vibrazioni)
e influenza la precisione di una misura PRECISIONE: descrive la riproducibilit delle
misurazioni
Errore grossolano: si presenta occasionalmente, spesso elevato e fa s che un singolo
dato si discosti da tutti gli altri dati di una serie di misure replicate
ERRORE SISTEMATICO
44
Gli errori sistematici hanno un valore definito ed una Gli errori sistematici hanno un valore definito ed una
causa identificabile.
Per misure replicate effettuate nello stesso modo
hanno lo stesso ordine di grandezza e generalmente
influenzano tutti i risultati di un set di misura allo
stesso modo stesso modo.
Provocano uno scostamento unidirezionale dal valore
vero che pu essere costante o proporzionale e che e o c e pu esse e costa te o p opo o a e e c e
pu assumere valore sia positivo che negativo.
Gli errori sistematici introducono un bias nella tecnica
di misura.
Bias: misura dellerrore sistematico associato
d li i ad una analisi.
Pu avere segno positivo o negativo.
Errore sistematico (o determinato)
Causa lo scostamento della media di un set di dati
sperimentali dal valore vero (o accettato)
Influenza laccuratezza di una misura
x
0
x
m
18 30 18 40 18 50 18 60 18 70 18,30 18,40 18,50 18,60 18,70
Cause degli errori sistematici
Errori strumentali: dovuti a imperfezioni e
malfunzionamento degli strumenti di misura malfunzionamento degli strumenti di misura
Variazioni di temperatura
Contaminazione dellequipaggiamento
Fluttuazioni nella tensione di alimentazione
Guasto o malfunzionamento di componenti
Errori di metodo: dovuti a comportamento
chimico o fisico non ideale dei reagenti e delle g
reazioni utilizzate in un procedimento analitico
E i li ti d l t i i Errori personali: causati da valutazioni
personali dellanalista nel corso del
procedimento analitico adottato procedimento analitico adottato
Rivelazione e correzione degli errori sistematici
Gli errori sistematici possono essere identificati ed annullati mediante
analisi di campioni standard, se disponibili;
li i d l i di t t d i di d t h
Gli errori sistematici possono essere identificati ed annullati mediante
analisi del campione mediante un metodo indipendente, ovvero che
prevede l'utilizzo di strumentazione di provata affidabilit o di
riferimento;;
analisi del bianco, cio di una soluzione contenente tutti i
componenti presenti nel campione in esame eccetto l'analita di p p p
interesse; il bianco ideale costituito dalla stessa matrice in cui
contenuto l'analita di interesse; l'analisi del bianco nelle titolazioni
volumetriche consente, per esempio, di correggere l'errore
connesso al volume di titolante necessario per far virare l'indicatore
colorimetrico stesso; colorimetrico stesso;
analisi di campioni contenenti un diverso ammontare della variabile
misurata (per es si pensi alla perdita connessa alla solubilit misurata (per es. si pensi alla perdita connessa alla solubilit
durante il lavaggio con volumi diversi di acque di lavaggio).
Rivelazione e correzione degli errori sistematici Rivelazione e correzione degli errori sistematici
x
0
x
m
0
Analisi di
18,30 18,40 18,50 18,60 18,70
standard
x
0
x
m
Calibrazione
0
18,30 18,40 18,50 18,60 18,70
Errore sistematico o determinato
Lerrore sistematico viene rivelato utilizzando opportuni std. di riferimento (analita a
concentrazione nota) e calcolando laccuratezza
Laccuratezza di una misura il grado di accordo tra essa e il valore vero e viene
espressa dallerrore (assoluto o relativo) espressa dall errore (assoluto o relativo)
Errore assoluto = valore osservato valore vero
valore osservato valore vero
E l ti 100 Errore relativo =
valore vero
x100
Determinazioni dell azoto in due composti puri con il metodo di Kjeldahl
I punti mostrano gli errori assoluti dei risultati (X X) replicati ottenuti da 4 analisti I punti mostrano gli errori assoluti dei risultati (X
i
-X
t
) replicati ottenuti da 4 analisti
Linea blu rappresenta la deviazione media assoluta dei dati dal valore vero (X
m
-X
t
)
Analista 1 accurato e preciso Analista 2 accurato ma poco preciso
Analista 3 preciso ma poco accuratoAnalista 4 poco accurato e poco preciso Analista 3 preciso ma poco accurato Analista 4 poco accurato e poco preciso
Errore casuale (o indeterminato)
Provoca la dispersione dei dati sperimentali intorno p p
al valore medio. Riflette la precisione di una misura
x
t
x
t
x
m
x
m
18,30 18,40 18,50 18,60 18,70
18,30 18,40 18,50 18,60 18,70
Errore casuale o indeterminato
( Lerrore casuale ha pari probabilit di essere positivo o negativo (dispersione dei dati pi o
meno simmetrica intorno al valore medio) e non pu essere corretto.
-4piccoli errori si combinano per dare le deviazioni indicate
dal valore medio.
Ciascunerrore ha la stessa probabilit di verificarsi e -Ciascunerrore ha la stessa probabilit di verificarsi e
la somma finale sia >o <di una quantit fissa U
-intabella tutte le possibili combinazioni e la frequenza
relativa con cui avvengono.
Distribuzione teorica relativa per
4 incertezze
Distribuzione teorica relativa per 10
incertezze. La deviazione pi frequente
dalla media 0, mentre la deviazione max ,
10U si verifica una volta ogni 500 misure
Distribuzione teorica relativa ad un numero
molto grande di incertezze ne risulta una
curva Gaussiana o curva normale dell
errore.
Distribuzione dei risultati sperimentali
Nella maggior parte degli esperimenti analitici
tit ti i l di t ib i d i d ti li ti quantitativi la distribuzione dei dati replicati
simile a quella di una curva Gaussiana e
questo perch la deviazione dalla media
conseguente allerrore casuale co segue te a e o e casuae
L esperimento di calibrazione di una pipetta da 10 ml prevede che un recipiente con tappo venga pesato
vuoto, nel recipiente si trasferiscano 10 ml di acqua con la pipetta da 10 ml, e il tutto venga ripesato. Si
misuri la temperatura dell acqua per stabilirne la densit, quindi si faccia la differenza tra le due masse misuri la temperatura dell acqua per stabilirne la densit, quindi si faccia la differenza tra le due masse
e si calcolino i ml dividendo la massa per la densit. L esperimento viene ripetuto per 50 volte.
La media si calcola con la funzione =MEDIA(B3:B19; E3:E19; H3:H18)
La mediana si calcola con la funzione =MEDIANA(B3:B19; E3:E19; H3:H18) La mediana si calcola con la funzione =MEDIANA(B3:B19; E3:E19; H3:H18)
La deviazione standard con opportuna funzione.
Il valore max si calcola con la funzione =MAX(B3:B19; E3:E19; H3:H18)
Il valore min si calcola con la funzione =MIN(B3:B19; E3:E19; H3:H18) Il valore min si calcola con la funzione MIN(B3:B19; E3:E19; H3:H18)
La dispersione la differenza tra valore max e minimo, e corrisponde alla
Sommatoria di tutte le incertezze dell esperimento.
1) I dati si possono riorganizzare in gruppi di distribuzione di frequenza ovvero
numero di dati che rientrano in una serie di celle adiacenti di ampiezza p
0.003 ml.
2) Si calcolano le % di misure contenute in ogni cella (3/50 x 100)=6.
Si nota che il 26% dei Risultati si trova nell intervallo 9.981-9.983.
Questo il gruppo che contiene media e mediana. Pi di meta dei risultati
contenuto in un intervallo di 0.004 ml rispetto al valore medio.
Con questi dati costruiamo un istogramma (A). Con l aumentare del numero
delle misure listogramma assumer una forma simile alla curva (B) che delle misure l istogramma assumer una forma simile alla curva (B) che
una Gaussiana o curva normale dell errore che deriva da un insieme infinito
dei dati. La Gaussiana ha la stessa media, la precisione e la stessa area
Sottesa alla curva dell istogramma Sottesa alla curva dell istogramma.
Il trattamento statistico dellerrore casuale
In uno studio scientifico deduciamo informazioni su una popolazione mediante
le osservazioni acquisite su un sottoinsieme o campione.
Popolazione: linsieme di tutte le misure di interesse
Campione: sottoinsieme della popolazione selezionato per lanalisi e rappresentativo p p p p pp
della popolazione stessa
CCurva normale di errore di una popolazione
-(x - )
2
/2o
2
Equazione della curva Gaussiana
y =
o 2t
e
-(x - ) /2o
2 curve Gaussiane che riportano la frequenza relativa y
di varie deviazioni dalla media in funzione della
deviazione dalla media. Queste curve vengono g
descritte da un equazione che contiene solo due
parametri: =media della popolazione e o =deviazione
standard della popolazione
La deviazione standard per la curva B doppia rispetto a p pp p
quella di A.
Media: Deviazione standard:
N N
60
x
X
N
1 i
i
=
=
( ) x x
s
N
1 i
2
i

=

=
necessario sapere che la media e la deviazione standard sopra
N
X
1 N
s

=
p p
definite, essendo valutate sulla base di un numero finito, e normalmente
molto basso, di misurazioni, cio di un campione delle infinite
misurazioni che costituiscono lintera popolazione delle misurazioni, sono
solo stime della media e della deviazione della popolazione. Per un
numero molto alto di misurazioni si pu scrivere:
N
x
N
1 i
i
( ) x
N
2
i

N
1 i=
=
( )
N
1 i
i
=

= o
Normalmente, queste due ultime equazioni valgono per N > 20.
La deviazione std. di un campione
La media di un campione la media aritmetica di un campione p p
limitato preso da una popolazione di dati ed indicata con x e la ds con s
N
s
=
E
i=1
(x
i
- x)
2
N-1
(N-1)= gradi di libert ovvero il
problema inizia con N dati
Indipendenti Dopo a er calcolato Indipendenti. Dopo aver calcolato
la media rimangono solo N-1 dati
indipendenti perch se si conoscono
N-1 dati e la media possibile
La varianza = s
2
p
calcolare lN-esimo dato.
deviazione std. relativa = s / x
Coefficiente di variazione (CV%) = (s / x) -100
62
Distribuzione normale o di Gauss
Nel caso sia effettuato un numero di misurazioni sufficientemente
elevato, spesso possibile verificare che i valori sperimentali
sono rappresentati da una distribuzione continua di tipo sono rappresentati da una distribuzione continua di tipo
Gaussiano (calcolo della frequenza relativa per ogni dato
sperimentale)
o

e
) (
2
2
2
) x x (
t o
=
2
e
) x ( y
La distribuzione Gaussiana simmetrica intorno alla media
(media e mediana coincidono) ed essendo una distribuzione di
probabilit racchiude un'area unitaria.
Se vale lipotesi che gli errori indeterminati seguano una
distribuzione Gaussiana possiamo usare le propriet di distribuzione Gaussiana, possiamo usare le propriet di
questultima per stimarne i parametri caratteristici, ovvero media
e deviazione standard.
Distribuzione normale o di Gauss
( )
( )
2
2 / 2
2
1
,
o

o

=
x
e N( )
2
,
t o

Distribuzione di probabilit teorica


che piu si avvicina alla curva di
frequenza sperimentale
Frequenza
relativa
Max=
q p
Max
media
(deviaz. standard) determina
lampiezza della curva
ai due lati della media
Valori osservati
Distribuzione normale o di Gauss
di d i i t d d con diversa deviazione standard o
Per una distribuzione gaussiana ideale il 68,3% delle misure compresa all interno
dell intervallo o; il 95,5% 2o; il 99,7% 3o.
Esempi Esempi
65
Calcolare la deviazione standard dei seguenti risultati.
X
1
=23 23; X
2
=21 29; X
1
23,23; X
2
21,29;
X
3
=20,66; X
4
=29,05;
X =23 33; X
5
=23,33;
i 1 5 i 1 5 ..
x
i
2323
x
m
i
x
i
5
x
m
23.512 =
s
i
x
i
x
m
2
23.23
21.29
20.66
29.05
5 1
s 3.311 =
RSD% s
100
x
m
.
RSD% 14.083 =
23.33
x
m
Livello di fiducia (o di confidenza)
66
Nelle normali operazioni di laboratorio spesso impossibile
eseguire numerose misurazioni. Tuttavia, possibile determinare
x e s ovvero la media e la deviazione standard del campione E x e s ovvero la media e la deviazione standard del campione. E
possibile definire un intervallo in cui poter assumere
ragionevolmente che in esso sia compreso il valore vero.
L intervallo di fiducia un espressione usata per definire la
probabilit che la media vera giaccia entro una certa distanza
dalla media misurata x.
Tale intervallo si chiama intervallo di fiducia, ed i suoi limiti estremi sono
chiamati limiti dell'intervallo di fiducia.
La probabilit che il valore atteso di un parametro stimato sia incluso in un
intervallo stimato del parametro stesso si chiama livello di fiducia, e si indica
con 1-o.
Il livello di fiducia espresso da un numero tra 0 e 1 (o in percento). La
quantit complementare, o, si chiama livello di significativit.
Quindi la scelta di un determinato livello di fiducia non esclude totalmente la
possibilit di fare previsioni sbagliate: se abbiamo scelto 1-o = 95% avremo
comunque 5 possibilit su cento che il valore vero cada al di fuori
dell'intervallo di fiducia.
68
z la variabile z la variabile
standard normalizzata; standard normalizzata;
la deviazione di un la deviazione di un la deviazione di un la deviazione di un
dato dalla media dato dalla media
espressa in unit di espressa in unit di
deviazione standard. deviazione standard.
Se noi abbiamo un risultato x proveniente da una serie di dati con una
deviazione standard o possiamo assumere che 90 volte su
100 la media vera si trovi nell intervallo xo. La probabilit chiamata p
livello di fiducia (90%) e l intervallo di fiducia compreso tra -1,64o e +1,64o.
Intervalli di fiducia
In analisi farmaceutica solitamente non si determina la media e d.s. di una popolazione
bens di un campione rappresentativo
E tuttavia possibile con lanalisi statistica determinare un intervallo di fiducia attorno ad E tuttavia possibile con l analisi statistica determinare un intervallo di fiducia attorno ad
x nel quale si prevede di determinare il valore medio con una certa probabilit (dal
95%)
Lintervallo di fiducia per una media x quindi lintervallo entro il quale ci si aspetta di Lintervallo di fiducia per una media x quindi l intervallo entro il quale ci si aspetta di
trovare, con una certa probabilit, la media della popolazione (le linee di confine sono
chiamati i limiti di fiducia)
Trovare lintervallo di fiducia quando o nota o quando s una buona stima di o
Intervallo di fiducia =

z
-
o
x
Intervallo di fiducia =

N
x
Il t di Student lo strumento statistico usato per esprimere gli p p g
intervalli di fiducia e confrontare i risultati di diversi esperimenti.
Es. confronto tra le medie di due popolazioni di dati.
Trovare lintervallo di fiducia quando o non nota
Intervallo di fiducia di =
x
t
-
s
N

N
zz
Esempio di calcolo degli intervalli di fiducia
Si considerino i seguenti risultati relativi al contenuto di alcol etilico in un campione di
sangue: 0.084%, 0.089%, 0.079%.
C l l li t ll di fid i l di l 95% d h Calcolare lintervallo di fiducia per la media al 95% assumendo che
a) dalle esperienze precedenti acquisite su un centinaio di campioni, si sa che la
deviazione std. del metodo s=0.005% una buona stima di o
b) I tre risultati ottenuti rappresentano il solo modo per valutare le precisione del metodo ) pp p p
Caso A
z
-
o

1.96
-
0.005
Intervallo di fiducia (95%) =

N
x

3
0.084
= =
0.084 0.006%
0.078 0.09

Esiste una probabilit del 95% che la media vera


rientri nell intervallo 0,078-0.09 ,
Se o nota l intervallo di fiducia decresce.
Caso B
t
s = 0.005%
Intervallo di fiducia (95%) =

t
-
s
N
x

4.303
-
0.005
3
0.084
= =
0.084 0.012%
0 072 0 096 0.072 0.096

Confronto di medie utilizzando la t di Student


Il test t viene utilizzato per confrontare due serie di misure al fine di decidere se sono o
non sono significativamente differenti tra loro non sono significativamente differenti tra loro
Il test si basa sullipotesi nulla che postula che le due serie di misure siano uguali
H
0
: =
0
i i ifi t li t i ll d l b bilit h l diff t l d per convenzione, si rifiuta lipotesi nulla quando la probabilit che la differenza tra le due
serie di misure sia casuale inferiore al 5%(p<0.05)
Confronto tra le media sperimentale (risultato misurato) ed il valore noto:
t
calcolata
=
| x valore noto |
s
N
Se t
calcolata
> t
tabulata
(al 95%) la differenza significativa
Es: verificare se un metodo analitico nuovo fornisca risultati in accordo con il valore noto
Caso 1) Esempio di confronto di una serie di misure con un valore noto
Si consideri un nuovo metodo analitico che viene applicato ad uno std. di riferimento
(valore noto= 3.19%). I valori ottenuti sono i seguenti: 3.29%, 3.22%, 3.30%, 3.23%
(x =3 26; s=0 04) Il metodo accurato? (il risultato in accordo con il valore noto?) (x = 3.26; s= 0.04). Il metodo accurato? (il risultato in accordo con il valore noto?)
3 26 3 19
t
calcolata
=
3.26 3.19
0.04
4 = 3.41
Poich t
calcolata
(3.41) > t
tabulata
(3.182) il risultato ottenuto differente da quello noto.
La possibilit di commettere un errore nel trarre questa conclusione minore del 5%
Caso 2 Confronto di misure ripetute (test t non accoppiato)
Serve a decidere se due serie di dati misurati sono uguali o differenti (stesso livello di fiducia)
Si considerino una serie di dati che consistono di n
1
e n
2
misure (aventi la media x
1
e x
2
)
t
calcolata
=
x
1
x
2
s
comune
n
1
n
2
n
1
+ n
2
s
comune
=
s
1
2
(n
1
-1)+ s
2
2
(n
2
-1)
n
1
+ n
2
-2
massa gas isolati aria: massa gas isolati aria:
x
1
= 2.31011 g; s
1
= 0.000143 (n
1
=7)
massa gas per via chimica: massa gas per via chimica:
x
2
= 2.29947 g; s
2
= 0.00138 (n
1
=8)
n.b gradi di libert = (n
1
+n
2
) -2
s
comune
= 0.00102
t
calcolata
= 20.2
Poich t >t (95% t compresa tra Poich t
calcolata
> t
tabulata
(95%, t
tabulata
compresa tra
2.228 e 2.131) la = significativa
Caso 3 Confronto di singole differenze (test t accoppiato)
Questo il caso in cui si utilizzano due metodi differenti per effettuare singole misure
sugli stessi campioni (confronto tra due metodi).
t
calcolata
=
d
s
d
N s
d =
E
i=1
N
(d
i
- d)
2
N-1
d
N-1
d la differenza media tra le due serie di dati e n il numero di coppie di dati
s
d
= 0.122
t =
0.060
6
=1 20 t
calcolata
=
0.122
6
= 1.20
Dato che t
calcolata
<t
tabulata
(2.571 per un livello di f. al 95% e 5 gradi di libert) i due metodi
non sono significativamente diversi tra loro
Il Test F per il confronto delle deviazioni std.
Il test t permette di confrontare le medie e quindi di rilevare lerrore sistemico Il test t permette di confrontare le medie e quindi di rilevare lerrore sistemico
Se si vuole confrontare la precisione si devono confrontare le deviazioni std. con il test F
s
1
2
F
calcolata
=
s
1
s
2
2
Si pone la d.s. maggiore al numeratore in modo che F>1
Se F
calcolata
> F
tabulata
allora la = significativa
Il Test Q per i dati sospetti (outliers)
talvolta data una serie di misure, un dato risulta non essere consistente con gli altri a
causa di un errore grossolano
i il t t Q d id di t t il d t tt si pu usare il test Q per decidere di mantenere o scartare il dato sospetto
Q
calcolata
=
divario
i t ll intervallo
Intervallo: la differenza tra valori estremi
Divario: la differenza fra il valore sospetto e quello Divario: la differenza fra il valore sospetto e quello
pi vicino
Se Q
calcolata
>Q
tabulata
il dato sospetto andrebbe
eliminato
divario = 0.11
Esempio
12.47 12.48 12.53 12.56 12.67
Qcalcolata: 0.11/0.2 = 0.55
Poich Q
calcolata
<Q
tabulata
il dato deve
essere mantenuto
Intervallo = 0.2
Analisi della varianza (ANOVA)
Lanalisi della varianza permette di confrontare pi di due medie di popolazioni cio se esiste
una differenza nelle medie di pi di due popolazioni. una differenza nelle medie di pi di due popolazioni.
Si considerino 4 serie di dati e le 4 medie delle popolazione
1
,
2
,
3
,
4
Lipotesi nulla di ANOVA : H
0
: 1= 2 = 3 = 4
Lipotesi alternativa: H
A
: almeno due medie tra loro =
Alcuni esempi di applicazione ANOVA:
- vi differenza nei risultati ottenuti da 5 analisti nella determinazione del Ca
2+
?
- quattro composizioni di solventi hanno influenza sulla reazione? quattro composizioni di solventi hanno influenza sulla reazione?
- I risultati delle determinazioni di Manganese sono = usando tre metodi analitici?
-Ci sono differenze nella fluorescenza di uno ione complesso a 6 valori di pH
Popolazioni presentano valori diversi di una caratteristica comune chiamata fattore
Il fattore la variabile indipendente la risposta la variabile dipendente. I differenti
valori del fattore di interesse vengono chiamati livelli.
Quando sono coinvolti pi di un fattore si utilizza ANOVA a due vie (es. effetto della
temperatura e pH sulla velocit di reazione)
L analista un fattore i diversi analisti sono i livelli del fattore.
Il principio dellANOVA di confrontare la variazione tra i diversi gruppi (livelli) rispetto alla
variazione allinterno di ciascun gruppo (livello).
Triangoli risultati individuali mentre i pallini sono le medie. Le variazioni tra le medie
sono confrontate con quella all interno dei gruppi (Principio dell ANOVA).
Lipotesi nulla vera quando le variazioni tra le medie dei gruppi simile alla
variazione allinterno dei gruppi
Lipotesi nulla falsa quando la variazione tra le medie dei gruppi > rispetto alle
variazione tra i singoli gruppi
Il test di base dell ANOVA il test F. Un valore alto di F rispetto al tabulato fa scartare l
ipotesi nulla a favore di quella alternativa.
In primo luogo si deve stimare la variazione tra i gruppi e allinterno del singolo gruppo nel In primo luogo si deve stimare la variazione tra i gruppi e all interno del singolo gruppo nel
seguente modo
1 Si calcola il valore medio complessivo x 1. Si calcola il valore medio complessivo
x
N
1
N
x
1
( ) =
N
2
N
x
2
( )
N
i
N
x
i
( )
+ + ..
x
N
1
( )
N
2
( )
N
i
( )
N
1
il numero di misure nel gruppo 1; N
2
il numero di misure nel gruppo 2 etc.
Il valore pu anche essere determinato sommando tutti i dati e dividendo per N
2. La variazione tra i gruppi si determina calcolando la somma dei quadrati dovuti al fattore
SQF = N
1
( )
2
+ N
2
( )
2
+ ..N
i
( )
2
x
1
- x
2
-
x
i
-
x x
x
Quadrato della media
dei livelli del fattore
QMF = =
SQF
I -1
I = numero dei fattori
3. La variazione allinterno dei gruppi viene determinata calcolando la somma
dei quadrati dellerrore
SQE = (N
1
-1)s
1
2
+ (N
2
-1)s
2
2
. (N
i
-1)s
i
2
Errore del quadrato della media EQM = =
SQE
N -1n
Dove n il numero di livelli
N 1n
F =
EQM
QMF
EQM
Lipotesi nulla scartata quando F
calcolato
> F
tabulato
Applicazioni analisi ANOVA
N. Prova Analista 1 Analista 2 Analista 3 Analista 4 Analista 5
1 10.3 9.5 12.1 9.6 11.6
2 9.8 8.6 13.0 8.3 12.5
3 11.4 8.9 12.4 8.2 11.4
Media 10.5 9 12.5 8.7 11.833
Dev. Std. 0.818535 0.458258 0.458258 0.781025 0.585947
Ad un livello del 95%, le medie sono diverse?
x =10 507 mmoli Ca
2+
x 10.507 mmoli Ca
SQF= 33.80267 (5-1= 4 gradi di libert); QMF= 33.80267/4= 8.450667
SQE=4.086667 (15-5=10 gradi di libert); EQM=4.086667/10 =0.408667 SQE 4.086667 (15 5 10 gradi di libert); EQM 4.086667/10 0.408667
F
calcolato
= 8.450667 / 0.408667 = 20.68
Dato che F
calcolato
>F
tabulato
(livello di fiducia al 95%)
Scartiamo H
0
quindi esiste un differenza significativa Scartiamo H
0
quindi esiste un differenza significativa
Tra quali gruppi esiste una differenza significativa?: Post-test q g pp g
Bonferroni Tukey: compara tutte le colonne Bonferroni, Tukey: compara tutte le colonne
Dunnett: compara tutte le colonne vs il controllo
Luso di fogli di calcolo in analisi chimica
Cella Cella
attiva
celle
Foglio di lavoro Foglio di lavoro
Le celle possono contenere testo, numeri o formule
In Excel le formule iniziano con il segno =
Al f i i t ti ti h i t t Alcune funzioni statistiche preimpostate
Uso di $ per variabili statiche Uso di $ per variabili statiche
Un test accoppiato : appropriato qualora esista un naturale appaiamento tra le
osservazioni dei campioni, quale il caso di una duplice verifica di un gruppo
campione o prima e dopo un esperimento. necessario che i due intervalli di input
contengano lo stesso numero di dati.
Un test non accoppiato: quando non esiste un appaiamento tra le due serie di Un test non accoppiato: quando non esiste un appaiamento tra le due serie di
misure. Le misure posso anche avere una numerosit differente
Test a una o due code:
Date due serie di misure le cui medie sono X
1
e X
2
, si scegli il test a
una coda quando lipotesi alternativa x
1
> x
2
(oppure x
1
< x
2
).
Il test a una coda si utilizza quando misure precedenti, limiti fisici o il buon senso
indica che se esiste una differenza questa pu andare in una sola direzione.
Il test a due code si utilizza quando la differenza pu andare in entrambe le direzioni
e quindi x1= x2
Categorie di errori nei dati sperimentali
E l ( i l ) Errore grossolano (o occasionale)
Si verifica occasionalmente, spesso grande e provoca un
significativo scostamento di un singolo dato (outlier) da tutti significativo scostamento di un singolo dato (outlier) da tutti
gli altri
x
0
18,30 18,40 18,50 18,60 18,70
Pu capitare, nel corso di una misura, di avere un valore che si
discosta significativamente da tutti gli altri dati replicati (outlier)
E necessario stabilire se il valore ottenuto deve essere utilizzato
per il calcolo della media oppure se va considerato un dato
anomalo e quindi scartato anomalo e quindi scartato
La scelta va fatta seguendo uno dei criteri codificati ed accettati
Regola del 2.5 d
Si scarta il valore sospetto (outlier) e si calcola la p ( )
media sui valori replicati rimanenti (x
m
)
Si calcola la deviazione media: d Si calcola la deviazione media: d
m
Se il valore sospetto (outlier) differisce da x
m
per
pi di 2.5 d
m
il valore viene scartato e la media
della misura calcolata solo sui valori rimanenenti
Se il valore sospetto (outlier) differisce da x
m
per
meno di 2.5 d
m
il valore viene incluso nel calcolo
m
della media
Regola del 2.5 d
Esempio
x d d ass
1 18,60 E 16 112,01 -0,01 0,01
2 18,55 N 6 -0,06 0,06
3 18,58 media 1-6 18,67 -0,03 0,03
4 18 68 i 1 18 61 0 07 0 07 4 18,68 media 1-5 18,61 0,07 0,07
5 18,65 0,04 0,04
6 18 95 18 95 18 61 0 34 d 0 04 2 5d 0 11 6 18,95 18,95-18,61= 0,34 dm 0,04 2,5d= 0,11
Si t 0 34 > 0 11 Si scarta se 0,34 > 0,11
Si accetta se 0,34 < 0,11
Raccomandazioni per il trattamento degli outliers
96
Raccomandazioni per il trattamento degli outliers.
Se un dato appare anomalo:
accertarsi di non aver commesso un errore
grossolano; grossolano;
ripetere lanalisi;
eseguire il test-Q;
nel caso il dato sia confermato come outliers nel caso il dato sia confermato come outliers,
eseguire una nuova replica;
Il metodo dei minimi quadrati
97
La maggior parte delle determinazioni analitiche effettuata utilizzando
tecniche strumentali. Nel caso pi frequente, la misurazione di tipo
indiretto. Si costruisce prima un diagramma di calibrazione analizzando
campioni a concentrazione nota e riportando in grafico il segnale
misurato (assorbanza, corrente, tensione, area di un picco, ecc.) in
funzione della concentrazione. Si pu quindi utilizzare il diagramma
ottenuto per ricavare il valore della concentrazione del campione
incognito da quello del segnale ad esso relativo.
Lequazione della retta di Lequazione della retta di
calibrazione :
Y = m
.
x + b
I punti sperimentali non sono mai
allineati perfettamente:
necessario usare metodi obiettivi necessario usare metodi obiettivi
per tracciare la retta migliore che
rappresenta i risultati sperimentali
Il metodo di regressione ai minimi
quadrati un metodo che permette
di identificare la miglior retta che
98
Y
Ay
di identificare la miglior retta che
passa attraverso i punti
corrispondenti ai dati sperimentali
mediante minimizzazione dei
y
2
mediante minimizzazione dei
quadrati delle distanze tra i punti
sperimentali e la retta supposta
ideale (solo deviazioni verticali)
X
0
x
2
ideale (solo deviazioni verticali).
Data una serie di risultati
sperimentali, (x
i
/y
i
) =
t i / l concentrazione/segnale
Si pu dimostrare che pendenza ed intercetta sono calcolabili per mezzo
delle equazioni:
( ) ( ) | |


m i m i
y y x x
( )

=
2
m i
i
x x
m
m m
x m y b =
I calcoli sono normalmente eseguiti per mezzo di software commerciali.
i
COEFFICIENTE DI DETERMINAZIONE R
2
Per stabilire fino a che punto lequazione di Per stabilire fino a che punto l equazione di
regressione calcolata con il metodo dei minimi
quadrati pu essere usata al fine di prevedere un
valore di y conoscendo un determinato valore di x,
si calcola il parametro R
2
mediante la relazione:
[xy
-
(x)(y)
]
2
n

R
2
=
R
2
pu assumere valori tra 0 e 1
che indicano la bont
dellequazione calcolata

[x
2
-
(x)2
] [y
2
-
(y)2
]
2
n n
R
q
Es:
R
2
= 0 non ce alcuna relazione
tra le variabili x e y
R
2
= 1 perfetta relazione
tra le variabili x e y, quindi ad un
determinato valore di x esiste
l l d solo un valore di y
Accuratezza e Precisione!
RIASSUMENDO:
Selettivit
Sensibilit Sensibilit
Precisione
Accuratezza
ATTENDIBILITA
DI UN DATO
ANALITICO ANALITICO
Selettivit: indica la capacit per un metodo
analitico di riconoscere e/o quantificare una
i hi i i di lt h specie chimica in presenza di altre, che sono
potenzialmente in grado di falsare i risultati delle
analisi (interferenti). ( )
Sensibilit: la pendenza della curva di calibrazione in uno
specifico intervallo di concentrazione. Se la calibrazione
lineare la sensibilit il coefficiente angolare della retta di
l
e
lineare, la sensibilit il coefficiente angolare della retta di
calibrazione.
d
s
e
g
n
a
l
metodo a
metodo b
concentrazione
Errori casuali: controllo della precisione
La diminuzione della precisione viene segnalata dallaumento della La diminuzione della precisione viene segnalata dall aumento della
dispersione dei dati attorno al valore medio.
La distribuzione che generalmente rappresenta il risultato della
determinazione analitica quella gaussiana (o normale).
z
a
f
r
e
q
u
e
n
z
distribuzione
GAUSSIANA
di
y

=

f
= media
o
2
= varianza
o = dev. standard
x = risultato
(
(


=
2
2
) (
exp
2
1
) (
2
x
x f
funzione di
distribuzione
(

o
t o
2
2
2
normale
stima della media
=
n
i
i n x x /
i
stima della
varianza
) 1 /( ) (
2 2
=

n x x s
n
i
i
stima della stima della
deviazione
standard
) (
2
s s =
d i i d d l i deviazione standard relativa
percentuale (RSD%) o
coefficente di variazione
100 RSD% = x s
percentuale (CV%)
curva a:
media = 3.0
s 0 5
a
s = 0.5
RSD% = 10%
risultato = 3.0

0.5
curva b:
media = 3.0
b
media 3.0
s = 1.0
RSD% = 33%
risultato 3

1 risultato = 3

1
La precisione della stima a superiore a quella della stima b,
quindi il metodo che ha fornito il risultato a il pi preciso.
Controllare: Controllare:
precisione contenitori e distributori di volume
St bilit hi di i Stabilit apparecchi di misura
Eventuali contaminazioni dei reattivi e contenitori
Errori sistematici: esattezza (accuratezza)
Oltre agli ineludibili errori casuali, possono essere presenti errori
riproducibili che determinano uno scarto tra il valore vero della
quantit di analita presente ed il valore stimato espresso dalla
media=perdita di accuratezza quando viene denunciato uno
i i d i l i i ll di spostamento sistematico dei valori rispetto alla media.
Errori strumentali (errata calibrazione o taratura)
Errori operativi (utilizzo scorretto della strumentazione e delle
apparecchiature di laboratorio) pp )
Errori metodologici (procedure di analisi non adeguate)
Verifica periodica delle calibrazioni
Esperienza nella pratica di laboratorio
Utilizzo di materiali certificati