1. Inseriamo sulla prima riga il titolo che definisce il contenuto del foglio.
Poi inseriamo su unaltra riga i valori sperimentali della x e su quella successiva i valori
della y.
OSSERVAZIONE
Vedremo pi avanti come inserire dei dati memorizzati precedentemente in un file.
2. Nel caso in cui i dati della x e della y siano stati immessi su due righe consecutive, il
grafico pu essere ottenuto semplicemente selezionando dapprima i dati con il mouse
(oppure facendo clic sui numeri che contraddistinguono le due righe) e facendo poi clic
sullicona GRAFICO presente sotto il men principale.
Icona GRAFICO
Tipo di grafico
Siamo finalmente
arrivati in fondo !
pH
0.8
0.6
0.4
0.2
0
0
10
15
concentrazioni
20
25
2.
4.
lnP
Serie1
0.0031
0.0032
0.0033
1/T (K)
0.0034
0.0035
lnP
6.8
6.6
6.4
6.2
6
5.8
5.6
5.4
5.2
5
0.003
Serie1
calc
0.0031
0.0032
0.0033
1/T (K)
0.0034
0.0035
Dopo aver creato il grafico, facciamo dapprima clic sulla serie dei dati
allinterno del grafico, poi, tenendo premuto il pulsante destro del mouse e
senza spostarlo in modo da lasciare evidenziati i dati, scegliamo lopzione
FORMATO SERIE DATI. Comparir la seguente finestra di dialogo.
lnP
6.2
6
Serie1
5.8
5.6
5.4
5.2
5
0.003
0.0031
0.0032
0.0033
1/T (K)
0.0034
0.0035
1. Supponiamo che i dati siano stati memorizzati in un file dati e in formato solo testo (o
ASCII); inoltre supponiamo che sulla prima riga vi sia la x , in cui i singoli valori sono
separati con dei spazi (o da un TAB) e sulla riga successiva la y, ancora con valori separati
da spazi. La seguente figura mostra il contenuto del file dati allinterno di WORDPAD.
N.B.
Il separatore dei decimali pu essere una virgola
oppure un punto a seconda delle impostazioni
internazionali con cui settato il computer tramite
il pannello di controllo.
ANALISI DI REGRESSIONE
La tecnica di REGRESSIONE ci permette di ricavare la miglior curva passante attraverso i
punti sperimentali.
Un esempio tipico la ricerca di una funzione partendo da dati sperimentali affetti da
errore e si vuole ricavare la funzione che meglio approssima landamento generale dei dati
(es. dati provenienti dallo studio cinetico di una reazione chimica, oppure da misure di
tensione di vapore di una sostanza in funzione della temperatura, oppure da dati di
calibrazione di uno strumento: es. spettrofotometro UV-Vis, rifrattometro di Abbe,
trasduttore di temperatura, ecc.).
Un metodo per ricavare la migliore curva che approssimi landamento dei dati quello di
applicare il metodo dei minimi quadrati . Questa tecnica si basa sul principio che la
miglior curva-modello che interpola dei dati sperimentali, sia quella per la quale valga la
relazione :
^
2
w
(
y
y
)
i1 i i i min imo
n
ANALISI DI REGRESSIONE(segue)
dove wi sono detti pesi dei dati sperimentali (tengono conto della maggiore o minore
incertezza con la quale i dati sperimentali stessi sono noti), e
^
yi y i
^
yi
Sr
2 ( yi a b xi )
a
i
Sr
2 [( yi a b xi ) xi ]
b
i
0 yi a b xi
0 yi xi a xi b xi2
Ora , tenendo conto che
(1)
a n a
n a xi b yi
x a x
i
2
i
b xi yi
n xi yi xi yi
n xi2 ( xi )2
a y b x
dove y e x
(2)
1
( yi a b xi )2
n2
sa
s xi2
1
2
1
2 2
2
n
i
i
i
sb
s n
1
2
2
n xi xi
i
i
1
2 2
b b t X %,n s b
a a t X %,n s a
x0
y0 a
b
y0 y
s
1 1
s x0
_ 2
b m n
2
b xi x
(3)
x0 x0 t X %,n s x0
(4)
y0 a b x0
Applicando la teoria di propagazione degli errori, tenendo presente che le incertezze
associate con i parametri a e b non sono tra loro indipendenti, si pu dimostrare che
lincertezza associata col valore calcolato di y0, data da
sy
_ 2
n x0 x
1
2
n n x 2 x
i i i i
y0 y0 t X %,n s y0
(5)
(6)
6,95
7,58
8,81
8,33
9,96
7,24
4,26
10,84
4,82
5,68
8
13
9
11
14
6
4
12
7
5
8,14
8,74
8,77
9,26
8,1
6,13
3,1
9,13
7,26
4,74
Serie N.1
12
10
8
8
13
9
11
14
6
4
12
7
5
6,77
12,74
7,11
7,81
8,84
6,08
5,39
8,15
6,42
5,73
Serie N.1
12
10
8
6
4
2
0
10
15
Serie N.2
10
9
8
7
6
5
4
3
2
1
0
10
12
14
16
Serie N.3
14
12
10
8
y
6
4
2
0
0
10
x
15
3
0,5
1,237
1,125
0,118
serie 2
3
0,5
1,237
1,125
0,118
serie 3
3
0,5
1,236
1,124
0,119
residui
2,500000
2,000000
1,500000
1,000000
0,500000
0,000000
-0,500000 0
-1,000000
-1,500000
-2,000000
-2,500000
10
15
residui
1,500000
1,000000
0,500000
0,000000
-0,500000 0
10
15
serie n. 1 residui
-1,000000
-1,500000
-2,000000
-2,500000
residui
3,500000
3,000000
2,500000
2,000000
1,500000
1,000000
0,500000
0,000000
-0,500000 0
-1,000000
-1,500000
serie n. 1 residui
10
15
N.B. Per modificare il n. di cifre decimali con cui vengono visualizzati i parametri
allinterno dellequazione sufficiente fare dapprima clic col pulsante sinistro sulla
formula allinterno del grafico e poi , dopo aver premuto il pulsante destro,
selezionare la voce FORMATO ETICHETTE DATI.
b
sb
R2
Statistica F
La somma della regressione dei
quadrati
0,500091
0,117906
0,666542
17,98994
27,51
3,000091
1,124747
1,236603
9
13,76269
sa
s
Gradi di libert
La somma residua dei quadrati
Intervallo
5.0
9.0
12.6
17.3
21.0
24.7
Concen- 0
trazione
(pg/ml)
10
12
a)
b)
c)
d)
b)
Lerrore standard s uguale a 0.4328 (cella B7), mentre gli errori standard di a e
b sono, rispettivamente, 0.294936 (cella C17) e 0.04090 (cella C18).
Sul foglio viene inoltre riportata la miglior stima di a e b, relativamente al livello
di fiducia prescelto (95%) sotto forma di estremi di intervallo (inferiore 95%,
superiore 95% ). Per esprimere i valori dei parametri con associata lincertezza
espressa come , basta sottrarre al valore corrispondente allestremo superiore,
quello del coefficiente, ottenendo:
a = 1.52 0.76
b=1.93 0.11
N.B. Si poteva ottenere lo stesso risultato, applicando le formule
a a t95%,5 s a
b b t95%,5 s b
x0 x0 t X %,n s x0
C(ppm)
2.151
9.561
16.878
23.476
30.337
0.0660
0.2108
0.3917
0.5441
0.6795
a)
b)
Al l t cl
dove t lo spessore della celletta contenente la soluzione da misurare.
Ponendo y=Al , b=lt e x=cl, abbiamo che lequazione, che potrebbe correlare i dati
riportati in tabella , del tipo
y=bx
Tuttavia, osservando soltanto i dati riportati in tabella, non possiamo affermare con
certezza che, a concentrazione 0, lassorbanza sia nulla. Potrebbe non esserlo a causa
di qualche influenza da parte della matrice ovvero della soluzione contenente
larsenico, oppure a un offset sistematico dovuto a una non perfetta calibrazione dello
strumento.
A tale scopo conviene dapprima supporre che la curva che rappresenta meglio i dati
sia una retta che non passi per lorigine, ovvero
y=a+bx
inf x t X %,n s _
sup x t X %,n s _
x m
s n
a
2
X%
1
100
sa
t tcritico
Dalla figura vista precedentemente, che riporta la curva di
distribuzione di Student in funzione di t, ci significa che siamo dentro
larea, per cui vi una probabilit di X% che il risultato ovvero che a
sia uguale a 0
t tcritico
Siamo al di fuori dellarea, per cui vi una probabilit di 100-X% (5%
se X%=95) che a sia diversa da 0.
REGRESSIONE POLINOMIALE
Nellelaborare i dati sperimentali, vi sono delle situazioni in cui essi sono meglio rappresentati da
una curva piuttosto che da una retta. Ad esempio, la dipendenza di alcune grandezze fisiche da T
(es. calori molari (intervallo di T ristretto), resistenza di una lega , tensione di una termocoppia,
ecc.) pu essere rappresentata meglio da una equazione polinomiale di 2 o 3 grado piuttosto che
da una retta.
La tecnica dei minimi quadrati, vista precedentemente per ricavare la migliore stima dei
coefficienti a e b di una retta, pu essere utilizzata anche per ricavare i coefficienti di una
equazione polinomiale ovvero rendendo minima la relazione
n
wi ( yi yi ) 2 min imo
i 1
in cui
yi
uguale a
REGRESSIONE POLINOMIALE(segue)
Uguagliando a 0 le equazioni e riordinando, otteniamo il seguente sistema di equazioni:
a n b xi c xi2 yi
a xi b xi2 c xi3 xi yi
a xi2 b xi3 c xi4 xi2 yi
dove tutte le sommatorie vengono eseguite per i che va da 1 al n. totale di dati n .
Excel permette di ricavare la miglior stima dei parametri a,b e c in modo semplice utilizzando
gli strumenti visti precedentemente per la retta , purch le nostre misure soddisfino le seguenti
condizioni:
- Le incertezze su y siano tutte uguali
- le incertezze su y siano normalmente distribuite
- le incertezze sulle x siano trascurabili
- gli errori sistematici su x e y siano trascurabili
ln p a
H vap
R T
s y s p s p
p
p
i
wi
sy 2
i
p2
wi
s p2
sy
2
(
y
x
)
i
i
2
Qualora le incertezze sui valori misurati di y (es. sp), sono note, possibile
ricavare il valore esatto dei pesi wi. Altrimenti il problema ancora
risolvibile, in quanto noi siamo interessati, pi che al valore assoluto di wi,
ad avere un valore relativo che ci permetta di stimare il diverso peso da dare
a ciascun dato, ma che non altera il rapporto tra i pesi dei dati.
Ad esempio, ponendo sp=1, avremo che i pesi wi saranno scalati tutti della
stessa quantit, per cui il rapporto tra i pesi relativi tra i vari dati non cambia.
w x w y w x w x y
i
2
i
w w x y w x w y
i
D wi wi xi2 wi xi
i
i
i
i
sa sw i
nD
, pu essere ricavato
sb
s w wi
i
nD
dove
n
wi wi xi yi wi xi wi yi
2
n2
i
i
i
sw
wi wi yi2 wi yi i
w
D
i
i i i
1
2
D wi wi xi2 wi xi
i
i
i
1
2
s2
y y0e
kt
ln y ln y0 kt
1
dY
dy
y y0e
kt
ln y
w =y 2
0,892061
-0,11422
0,795772
0,821173
-0,19702
0,674326
0,753583
-0,28292
0,567887
0,682304
-0,38228
0,465538
0,623862
-0,47183
0,389204
0,526976
-0,6406
0,277703
0,494243
-0,70473
0,244277
0,460279
-0,77592
0,211857
0,395703
-0,92709
0,156581
0,360977
-1,01894
0,130305
10
0,315967
-1,15212
0,099835
11
0,282725
-1,26328
0,079933
12
0,262755
-1,33653
0,06904
13
0,238862
-1,43187
0,057055
14
0,201951
-1,59973
0,040784
15
0,196217
-1,62853
0,038501
16
0,178643
-1,72237
0,031913
17
0,166647
-1,79187
0,027771
18
0,145914
-1,92474
0,021291
19
0,132065
-2,02446
0,017441
20
ln y
w =y 2
0,118754
-2,1307
0,014103
21
0,12423
-2,08562
0,015433
22
0,099406
-2,30854
0,009882
23
0,088856
-2,42073
0,007895
24
0,076953
-2,56456
0,005922
25
0,093996
-2,36451
0,008835
26
0,075862
-2,57884
0,005755
27
0,084567
-2,47022
0,007152
28
0,048474
-3,02672
0,00235
29
0,066402
-2,71203
0,004409
30
0,028925
-3,54304
0,000837
31
0,046152
-3,07582
0,00213
32
0,045905
-3,08118
0,002107
33
0,052562
-2,94575
0,002763
34
0,029352
-3,52839
0,000862
35
0,022086
-3,81282
0,000488
36
0,031475
-3,45856
0,000991
37
0,018558
-3,98688
0,000344
38
0,027818
-3,58207
0,000774
39
0,003874
-5,55353
1,5E-05
40
0,0081
-4,81585
6,56E-05
41
0,00994
-4,61121
9,88E-05
43
0,011953
-4,42681
0,000143
44
0,01139
-4,475
0,00013
45
0,006825
-4,98721
4,66E-05
46
0,03104
-3,47247
0,000963
47
OSSERVAZIONE
E possibile utilizzare la MACRO per eseguire i calcoli su altri dati, semplicente cancellando
il contenuto del foglio ed immettendo i nuovi dati da elaborare.
La voce Minimi quadrati pesati scomparir automaticamente dal men STRUMENTI, una
volta che abbiamo chiuso il foglio di lavoro minimipesati.xls.
Residui
6.6
0.02
6.4
0.015
6.2
0.01
0.005
sper
calc
5.8
5.6
residui
lnP
6.8
0
-0.0050.003
Serie1
0.0031
0.0032
0.0033
-0.01
5.4
-0.015
5.2
-0.02
5
0.003
1/T
0.0031
0.0032
0.0033
0.0034
0.0035
1/T (K)
0.0034
0.0035
B
y A x C
x
dove
Velocit
(ml/min)
Altezza piatto
(mm)
3,4000
9,59
7,1
5,29
16,1
3,63
20
3,42
23,1
3,46
34,4
3,06
40
3,25
44,7
3,31
65,9
3,5
78,9
3,86
96,8
4,24
115,4
4,62
120
4,67
Nella casella Imposta cella ci va messo il riferimento alla cella contenente la somma
dei quadrati dei residui
Visto che vogliamo rendere minima tale somma, scegliamo lopzione Uguale a Min
La minimizzazione va fatta rispetto ai parametri (A, B , C) contenuti nelle relative celle.
Pertanto nel campo Cambiando le celle ci va un riferimento alle celle contenenti i
parametri suddetti.
In altri termini abbiamo indicato al programma di rendere minima la somma dei
quadrati dei residui variando i valori dei parametri A ,B e C.
E sufficiente fare clic su RISOLVI per ottenere i valori ottimali dei parametri.
Una volta eseguito il calcolo, conviene visualizzare anche il grafico dei residui
e quello contenente sia i dati sperimentali che quelli calcolati.
Se vogliamo avere anche una stima delle incertezze sui parametri, possiamo
usare la MACRO Solver Aid disponibile tramite lesempio allegato
solveraid.xls .
Una volta caricato il foglio solveraid.xls, selezioniamo la voce Solver Aid
presente allinterno del men STRUMENTI e immettiamo le informazioni che
ci vengono richieste dal programma. Alla fine sul foglio di lavoro, accanto ai
parametri verranno aggiunte le deviazioni standard associate a ciascun
parametro; inoltre verr visualizzata la deviazione standard sy . accanto alla
cella SSR (somma dei quadrati dei residui).
10 stadio :
E stato eseguito il fitting
soltanto rispetto alla seconda
parte del grafico, ricavando
dei valori solo per a2 e k2 e
lasciando nulli a1 e k1.
30 stadio :
E stato eseguito il fitting
rispetto a tutti e quattro i
parametri, i cui valori sono
stati ricavati
precedentemente.
La seguente tabella riporta i valori dei coefficienti ottenuti dopo il terzo stadio
con la relativa incertezza, ricavata mediante la MACRO Solver Aid.
I risultati ottenuti sono ottimi.
coeff. Esatti
coeff iniziali
incertezze
a1
8,999943784
5,845E-06
k1
2,000011418
1,57037E-06
a2
0,02
0,020054365
6,15801E-06
k2
0,5
0,500834105
9,47348E-05
[ H ] ] [OH ]
e
[ H ]2 ka1
a2
D
[ H ] k a1 k a 2
a1
D
k k k
a 0 a1 a 2 a 3
D
e
D [ H ]3 [ H ]2 ka1 [ H ] ka1 ka 2 ka1 ka 2 ka 3
pH
10
8
spe
6
4
2
0
0
50
100
150
Vb (ml)
200
250
300
pH
10
8
spe
calc
6
4
2
0
0
50
100
150
Vb (ml)
200
250
300
pH
k1= 0.1
k2=0.001
k3=5.74e-13
spe
calc
6
4
SSR=46173.47
2
0
0
50
100
150
200
250
300
Vb (ml)
pH
spe
calc
6
4
2
0
0
50
100
150
Vb (ml)
200
250
300
I (intensit relativa)
conc.(p.p.m.)
62
115
10
160
15
200
20
233
25