Esempio
p la pressione
p
arteriosa in funzione
f
dellet
= + x
in cui e sono i parametri che definiscono la retta
= intercetta
i t
tt , punto
t dove
d
la
l retta
tt iincontra
t llasse d
delle
ll y
= coefficiente di regressione,
indica di quanto aumenta la y
per laumento di una unit delle x,
quindi un numero
che assume la dimensione delle y e pu variare tra( - e +)
% di umidit relativa
mg di perdita peso
y 9.0
12
30
43
53
63
76
85
93
8.1
7.0
6.0
5.8
5.5
5.0
4.2
3.5
% di umidit relativa
12
30
43
53
63
76
85
93
mg di perdita peso
90
9.0
81
8.1
70
7.0
60
6.0
58
5.8
55
5.5
50
5.0
42
4.2
35
3.5
Perdita di peso
Tribolium Confusum
mg
10
8
6
4
2
0
0
10 20 30 40 50 60 70 80 90 100
% umidit relativa
a , b
Per stimare i parametri si interpola la retta con il metodo dei minimi quadrati,
quadrati
cio cercando il valore che minimizza lo scarto quadratico tra un generico punto
y e la retta di regressione
( yi- i )2= minimo
( yi- i )2= [ yi- ((a+ bxi)]2= ( yi - a - b xi)
2na- 2y
yi +2b xi= 0
na = yi - b xi
a= yi - b xi
n
n
a= y - bx
2b xi2 - 2xi yi + 2a xi = 0
b xi2 = xi yi - a xi
Sostituisco a
b (x
b=
( i -x)(y
)( i- y ) = codevianza
d
((xy))
( xi - x )2
devianza x
a= y - b
bx
b= (xi -x)(yi- y )2 =
( xi - x )2
codevianza (xy)
devianza x
La codevianza serve nello studio di due variabili: stima come X e Y variano congiuntamente,
rispetto al loro valore medio. E' definita come la sommatoria degli n prodotti degli scarti di X
rispetto alla sua media e di Y rispetto alla sua media:
70
yi
Y
i
y
y
60
50
40
30
0
10
20
30
40
Il test si basa sulla ipotesi che non ci sia regressione lineare semplice, cio che non
esista
i t regressione
i
e quindi
i di che
h il coefficiente
ffi i t di regressione
i
sia
i parii a zero.
Per verificare questa ipotesi si pu effettuare un test F partendo dalla scomposizione della devianza:
(yi
i ) = (yi y
i y)
Y
) ( Y
2
2
(y
(yi y
y ) = (y
(yi Yi ) + (( Yi y
y)
d i
devianza
totale
(yi y
y )2
Dovuta a
regressione
( Y i y
(Y
y) ?
??
Intorno a
regressione
2
(yi Y i )
f
formule
l di calcolo
l l
differenza
varianza
i
n-1
yi2 (y )2
n
[ xi yi -(xi yi) /n]
2
2
xi -(xi) /n
gdl
dl
S2 reg
n-2
n
2
S2 e
s2reg / s2 e
codevianza(xy)2
devianza (x)
RIFIUTARE O ACCETTARE H0
La Varianza della regressione il rapporto tra devianza della regressione e i suoi gdl
La Varianza residua o derrore il rapporto tra devianza intorno e i suoi gdl
Se lipotesi nulla vera, la varianza derrore e la varianza della regressione sono simili.
Se esiste regressione (Rifiuto H0), la varianza della regressione significativamente maggiore di
quella d
derrore
errore.
l rapporto tra queste due varianze determina il valore del test F con gdl 1 e n-2
se il valore di F calcolato inferiore al valore tabulato,
tabulato allora si accetta ll'ipotesi:
ipotesi: i dati non mi indicano
una regressione statisticamente significativa ( non differisce dallo 0)
.
se il valore calcolato di F supera il valore tabulato, allora si rifiuta l'ipotesi nulla : la regressione lineare
tra le due variabili statisticamente significativa ( differisce significativamente da 0)
0).
TEST DIPOTESI
H0: = 0
H1: 0
Il test t il rapporto tra il valore del coefficiente angolare b ed il suo errore standard Sb.
Dove
e
Nella verifica della significativit della regressione uguale a 0
Limiti di confidenza di b
b t n-2,a Sb
Il coefficiente di determinazione
Assunzioni
Queste assunzioni ovviamente non sono necessarie per la stima puntuale dei parametri ma per la costruzione dei
tests statistici e per la definizione degli intervalli di confidenza.
Una volta stimati i parametri della retta necessario valutare se questa pu rappresentare la relazione tra le due
variabili
Si definisce
d f
residuo
d i-esimo:
Si p
pu verificare
f
che: