Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2017 / 2018
Laboratorio
del corso di
STATISTICA
Donata Bonino
donata.bonino@polito.it
Parte II:
regressione multivariata
2
Regressione lineare ai minimi quadrati
multivariata
che minimizzi la somma dei quadrati degli errori tra osservazioni e stime.
m
f ( a, b) = [
∑ yi − (a1 x1i + a2 x2i + ... + an xni + b) ] 2
i= 1
variabile
dipendente
variabili
indipendenti
ATTENZIONE!
In questo caso, però, si richiede che le variabili indipendenti Xi
siano tutte correlate con Y, ma tra loro mutuamente indipendenti.
4
Regressione lineare ai minimi quadrati:
valutazione del modello
5
Regressione lineare ai minimi quadrati:
analisi dei residui
E [ Ei ] = 0
Var[ Ei ] = σ 2
6
Analisi multivariata
7
Analisi multivariata
Esercizio:
Si sono raccolti informazioni sull’età, il peso e l’altezza dei ragazzi di una
scuola media e superiore. Si vuole descrivere il peso in funzione degli altri
parametri. Ovviamente, maschi e femmine hanno uno sviluppo fisico
diverso.
I dati sono contenuti nel data set HeightWeight.
Verificare eventuali relazioni per mezzo dell’analisi di regressione.
8
Sia nel caso del gruppo femminile (a
sinistra) che del gruppo maschile (a
destra), la tabella di correlazione mostra
come età e altezza (var. indipendenti)
siano entrambi correlati con la var.
dipendente peso (cerchio rosso), ma
anche tra di loro (cerchio blu)
9
Correlazione lineare… cont
Possiamo anche richiedere la matrice dei grafici di dispersione:
10
Esercizio… analisi di regressione
Confrontiamo il modello in cui il peso dipende solo dall'altezza (modello
univariato) con il modello multivariato in cui utilizziamo entrambe le variabili
indipendenti.
11
Esercizio… cont
Per le femmine, il coefficiente R2
passa da 0.5642 (modello
univariato) a 0.5884 (modello
multivariato). Per entrambi i
modelli i residui hanno varianza
non costante (anche se i dati
sono ben concentrati).
Modello
univariato
(residui
normali)
12
Modello multivariato
(dati femminili)
I residui hanno
normalità più dubbia
13
Analogamente per i
maschi, dove R2 passa
da 0.6245 (modello
univariato) a 0.6616
(modello multivariato).