Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
(cap. 6) A
M
D
Marcello Gallucci
marcello.gallucci@unimib.it
Lezione 10
Modello Lineare Generale
B
Le variabili A e B sono associate
in maniera perfetta, eppure la
loro correlazione è solo 0.2
La correlazione/regressione è in
grado di quantificare solo le
relazioni lineari
A
Relazioni non lineari
Incrementa qui
Incrementa qui
Decrementa qui
Incrementa qui
Incrementa qui 0
Discrepanza osservati-
predetti
y i =ab yx x i predetti
y i − y i =y i − ab yx x i errore
y i = ab yx x i y i − y i
retta errore
Assunzione 2: Omoschedasticità
Stessa ampiezza
Differente
ampiezza
Assunzione 2: Omoschedasticità
Stessa ampiezza
Differente
ampiezza
Assunzione 3: Normalità dei residui
y i − y i =y i − ab yx x i
Calcolare i residui
y i − y i =y i − ab yx x i
Calcolare i residui
Sembrano
distribuiti a
caso
Possibili violazioni
Non sembrano
distribuiti a caso
Esempi VI Continua
Non Sembrano
distribuiti a caso
Possibili violazioni
Presenza di casi
estremi “outlier”
Outlier
E' possibile testare l'ipotesi nulla che la distribuzione dei residui sia
normale: test di Kolmogorov-Smirnov
Il test di Kolmogorv-
Smirnov testa la differenza
tra la distribuzione dei
residui e una normale
gaussiana
Test di Normalità
E' possibile testare l'ipotesi nulla che la distribuzione dei residui sia
normale: test di Kolmogorov-Smirnov
Il test di Kolmogorv-
Smirnov testa la differenza Se il test NON è
tra la distribuzione dei significativo, l'assunzione
residui e una normale di normalità è rispettata
gaussiana
Normalità dei residui
E' possibile testare l'ipotesi nulla che la distribuzione dei residui sia
normale: test di Kolmogorov-Smirnov
Il test di Kolmogorv-
Smirnov testa la differenza
tra la distribuzione dei
residui e una normale
gaussiana
Verifica assunzioni
Per poter affermare che i risultati della nostra regressione/ANOVA sono validi,
è necessario che i dati rispettino le assunzioni
Nella prossima lezione affronteremo dei possibili rimedi alla violazione delle
assunzioni
Riepilogo
Y ' i= f Y i
Esempi
2
Y ' i=Y i Y ' i=ln Y i Y ' i=1/Y i
Normalizzazione
Y ' i=lnY i
Scelta della Trasformazione Normalizzante
Calcolo nuova
variabile
Nuova trasformazione
Test di normalità NO
SI
Regression/ANOVa
Trasformazione normalizzante
1.Harvard University
2.Stanford University
Ranghi
3.Massachusetts Institute of Technology (MIT)
4.University of California, Berkeley
5.University of Cambridge
Aumentare di una unità
6.California Institute of Technology
significa scendere di un
posto nella classifica 7.Princeton University
8.Columbia University
9.University of Chicago
Ma la distanza tra le 10.University of Oxford
posizioni non è
necessariamente costante
Trasformazione in ranghi
VD Ranghi
Trasformazione in ranghi
Ranghi
VD
Trasformazione in ranghi
VD Ranghi
Test non parametrici
Consta nel calcolare la correlazione (quella che conosciamo) sui ranghi (R)
delle variabili
COV RY , R X
i=
STD RY ∗STD R X
Indica il grado di monotonicità
della relazione tra due variabili
Regressione non-parametrica
ttest N −1
U=
ttest 2
1
Indica il grado differenza delle
distribuzioni di Y tra due gruppi
Kruskal-Wallis