Sei sulla pagina 1di 12

ANALISI DELLA VARIANZA

(a due o pi fattori)
APPLICAZIONI ED ESEMPI PER IL CORSO DI -MARKETING
A.A. 2009/10

DOCENTE: LUCIA BALDI

ANALISI DELLA VARIANZA MULTIFATTORIALE


La tecnica dellANOVA pu essere estesa allanalisi di un numero maggiore di fattori. La
variabile analizzata sempre una sola (ANOVA univariata), ma il numero di fattori (o criteri
di classificazione, o vie) che distinguono i diversi campioni maggiore di 1. Si parla quindi
di ANOVA univariata multifattoriale.

MODELLO LINEARE DELLA ANOVA A DUE FATTORI


(con repliche):
y ijk i j ij eijk

dove: i=1,, p;

j=1,, q

k=1,, n (repliche)

()ij rappresenta linterazione tra il fattore ed il fattore ed indica se leffetto di un


fattore sulla variabile dipende dagli altri fattori, o meglio, dai livelli degli altri fattori.

Con 3 fattori si hanno:


- gli effetti principali dei 3 fattori (, , ),
- le 3 interazioni di primo ordine (, , ) causate dalleffetto dei fattori due a due
- una interazione di secondo ordine (), determinata dalleffetto congiunto dei tre
fattori.
Quando si considerano contemporaneamente molti fattori, il numero delle loro
combinazioni di primo ordine e di ordine superiore cresce in modo rapido; diventa
difficile analizzare tutte le interazioni. Per esempio, con 4 fattori (, , , ) nel modello
additivo dellanalisi della varianza con interazione, per ogni singolo valore Xijk
possibile stimare gli effetti di 17 quantit.

Nel modello ANOVA a due fattori con repliche, la devianza totale pu essere
suddivisa in 4 devianze:
- devianza del fattore ;
- devianza del fattore ;
- devianza dovuta all'effetto dell'interazione ;
- devianza d'errore o residuo.
Esse ed i loro gdl godono della propriet additiva:
Devianzatotale= Devianza+ Devianza+ Devianza()+ Devianzatotale errore
Dalle devianze possibile risalire alle varianze dividendo per i relativi gradi di libert:

DEVIANZE

GdL (Gradi di Libert)


pqn-1
p-1
q-1
(p-1)*(q-1)
(n-1)*(p*q)

Devianzatotale
Devianza
Devianza
Devianza()
Devianzatotale errore

Nel modello ANOVA a due fattori con repliche, si possono verificare 3 ipotesi distinte
ed eseguire i tre test corrispondenti.
1) Si verifica l'ipotesi nulla di nessuna differenza tra le medie del fattore :
H0: 1= 2= 3=........= p
contro l'ipotesi alternativa:
H1 : non tutte le medie sono tra loro uguali
2) Si verifica l'ipotesi nulla di nessuna differenza tra le medie del fattore
H0: 1= 2= 3=........= q
contro l'ipotesi alternativa
H1: non tutte le sono tra loro uguali
3) Si verifica l'ipotesi nulla di nessuna interazione tra i fattori e ai vari livelli
3

H0:()ij = 0 per ogni i e j


contro l'ipotesi alternativa
H1: :()ij 0 per almeno un ij
Le tre ipotesi vengono verificate mediante tre test F costruiti con le diverse varianze
utilizzate seguendo il criterio rappresentato nella seguente tabella:
Fonti di
Variabilit
FdV

DEVIANZE

GDL

VARIANZE

SS()

p-1

MQ()

MQ()/ MQ()

SS()

q-1

MQ()

MQ()/ MQ()

()ij

SS()

(p-1)*(q-1)

MQ()

MQ()/ MQ()

(nij
yij

SS()
SSTOT

1)*(p*q)
n*p*q-1

MQ()
MQTOT

Confrontando i valori di F calcolati con i valori di F tabulati con i relativi gradi di libert,
siamo in grado di rifiutare (o non rifiutare) le ipotesi nulle a seconda che il valore calcolato
superi (o sia inferiore) al valore critico in base ad un prefissato livello di significativit.

applicazione della Analisi della varianza a 2 fattori con EXCEL


FILE:esanova2.xls
Si vuole studiare se la produzione di una certa proteina da parte di colture cellulari
differente in base a diversi terreni di crescita e a tre diversi livelli di temperatura: alta,

Terreno di
coltura

media, bassa:

alta
5.02
5.08
7
11.05

1
2
3
4

Temperatura
media
6.05
6.08
8.05
14.01

bassa
8.03
8.06
10.02
16.08

OUTPUT DI EXCELL
Analisi varianza: a due fattori senza replica
RIEPILOGO Conteggio Somma

Media

Varianza

3 0,798611 0,266204 0,004071

3 0,806944 0,268981 0,003955

3
4

3 7,754861 2,584954 14,62113


3 1,718056 0,572685 0,011165

alta
media
bassa

4 7,885417 1,971354 11,25268


4 1,429861 0,357465 0,024319
4 1,763194 0,440799 0,025283

ANALISI VARIANZA
Origine della
variazione
Righe
Colonne
Errore

SQ
11,232
6,606
22,675

Totale

40,512

gdl
3
2
6

MQ
3,744
3,303
3,779

Valore di
F
significativit
0,991
0,458
0,874
0,464

F crit
4,757
5,143

11

Dai risultati si evince che entrambi i fattori non sono significativi nella produzione di
proteine perch i valori dei due test F calcolati sono inferiori ai relativi valori critici.

applicazione della Analisi della varianza a 2 fattori (con ripetizioni)


con EXCEL
FILE:esanova2r.xls
Si vuole verificare se insetti adulti della stessa specie che vivono in 4 localit differenti (A,
B, C, D) hanno differenze significative nelle loro dimensioni, considerando pure che dalla

STAGIONE

primavera all'autunno continuano ad aumentare.


LOCALITA'
localit A localit B localit C localit D
Primavera
45
63
70
48
50
57
65
52
Estate
57
77
74
60
65
69
80
56
Autunno
70
82
88
70
79
75
82
77

OUTPUT DI EXCEL:
Analisi varianza: a due fattori con replica
RIEPILOGO localit A localit B localit C localit D Totale
Primavera

Conteggio
Somma
Media
Varianza

2
95
47,5
12,5

2
120
60
18

2
135
67,5
12,5

2
100
50
8

8
450
56,25
80,5

2
122
61
32

2
146
73
32

2
154
77
18

2
8
116
538
58
67,25
8 85,07143

2
149
74,5
40,5

2
157
78,5
24,5

2
170
85
18

2
8
147
623
73,5
77,875
24,5 38,69643

6
366
61
162,8

6
423
70,5
87,1

6
459
76,5
71,1

Estate

Conteggio
Somma
Media
Varianza
Autunno

Conteggio
Somma
Media
Varianza
Totale

Conteggio
Somma
Media
Varianza

6
363
60,5
122,3

ANALISI VARIANZA
Origine della
variazione
Campione
Colonne
Interazione
In

SQ
1870,75
1084,125
97,25
248,5

Totale

3300,625

gdl
2
3
6
12

MQ
935,38
361,38
16,21
20,71

Valore di
significativit
F
45,17
0,00000
17,45
0,00011
0,78
0,59948

F crit
3,885
3,490
2,996

23

Con i risultati dell'esempio, si possono trarre le conclusioni relative ai tre test F:


1 - nelle 4 localit, le dimensioni medie degli insetti sono significativamente differenti;
2 - tra primavera, estate ed autunno le dimensioni medie degli insetti variano
significativamente;
3 - non esiste interazione: nelle 4 localit le dimensioni medie degli insetti variano con
intensit simile durante le stagioni.

applicazione della Analisi della varianza a 2 fattori (con ripetizioni)


con SPSS
FILE:esanova2r.sav
stagione
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3

localita
1
1
2
2
3
3
4
4
1
1
2
2
3
3
4
4
1
1
2
2
3
3
4
4

crescita
45
50
63
57
70
65
48
52
57
65
77
69
74
80
60
56
70
79
82
75
88
82
70
77

N.B. La disposizione dei dati in SPSS differente da


quella di Excel! In questo caso, difatti, i valori della
variabile dip. devono essere predisposti in una stessa
colonna.

OUTPUT DI SPSS:

Analisi della varianza univariata


Fattori tra soggetti

stagione

localit

1
2
3
1
2
3
4

Etichetta
di valore
primavera
estate
autunno
a
b
c
d

N
8
8
8
6
6
6
6

Statistiche descrittive
Variabile dipendente: crescita
stagione
primavera

estate

autunno

Totale

localit
a
b
c
d
Totale
a
b
c
d
Totale
a
b
c
d
Totale
a
b
c
d
Totale

Media
47,50
60,00
67,50
50,00
56,25
61,00
73,00
77,00
58,00
67,25
74,50
78,50
85,00
73,50
77,88
61,00
70,50
76,50
60,50
67,13

Deviazione
std.
3,536
4,243
3,536
2,828
8,972
5,657
5,657
4,243
2,828
9,223
6,364
4,950
4,243
4,950
6,221
12,759
9,333
8,432
11,059
11,979

N
2
2
2
2
8
2
2
2
2
8
2
2
2
2
8
6
6
6
6
24

Test degli effetti fra soggetti


Variabile dipendente: crescita
Somma dei
quadrati
Media dei
Sorgente
Tipo III
df
quadrati
Modello
111190,500 a
12
9265,875
stag
1870,750
2
935,375
local
1084,125
3
361,375
stag * local
97,250
6
16,208
Errore
248,500
12
20,708
Totale
111439,000
24
a. R quadrato = ,998 (R quadrato corretto = ,996)

F
447,447
45,169
17,451
,783

Sig.
,000
,000
,000
,599

Test post-hoc
stagione
Confronti multipli
Variabile dipendente: crescita
Scheffe

Differenza fra
medie (I-J)
Errore std.
-11,00*
2,275
-21,63*
2,275
estate
11,00*
2,275
-10,63*
2,275
autunno
21,63*
2,275
10,63*
2,275
Basato sulle medie osservate.
*. La differenza fra medie significativa al livello ,05.
(I) stagione
primavera

(J) stagione
estate
autunno
primavera
autunno
primavera
estate

Sig.
,002
,000
,002
,002
,000
,002

Intervallo di confidenza
95%
Limite
Limite
inferiore
superiore
-17,34
-4,66
-27,97
-15,28
4,66
17,34
-16,97
-4,28
15,28
27,97
4,28
16,97

Sottoinsiemi omogenei
crescita
Scheffe a,b
stagione
primavera
estate
autunno
Sig.

N
8
8
8

1
56,25

Sottoinsieme
2

67,25
77,88
1,000

1,000
1,000
Sono visualizzate le medie per i gruppi di sottoinsiemi
omogenei.
Basato sulla somma dei quadrati Tipo III
Il termine di errore Media dei quadrati(Errore) = 20,708.
a. Utilizza dimensione campionaria media armonica =
8,000
b. Alfa = ,05

__________________________________________________________________
Non si distinguono gruppi significativamente diversi da altri

10

localit
Confronti multipli
Variabile dipendente: crescita
Scheffe

Differenza fra
medie (I-J)
Errore std.
-9,50*
2,627
-15,50*
2,627
,50
2,627
b
9,50*
2,627
-6,00
2,627
10,00*
2,627
c
15,50*
2,627
6,00
2,627
16,00*
2,627
d
-,50
2,627
-10,00*
2,627
-16,00*
2,627
Basato sulle medie osservate.
*. La differenza fra medie significativa al livello ,05.
(I) localit
a

(J) localit
b
c
d
a
c
d
a
b
d
a
b
c

Sig.
,027
,001
,998
,027
,212
,020
,001
,212
,001
,998
,020
,001

Intervallo di confidenza
95%
Limite
Limite
inferiore
superiore
-18,00
-1,00
-24,00
-7,00
-8,00
9,00
1,00
18,00
-14,50
2,50
1,50
18,50
7,00
24,00
-2,50
14,50
7,50
24,50
-9,00
8,00
-18,50
-1,50
-24,50
-7,50

Sottoinsiemi omogenei (i sottoinsiemi omogenei indicano quali gruppi hanno


medie non statisticamente differenti)
crescita
Scheffe a,b
Sottoinsieme
1
2
6
60,50
6
61,00
6
70,50
6
76,50
,998
,212
Sono visualizzate le medie per i gruppi di sottoinsiemi
omogenei.
Basato sulla somma dei quadrati Tipo III
Il termine di errore Media dei quadrati(Errore) = 20,708.
a. Utilizza dimensione campionaria media armonica
= 6,000
b. Alfa = ,05
localit
d
a
b
c
Sig.

__________________________________________________________________
I gruppi d ed a sono significativamente diversi dagli altri

11

BIBLIOGRAFIA
A. Camussi, F. Mller, E. Ottaviano, M. Sari Gorla, METODI STATISTICI PER LA
SPERIMENTAZIONE BIOLOGICA, IIa ed., Zanichelli, 1995.
R. J. Freund, W. J. Wilson, Metodi Statistici, ed. PICCIN, 1997.

12