Sei sulla pagina 1di 93

Analisi della Varianza

(ANOVA)
Corso di laurea in Scienze e Tecniche Psicologiche
(classe L-24)(A-K)
2017-2018
Caterina Primi
Dipartimento NEUROFARBA
Sezione di Psicologia
primi@unifi.it
• Un insegnante deve decidere quale
metodo di insegnamento adottare. Ad
un primo gruppo propone un metodo di
studio tradizionale, ad un secondo un
metodo che prevede un supporto
individuale nello studio, ad un terzo un
metodo che comporta l’uso del
computer. Al termine dell’anno
scolastico rileva la votazione ottenuta
da ciascun allievo.
Indicare la variabile dipendente e la variabile
indipendente con relative scale di misura
• Sono stati selezionati 60 studenti
maschi di 20 anni e sono stati assegnati
casualmente a tre diverse condizioni
sperimentali definite in base alla
deprivazione di sonno (24 ore, 36 ore e
48 ore). Al termine di ciascuna fase
veniva rilevato attraverso un test il
grado di coordinazione dei movimenti di
ciascun soggetto.
Indicare la variabile dipendente e la variabile
indipendente con relative scale di misura
Analisi della varianza

• Tecnica di analisi che permette di valutare gli


effetti su una variabile dipendente (quantitativa) di
una o più variabili esplicative qualitative dette
fattori.
• L’analisi della varianza è basata sul rapporto tra
varianze, denominato test F in onore di Fischer e
utilizza la distribuzione F
Analisi della varianza

• Scopo del Modello Lineare Generale è


– studiare la dipendenza in media di una
variabile aleatoria Y da k variabili
esplicative X:
• ANALISI DELLA VARIANZA
– Variabili esplicative qualitative
• ANALISI DELLA REGRESSIONE
– Variabili esplicative quantitative
Analisi della varianza
• Modello di previsione

Y=  + X +

– Il punteggio che osserviamo per ogni soggetto


sia dato
• da una costante () il livello generale della variabile
dipendente,
• dall’effetto () di una variabile indipendente (X)
• da un errore ()
Analisi della varianza
• Modello di previsione

Y=  + X +

– Possiamo avere 2 livelli della variabile x che


costituiscono dei gruppi dei soggetti
• Ogni punteggio Y dipende dal gruppo cui
appartiene il soggetto (più un errore)
– Si vuole prevedere il punteggio di ogni soggetto
in base al gruppo cui appartiene
Analisi della varianza

• L’analisi della varianza consente di valutare


l’importanza delle diverse fonti di
variazione nella variabilità osservata di un
esperimento.
• Le fonti di variazione possono essere:
– Sistematiche (sotto il controllo dello
sperimentatore)
– Casuali (variabilità biologica, condizioni
ambientali, errore di misura ecc.)
Analisi della varianza

• Fonti di variazioni sistematica


– variabili indipendenti (o criteri di
classificazione o fattori)
– I fattori assumono più valori detti livelli
– ciascuno dei k campioni si distingue per almeno
una modalità-livello delle variabili indipendenti
 su ciascun campione viene misurata la
variabile dipendente oggetto della ricerca
Analisi della varianza

• Esempi:
– Fattore reddito su 3 livelli
(basso, medio, alto)
k=3 campioni, uno per classe di reddito
– Fattore età su 4 livelli (3, 5, 8 e 11 anni)
k=4 campioni, uno per classe di età
Analisi della varianza

• Abbiamo k campioni (K livelli della variabile


indipendente) ognuno costituito da nk
soggetti
– Non è necessario che tutti i campioni abbiano la
stessa numerosità
• Per ciascun soggetto appartenente ai k
campioni abbiamo una misura della variabile
dipendente
Analisi della varianza

• ANOVA ad un fattore
– Si valuta quanto della variabilità riscontrata nei
dati osservati (variabile dipendente ) è
attribuibile alla variabile indipendente e quanta
alle variabili non controllate/ controllabili della
ricerca
Analisi della varianza

• L’analisi della varianza serve a verificare se


i punteggi osservati dipendono
dall’appartenenza a gruppi diversi
– Se la varianza spiegata nei punteggi Y
dall’appartenenza ai gruppi (varianza tra
gruppi) è significativamente maggiore della
varianza di errore
• Si conclude che i punteggi osservati dipendono
dall’appartenenza al gruppo e che le medie sono
diverse
Analisi della varianza

• La varianza tra gruppi riflette l’effetto della


variabile indipendente
• La varianza entro i gruppi, non può essere
spiegata in base agli effetti del trattamento,
viene attribuita all’errore casuale
Attribuzione della variabilità osservata alle
rispettive fonti

VARIABILITA’ TOTALE

Variabilità dovuta Variabilità dovuta a variabili


alla v. indipendente = non controllate =
VARIANZA VARIANZA NON
SPERIMENTALE o SPIEGATA o DI ERRORE
SPIEGATA (o RESIDUA) o ENTRO I
o TRA GRUPPI (between) GRUPPI (within)
Analisi della varianza

L’analisi della varianza consente di dire se la


varianza spiegata è maggiore della
varianza residua e se la differenza è tale
da giustificare, per inferenza statistica, che
le medie delle popolazioni da cui i campioni
sono state estratti siano significativamente
diverse
MATRICE DEI DATI ij (righe  colonne)
Sogg Campione Campione … Campione
1 2 k
1 x11 x12 … x1j
2 x21 x22 … x2j
3 x31 x32 … …
… x41 … … xij
… … xi2 …
n xì1 …
xij= ogni singola misura della VARIABILE DIPENDENTE sulla i-esima
riga e j-esima colonna (corrispendente all’ n-esimo soggetto del k-
esimo campione)
Verificare un effetto del ruolo sul
livello di stress
 k=3; n1 = n2 = n3 = 5  N =15

Sogg 1° 2° 3°
Operaio CReparto Dirigente
1 2 2 1
2 1 4 1
3 3 3 2
4 2 2 2
5 1 4 1
9 15 7
n

x i1
Media del 1° campione
M1  i 1

n1 (numerosità n1)
n

x i2 Media del 2° campione Mj


M2  i 1
(numerosità n2)
n2
n
Media del k° campione
x ik
(numerosità nk)
Mk  i 1
k n

 x
nk
ij
Media totale j 1 i 1
(con N = n1 + n2 +...+ nk) MT 
N
Verificare un effetto del ruolo sul
livello di stress
 k=3; n1 = n2 = n3 = 5  N =15
Sogg 1° 2° 3°
Operaio CReparto Dirigente M1 
9
 1.8
1 2 2 1 5
2 1 4 1 15
3 3 3 2 M2  3
5
4 2 2 2
5 1 4 1 7
M3   1.4
9 15 7 5

9  15  7
MT   2.1
15
Analisi della varianza

• L’ANOVA serve a verificare se i punteggi


osservati dipendono dall’appartenenza a
gruppi diversi
– Occorre controllare se la varianza spiegata nei
punteggi Y dall’appartenenza ai gruppi è
maggiore della varianza di errore
– Se la varianza spiegata dai gruppi è
significativamente più grande
• Si conclude che i punteggi osservati dipendono
dall’appartenenza al gruppo e che le medie dei due
gruppi sono diverse
DEVIANZA TOTALE = DevT
DEVIANZA TRA GRUPPI DEVIANZA ENTRO I
(between) = DevB GRUPPI (within) = DevW

DevT = DevB + DevW


Scomposizione della devianza

DevT= scarti al quadrato (SQ) di ogni


singolo valore xij dalla media totale MT

DevB= scarti al quadrato (SQ) DevW= scarti al quadrato


da MT calcolati sostituendo a (SQ) di ogni singolo valore
xij di ciascun soggetto la media xij dalla rispettiva Mj del
del campione al quale proprio campione
appartiene (Mj)
Scomposizione della devianza

k nj

DevT   ( xij  M T )
2

j 1 i 1

k nj k nj

MT ) DevW   ( xij  M j )


2 2
Dev B   (M j
j 1 i 1 j 1 i 1
Analisi della varianza

• Devianze tra gruppi :


– misura la quota di variabilità attribuibile alle
differenze tra i livelli (trattamenti)
• Devianza entro i gruppi:
– Misura la quota di variabilità imputabile a tutte le
cause non controllate nell’esperimento e
all’errore di campionamento
 k=3; n1 = n2 = n3 = 5  N =15
Sogg 1° 2° 3°
 M1=1.8 Campione Campione Campione
1 2 2 1
 M2=3 2 1 4 1
3 3 3 2
 M3=1.4 4 2 2 2
5 1 4 1
 MT=2.1 9 15 7

1° campione 2° campione

DevT  (2  2.1) 2  (1  2.1) 2  ...  (2  2.1) 2  (4  2.1) 2  ...


 (1  2.1) 2  (1  2.1) 2  ...  14.95

3° campione
 k=3; n1 = n2 = n3 = 5  N =15
 M1=1.8 Sogg 1°
Campione
2° 3°
Campione Campione
 M2=3 1 2 2 1
2 1 4 1
 M3=1.4 3 3 3 2
4 2 2 2
 MT=2.1 5 1 4 1
9 15 7
1° campione 2° campione 3° campione

Dev B  5(1.8  2.1) 2  5(3  2.1) 2  5(1.4  2.1) 2  6.95


 k=3; n1 = n2 = n3 = 5  N =15
Sogg 1° 2° 3°
 M1=1.8 Campione Campione Campione
1 2 2 1
 M2=3 2 1 4 1
3 3 3 2
 M3=1.4 4 2 2 2
5 1 4 1
 MT=2.1 9 15 7

1° campione 2° campione

DevW  (2  1.8) 2  (1  1.8) 2  ...  (2  3) 2  (4  3) 2  ...


 (1  1.4) 2  (1  1.4) 2  ...  8

3° campione
• Scomposizione della devianza

DEVIANZA TOTALE = 14.95

DEVIANZA TRA DEVIANZA ENTRO


GRUPPI = 6.95 GRUPPI = 8

14.95 = 6.95 + 8
Analisi della varianza

• Dalla Devianza alla Varianza


– Devianze non sono confrontabili
– Varianza è una sorta di Devianza media
– Si divide la devianza per i gradi di libertà in
modo da ottenere la varianza spiegata dalle
diverse fonti di variazione
PARTIZIONE DEI GRADI DI LIBERTA’

Gradi di libertà totali (gdlT)= N-1

Gradi di libertà tra gruppi Gradi di libertà entro gruppi


(gdlB) = k-1 (gdlW) = N-k

gdlT = gdlB + gdlW


N-1 = (k-1) + (N-k)
 k=3; n1 = n2 = n3 = 5  N =15

 gdlT = 15-1= 14
 gdlB = 3-1= 2
 gdlW = 15-3=12
14 = 2 + 12
Si ottengono le varianze dividendo le
devianze per i rispettivi gradi di libertà

DevT
VarT 
N 1
DevW
VarW 
N k
Dev B
Var B 
k 1
 k=3; n1 = n2 = n3 = 5  N =15
14.95
 DevT= 14.95; gdlT = 14 VarT   1.07
14
6.95
 DevB= 6.95; gdlB = 2 Var B   3.47
2
8
VarW   .67
 DevW= 8; gdlW = 12 12

Per le varianze non vale


la scomposizione che vale 1.07  3.47 + .67
per le devianze e per i
gradi di libertà
• TAVOLA RIASSUNTIVA

Fonte di variazione Dev gdl Var


Tra gruppi DevB gdlB VarB

Entro gruppi DevW gdlW VarW

Totale DevT gdlT


• TAVOLA RIASSUNTIVA

Fonte di variazione Dev gdl Var


Tra gruppi 6.95 2 3.47

Entro gruppi 8 12 .67

Totale 14.95 14
Analisi della varianza

• Si calcola F per confrontare la due varianze


e verificarne l’omogeneità

Si dimostra che la varianza tra gruppi e


sempre maggiore di quella entro i gruppi 
la prima va a numeratore e la seconda a
denominatore Dev B
Var B
F   k 1
VarW DevW
N k
• A tre campioni, costituiti da 8 studenti, vengono presentate
liste di parole da memorizzare. A ciascun gruppo viene
suggerita una diversa mnemotecnica. I risultati ottenuti
sono i seguenti:
Sogg 1° Campione 2° Campione 3° Campione
1 4 5 12
2 3 6 3
3 12 2 2
4 16 9 6
5 6 4 4
6 8 4 7
7 9 11 11
8 10 3 2
Esiste una differenza tra le tre mnemotecniche?
V. indipendente: mnemotecnica
(scala nominale)
V. dipendente: prova di memoria (n°
di parole ricordate = scala metrica a
rapporti)
Sogg 1° Campione 2° Campione 3° Campione
1 4 5 12
2 3 6 3
3 12 2 2
4 16 9 6
68 5 6 4 4
M1   8.5 6 8 4 7
8
7 9 11 11
44 8 10 3 2
M2   5.5
8 68 44 47
47
M3   5.9
8
68  44  49
MT   6. 6
24
 Si calcolano le devianze:
1° campione 2° campione

DevT  (4  6.6) 2  (3  6.6) 2  ...  (5  6.6) 2  (6  6.6) 2  ...


 (12  6.6) 2  (3  6.6) 2  ...  343.6

3° campione
 per differenza:

1° campione 2° campione 3° campione

 
Dev B  8 (8.5  6.6) 2  (5.5  6.6) 2  (5.9  6.6) 2  42.7

DevW  343.6  42.7  300.9


 Si calcolano le varianze:
 Varianza tra gruppi: 42.7
Var B   21.4
 DevB= 42.5; gdlB = 2 2

 Varianza entro gruppi:


300.9
 DevW= 330.1; gdlW = 21 VarW   14.3
21
21.4
 F 2 , 21 
14.3
 1.5
Fonte di variazione Dev gdl Var F
Tra gruppi 42.7 2 21.4
F(2,21)=1.5
Entro gruppi 300.9 21 14.3

Totale 343.6 23
Analisi della varianza

• Per decidere se la varianza spiegata è


maggiore della varianza residua e, dunque,
che le medie delle popolazioni da cui i
campioni sono state estratti sono
significativamente diverse
– VERIFICA DELL’IPOTESI CON F
(distribuzione F di Fisher o Snedecor)
Analisi della varianza

• Distribuzione F di Fisher o Snedecor


– è definita dal rapporto tra chi2 indipendenti

 12
1
F  2
2 1 e 2 = gradi di libertà
2
Analisi della varianza

• Distribuzione F di Fisher o Snedecor


– Famiglia di distribuzioni che variano al variare
del parametri 1 e 2
1=2 e 2=4
f(F)
1=2=12

1=2=4

F
Analisi della varianza

• Distribuzione F di Fisher o Snedecor


– La forma dipende da 1 e 2
– Funzione continua che va da 0 a  (entro il
quadrante positivo degli assi cartesiani)
– Si usa la curva per calcolare la probabilità
associata ai valori di F (porzioni di area),
sapendo che:

p (0  F   )  
0
f ( F ) dF  1
TAVOLA DI F
Riporta i valori di F in base a:  (.05, .01, .001),
Riga: gdl1 per la varianza Between
Colonna :gdl2 per la varianza Within
gdl1 1 2 3 4 5 6 7 8 9 10 …
gdl2 • Esempio:
1
2  =.05
3 gdl1=6
4
. gdl2=10
.
3.22   =.05
10 F(6;10)= 3.22

Analisi della varianza

• VERIFICA DELL’IPOTESI CON F


H0: 1=2=….=k
H1: almeno due diverse

– H0 vera : varianze tra gruppi ed entro i gruppi


molto simili, rapporto vicino ad 1
– H0 falsa: varianza tra i gruppi maggiore della
varianza entro i gruppi. Rapporto F elevato
Analisi della varianza

• VERIFICA DELL’IPOTESI CON F


H0: 1=2=….=k
H1: almeno due diverse

 gdl B  k  1
• Si fissa
gdlW  N  k
• Si calcolano i gdl 
• Si delinea la regione di rifiuto di H0 trovando
Fcritico(gdl
sullaB,Tavola
gdlW)
Analisi della varianza

• VERIFICA DELL’IPOTESI CON F


– Si calcola F per confrontare la due varianze

Dev B
Var B
F   k 1
VarW DevW
N k
Analisi della varianza

• VERIFICA DELL’IPOTESI CON F


– Decisione:F < Fcritico ; p>  Accetto H0
 Le varianze tra e entro i gruppi sono omogenee le
medie delle popolazioni da cui i campioni sono state
estratti non sono significativamente diverse
– Decisione: F > Fcritico ; p<  Rifiuto H0
 Le varianze tra e entro i gruppi non sono omogenee 
almeno due medie delle popolazioni da cui i campioni
sono state estratti sono significativamente diverse
Analisi della varianza

• VERIFICA DELL’IPOTESI CON F


– Se si osserva che la variabilità tra gruppi è
significativamente diversa da quella entro i
gruppi (nello specifico maggiore) 
• la variabilità osservata nella variabile dipendente è
riconducibile alla variabile indipendente che ha
generato i gruppi
– esiste una differenza tra le medie dei gruppi riconducibile
alla variabile indipendente
Analisi della varianza

• VERIFICA DELL’IPOTESI CON F


– Per k3 con la statistica F è possibile rilevare la
presenza di una differenza tra almeno due
medie ma non si può dire dove si colloca la
differenza
12….k oppure 12….k
12…. k oppure 12….k ecc.

Post hoc = Varianti del t-test per confronti fra coppie


di campioni
Sogg 1° 2° 3°
Campione Campione Campione
1 2 2 1
2 1 4 1
3 3 3 2
4 2 2 2
5 1 4 1
9 15 7
 k=3; n1 = n2 = n3 = 5  N =15
Fonte di variazione Dev gdl Var
Tra gruppi 6.95 2 3.27

Entro gruppi 8 12 .67

Totale 14.95 14
Si definisce:
H0: 1=2=3
H1: almeno due diverse
(123 o 123 o 123)
Si fissa =.05
gdlB=2 e gdlW=12
Si delinea la regione di rifiuto di H0
trovando Fcritico(2,12) =3.88 sulla Tavola
Si calcola F per confrontare varianza
tra gruppi e entro i gruppi e
verificarne l’omogeneità
3.47
F 2,12    5.18
.67
Fonte di variazione Dev gdl Var F
Tra gruppi 6.95 2 3.47
F(2,12)=5.18
Entro gruppi 8 12 .67

Totale 14.95 14
 Decisione: F > Fcritico (5.18>3.88) 
Rifiuto H0
Le varianze tra e entro i gruppi non
sono omogenee  almeno due medie
delle popolazioni da cui i campioni sono
state estratti sono significativamente
diverse
Esiste un effetto del ruolo sul livello di
stress
• TAVOLA RIASSUNTIVA

Fonte di variazione Dev gdl Var F


Tra gruppi SSB gdlB MSB
F(gdlB, gdlW)
Entro gruppi SSW gdlW MSW

Totale SST gdlT


• A tre campioni, costituiti da 8 studenti, vengono presentate
liste di parole da memorizzare. A ciascun gruppo viene
suggerita una diversa mnemotecnica. I risultati ottenuti
sono i seguenti:
Sogg 1° Campione 2° Campione 3° Campione
1 4 5 12
2 3 6 3
3 12 2 2
4 16 9 6
5 6 4 4
6 8 4 7
7 9 11 11
8 10 3 2
Esiste una differenza tra le tre mnemotecniche?
V. indipendente: mnemotecnica (scala nominale) V.
dipendente: prova di memoria (n° di parole ricordate =
scala metrica a rapporti)
 H0: 1=2=3
 H1: almeno due diverse
 (123 o 123 o 123)
 Si fissa =.05
 Si calcolano i gdl: k=3; n1 = n2 = n3 = 8  N =24
  gdlB=3-1=2 e gdlW=24-3=21
 Si delinea la regione di rifiuto di H0 trovando
Fcritico(2,21) =3.47 sulla Tavola
 Si calcola F:
Sogg 1° Campione 2° Campione 3° Campione
68 1 4 5 12
M1   8.5 2 3 6 3
8
3 12 2 2
44 4 16 9 6
M2   5.5
8 5 6 4 4
6 8 4 7
47 7 9 11 11
M3   5.9
8 8 10 3 2
68 44 47
68  44  49
MT   6. 6
24
 Si calcolano le devianze:
1° campione 2° campione

DevT  (4  6.6) 2  (3  6.6) 2  ...  (5  6.6) 2  (6  6.6) 2  ...


 (12  6.6) 2  (3  6.6) 2  ...  343.6

3° campione

 per differenza:

1° campione 2° campione 3° campione

 
Dev B  8 (8.5  6.6) 2  (5.5  6.6) 2  (5.9  6.6) 2  42.7

DevW  343.6  42.7  300.9


 Si calcolano le varianze:
 Varianza tra gruppi: 42.7
Var B   21.4
 DevB= 42.5; gdlB = 2 2

 Varianza entro gruppi:


300.9
 DevW= 330.1; gdlW = 21 VarW   14.3
21
21.4
 F 2 , 21 
14.3
 1.5
Fonte di variazione Dev gdl Var F
Tra gruppi 42.7 2 21.4
F(2,21)=1.5
Entro gruppi 300.9 21 14.3

Totale 343.6 23

 Decisione: F< Fcritico (1.5<3.47)  Accetto H0


 Le varianze tra e entro i gruppi sono omogenee  Le tre
mnemotecniche sono equivalenti
Analisi della varianza

• Assunzioni
– Le popolazioni da cui provengono i k campioni
sono distribuite in modo normale
– Le varianze di tali popolazioni sono omogenee
(omoschedasticità)
– I campioni sono INDIPENDENTI
– La variabile indipendente ha k  2 livelli  è su
scala nominale-ordinale
– La variabile dipendente è su scala metrica
Verifica (17)
E’ stato introdotto sul mercato un nuovo software. Alcuni nuovi
acquirenti, selezionati in modo casuale, vengono suddivisi in
tre gruppi. Al primo viene proposto un corso per apprendere
l’uso del nuovo programma; al secondo si consiglia di
consultare il manuale allegato; al terzo di orientarsi utilizzando
la guida online del programma. In seguito, tutti svolgono una
prova per valutare la loro capacità di utilizzare il programma.
Ottengono i seguenti punteggi: Gr 1 Gr 2 Gr 3
  15 13 11
Specificare le variabili dell’indagine e 14 11 12
stabilire se esiste una differenza 16 13 11
legata alle diverse modalità adottate 12 12 12
per apprendere l’uso del programma 14 14 13
(=.05) ? 17 11
15
Risultati -Verifica (17)
• Variabile indipendente = modalità di apprendimento del
software (su scala nominale),
• Variabile dipendente = l’apprendimento (misurata su
scala ad intervalli)
H0: 1=2=3
H1: almeno due diverse (123 o 123 o 123)

Livello di significatività: =.05


•  gdlB= k – 1 gdlW= N – k
•  gdlB = 3 – 1 = 2 gdlW = 18 – 3 = 15
• Fcritico(2,15) =3.68 .
Risultati -Verifica (17)
• Per semplificare i calcoli, togliamo la costante c = 10 da tutti i valori
(la trasformazione non modifica la relazione tra i dati).

  Gruppo 1 Gruppo 2 Gruppo 3 M1 


33
 4.7 M2 
14
 2.3
5 3 1 7 6
4 1 2 9
6 3 1 M 3   1. 8
2 2 2 5
4 4 3 33  14  9
7 1 9 MT   3.1
5 14 18
33

DevB  7(4.7  3.1) 2  6( 2.3  3.1) 2  5(1.8  3.1) 2  30.3


DevT  (5  3.1) 2  (4  3.1) 2  ...  (5  3.1) 2 
 (3  3.1) 2  (1  3.1) 2  ...  (1  3.1) 2  DevW  (5  4.7) 2  (4  4.7) 2  ...  (5  4.7) 2 

 (1  3.1)  (2  3.1)  ...  (3  3.1)  55.8


2 2 2  (3  2.3) 2  (1  2.3) 2  ...  (1  2.3) 2 
 (1  1.8) 2  ( 2  1.8) 2  ...  (3  1.8) 2  25.5
Risultati -Verifica (17)
30.3 25.5 15.15
Var B   15.15 VarW   1.7 F 2,15    8.91
2 15 1.7

Fonte di
Dev gdl Var F
variazione

Tra gruppi 30.3 2 15.15 F(2,15)=8.91


Entro
25.5 15 1.7
gruppi
Totale 55.8 17

8.91> 3.68 F > Fcritico Rifiutiamo H0, Accettiamo H1

Esistono delle differenze nell’apprendimento del software in relazione


alla modalità di apprendimento usata.
Analisi della varianza

• Esercizio:
Ipotizzare una situazioni di ricerca (ipotesi,
variabili, dati) dove utilizzare come tecnica di
analisi:

• ANALISI DELLA VARIANZA AD UNA VIA


Analisi della varianza

• Una sola VI : Disegni a una via


• Due o più VI: Disegni Fattoriali
• Una sola VD : Analisi univariata
• Due o più VD : Analisi multivariata
(MANOVA)
Analisi della varianza

• Disegni Fattoriali
– Si “manipolano” contemporaneamente più
variabili indipendenti
– Si evidenziano eventuali interazioni
• informazione sul modo in cui le variabili indipendenti
si combinano nell’influenzare un comportamento
Analisi della varianza

• Analisi della varianza a due o più fattori


• Si valuta quanto della variabilità riscontrata
nella variabile dipendente è attribuibile alle
variabili indipendenti A e B
– Effetto Fattore A
– Effetto Fattore B
– Effetto interazione AxB
Analisi della varianza

• Analisi della varianza a due o più fattori


2 variabili indipendenti:
mi con ki livelli e mj con kj livelli
k= ki kj campioni INDIPENDENTI quante sono le
combinazioni tra i livelli delle variabili
indipendenti  su ciascun campione viene
misurata la variabile dipendente oggetto
della ricerca
Analisi della varianza

• Si vuole verificare l’effetto della terapia e del


tipo di disturbo sul miglioramento del
paziente
– Fattore A: tipo di terapia (dinamica,comportamentale)
– Fattore B: tipo di disturbo (ansia,depressione)
– Variabile dipendente: miglioramento
Analisi della varianza

– In base alla terapia c’è un miglioramento


(indipendentemente dal tipo di disturbo)?
Effetto A
– In base al tipo di disturbo c’è un miglioramento
(indipendentemente dalla terapia?) Effetto B
– Si presenta un miglioramento più elevato
quando un certo tipo di terapia si presenta con
un certo disturbo? Effetto interazione AxB
Analisi della varianza
• Effetti principali e interazione
– Effetto principale: riflette l’influenza esercitata
dalla singola variabile manipolata (Fattore)
indipendentemente dall’altra
(stessa informazione ottenuta da un
disegno unifattoriale)
– Interazione: valuta l’effetto congiunto delle
variabili indipendenti considerate
Attribuzione della variabilità osservata
alle rispettive fonti

VARIANZA TOTALE

VARIANZA TRA GRUPPI VARIANZA ENTRO


GRUPPI

FATTORE A FATTORE B

INTERAZIONE A B
ANOVA a due fattori

Se il disegno di ricerca è 2x2, cioè due variabili


indipendenti ciascuna con due modalità
avremo:
Variabile b
1 2

1 A1 B1 A1 B2
Variabile A
2 A2 B1 A2 B2
comportamentale dinamica

M  7.40 M  3.20 M  5.30


ansia

depressione M  5.00 M  7.80 M  6.40

M  6.20 M  5.50

Dalle medie si evince che l’ansia migliora di più se trattata con


terapia comportamentale, la depressione con terapia dinamica
Analisi della varianza
• Rappresentazione dei dati
– Tabella : medie
• Effetti principali (effetti marginali di riga e di colonna)
• Effetti semplici (singole medie nelle celle)
– Grafico:
• Sull’asse delle X variabile indipendente
• Sull’asse delle Y variabile dipendente
Rappresentazione grafica
8
dinamica
7

5 comportamentale
4 D
C

3 A M  7.40 M  3.20
2

1
D M  5.00 M  7.80
ansia depressione

disturbo
Analisi della varianza
• Rappresentazione dei dati
– Se le due rette non sono parallele:
• Potrebbe esserci un’interazione significativa tra le
variabili
– Se le due rette sono parallele:
• L’interazione tenderà a non essere significativa
Anova 3x2
Tipo di problema (B)
Semplici Complessi
Rinforzo
verbale(A)
Lode 7.6 7 7.3
Critica 7.2 2 4.6
Silenzio 4.4 3.2 3.8
6.4 4.07

Numero medio dei problemi svolti in funzione del tipo


di rinforzo verbale e della complessità del problema

RAPPRESENTARE GRAFICAMENTE E COMMENTARE


8
  Problemi semplici

6

4

2
 Problemi complessi

Lode Critica Silenzio


• Analisi degli effetti principali.
– Compito (2 livelli) : i due compiti hanno un
numero medio di risposte significativamente
diverse
– Rinforzo (3 livelli) : almeno due dei rinforzi
determinano un numero medio di risposte
significativamente differenti
• Confronti post-hoc:
– Lode>Critica =Silenzio
Tipo di problema (B)
Semplici Complessi
Rinforzo
verbale(A)
Lode 7.6 .4 7 5 7.3 2.7
Critica 7.2 2 4.6
Silenzio 4.4 2.8 3.2 -1.2 3.8 .8
6.4 4.07

Effetti del tipo di rinforzo sulla soluzione dei problemi


dipendono dalla difficoltà del compito
Tipo di problema (B)
Semplici Complessi
Rinforzo
verbale(A)
Lode 7.6 .6 7 7.3
Critica 7.2 5.2 2 4.6
Silenzio 4.4 1.2 3.2 3.8
6.4 4.07
2.33

L’interpretazione dell’effetto principale oscura il fatto


che la differenza di rendimento dipende dal tipo di
rinforzo
• La variabile Rinforzo produce un effetto
sulla variabile Risposte che è differente a
seconda dei livelli della variabile Compito:
– Lode = stesso effetto nei compiti semplici e
complessi
– Critica = molto più efficace nei compiti
semplici
– Silenzio = stesso effetto nei due tipi di compiti
• Gli effetti semplici consentono di
evidenziare l’effetto di modulazione che
una VI ha sulla relazione tra un’altra VI e
la variabile dipendente.
• L’analisi degli effetti principali annulla tale
effetto, poiché confronta le medie
marginali, nelle quali i livelli dell’altra VI
vengono sommati tra loro
• Questo risultato evidenzia che la
differenza nelle risposte date ai compiti
Semplici e Complessi è significativa solo
nella condizione Critica mentre non lo è
nella condizione Lode e Silenzio
ANOVA Fattoriale

• Ipotizzare una situazioni di ricerca (ipotesi,


variabili, dati) dove utilizzare come tecnica
di analisi:

• ANALISI DELLA VARIANZA FATTORIALE

Potrebbero piacerti anche