Sei sulla pagina 1di 85

Analisi della varianza

Analisi della varianza

L’analisi della varianza (ANOVA, ANalysis Of VAriance) è una tecnica di


analisi dei dati che consente di verificare ipotesi relative a differenze tra le
medie di due o più popolazioni.
L’analisi della varianza è una tecnica statistica di tipo parametrico:
• si assume che la variabile di interesse si distribuisca normalmente nella
popolazione e che i due campioni siano estratti in maniera casuale dalla
popolazione;
• la numerosità campionaria è rilevante
• nel confronto tra più campioni le varianze devono essere omogenee.
Analisi della varianza

È possibile classificare i diversi modelli di ANOVA in base al numero di


variabili indipendenti e dipendenti:
• i modelli che prevedono una sola variabile indipendente vengono definiti
disegni a una via;
• i modelli che prevedono due o più variabili indipendenti vengono definiti
disegni fattoriali;
• i modelli che prevedono una sola variabile dipendente definiscono
un’analisi della varianza univariata;
• i modelli che prevedono due o più variabili dipendenti definiscono un’analisi
della varianza multivariata (o MANOVA, Multivariate Analysis of Variance)
Analisi della varianza univariata:
disegni “tra soggetti” ad un solo
fattore
Vengono definiti “tra soggetti”, oppure per gruppi indipendenti, i disegni in cui
ad ogni trattamento o condizione sperimentale corrisponde un diverso
gruppo di soggetti. In ogni condizione ci sono soggetti diversi: un soggetto
esposto ad una condizione non viene esposto a nessun’altra condizione.

A B
S1 S11
S2 S12
… …
S10 Sn
Il modello teorico
dell’ANOVA
Nel modello teorico dell’ANOVA “tra i soggetti” il punteggio yij di un soggetto j
nel gruppo i è così scomponibile:
yij = µ + αi + εij
Dove:
µ è la media generale dei punteggi sul campione totale;
αi è l’effetto dovuto al trattamento (livello i della variabile indipendente), ed è
costante all’interno del trattamento;
εij è una componente “residua”, o di errore causale, specifica per ogni
soggetto
Il modello teorico
dell’ANOVA
SCOMPOSIZIONE DELLA DEVIANZA

La devianza rappresenta la somma dei quadrati degli scostamenti tra ogni


punteggio e la media.
I diversi tipi di devianza:
• devianza totale (SST): è la somma dei quadrati (sum of squares) degli
scarti (differenza tra i singoli punteggi e la media generale della variabile);
• devianza tra i gruppi (o between, SSB): è la somma dei quadrati degli
scarti (differenza tra i punteggi medi di gruppo e la media generale), ovvero
la variabilità tra i diversi gruppi;
• devianza entro i gruppi (o within, SSW): è la somma dei quadrati degli
scarti tra i punteggi di ogni soggetto e la relativa media di gruppo, ovvero alla
variabilità dei soggetti all’interno di ogni gruppo.
Il modello teorico
dell’ANOVA
GRADI DI LIBERTA’ E VARIANZE

Gradi di libertà (gdl) per ognuna delle componenti della variabilità:


• devianza totale (SST): ( y −
∑ i ∑ j ij .. , n–1 gdl (il gdl perso è quello
y )2

della media totale);


• devianza tra i gruppi (o between, SSB): ( y −
∑ i ∑ j i .. y )2
, k–1 gdl (il gdl
perso è quello della media totale);
• devianza entro i gruppi (o within, SSW): ∑∑ i j
( yij − yi. )2
, n–k gdl (si
perde un gdl per ogni media di gruppo).
Dividendo le devianze per i rispettivi gradi di libertà si ottengono le varianze:
• Varianza totale (MST) = devianza totale / n–1;
• Varianza tra i gruppi (MSB) = devianza tra i gruppi / k–1;
• Varianza entro i gruppi (MSW) = devianza entro i gruppi / n–k.
Il modello teorico
dell’ANOVA
IL RAPPORTO «F»

Il rapporto tra le varianze MSB / MSW segue la distribuzione F, quindi può


essere utilizzato per esaminare ipotesi sulla significatività della differenza tra
la variabilità dovuta al trattamento e quella residua
La F esamina le seguenti ipotesi:
H0: µ1 = µ2 = … = µk
H1: almeno due µ diverse
Il modello teorico
dell’ANOVA
ASSUNZIONI

Ci sono delle assunzioni che devono essere soddisfatte affinché i risultati


dell’ANOVA possano essere interpretati in maniera affidabile:
• gli errori (εij) devono seguire la distribuzione normale ed avere media
uguale a 0;
• la varianza degli errori (σε) deve essere uguale in ogni gruppo (condizione
di omoschedasticità);
• gli errori (εij) devono essere indipendenti;
• gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge»
qualcosa alla condizione-base e lo fa in maniera «identica» per tutti i
soggetti.
Analisi della varianza univariata:
disegni fattoriali
Vengono definiti fattoriali (o più vie) i disegni di analisi della varianza in cui
vi sono due o più variabili indipendenti. Nei disegni fattoriali vengono
esaminati gli effetti di due o più variabili indipendenti sulla variabile
dipendente.
Il più semplice disegno è il «2 x 2», dove abbiamo due fattori ciascuno dei
quali ha due differenti livelli.
Vantaggi dei disegni fattoriali:
• consentono lo studio dell’interazione. Cioè l’effetto congiunto delle VI sulla
VD
• aumentano la potenza del test, cioè la probabilità di rilevare la presenza di
un effetto, quindi la probabilità di rifiutare l’ipotesi nulla quando essa è falsa
• consentono una maggiore economia nel numero dei soggetti da esaminare,
mantenendo la stessa potenza del test.
Analisi della varianza univariata:
disegni fattoriali
EFFETTI PRINCIPALI E INTERAZIONI

Nei disegni fattoriali abbiamo due tipi di effetti: gli effetti principali e le
interazioni.
L’effetto principale rappresenta l’effetto medio di una variabile indipendente
sulla variabile dipendente, indipendentemente dai valori delle altre variabili
indipendenti.
L’interazione rappresenta l’effetto di una variabile indipendente sulla
variabile dipendente non è lo stesso per tutti i livelli delle altre variabili
indipendenti.
Analisi della varianza univariata:
disegni fattoriali
DISEGNI FATTORIALI «TRA SOGGETTI» (BETWEEN SUBJECTS)

Nei disegni fattoriali «tra i soggetti» tutti i fattori sono fattori between
subjects, ovvero i soggetti vengono assegnati ad ognuna delle singole celle,
quindi ogni soggetto è esposto solamente ad una particolare combinazione
delle condizioni sperimentali.

A1 A2
S1 S6
B1 S2 S7
… …
S11 S16
B2 S12 S17
… …
Analisi della varianza univariata:
disegni “entro i soggetti” ad un solo
fattore
I disegni entro i soggetti (o within subjects) sono disegni in cui si utilizzano gli
stessi soggetti nelle diverse condizioni sperimentali. Nel caso di disegni entro
i soggetti l’analisi della varianza viene anche detta per prove (o misure)
ripetute.

A B
S1 S1
S2 S2
… …
Sn Sn
Analisi della varianza univariata:
disegni “entro i soggetti” ad un solo
fattore
SCOMPOSIZIONE DELLA DEVIANZA TOTALE

• devianza totale (SST): ( y −


∑ i ∑ j ij .. , [nk–1 gdl];
y ) 2

• devianza tra le prove (SSk): ∑ i ∑ j ( y. j − y.. ) , [k–1 gdl];


2

• devianza entro i gruppi (o within, SSW): ( y −


∑ i ∑ j 2 ij . j , [k(n–1) gdl]
y )2

• devianza tra i soggetti (SSS): ∑ i ∑ j ( yi. − y.. ) , [n–1 gdl];


• devianza residua (SSres): SSW – SSs , [(n–1)(k–1) gdl];
Analisi della varianza univariata:
disegni “entro i soggetti” ad un solo
fattore
ASSUNZIONI

Ci sono delle assunzioni che devono essere soddisfatte affinché i risultati


possano essere interpretati in maniera affidabile:
• gli errori (εij) devono essere indipendenti;
• gli errori (εij) devono seguire la distribuzione normale ed avere media
uguale a 0;
• la varianza delle differenze tra tutte le coppie delle misure ripetute deve
essere uguale (sfericità o circolarità);
•gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge»
qualcosa alla condizione-base e lo fa in maniera «identica» per tutti i
soggetti.
Analisi della varianza
disegni fattoriali «Misti»
Nei disegni fattoriali «misti», almeno un fattore è tra i soggetti ed almeno un
fattore è entro i soggetti.
I soggetti vengono esposti a tutte le condizioni sperimentali della variabile
entro, e soltanto ad un livello della variabile tra.

A1 A2
S1 S1
B1 S2 S2
… …
S6 S6
B2 S7 S7
… …
Analisi della varianza
- Le variabili -

La o le variabili dipendenti sono di tipo quantitativo (scala intervalli o


rapporto).

Le variabili indipendenti possono essere di due tipi:


• categoriale o qualitativo a loro volta distinte in variabili:
- tra soggetti o fattori beetween
- entro soggetti o fattori within
• quantitativo note anche come covariate.
Analisi della varianza Univariata

OBIETTIVO ANALISI DELLA VARIANZA UNIVARIATA BETWEEN

Il caso più semplice di analisi della varianza univariata è il t-test per


campioni indipendenti. In quel caso l’obiettivo è quello di confrontare, per
una fissata variabile dipendente, le medie di due gruppi indipendenti di
soggetti (fattore between a 2 livelli).

L’analisi della varianza univariata può essere vista come un’estensione del
t-test per campioni indipendenti nei casi in cui:
- il fattore between ha più di due livelli (aov a una via);
- esiste più di un fattore between (aov a due o più vie, o aov fattoriale).
Analisi della varianza Univariata

ESEMPI DI APPLICAZIONE AOV AD UNA VIA

Si supponga di aver somministrato un test di logica ad un campione di


soggetti provenienti da tre tipi differenti di scuole superiori (liceo classico,
liceo scientifico, liceo artistico); e di voler valutare se esiste un effetto “scuola
di provenienza” sul numero di risposte corrette al test.

Il modello da adottare sarà quello di analisi della varianza ad una via con:
variabile dipendente: il numero di risposte corrette al test
variablie indipendente un fattore beetween a 3 livelli: scuola di
provenienza (classico, scientifico, artistico)
Analisi della varianza Univariata

ESEMPI DI APPLICAZIONE AOV FATTORIALE


Riprendendo l’esempio precedente si supponga di disporre anche della classe di
provenienza dei soggetti, e di voler valutare i seguenti aspetti:
• Complessivamente i soggetti rispondono in maniera diversa a seconda della
scuola di provenienza?
• Complessivamente i soggetti rispondo in maniera diversa a seconda della
classe frequentata?
• Esiste un interazione tra il tipo di scuola di provenienza e la classe frequentata?
(le differenze tra i tipi di scuola sono costanti per ogni livello di classe
frequentata? )
Il modello da adattare ai dati sarà di analisi della varianza 3x5 con:
variabile dipendente: il numero di risposte corrette;
un fattore between a 3 livelli: “scuola di provenienza” (classico, scientifico,
artistico);
un fattore between a 5 livelli: “classe” (Ia, IIa, IIIa, IVa, Va)
Analisi della varianza Univariata

ASSUNZIONI

• Le osservazioni seguono una distribuzione normale sulla variabile


dipendente in ciascun gruppo.

• Le varianze dei gruppi sono uguali (omogenietà della varianza).

• Le osservazioni sono indipendenti.


Analisi della varianza Univariata ad una via

L’APPROCCIO STATISTICO

LA FORMULAZIONE DEL PROBLEMA

H0 µ1 = µ2 = µ3 = ….. = µk

almeno una media


H1
è diversa dalle altre

Nota: K è il numero di livelli del fattore between


Analisi della varianza Univariata ad una via

L’APPROCCIO STATISTICO

LA SCOMPOSIZIONE DELLA DEVIANZA

Devianza totale
(N-1)

Devianza tra i gruppi Devianza entro i gruppi


(k-1) (N-k)

Nota: N è il numero di oservazioni


K è il numero di livelli del fattore between
Analisi della varianza Univariata ad una via

L’APPROCCIO STATISTICO

IL RAPPORTO: (VARIANZA TRA SOGG.) / (VARIANZA ENTRO SOGG.)


Dividendo le devianze (SS) per i rispettivi gradi di libertà si ottengono le
varianze (MS). Sotto H0 il rapporto tra le varianze ha una distribuzione nota:

MSTra
F Oss
= ≈ F ( dfTra , df Entro )
MS Entro
Se la probabilità associata (p-value) al valore di F osservato è minore di un
valore critico fissato a priori (ad esempio 0.05), si rifiuta H0.
In questo caso si può conludere che il fattore between, ha un effetto
statisticamente significativo sulla variabile dipendente.
Analisi della varianza Univariata ad una via

L’ANALISI POST-HOC

Se l’analisi della varianza è risultata significativa, si potrebbe essere


interessati a capire quali tra le medie dei livelli del fattore between
differiscono tra loro.

La tentazione potrebbe essere quella di applicare una serie di t-test per


confrontare tutte le medie tra loro.

ERRORE
Analisi della varianza Univariata ad una via

L’ANALISI POST-HOC

Infatti, aumentando il numero di test effettuati, aumenta la probabilità di


errore di I° tipo: se testiamo un’ipotesi nulla che in effetti è vera, utilizzando α
come valore critico, la probabilità di ottenere un risultato non significativo
(corretto) è 1-α; se testiamo 2 ipotesi indipendenti la probabilità che nessuno
dei 2 test sia significativo è data, per un teorema del calcolo delle probabilità,
dal prodotto delle probabilità (1-α)*(1-α); più generalmente se testiamo K
ipotesi indipendenti la probabilità che i test siano congiuntamente non
significativi è data da (1-α)K; ne consegue che la probabilità di avere almeno
un test significativo sarà 1-(1-α)K.
Esemplificando, se vengono testate 20 ipotesi indipendenti al livello di
significatività α = 0,05, la probabilità che nessuna sia significativa è 0,9520 =
0,36. La probabilità che almeno una sia significativa per errore sarà
1-(1-0,05)20 = 0,64, ben superiore al valore nominale prescelto del 5%.
Analisi della varianza Univariata ad una via

L’ANALISI POST-HOC

Per “mantenere sotto controllo” la probabilità di errore globale esistono delle


tecniche dette di “analisi post-hoc” che mirano a correggere la probabilità di
errore dei singoli confronti tra le medie, in modo da ottenere dei risultati
statisticamente corretti.
Analisi della varianza Univariata

I PASSI FONDAMENTALI

1. Identificazione della variabile dipendente e del fattore between (o dei


fattori between).
2. Definizione del modello di analisi.
3. Analisi descrittiva dei dati.
4. Verifica delle assunzioni teoriche.
5. Adattamento del modello ai dati.
6. Verifica della significatività degli effetti.
7. Eventuale analisi post-hoc
Analisi della varianza Univariata ad una via in
SPSS

1. Selezionare il menù “Analizza”.


2. Selezionare l’opzione “Confronta Medie”.
3. Selezionare l’opzione “Anova Univariata”.
4. Selezionare la variabili dipendente e il fattore between.
5. Selezionare l’opzione “opzioni” per statistiche descrittive e test
dell’omogeneità delle varianza fra i gruppi.
6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le
tecnica/che di analisi post-hoc desiderata/e.
7. Cliccare OK!
Analisi della varianza Univariata fattoriale in
SPSS

1. Selezionare il menù “Analizza”.


2. Selezionare l’opzione “Modello Lineare Generalizzato”.
3. Selezionare l’opzione “Univariata”.
4. Selezionare la variabile dipendente, i fattori between e le eventuali
variabili indipendenti covariate.
5. Selezionare l’opzione “opzioni” per statistiche descrittive e test
dell’omogeneità delle varianza fra i gruppi.
6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le
tecnica/che di analisi post-hoc desiderata/e.
7. Cliccare OK!
Analisi della varianza Univariata ad una via

ESEMPIO PRATICO (I)

Si supponga di aver somministrato un test sulla memoria ad un campione di


soggetti appartenenti a tre fasce d’età (20-29 anni, 30-49 anni, 50 anni e
oltre).
Si vuole valutare se l’età ha un effetto sulla memoria.

Nota: i dati sono contenuti nel file “memoria.sav”


Analisi della varianza Univariata ad una via

IL MODELLO DI ANALISI

Per valutare l’effetto dell’età sulla memoria si adotterà un modello di analisi


della varianza univariata ad una via con:

• variabili dipendente: il numero di risposte corrette al test


• un fattore tra soggetti a 3 livelli: Età (20-29 anni, 30-49 anni, 50 e oltre)
Analisi della varianza Univariata ad una via

ANALISI DESCRITTIVA DEI DATI


Analisi della varianza Univariata ad una via

VERIFICA DELL’IPOTESI DI NORMALITA’


Analisi della varianza Univariata ad una via

VERIFICA DELL’IPOTESI DI OMOGENEITA’ DELLE VARIANZE

Test di omogeneità delle varianze

numero di rispote corrette


Statistica
di Levene df1 df2 Sig.
1.407 2 42 .256

Osservando il valore di significatività del test di Levene si può


concludere che le varianze dei tre gruppi di soggetti sono omogenee.
Analisi della varianza Univariata ad una via

I RISULTATI DELL’ANALISI DELLA VARIANZA

ANOVA univariata

numero di rispote corrette


Somma dei Media dei
quadrati df quadrati F Sig.
Fra gruppi 1086.711 2 543.356 4.481 .017
Entro gruppi 5093.200 42 121.267
Totale 6179.911 44

Osservando il valore di significatività (p-value) del test F si può


concludere che l’età ha un effetto significativo sulla memoria.
Analisi della varianza Univariata ad una via

I RISULTATI DEL POST-HOC


Confronti multipli

Variabile dipendente: numero di rispote corrette


Bonferroni
Intervallo di confidenza
95%
Differenza fra Limite Limite
(I) età (J) età medie (I-J) Errore std. Sig. inferiore superiore
20-29 anni 30-49 anni 3.26667 4.02106 1.000 -6.7605 13.2938
50 anni e oltre 11.66667* 4.02106 .018 1.6395 21.6938
30-49 anni 20-29 anni -3.26667 4.02106 1.000 -13.2938 6.7605
50 anni e oltre 8.40000 4.02106 .128 -1.6272 18.4272
50 anni e oltre 20-29 anni -11.66667* 4.02106 .018 -21.6938 -1.6395
30-49 anni -8.40000 4.02106 .128 -18.4272 1.6272
*. La differenza tra le medie è significativa al livello .05.

Dall’analisi post-hoc con il metodo di Bonferroni emerge che l’unica


differenza significativa è quella tra la prima e la terza fascia d’età.
Analisi della varianza Univariata ad una via

CONCLUSIONI

L’analisi ha riscontrato un effetto significativo dell’età sulla capacità di


memoria dei soggetti (F2,42=4,481 ; p<0.05).
In particolare si può notare, in seguito all’applicazione dell’analisi post-hoc
con il metodo di Bonferroni, che i soggetti può giovani manifestano una
capacità di memoria significativamente maggiore di quella dei soggetti più
anziani (p=0.018).
Analisi della varianza Univariata fattoriale

ESEMPIO PRATICO (II)

Si supponga di voler studiare gli effetti del fumo da sigaretta su alcuni tipi di
prestazione. A tale scopo è stato selezionato un campione i cui soggetti sono
stati suddivisi in tre gruppi rispetto al fumo: non fumatori (NS), fumatori ma
non prima-durante la prova (DS), fumatori attivi prima-durante la prova (AS).
In maniera casuale all’interno di ciascun gruppo un terzo dei soggetti ha fatto
un compito di pattern recognition, un terzo un compito di tipo cognitivo e un
terzo una simulazione di guida con un video game. In ogni caso la variabile
dipendente è il numero di errori commessi.
Le domande di ricerca riguardano la valutazione dell’effetto del fumo,
dell’effetto del tipo di compito, e dell’eventuale interazione tra fumo e
compito sulle perfomance dei soggetti.

Nota: i dati sono contenuti nel file “smoking.sav”


Analisi della varianza Univariata fattoriale

IL MODELLO DI ANALISI

Per rispondere alle domande di ricerca si adotterà un modello di analisi della


varianza univariata fattoriale 3×3 con:

• variabili dipendente: il numero di errori commessi


• un fattore tra soggetti a 3 livelli: Fumo (Non Fumatori, Fumatori ma non
prima e durante la prova, Fumatori prima e durante la prova)
• un fattore tra soggetti a 3 livelli: Compito (Pattern Recognition, Cognitivo,
Simulazione di Guida)
Analisi della varianza Univariata fattoriale

RISULTATI DELL’ANALISI DELLA VARIANZA

Osservando i risultati dell’analisi della varianza si può affermare che:


• il fumo complessivamente non ha un effetto significativo sulla performance
• il tipo di compito ha un effetto significativo sulla performace
• esiste un effetto significativo dell’interazione fumo-tipo di compito sulla
performance
Analisi della varianza Univariata fattoriale

INTERPRETAZIONE GRAFICA DEI RISULTATI

50 ,0 0 smokegr
N o Smoker
D elay Smoker
Active Smoker
medie marginali attese

40,00

30 ,0 0

20 ,0 0

10 ,0 0

0,00

pattern re co gnition cogn itive task d riving simula tio n


tas k
Analisi della varianza Univariata fattoriale

CONCLUSIONI

L’analisi ha riscontrato un effetto significativo del tipo di compito (F2,81=73.865


; p<0.05) e un effetto significativo dell’interazione fumo-tipo di compito
(F4,81=3.261 ; p<0.05) sulle performance dei soggetti. L’effetto principale del
fattore fumo non è invece risultato significativo.

Si può quindi concludere che;


• il fumo complessivamente non incide sulla performace;
• il tipo di compito complessivamente ha influenza sulla performance;
• esiste un effetto interattivo “fumo-tipo di compito” sulle performance (le
differenze di performance tra i tre gruppi di fumatori non sono costanti nei tre
diversi tipi di compito).
Analisi della varianza Multivariata
(MANOVA)

L’OBIETTIVO DELL’ANALISI DELLA VARIANZA MULTIVARIATA

L’obiettivo dell’analisi della varianza multivariata è quello di studiare gli effetti


di uno o più fattori tra soggetti su un insieme di variabili dipendenti.
(Mentre nell’Anova Univariata la variabile dipendente è una, nella Manova le
variabili dipendenti sono più di una)

Esempio: Si vuole studiare se i maschi differiscono complessivamente dalle


femmine sui punteggi totali di tre questionari che rilevano tre diversi aspetti
dell’ansia.
In questo caso si adotterà un disegno di analisi della varianza multivariata
(Manova) con:
- 3 variabili dipendenti (i 3 aspetti dell’ansia);
- 1 fattore tra soggetti (sesso).
Analisi della varianza Multivariata
(MANOVA)

ASSUNZIONI NELL’ANALISI DELLA VARIANZA MULTIVARIATA

• Le osservazioni seguono una distribuzione normale multivariata sulle


variabili dipendenti in ciascun gruppo.

• Le matrici di covarianza sulle variabili dipendenti di ciascun gruppo sono


uguali.

• Le osservazioni sono indipendenti.


Analisi della varianza Multivariata (MANOVA) in
SPSS

1. Selezionare il menù “Analizza”.


2. Selezionare l’opzione “Modello lineare generalizzato”.
3. Selezionare l’opzione “Multivariato”.
4. Selezionare le variabili dipendenti, i fattori between e le eventuali
covariate in modo appropriato.
5. Selezionare l’opzione “opzioni” per statistiche descrittive e test
dell’omogeneità delle varianza fra i gruppi.
6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le
tecnica/che di analisi post-hoc desiderata/e.
7. Cliccare OK!
Analisi della varianza Multivariata (MANOVA) in
SPSS

ESEMPIO PRATICO (III)

Per capire se un nuovo approccio didattico nell’insegnamento del clarinetto è


efficace, si vogliono confrontare due gruppi di alunni delle scuole elementari:
- Gruppo Sperimentale (alunni che hanno seguito le lezioni con il metodo
innovativo);
- Gruppo di Controllo (alunni che hanno seguito le lezioni con il metodo
tradizionale).

I dati raccolti riguardano le perfomance degli alunni valutate sui seguenti 6


aspetti: interpretazione, tono, ritmo, intonazione, tempo, articolazione.
(Ambrose, 1985)

Nota: i dati sono contenuti nel file “clarinetto.sav”


Analisi della varianza Multivariata (MANOVA) in
SPSS

IL MODELLO DI ANALISI

Per valutare l’efficacia del nuovo approccio si adotterà un modello di analisi


della varianza multivariata (MANOVA) con:

• sei variabili dipendenti: Interpretazione, Tono, Ritmo, Intonazione, Tempo,


Articolazione;
• un fattore tra soggetti a 2 livelli: Gruppo (Sperimentale vs. Controllo).
Analisi della varianza Multivariata (MANOVA) in
SPSS

ANALISI DESCRITTIVA DEI DATI


Confronto tra il Gruppo Sperimentale e il Gruppo di Controllo

4.00
sperimentale
controllo
3.50

3.00
media dei punteggi

2.50

2.00

1.50

1.00

0.50

0.00
interpretazione tono ritmo intonazione tempo articolazione

aspetti valutati
Analisi della varianza Multivariata (MANOVA) in
SPSS

RISULTATI DELLA MANOVA


b
Test multivariati

Gradi di
libertà
Effetto Valore F Ipotesi df dell'errore Sig.
Intercetta Traccia di Pillai .991 278.492 a 6.000 16.000 .000
Lambda di Wilks .009 278.492 a 6.000 16.000 .000
Traccia di Hotelling104.434 278.492a 6.000 16.000 .000
Radice di Roy 104.434 278.492 a 6.000 16.000 .000
gruppo Traccia di Pillai .584 3.749a 6.000 16.000 .016
Lambda di Wilks .416 3.749 a 6.000 16.000 .016
Il fattore gruppo
Traccia di Hotelling 1.406 3.749 a 6.000 16.000 .016 ha un effetto
Radice di Roy 1.406 3.749 a 6.000 16.000 .016 significativo
a. Statistica esatta
b. Disegno: Intercept+gruppo
Analisi della varianza Multivariata (MANOVA) in
SPSS

CONCLUSIONI

Il Gruppo Sperimentale differisce significativamente dal Gruppo di Controllo


sui 6 aspetti valutati (F6,16= 3.749 ; p<0.05).

Si può quindi concludere che il nuovo approccio didattico è efficace.


Analisi della varianza a misure ripetute

L’OBIETTIVO DELL’ANALISI DELLA VARIANZA A MISURE RIPETUTE

Il caso più semplice di analisi della varianza a misure ripetute è il t-test


per dati appaiati. In quel caso i soggetti vengono misurati due volte, ad
esempio prima e dopo un trattamento, e si vuole verificare l’effetto del
trattamento (fattore within).

L’analisi della varianza a misure ripetute può essere vista come


un’estensione del test-t per dati appaiati nei casi in cui:
- il fattore within ha più di due livelli;
- esiste più di un fattore within.
Analisi della varianza a misure ripetute

ESEMPI DI APPLICAZIONE DELL’AOV A MISURE RIPETUTE

Valutazione dell’effetto del tempo.


Esempio: valutare se esistono variazioni dell’umore materno nel primo anno
post-gravidanza.

Valutazione dell’effetto di più trattamenti.


Esempio: Valutare come incidono la lunghezza e la tipologia di un testo
sulla comprensione.
Analisi della varianza a misure ripetute

I VANTAGGI DELL’AOV A MISURE RIPETUTE

Controllo della variabilità entro soggetto


Le differenze tra Gruppo Sperimentale e Gruppo di controllo possono
dipendere sia dall’effetto del trattamento sia dalla diversa composizione dei due
gruppi. In un disegno a misure ripetute invece i soggetti fungono da “controllo di
se stessi” .

Minor numerosità campionaria richiesta rispetto all’analisi della varianza


between.
Se in un disegno di analisi della varianza between per valutare l’effetto di 3
diversi trattamenti sono richiesti 45 soggetti (15 per trattamento), in un disegno a
misure ripetute ne bastano 15 !

Nota: non sempre si può utilizzare un disegno a misure ripetute (ad. esempio:
valutazione dell’effetto genere)
Analisi della varianza a misure ripetute

ASSUNZIONI NELL’ANALISI DELLA VARIANZA A MISURE RIPETUTE

• Le osservazioni sono indipendenti.

• Le osservazioni seguono una distribuzione normale multivariata sui livelli


del fattore entro soggetti.

• Le osservazioni soddisfano l’ipotesi di sfericità.

Nota: Le prime due assunzioni sono richieste anche per l’analisi della varianza
multivariata (MANOVA), mentre l’ipotesi di sfericità non lo è.
Analisi della varianza a misure ripetute

CHE COSA IMPLICA L’IPOTESI DI SFERICITA’?

• L’ipotesi di sfericità implica che la matrice di covarianza sulle misure ripetute


rispetti una forma particolare (varianze e covarianze pressoché costanti).

• In poche parole, l’idea è che le varianze delle differenze tra le misure


ripetute devono essere pressoché uguali.
Analisi della varianza a misure ripetute

CHE COSA IMPLICA L’IPOTESI DI SFERICITA’?


Esempio: Si supponga di voler valutare la variazione di peso nel tempo in bambini
neonati. Il peso dei neonati viene misurato ogni giorno per un periodo critico di 3 giorni.
Il modello da adattare potrebbe essere quello di un’AOV a misure ripetute con v.d. il
peso dei bambini e fattore entro soggetti il tempo (3 livelli pari ai 3 giorni).
Osservando i dati si nota che:
- in media i bambini sono aumentati di 100 grammi tra il giorno 1 e 2 e di 150 grammi
tra il giorno 2 e 3.
- la varianza degli aumenti tra il giorno 1 e 2 è di 20, mentre quella tra il giorno 2 e 3 è
di 100.
In questo caso l’ipotesi di sfericità che presuppone che la varianza degli aumenti tra i
giorni 1 e 2 e quella tra i giorni 2 e 3 ( e anche quella tra 1 e 3) siano uguali non è
soddisfatta.
Il modello di AOV a misure ripetute potrebbe produrre una stima distorta della
significatività dell’effetto del tempo.
Analisi della varianza a misure ripetute

VALUTAZIONE DELL’IPOTESI DI SFERICITA’


Per valutare se i dati soddisfano l’ipotesi
di sfericità si può utilizzare il test di Mauchly

Il test di Mauchly
è significativo (p<0.05) ?

No Sì

I dati non soddisfano l’ipotesi di sfericità.


I dati soddisfano l’assunzione di sfercità. Per ottenere una stima non distorta degli
La stima degli effetti non è distorta. effetti si deve ricorrere a dei criteri di
correzione (ad es. Greenhouse-Geisser)
Analisi della varianza a misure ripetute in SPSS

1. Selezionare il menù “Analizza”.


2. Selezionare l’opzione “Modello lineare generalizzato”.
3. Selezionare l’opzione “Misure Ripetute”.
4. Nella finestra “Definisci Fattori” inserire i nomi dei fattori within ed il
rispettivo numero di livelli. Cliccare “Definisci”.
5. Inserire le variabili within in modo appropriato rispetto le definizioni dei
fattori fatte al punto 4.
6. Cliccare OK!
Analisi della varianza a misure ripetute in SPSS

ESEMPIO PRATICO (IV)

Si supponga di voler studiare l’effetto di 4 diversi tipi di vino sui tempi di


reazione ad una particolare prova di abilità.
Nella conduzione dell’esperimento un tempo sufficiente viene fatto
trascorrere tra una prova e l’altra, in modo da minimizzare gli effetti della
“somministrazione” di un tipo di vino sui tempi di reazione legati alla
“successiva somministrazione” (Winer, 1971).

Nota: i dati sono contenuti nel file “vini.sav”


Analisi della varianza a misure ripetute in SPSS

IL MODELLO DI ANLISI

Per valutare se il tipo di vino ha un effetto sui tempi di reazione dei soggetti si
adotterà un modello di analisi della varianza a misure ripetute con:

- variabile dipendente: il Tempo di Reazione dei soggetti;


- un fattore entro-soggetti a 4 livelli: Tipo di Vino (Chianti, Merlot,
Prosecco, Zibibbo).
Analisi della varianza a misure ripetute in SPSS

ANALISI DESCRITTIVA DEI DATI


Confronto dei tempi di reazione medi ottenuti per tipo di vino

45

40

35
media dei tempi di reazione

30

25

20

15

10

0
chianti merlot prosecco zibibbo
tipo di vino
Analisi della varianza a misure ripetute in SPSS

CONTROLLO DELL’IPOTESI DI SFERICITA’


Test di sfericità di Mauchly b

Misura: MEASURE_1

a
Approssimaz Epsilon
ione Greenhous Limite
Effetto entro soggetti W di Mauchly chi-quadrato df Sig. e-Geisser Huynh-Feldt inferiore
tipo_v .186 4.572 5 .495 .605 1.000 .333
Verifica l'ipotesi nulla per la quale la matrice di covarianza dell'errore della variabile dipendente trasformata ortonormalizzata
è proporzionale a una matrice identità.
a. È possibile utilizzarlo per regolare i gradi di libertà per i test di significatività mediati. I test corretti vengono
visualizzati nella tabella dei test sugli effetti entro soggetti.
b.
Disegno: Intercept
Disegno entro soggetti: tipo_v

L’ipotesi di sfericità è soddisfatta.


Analisi della varianza a misure ripetute in SPSS

RISULTATI DELL’ANALISI DELLA VARIANZA A MISURE RIPETUTE


Test degli effetti entro soggetti

Misura: MEASURE_1
Somma dei
quadrati Media dei
Sorgente Tipo III df quadrati F Sig.
tipo_v Assumendo la sfericità 698.200 3 232.733 24.759 .000
Greenhouse-Geisser 698.200 1.815 384.763 24.759 .001
Huynh-Feldt 698.200 3.000 232.733 24.759 .000
Limite inferiore 698.200 1.000 698.200 24.759 .008
Errore(tipo_v) Assumendo la sfericità 112.800 12 9.400
Greenhouse-Geisser 112.800 7.258 15.540
Huynh-Feldt 112.800 12.000 9.400
Limite inferiore 112.800 4.000 28.200

Il fattore within Tipo di Vino ha un effetto


statisticamente significativo.
Analisi della varianza a misure ripetute in SPSS

CONCLUSIONI

Il fattore Tipo di Vino ha un effetto statisticamente significativo sui tempi di


reazione dei soggetti (F3,12= 24.759 ; p<0.05).

Si può quindi concludere che a seconda del tipo di vino somministrato i tempi
di reazione dei soggetti variano.
Analisi della varianza con
Disegno Misto

COSA SI INTENDE PER “ANALISI DELLA VARIANZA CON DISEGNO


MISTO?”

Un modello analisi della varianza con disegno misto è un modello che


comprende sia fattori between che fattori within.
Analisi della varianza con
Disegno Misto

ESEMPIO DI UN PROBLEMA RISOLVIBILE ATTRAVERSO UN AOV


CON DISEGNO MISTO

Si supponga di voler misurare l’effetto di tre diversi trattamenti somministrati


ad un campione comprendente maschi e femmine.
La situazione può essere così rappresentata:

TRATTAMENTI
A B C
Maschi
Femmine
Analisi della varianza con
Disegno Misto

LE DOMANDE DI RICERCA
Esiste un effetto trattamento?
Effetto principale
del fattore within Complessivamente i soggetti rispondono in maniera diversa
a seconda del trattamento?

Esiste un effetto genere?


Effetto principale
del fattore
Complessivamente i maschi rispondono in maniera diversa
between rispetto alle femmine?

Esistono dei legami tra il tipo di trattamento e il genere


dei soggetti?
Interazione tra
fattore within e Le differenze tra i maschi e le femmine sono costanti o
between variano a seconda del tipo di trattamento?
Analisi della varianza con
Disegno Misto

IL MODELLO DI ANALISI

Il modello da adattare ai dati sarà un modello di analisi della varianza a


disegno misto 3×2 con:

• variabile dipendente: le risposte dei soggetti


• un fattore within a 3 livelli: trattamento (A, B, C)
• un fattore between a 2 livelli: sesso (Maschi vs. Femmine)
Analisi della varianza con Disegno Misto in SPSS

1. Selezionare il menù “Analizza”.


2. Selezionare l’opzione “Modello lineare generalizzato”.
3. Selezionare l’opzione “Misure Ripetute”.
4. Nella finestra “Definisci Fattori” inserire i nomi dei fattori within ed il
rispettivo numero di livelli. Cliccare “Definisci”.
5. Inserire le variabili within in modo appropriato rispetto le definizioni dei
fattori fatte al punto 4.
6. Selezionare i fattori between e le eventuali covariate.
7. Cliccare OK!
Analisi della varianza con Disegno Misto in SPSS

ESEMPIO PRATICO (V)

A due gruppi, uno sottoposto a una condizione stressante (gruppo


sperimentale) ed uno sottoposto ad una condizione neutra (gruppo di
controllo), vengono letti tre brani di crescente difficoltà.
Dopo la lettura di ciascun brano vengono poste ai soggetti 10 domande di
comprensione del testo e viene rilevato il numero di risposte corrette.
Si vogliono studiare i seguenti aspetti:
• la difficoltà dei brani ha un effetto sul numero di risposte corrette?
• il gruppo sottoposto ad una condizione di stress risponde complessivamente in
maniera diversa rispetto al gruppo di controllo?
• esiste un’interazione tra la difficoltà dei brani ed il livello di stress (le differenze
tra i due gruppi sono costanti per i tre livelli di difficoltà dei brani)?

Nota: i dati sono contenuti nel file “stress.sav”


Analisi della varianza con Disegno Misto in SPSS

IL MODELLO DI ANLISI

Il modello da applicare sarà un modello di analisi della varianza a disegno


misto 3×2 con:

• variabile dipendente: il numero di risposte corrette


• un fattore within a 3 livelli: difficoltà del brano (1,2,3)
• un fattore between a 2 livelli: gruppo (sperimentale vs. controllo)
Analisi della varianza con Disegno Misto in SPSS

CONTROLLO DELL’IPOTESI DI SFERICITA’

Test di sfericità di Mauchly b

Misura: MEASURE_1

Approssima
zione
Effetto entro soggetti W di Mauchly chi-quadrato df Sig. La sfericità non è
difficol .673 6.733 2 .035 soddisfatta. Bisognerà
adottare un criterio
correttivo.
Analisi della varianza con Disegno Misto in SPSS

RISULTATI DELL’ANALISI DELLA VARIANZA CON DISEGNO MISTO

Effetto
siginificativo del
fattore within.

Effetto
siginificativo
dell’interazione
tra il fattore within
e quello between
Analisi della varianza con Disegno Misto in SPSS

RISULTATI DELL’ANALISI DELLA VARIANZA CON DISEGNO MISTO

Effetto
significativo del
fattore between.
Analisi della varianza con Disegno Misto in SPSS

INTERPRETAZIONE GRAFICA DEI RISULTATI


Analisi della varianza con Disegno Misto in SPSS

CONCLUSIONI

L’analisi condotta ha messo in evidenza i seguenti aspetti:


• emerge un effetto significativo del fattore within “difficoltà” (F1.507,27.129=20.028 ;
p<0.05);
• emerge un effetto significativo del fattore between “gruppo” (F1.507,27.129=5.861 ;
p<0.05);
• emerge un effetto significativo dell’interazione tra il fattore within e il fattore
within (F1,18=9.227 ; p<0.05).
Si può quindi concludere che:
• la difficoltà del brano influenza il numero di risposte corrette;
• i due gruppi differiscono sulla base del numero di riposte corrette;
• le differenze tra i due gruppi non sono costanti per i tre livelli di difficoltà dei
brani; in particolare si può notare che nella condizione “alta difficoltà” dei brani, la
differenza tra i due gruppi è molto maggiore rispetto a quelle che si registrano
nelle condizioni “media e bassa difficoltà”.
Analisi della varianza

COSA FARE QUANDO LE ASSUNZIONI PER L’ANALISI DELLA


VARIANZA NON SONO SODDISFATTE?

Se le assunzioni per l’analisi della varianza non sono soddisfatte, cioè ad


esempio:
• la variabile dipendente non è quantitativa ma è su scala ordinale;
• la variabile dipendente non è distribuita normalmente;
• la numerosità campionaria è ridotta.

E’ POSSIBILE ADOTTARE UN APPROCCIO NON PARAMETRICO


I vantaggi dell’approccio Non-
parametrico

Le tecniche non-parametriche, che si basano sui ranghi e non sui valori


originali come le tecniche parametriche, presentano i seguenti principali
vantaggi:

sono “distribution-free”, cioè indipendenti dalla distribuzione campionaria


della variabile dipendente;

sono particolarmente indicate nei casi di ridotta numerosità campionaria.


Alternative Non-parametriche
all’analisi della varianza con fattore
between

NUMERO DI ANALISI
LIVELLI DEL ANALISI
FATTORE NON-
PARAMETRICA
BETWEEN PARAMETRICA

test t per test


due campioni
indipendenti di Mann-Whitney

due analisi della test


varianza ad un
o più di due fattore between di Kruskal-Wallis
Alternative Non-parametriche
all’analisi della varianza a misure
ripetute con fattore within

NUMERO DI ANALISI
ANALISI
LIVELLI DEL NON-
FATTORE WITHIN PARAMETRICA
PARAMETRICA
test t per test
due campioni
appaiati di Wilcoxon

due analisi della test


varianza a
o più di due misure ripetute di Friedman
Alternative Non-parametriche all’analisi della
varianza a misure ripetute con fattore within
(variabile dipendente dicotomica)

NUMERO DI ANALISI
ANALISI
LIVELLI DEL NON-
FATTORE WITHIN PARAMETRICA
PARAMETRICA

test
due -
di McNemar

due test
-
o più di due di Cochran
L’approccio Non-parametrico in SPSS

1. Selezionare il menù “Analizza”.


2. Selezionare l’opzione “Test non parametrici”.
3. Selezionare l’opzione che si intende utilizzare.
4. Selezionare le variabili di interesse in modo appropriato.
5. Cliccare OK!
“Mi conviene usare le tecniche
parametriche o quelle non
parametriche?”

Quando le assunzioni per l’analisi della varianza sono soddisfatte, l’approccio


parametrico è più “potente” (migliore) di quello non-parametrico.

Nel caso in cui le assunzioni per l’analisi della varianza sono dubbie, è
conveniente utilizzare sia l’approccio parametrico che quello non-
parametrico e confrontare i risultati.
Per approfondimenti

Per approfondire le tecniche di Analisi della Varianza si consigliano i seguenti


testi:

“Using Multivariate Statistics” (5th edition) – Barbara G. Tabachnick &


Linda S. Fidell, 2007 – Pearson Education
“Applied Multivariate Statistics For The Social Sciences, Fourth
Edition” – James P. Stevens, 2002 – LEA, Publishers

Potrebbero piacerti anche