Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
7-Analisi della varianza vers. 1.5 Germano Rossi1 germano.rossi@unimib.it Giovanni Battista Flebus1 giovannibattista.flebus@unimib.it
1 Dipartimento
2008-2008
Psicometria
2008-2008
1 / 41
Psicometria
2008-2008
2 / 41
Disegni a 1 via: quando c una sola variabile indipendente (anova univariata) Disegni fattoriali: con 2 o pi variabili indipendenti (anova multivariata) Disegni tra i soggetti (between subjects): quando, rispetto ad una VI, i soggetti sono misurati una sola volta (ad es. ansia misurate fra maschi e femmine) Disegni entro i soggetti (within subjects): quando, rispetto ad una VI, i soggetti sono misurati pi di una volta (ad es. ansia prima e dopo un esame)
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 3 / 41
Esempio empirico
In un campione di persone abbiamo misurato lautoritarismo usando la scala di Karen Stenner (5 item sulle cose importanti da insegnare ad un bambino, maggiore il punteggio, maggiore lautoritarismo) e lorientamento politico (su una scala da 1 a 10, da sinistra a destra) Raccogliamo i 10 punteggi dellorientamento politico in 3 categorie: 1-3 SX, 4-7 Centro, 8-10 DX Lautoritarismo uguale nei tre campioni? Oppure ogni sottocampione (in base allorientamento politico) ha parametri della popolazione diversi? Se usassimo il t-test (differenza delle medie, dovremmo fare 3 confronti a coppie: SX vs. Centro, SX vs. DX, Centro vs. DX) Usiamo lanalisi della varianza
Psicometria
2008-2008
4 / 41
Esempio empirico
N 154 182 80 416 Media 13,16 14,63 15,94 14,34 Stenner Dev. std. Err. std. 4,159 0,335 4,391 0,326 5,321 0,595 4,607 0,226 Minimo 5 5 5 5 Massimo 25 27 30 30
SX Centro Dx Totale
ANOVA univariata Somma Media quadrati df quadrati 433,245 2 216,622 8373,964 413 20,276 8807,209 415
F 10,68
Sig. 0,000
C almeno un gruppo che ha una media statisticamente diversa da quelle degli altri (cio stato estratto da una popolazione con parametri diversi)
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 5 / 41
Esempio empirico
Quale? Usiamo i confronti a posteriori Test post hoc Sottoinsiemi omogenei Stenner Student-Newman-Keuls N SX Centro Dx Sig. 154 182 80 Sottoinsieme per alfa = .05 1 2 3 13,1623 14,6319 15,9375 1,000 1,000 1,000
Le tre medie sono tutte diverse fra di loro, ovvero i campioni su cui sono state calcolate sono stati estratti da popolazioni con parametric statistici diversi
Psicometria
2008-2008
6 / 41
Esempio empirico
Psicometria
2008-2008
7 / 41
La logica dellanova
Possiamo pensare allautoritarismo come ad una variabile casuale il cui valore atteso la sua media E(X) o Tuttavia lorientamento politico pu inuenzare lautoritarismo aggiungendo un certo valore (sx = sx ) e inne si aggiunge un possibile errore casuale () che dipende da ogni singolo soggetto quindi il punteggio di ogni soggetto X =++ cio dipende dalla media della variabile nella popolazione, da un fattore di correzione dovuto allinuenza della variabile indipendente (trattamento) e ad un errore (fattore di correzione?) dovuto al caso statistico
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 8 / 41
La logica dellanova
per lAnova assumiamo (fra laltro)
normalit: la variabile dipendente (autoritarismo) sia quantitativa e che si distribuisca normalmente 2 omogeneit della varianza: i diversi campioni siano estratti dalla stessa popolazione e abbiano quindi varianza uguale fra loro e con 2 2 2 2 quella della popolazione (1 = 2 = = n e quindi 1 = s2 ) 1 3 indipendenza dei soggetti: le osservazioni siano fra loro indipendenti e quindi le differenze individuali siano casuali
1
Ipotizziamo che tutti i gruppi abbiano la stessa media (H0 : 1 = 2 ). Lipotesi alternativa sar che almeno un gruppo ha media diversa dagli altri (H1 : i = j ) per semplicit usiamo campioni di uguale numerosit
Psicometria
2008-2008
9 / 41
La logica dellanova
Se sono veri i primi due assunti, i gruppi formati dallindipendente sono uguali, hanno la stessa forma e la stessa varianza Se hanno la stessa varianza, possiamo calcolare la stima della varianza della popolazione come media delle varianze dei singoli campioni
2 1
s2 1
2 e
s2 i = k
n i=1
k j=1 (Xij
X.j )2
k(n 1)
con Xij =il punteggio di un individuo in un certo gruppo, X.j =la media di quel gruppo, n=lampiezza del singolo gruppo e k=numero dei gruppi
Psicometria
2008-2008
11 / 41
La logica dellanova
Se H0 vera, allora la varianza della popolazione stimabile tramite la distribuzione campionaria delle medie
2 X =
2 n
Le medie dei singoli gruppi sono utilizzate per stimare la varianza, quindi con n k (X.j X.. )2 j=1 2 2 t = nX = k1 .j la media calcolata su ogni gruppo e X.. dove n lampiezza, X la media delle medie
Psicometria
2008-2008
12 / 41
La logica dellanova
Abbiamo in questo modo due diverse stime della varianza della popolazione La prima calcolata entro i gruppi (chiamata anche varianza derrore= M Se ) perch si basa sulle differenze individuali rispetto alla media dei singoli gruppi La seconda fra i gruppi (chiamata anche varianza di trattamento= M St ) perch considera uguali gli individui di un gruppo e imputa le differenze al trattamento (la variabile categoriale usata per suddividere il campione in gruppi)
Psicometria
2008-2008
13 / 41
La logica dellanova
il loro rapporto si distribuisce secondo la curva di probabilit di F F = M St M Se
con k 1 e k(n 1) gradi di libert Se il rapporto piccolo (e non signicativo) le due stime sono uguali e quindi non vi differenza fra i gruppi Se il rapporto grande (e signicativo), le due stime sono diverse e vi differenza fra i gruppi
Psicometria
2008-2008
14 / 41
Esempio di calcolo
Gruppo 1 9 12 8 Gruppo 2 4 2 5 Gruppo 3 3 6 3
x2 ( x)2 /N N 1
e che il numeratore si chiama anche somma dei quadrati, il denominatore pu essere pensato come un gdl
Psicometria
2008-2008
15 / 41
SStot =
2 Xij (
SSt =
x2 (
SSe =
x2 (
Risultati da SPSS Somma dei quadrati 68,222 19,333 87,556 Media dei quadrati 34,111 3,222
df 2 6 8
F 10,586
Sig. 0,011
Psicometria
2008-2008
19 / 41
Formule di calcolo
Fonte Trattamento Errore Totale SQ (SS) Somme quadrati (X.j X.. )2 (Xij X.j )2
ij (Xij
df gdl k1 k(n 1) N 1
F M Qt /M Qe
X.. )2
= X.. , (la media dellintero campionee) = (X.j X.. ), (lo scostamento dalla media dei singoli gruppi) = (Xij X.. ), (lo scostamento delle medie dei singoli gruppi dalla media dellintero campione)
Psicometria
2008-2008
20 / 41
In SPSS
Analizza | Confronta medie | ANOVA univariata... trascinate almeno una variabile quantitativa (Intervallo o a rapporto) nel riquadro Variabili dipendenti se indicate pi dipendenti, verr calcolata una anova per ogni variabile indicata trascinate una variabile qualitativa (Nominale o Ordinale) nel riquadro Fattore: Date lOK
Psicometria
2008-2008
21 / 41
Confronti post-hoc
Sono confronti che si fanno a posteriori, se lAnova signicativa e se ci sono pi di 2 gruppi in una variabile indipendente La logica quella di tenere sotto controllo i problemi di signicativit legati ai confronti multipli. Vi sono diverse procedure di confronti
alcuni presumono che le varianze siano uguali: LSD (Least Signicant Difference), Bonferroni,Sidak, Scheff, SNK (Student-Neumann-Kouls), Tukey HSD (Honesty Signicant Difference), Duncan, Hochberg, Gabriel, Waller-Duncan, Dunnett altre no: Tamhane, Dunnett, Games-Howell, C di Dunnett
In Spss, premete il bottone Post Hoc... e selezionate tutti i test che volete gli output sono di due tipi: confronti multipli completi oppure gruppi omogenei
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 22 / 41
Intervallo di condenza 95% Lim. sup. Lim. inf. -2,409 8,002 1,369 14,349 -8,002 2,409 -1,273 11,398 -14,349 -1,369 -11,398 1,273
Psicometria
2008-2008
23 / 41
Intervallo di condenza 95% Lim. sup. Lim. inf. -2,409 8,002 1,369 14,349 -8,002 2,409 -1,273 11,398 -14,349 -1,369 -11,398 1,273
Psicometria
2008-2008
23 / 41
Psicometria
2008-2008
24 / 41
Psicometria
2008-2008
24 / 41
Confronti a priori
Oltre ai post hoc si possono effettuare dei confronti a priori ovvero decisi prima ancora di effettuare lanova, sulla base di una teoria Questi confronti si chiamano anche contrasti perch contrastano la media di uno o pi gruppi con quella di altri Anche in questo caso ci sono due possibilit:
contrasti predeniti: lineare, quadratico, Helmert... contrasti decisi da noi
Psicometria
2008-2008
26 / 41
Psicometria
2008-2008
27 / 41
Psicometria
2008-2008
28 / 41
Esempio concreto
Deprivazione sonno 4h 12h 24h 16 18 22 12 16 24 17 25 32 11 13 12 9 8 14 12 11 12
Questi dati possono essere considerati come un solo campione (media totale) Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) Considerando i 6 sottogruppi
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 29 / 41
Esempio concreto
Deprivazione sonno 4h 12h 24h 16 18 22 12 16 24 17 25 32 11 13 12 9 8 14 12 11 12
Questi dati possono essere considerati come un solo campione (media totale) Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) Considerando i 6 sottogruppi
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 29 / 41
Esempio concreto
Deprivazione sonno 4h 12h 24h 16 18 22 12 16 24 17 25 32 11 13 12 9 8 14 12 11 12
Questi dati possono essere considerati come un solo campione (media totale) Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) Considerando i 6 sottogruppi
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 29 / 41
Esempio concreto
Deprivazione sonno 4h 12h 24h 16 18 22 12 16 24 17 25 32 11 13 12 9 8 14 12 11 12
Questi dati possono essere considerati come un solo campione (media totale) Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) Considerando i 6 sottogruppi
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 29 / 41
Within
Between
AxB
La varianza totale quindi scomponibile in una parte dovuta alle differenze individuali (within=errore) e una parte dovuta ai trattamenti (che in questo caso sono 2 diversi) La varianza dovuta ai trattamenti (Between) scomponibile in una parte dovuta solo al primo trattamento (A), una dovuta solo al secondo trattamento (B) e una parte dovuta alla loro interazione (AxB)
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 30 / 41
Psicometria
2008-2008
31 / 41
Psicometria
2008-2008
31 / 41
Psicometria
2008-2008
31 / 41
Varianza totale
Depriv. sonno 4h 12h 24h 16 18 22 12 16 24 17 25 32 11 13 12 9 8 14 12 11 12 77 91 116 Quadrati 256 144 289 121 81 144 1035 324 256 625 169 64 121 1559 484 576 1024 144 196 144 2568
Alcohol
No Alc.
Somma (
Varianza dellerrore
Depriv. sonno 4h 12h 24h 1,000 -1,667 -4,000 -3,000 -3,667 -2,000 2,000 5,333 6,000 0,333 2,333 -0,667 -1,667 -2,667 1,333 1,333 0,333 -0,667 0,000 0,000 0,000 x)2 = (0 + 0 + 0)2 = (0)2 = 0 X 2 = 18, 667 + 57, 333 + 58, 667 = 134, 667 SQtot = 134, 667 0/18 = 134, 667 gdl = N kA kB = 18 3 2 = 12
Rossi, Flebus (Dip. Psicologia) Psicometria 2008-2008 33 / 41
Quadrati 1 9 4 0,111 2,778 1,778 18,667 2,778 13,444 28,444 5,444 7,111 0,111 57,333 16 4 36 0,444 1,778 0,444 58,667
Alcohol
No Alc.
Somma (
Alcohol
No Alc.
Somma
x)2 = (77 + 91 + 116)2 = (284)2 = 80656 X 2 = 988, 167 + 1380, 167 + 2242, 667 = 4611
Psicometria
2008-2008
34 / 41
Alcohol
No Alc.
Somma
x)2 = (77 + 91 + 116)2 = (284)2 = 80656 X 2 = 1612, 148 + 1612, 148 + 1612, 148 = 4836, 444
Psicometria
2008-2008
35 / 41
Psicometria
2008-2008
36 / 41
Quadrati 5,188 5,188 5,188 5,188 5,188 5,188 31,130 0,003 0,003 0,003 0,003 0,003 0,003 0,019 4,938 4,938 4,938 4,938 4,938 4,938 29,630
Alcohol
No Alc.
Somma (
Psicometria
In Spss
Analizza | Modello lineare generalizzato | Univariata... Inserite la variabile da studiare in Variabile dipendente Inserite le variabili categoriali in Fattori fissi Scegliete i contrasti o post-hoc se li volete Nel pulsante Opzioni, selezionare le Medie marginali stimate (se volete) Date lOK
Psicometria
2008-2008
40 / 41
Psicometria
2008-2008
41 / 41