Sei sulla pagina 1di 7

APPUNTI SPSS2

RIPASSO
Nominali: frequenze e moda

Ordinali: + range interquartile e mediana

Intervalli equivalenti: + media. Hanno 0 arbitrario, es. lansia.

Rapporto: . Hanno 0 assoluto come i Kelvin, quindi posso fare differenze sui rapporti
(es. A il doppio di B)

COME SCRIVERE RISULTATI T-TEST PER CAMPIONI INDIPENDENTI:

Siccome il test di Levene non sign. assumo varianze uguali nei campioni

t(98) = 2,822 p=.006

COME SCRIVERE RISULTATI T-TEST PER CAMPIONI APPAIATI:

t(99) = 6,182 p < 0.001 (NON MAI 0, se pi piccolo di 0.001 si scrive cos,
altrimenti il numero preciso) Non serve il segno, perch il senso si capisce riportando
le medie (la media del post pi grande del pre).

COVARIAZIONE: media degli scarti dalla media, dipende dalla scala di misura, non
posso dire se grande o piccola. Se standardizzata (coi punti Z) detta
CORRELAZIONE: somma dei prodotti dei valori standardizzati. Varia da 0 a 1, se ho 1
sto misurando la stessa cosa. Posso dire se grande o piccola in base a convenzioni.
Se sign. la correlazione, posso dire che lo anche la covariazione.

CORRELAZIONE: 0 assente, media 0.2-0.5, alta 0.5-0.9, 1 stessa cosa

SCATTERPLOT: grafici > finestre di dialogo legacy > dispersione/punti > semplice
OPPURE matrice di dispersione (per vederne di + tutti insieme)

REGRESSIONE LINEARE SEMPLICE


Nella regressione lineare semplice, se le due variabili sono standardizzate b
detto e corrisponde alla correlazione tra x e y (u di misura la deviazione standard);
se x e y non sono standardizzate, b corrisponde alla covarianza tra x e y divisa per
la varianza di x (u di misura la VD).

Analizza regressione lineare

B il coefficiente angolare; Costante lintercetta

Limite: si va anche nel negativo, anche quando nella realt non ha senso (es. peso
negativo).

Nella regressione lineare semplice Beta = correlazione.


R2 qui il coefficiente di correlazione al quadrato. In tutte le regressioni la quantit
di varianza della V.D. spiegata dalla V.I.

LA REGRESSIONE MULTIPLA
Prevede 2 o pi variabili indipendenti e una sola variabile dipendente. Il coefficiente bi
di ogni xi esprime la variazione attesa della y al variare di ununit della x i quando tutti
gli altri predittori x assumono un valore costante (effetto di una certa variabile
indipendente X al netto di tutte le altre). Es. y numero comportamenti aggressivi, x
quanto la persona si sente religiosa e quanto psicotica

F vede se R2 sign. diverso da 0 (quindi la sign. dellanova la sign. di R 2).

Se voglio confrontare il peso dei predittori, devo vedere i coefficienti standardizzati


Beta!

Per vedere la porzione di varianza che ogni predittore spiega, uso i coefficienti di
correlazione parziale e semi-parziale al quadrato. Le ottengo da: statistiche >
correlazioni di ordine zero e parziale (Parziale e Parte, devo farle al quadrato A MANO;
ordine zero la correlazione di Pearson e ha diversa significativit).

- Semi-parziale/parte (sr2): quando dice rispetto al totale, variabile che varia


naturalmente nella realt, per vedere contributo unico
- Parziale (pr2) se sul totale della varianza della V.D. non spiegata dallaltro
predittore, VI variata artificialmente da noi (es. esperimenti)

Se la faccio a blocchi (aggiungendo variabili da avanti), metto anche Cambiamento


di R e vedo quanto cambiato e la sign. modifica F.

I gdl dellANOVA si scrivono ad es. 1,22 (1 regressione, 22 residuo)

ESERCIZIO

Lunghezza 450 cm Peso 1,6 tonnellate = 1600 kg 200 cavalli


Prezzo?

PREZZO = -47860,902 + (450 x B della lunghezza) + (1600 x B del peso) + (200 x B


della potenza)

In teoria per guardo solo quelli significativi

ANOVA
VI che definisce pi di 2 gruppi e VD continua. H0: nessuna differenza fra i gruppi; H1:
almeno due gruppi sono diversi. Fa il rapporto fra variazione fra i gruppi e variazione
entro i gruppi.

Per trasformare una VI continua in categoriale faccio: trasforma > ricodifica in variabili
differenti; per scegliere il punto di divisione chiedo la mediana o il punto di divisione
(se ho 3 gruppi posso chiedere solo punti di divisione).
Se ho solo 2 gruppi, uguale a fare il t-test. F e t hanno valori diversi, ma la loro
significativit uguale. Con pi di 2 gruppi, non posso fare il t-test perch si
altererebbe la significativit.

Lanova si fa da: modello lineare generale > univariata

F(1, 98) = 4.667, p = .033 lipotesi nulla rifiutata. 1 sono i gdl e 98 i gdl dellerrore.

Opzioni:

Stima della dimensione degli effetti: Eta quadrato parziale la correlazione


parziale al quadrato (varianza spiegata dalla VI sul totale della varianza della
V.D. non spiegata dallaltro predittore).
Stima dei parametri: lo trasforma in una regressione Y= 139,385 6,176x in cui
x=1 per i vecchi e x=0 per i giovani. Per non calcolarlo a mano, faccio Medie
marginali stimate da Opzioni.
Posso chiedere il grafico. Quando ho tre gruppi lequazione della retta cambia, nel
senso che per ogni gruppo guardo solo la sua B. Lintervallo di confidenza comprende
lo 0 quando c significativit, quindi non mi serve guardarlo.

ANOVA BETWEEN FATTORIALE (con MODERAZIONE/INTERAZIONE)


ANOVA su disegni fattoriali tramite i quali viene testata, oltre agli effetti principali
dei singoli fattori sulla variabile dipendente, anche linterazione tra i fattori stessi.
2 fattori= interazione primo livello; 3 fattori= interazione secondo livello; 4 fattori=
interazione di ultimo livello. Faccio grafico. Post-hoc non si pu fare per linterazione.
Stime della dimensione degli effetti e volendo medie marginali. Modello corretto=
totale della varianza spiegata da tutti i fattori F(5,94)= 3964 p=0.003 sign. La
differenza di genere la distanza fra le due linee; la differenza fra fasce det la
differenza fra la media dei punti delle due linee. Se uno dei fattori sign. e ha pi di
due gruppi, guardo i suoi post-hoc. Per ogni effetto dico F, gdl, significativit e, se
sign., Eta2. Predittore con eta2 + alta spiega pi varianza quindi + influente.

Post-hoc per linterazione: creare nuova variabile COMBO che assuma valore 1 per
maschi di milano, 2 per maschi di cremona ecc. (1 Se genere = 1 & citt=1). Incollo
nella sintassi. Copio e incollo cambiando i valori IF (genere = 1 & citt = 1) combo=1.
IF (genere = 1 & citt = 2) combo=2. Per tutti gli otto casi.

Ora rifaccio lanova mettendo come unica VI combo e poi chiedo i post-hoc. (es. le
uniche medie diverse sono maschi di bergamo e femmine di bergamo).

ANCOVA: uguale allanova, ma con una covariata (VI continua) oltre al fattore fisso

MEDIAZIONE (NON = a moderazione)


X, Y e mediatore.

1) Regressione semplice: vedo se X ha effetto su Y.


2) Regressione semplice: per vedere se c effetto di X sul mediatore.
3) Regressione multipla: se X e mediatore hanno effetto su Y (effetto del mediatore
al netto di X).

Ne derivano effetto principale, effetto diretto e mediato (differenza fra i due, uguale al
prodotto di a e b).

X Effetto semplice: 8,484 B Y

5,384 B 0,573 B
MEDIATOR
E

Effetto diretto=5,397 (vedo dalla reg. mult. B di X) Effetto mediato= 5,384*0,573=


3,08 OPPUR 8,484-5,397
Se effetto diretto al netto del mediatore sign. la mediazione parziale; non sign.
totale.

ASSUNZIONI DEL MODELLO LINEARE GENERALE


Predetti: in una regressione o ANOVA: punteggi predetti dallequazione per ciascun
soggetto.

Residui: differenza tra i punteggi predetti e quelli osservati per ciascun soggetto.

Quando facciamo lANOVA o la regressione, nel menu ANALIZZA > MODELLO LINEARE
GENERALIZZATO > UNIVARIATA > SALVA chiediamo i residui e i predetti (nascono 2
nuove variabili).

Indipendenza dei residui: non posso usare il punteggio di un soggetto per


predire quello di un altro. Non si testa, si pensa a mente (es. non c se un test
viene ripetuto pi volte su stessi soggetti).
Omoschedasticit: varianza dei residui della VI per ciascun livello uguale
agli altri livelli. Vedo che non ci siano outlier (osservazione che non fa parte di
quella popolazione, che ha un punteggio molto diverso dagli altri), che
dovrebbero essere eliminati, se sono in dubbio lo scrivo e basta. Uso grafico
dispersione punti con Y: res e X: pre, se i punti sono tutti dispersi uguali va
bene.
Normalit dei residui: i residui devono essere distribuiti normalmente; si vede
dallistogramma (statistiche descrittive frequenze grafici istogramma con
verifica della normalit) o dal test K-S (Analizza > Test non parametrici >
Finestre legacy > K-S), se significativo vuol dire che violata, altrimenti
rispettata.
Linearit fra coefficienti: scatterplot con le due variabili (grafici finestre di
dialogo legacy dispersione punti dispersione semplice) deve formare una
linea o nube, altrimenti non modello lineare. Sempre rispettata nellANOVA. Se
ho pi di 2 variabili guardo lo scatterplot a dispersione multipla.

TEST NON PARAMETRICI (oltre a K-S)


Si usano se le assunzioni non sono rispettate.

Correlazione per ranghi di Spearman-Brown (Analizza > Correlazione > Bivariata >
Spearman). Ordina soggetti in base a una variabile formando una classifica in cui il
pi basso ha punteggio 1, il penultimo 2, ecc. Gli outlier e la distribuzione non sono pi
rilevanti, quindi uso test non parametrici su relazioni non lineari.

Altri: Analizza > Test non parametrici > finestre legacy

2 campioni indipendenti -> Mann-Withney (t-test)

K campioni indipendenti (come ANOVA a una via) -> Kruskal-Wallis (ANOVA)


ANALISI FATTORIALE
Tecnica di analisi multivariata solitamente impiegata per estrarre un numero di fattori
(variabili latenti) da un set di variabili osservate (es. item). Variabili osservate che
correlano molto tra loro possono essere riassunte da un fattore, variabili che non
correlano tra loro fanno probabilmente parte di fattori differenti.

Bisogna prima decidere quanti fattori scegliere, poi come ruotarli, infine come
interpretarli. Se ho item che non saturano su nessun fattore (minore di |0.35|) o in
modo uguale su tutti, li elimino. Posso salvare punteggi fattoriali per usarli per altre
analisi. Punteggi - salva come variabili.

Criteri di scelta dei fattori:

1. Mineigen: Autovalore > 1

2. Scree-test (in SPSS: grafico decrescente degli autovalori/grafico scree)

3. Interpretabilit dei fattori (ma solo DOPO aver scelto il tipo di rotazione)

Analizza > riduzione delle dimensioni > fattore. In Estrazione chiedo Grafico Scree.

Metto da Estrazione il numero


fisso di fattori scelto. In Rotazione:
se si scelto 1 solo fattore, non
ruotare. Se pi fattori, iniziare con
oblimin. Se le correlazioni tra fattori
in matrice delle componenti sono
tutte < |.20| passare a varimax. Se
la rotazione oblimin non converge,
aumentare le iterazioni.

Se ho fatto oblimin guardo la


matrice dei modelli. Se tutti gli item di una variabile saturano bene con un fattore
(almeno |0.35|), la soluzione semplice.

Una volta trovati i fattori, posso scegliere item migliori togliendo quelli che saturano
meno uno alla volta. Sono da togliere anche quelli che saturano molto con pi fattori.
(Togliere nel senso che rifaccio le analisi senza prenderli nelle variabili). Poi si possono
salvare i punteggi fattoriali da Punteggi per analisi successive. OUTPUT: I fattori
riproducono la struttura ipotizzata. Il primo , il secondo satura negativamente con
e quindi lo chiamo allopposto.

ATTENDIBILIT
Misura quanto un test correla con se stesso.

Analizza > scala > analisi di affidabilit.

Metto una serie di variabili e mi esce Alpha di Cronbach. Alpha cresce se gli item sono
tanti e correlano molto fra loro positivamente. Se alcuni correlano in positivo e altri in
negativo non funziona bene. Perci se ho item reverse faccio (max + min var).
Minimo e massimo da descrittive. Soglia minima 0.70 (vedo teoria), per meno di 5
item accetto minimo 0.60, per pi di 10 accetto minimo 0.80.