Sei sulla pagina 1di 38

Metodi e tecniche della ricerca

sociale
CdL triennale in Sociologia
Università di Trento

Prof. Moris Triventi


moris.triventi@unitn.it
La logica dell’analisi multivariata

2
Outline
Esperimenti vs indagine campionaria
L’‘ordine causale’ tra le variabili
Il ruolo di una terza variabile:
Effetto spurio
Variabili intervenienti/di mediazione
Variabile ‘soppressore’
La logica di “controllare per..”
Regressione multivariata

M. Triventi
Il ‘gold standard’ degli esperimenti
Experimental settings: stimare l’effetto di un ‘trattamento’
(X) su un outcome (Y)
Le variabili che possono confondere la relazione tra X e Y
sono controllate automaticamente dall’assegnazione
casuale degli individui nel gruppo dei trattati e non trattati

• L’obiettivo e’ assicurare che i


due gruppi siano analoghi (in
media) in tutte quelle
caratteristiche che potrebbero
distorcere la relazione tra X e
Y

M. Triventi
Esperimenti vs survey
L’assegnazione casuale, a certe condizioni (es.
N abbastanza grande) e’ uno strumento
potente per stimare l’effetto causale di X e Y
Sfortunatamente, non tutti i comportamenti
sociali sono studiabili con esperimenti
Con dati dall’indagine campionaria e’ molto
difficile stimare effetti causali, ma e’ possibile
cercare di controllare per i fattori confondenti
piu’ rilevanti (se misurati nella survey)

M. Triventi
La logica dell’analisi multivariata
I passaggi principali:
1. Identificare tutti i fattori che potrebbero

distorcere la relazione XY


2. Operativizzare questi fattori in variabili

3. Tenere sotto controllo questi fattori attraverso


appropriate analisi statistiche
4. Stimare la relazione tra X e Y, al netto (a

parita’) di altre variabili

M. Triventi
Il limite principale
E’ difficile con analisi multivariate tenere
sotto controllo tutti i fattori che possono
distorcere la relazione tra X e Y
Possiamo solamente approssimare la
stima dell’effetto causale di XY
Nell’interpretazione dei risultati essere
espliciti su possibili variabili confondenti
non misurate

M. Triventi 7
I passaggi
Prima di stimare un modello di regressione
multivariata, bisogna sviluppare un'idea sul
meccanismo di generazione dei dati (Elwert & Winship
2014)
Per fare questo è importante:
essere espliciti sullo scopo dell'analisi (descrittivo, predittivo,
causale)
scegliere le variabili da includere nel modello
chiarire l'ordine causale delle variabili da includere nella
analisi
scegliere il modello statistico appropriato
interpretare correttamente i risultati

M. Triventi 8
L’ordine causale

X Y
L’ordine causale

A X I Y S

A: variabile antecedente
C: variabile concomitante
I: variabile interveniente
S: variabile susseguenti
L’ordine causale

A X I Y S

A: variabile antecedente rilevante


C: variabile concomitante
I: variabile interveniente
S: variabile susseguenti
Lo status delle variabili di controllo
Studiamo la relazione tra X e Y, poi
introduciamo una terza variabile Z
Z puo’ assumere un diverso ‘ruolo’
1. Variabile confondente
2. Variabile moderatore
3. Variabile interveniente

Le differenze sono di ordine concettuale, la


procedura da seguire nell’analisi trivariata e’ la
stessa!!!
M. Triventi 12
1a) Z e’ una variabile confondente: effetto spurio

Relazione bivariata: Relazione trivariata:

Y Z Y

X X

La relazione tra X e Y scompare controllando per Z

M. Triventi
1a) Z e’ una variabile confondente: effetto spurio

Relazione bivariata:

Z Y
X

M. Triventi
1a) Z e’ una variabile confondente: effetto spurio

Relazione trivariata (controllando per Z):

Z Y
La relazione tra X e
X Y scompare
controllando per Z

M. Triventi
Esempio di effetto spurio

Tab 1: Tasso di criminalita’ secondo l’ordine di nascita


Posizione intermedia

Commesso No Si
Crimine

No 79 70
Si 21 30
100 100
(720) (360)
Effetto bivariato:
dXY= Pr(Y=2|X=2) – Pr(Y=2|X=1) = .30-.21 = .09

 a causa della deprivazione emotive di chi e’ nato in mezzo?

Vi viene in mente una possibile variabile confondente??

La dimensione famigliare

M. Triventi
Esempio di effetto spurio
Tab. 2 Crime by Family size
Family size ZY
Crime 3 or less children 4 or more children

No 81 60
Yes 19 40
Total 100 100
(828) (252)
ZX
Tab. 3 Intermediate position by family size
Family size
Intermediate 3 or less children 4 or more children

No 78 29
Yes 22 71
Total 100 100
(828) (252)

X, Y by Z (vedi
slide successiva)

M. Triventi
Domanda: entro le famiglie con eguale numerosita’,
l’ordine di nascita influisce sui reati?
Tab. 4 Tasso di criminalita’ secondo l’ordine di nascita e la dimensione famigliare
3 figli o meno(Z=1) 4 o piu’ figli (Z=2)

Reato Posiz. Posiz. N. Posiz. Posiz. N.


Non Interme- Non Interme-
interme- dia interme- dia
dia (X=1) (X=2) dia (X=1) (X=2)
No (Y=1) 80 81 161 60 58 118
Si (Y=2) 20 19 39 40 42 82
Totale 100 100 100 100 828/(828+252)
N 180 648 828 180 72 252
252/(828+252)
Effetti condizionati:
dXY|Z=1 = Pr(Y=2|X=2, Z=1) – Pr(Y=2|X=1, Z=1) = .19 - .20 = –.01
dXY|Z=2 = Pr(Y=2|X=2, Z=2) – Pr(Y=2|X=1, Z=2) = .42 - .40 = .02
Effetto netto:
𝑛𝑍=1 𝑛𝑍=2
dXY.Z = (dXY|Z=1× ) + (dXY|Z=2× ) = (–.01 ×.767) + (.02 ×.233) = -.003
𝑁 𝑁
Effetto spurio:
d(XY)Z = dXY − dXY.Z = .09 – (–.003) = .093
1b) Relazione spuria: la variabile soppressore

Relazione bivariata: Relazione trivariata:

Y Y
Z

X X

La relazione tra X e Y compare controllando per Z

M. Triventi
1b) Relazione spuria: la variabile soppressore

Scenario 1: Scenario 2:

+ Y ̶
Y
Z ̶
Z +
+ +
X X
Una variabile soppressore Z è una variabile che rende più bassa o, nel caso estremo ,
nulla la relazione bivariata tra X e Y.

Una volta che Z è controllata, la relazione tra X e Y si manifesta, si rinforza o


addirittura cambia di segno

M. Triventi
Esempio di variabile soppressore

% di individui con atteggiamenti antisemiti secondo anni di


affiliazione al sindacato
Anni affiliazione sindacato
4 anni > 4 anni
No 49 50
Si 51 50
Totale 100 100
(N) (126) (256)
Fonte: Rosenberg (1968) Tab. 3.3

M. Triventi
Esempio di variabile soppressore

Anti-semite attitude (Y) by age (Z) and years in the union (X)

Age
<30 years 30-49 years >50 years

Years in union Years in union Years in union


4 >4 4 >4 4 >4
years years years years years years
No 56 63 37 48 38 46
Yes 44 37 63 52 62 54
Total 100 100 100 100 100 100
(N) (78) (51) (35) (116) (13) (89)
Source: Rosenberg (1968) Tab. 3.4

M. Triventi
Esempio di variabile soppressore

0
Anni affiliazione
sindacato Y atteggiamento antisemita

+
Z Eta’ Y atteggiamento antisemita

+ -
Anni affiliazione sindacato

Se non controlliamo per eta’, la variabile Z “assorbe” l’effetto


positive dell’eta’ sugli atteggiamenti antisemiti.

Z sopprime quindi l’effetto di X

M. Triventi
1c) Paradosso di Simpson
Scenario in cui la forma della covariazione fra X
e Y emersa dall’analisi bivariate risulta invertita
quando introduciamo una (o più) variabili con
funzione di “controllo”

M. Triventi 24
1) Paradosso di Simpson: tavola bivariata

Emerge una relazione positiva tra senso di appartenenza alla Chiesa cattolica
ed essere favorevole alla pena di morte.

Non è strano? Quale variabile confondente?


M. Triventi 25
1) Paradosso di Simpson: tabella trivariata

Livello di istruzione!

Una volta controllato per livello di istruzione, I cattolici si dichiarano meno di


frequente favorevoli alla pena di morte!
M. Triventi 26
In forma grafica
Relazione trivariata:
Relazione bivariata:

PdM Istr
̶ PdM
+ ̶
̶
Catt Catt

M. Triventi 27
2) Z e’ una variabile interveniente

C=effetto totale

c’ = effetto diretto
a×b = effetto indiretto

Effetto totale = effetto diretto +


effetto indiretto
c = c' + ab

Attenzione: se si vuole stimare l’effetto totale di X su Y non bisogna


controllare per M! [Elwert & Winship 2014]
Source: http://davidakenny.net/cm/mediate.htm#IE

M. Triventi
Un esempio di variabile interveniente
Intenzione di voto (Y) secondo il livello di istruzione (X). Fonte:
Rosenberg (1968) Tab. 3.3

Upper education Lower Education

Will not vote 8 14


Will vote 92 86
Total 100 100
(N) (1613) (1199)

Perche’ gli individui piu’ istruiti hanno piu’ probabilita’ di


votare rispetto a quelli meno istruiti?

M. Triventi
Un esempio di variabile interveniente

Una possibile spiegazione: sono piu’ interessati alla politica

Political interest by level of education

Political interest
Education Low Medium Great Tot

Upper edu 10 40 50 100 (N=1613)

Lower edu 30 45 25 100 (N=1199)

M. Triventi
Un esempio di variabile interveniente
Education and Intention to vote, by Political Interest (Z)

Political interest
Great Medium Low

Up Ed Low Ed Up Ed Low Ed Up Ed Low Ed

Will not vote 1 2 7 10 44 41


Will vote 99 98 93 90 56 59
Total 100 100 100 100 100 100
(N) (495) (285) (986) (669) (132) (245)

Source: Rosenberg (1968) Tab. 3.4

Cosi’ abbiamo: istruzione  interesse politico voto

Interpretazione: la procedura e’ identica a quella seguita per stabilire l’esistenza


di un effetto spurio di Z, MA l’interpretazione e’ differente!
In questo caso, la relazione tra X e Y e’ interamente spiegata dal mediatore M

M. Triventi
3) Z e’ un moderatore: relazione condizionata o
interazione

Tab. 1 Percentage who make the transition to upper secondary


education by social class • Indaghiamo la relazione tra
origine sociale e la probabilita’ di
Transition to Upper Sec
iscriversi alle scuole superiori
Class of origin No Yes | Total
-----------+----------------------+----------
(coorti nate negli anni 60-70s)
Upper class| 49 366 | 415
| 11.81 88.19 | 100.00
-----------+----------------------+---------- • Poi ci chiediamo se questa
WhiteCollar| 41 222 | 263
| 15.59 84.41 | 100.00 relazione valga in egual modo per
-----------+----------------------+----------
Self | 162 369 | 531
X  Y (+) studenti con diverso rendimento
| 30.51 69.49 | 100.00
-----------+----------------------+---------- scolastico
SelfAgri | 148 143 | 291
| 50.86 49.14 | 100.00
-----------+----------------------+----------
SkillWor | 393 532 | 925
| 42.49 57.51 | 100.00
-----------+----------------------+----------
UnskWork | 232 294 | 526
| 44.11 55.89 | 100.00
-----------+----------------------+----------
UnskWorkAg | 175 74 | 249
| 70.28 29.72 | 100.00
-----------+----------------------+----------
Total | 1,200 2,000 | 3,200
| 37.50 62.50 | 100.00

M. Triventi
La relazione tra i voti (Z) e iscrizione alle superiori (Y)

Tab. 3: Percentage who make the transition to upper secondary


education by previous grades

| Transition
Grades | No YES | Total
-----------+----------------------+----------
Bad | 222 90 | 312
| 71.15 28.85 | 100.00 Z  Y (+)
-----------+----------------------+----------
Not good | 610 502 | 1,112
| 54.86 45.14 | 100.00
-----------+----------------------+----------
Good | 324 1,024 | 1,348
| 24.04 75.96 | 100.00
-----------+----------------------+----------
Very good | 44 384 | 428
| 10.28 89.72 | 100.00
-----------+----------------------+----------
Total | 1,200 2,000 | 3,200
| 37.50 62.50 | 100.00

M. Triventi
La relazione tra origine sociale (X) e i voti (Z)

Tab. 2: Grades at the end of lower secondary by social class


| Grades

clase | Bad Not good Good Very good | Total


-----------+--------------------------------------------+----------
UpperClass | 30 93 200 108 | 431
| 6.96 21.58 46.40 25.06 | 100.00
-----------+--------------------------------------------+----------
WhColl | 24 84 123 39 | 270
| 8.89 31.11 45.56 14.44 | 100.00
-----------+--------------------------------------------+----------
Self | 36 185 240 89 | 550 X  Z (+)
| 6.55 33.64 43.64 16.18 | 100.00
-----------+--------------------------------------------+----------
SelfAgri | 32 112 132 25 | 301
| 10.63 37.21 43.85 8.31 | 100.00
-----------+--------------------------------------------+----------
SkillWor | 109 347 411 102 | 969
| 11.25 35.81 42.41 10.53 | 100.00
-----------+--------------------------------------------+----------
UnskWork | 66 201 223 61 | 551
| 11.98 36.48 40.47 11.07 | 100.00
-----------+--------------------------------------------+----------
UnskWorkA | 23 133 78 20 | 254
| 9.06 52.36 30.71 7.87 | 100.00
-----------+--------------------------------------------+----------
Total | 320 1,155 1,407 444 | 3,326
| 9.62 34.73 42.30 13.35 | 100.00

M. Triventi
Relazione condizionata
Percentage that make the transition to upper secondary education
(Y) by social class of origin (x) and grades (Z)
Bad Not good Good Very good
Good

Social class % UpSec % UpSec % UpSec % UpSec

Upper class 67% 72% 93% 99%

Whtcollar 48 75 93 97

Self 29 51 80 94

SelfA 26 35 64 68

SkillWor 25 41 71 93

UnskillWor 17 46 71 77

UnskillWorA 14 17 49 55

M. Triventi
Relazione condizionata: focus su categorie estreme

(UC-SW|GRADE=Bad)=42p.p. (UC-SW|GRADE=Very good)=6p.p.

M. Triventi
Rappresentazione visuale di un
effetto di interazione
High

Upper class

Lower class

Low
Bad Good
Previous performance

Source: Bernardi & Triventi (2020)


Analisi multivariata: il linguaggio degli effetti

Effetto bivariato

Variabili antecedenti

Effetto spurio Effetto causale

Variabili intervenienti

Effetto indiretto Effetto diretto

M. Triventi 38

Potrebbero piacerti anche