sociale
CdL triennale in Sociologia
Università di Trento
2
Outline
Esperimenti vs indagine campionaria
L’‘ordine causale’ tra le variabili
Il ruolo di una terza variabile:
Effetto spurio
Variabili intervenienti/di mediazione
Variabile ‘soppressore’
La logica di “controllare per..”
Regressione multivariata
M. Triventi
Il ‘gold standard’ degli esperimenti
Experimental settings: stimare l’effetto di un ‘trattamento’
(X) su un outcome (Y)
Le variabili che possono confondere la relazione tra X e Y
sono controllate automaticamente dall’assegnazione
casuale degli individui nel gruppo dei trattati e non trattati
M. Triventi
Esperimenti vs survey
L’assegnazione casuale, a certe condizioni (es.
N abbastanza grande) e’ uno strumento
potente per stimare l’effetto causale di X e Y
Sfortunatamente, non tutti i comportamenti
sociali sono studiabili con esperimenti
Con dati dall’indagine campionaria e’ molto
difficile stimare effetti causali, ma e’ possibile
cercare di controllare per i fattori confondenti
piu’ rilevanti (se misurati nella survey)
M. Triventi
La logica dell’analisi multivariata
I passaggi principali:
1. Identificare tutti i fattori che potrebbero
M. Triventi
Il limite principale
E’ difficile con analisi multivariate tenere
sotto controllo tutti i fattori che possono
distorcere la relazione tra X e Y
Possiamo solamente approssimare la
stima dell’effetto causale di XY
Nell’interpretazione dei risultati essere
espliciti su possibili variabili confondenti
non misurate
M. Triventi 7
I passaggi
Prima di stimare un modello di regressione
multivariata, bisogna sviluppare un'idea sul
meccanismo di generazione dei dati (Elwert & Winship
2014)
Per fare questo è importante:
essere espliciti sullo scopo dell'analisi (descrittivo, predittivo,
causale)
scegliere le variabili da includere nel modello
chiarire l'ordine causale delle variabili da includere nella
analisi
scegliere il modello statistico appropriato
interpretare correttamente i risultati
M. Triventi 8
L’ordine causale
X Y
L’ordine causale
A X I Y S
A: variabile antecedente
C: variabile concomitante
I: variabile interveniente
S: variabile susseguenti
L’ordine causale
A X I Y S
Y Z Y
X X
M. Triventi
1a) Z e’ una variabile confondente: effetto spurio
Relazione bivariata:
Z Y
X
M. Triventi
1a) Z e’ una variabile confondente: effetto spurio
Z Y
La relazione tra X e
X Y scompare
controllando per Z
M. Triventi
Esempio di effetto spurio
Commesso No Si
Crimine
No 79 70
Si 21 30
100 100
(720) (360)
Effetto bivariato:
dXY= Pr(Y=2|X=2) – Pr(Y=2|X=1) = .30-.21 = .09
La dimensione famigliare
M. Triventi
Esempio di effetto spurio
Tab. 2 Crime by Family size
Family size ZY
Crime 3 or less children 4 or more children
No 81 60
Yes 19 40
Total 100 100
(828) (252)
ZX
Tab. 3 Intermediate position by family size
Family size
Intermediate 3 or less children 4 or more children
No 78 29
Yes 22 71
Total 100 100
(828) (252)
X, Y by Z (vedi
slide successiva)
M. Triventi
Domanda: entro le famiglie con eguale numerosita’,
l’ordine di nascita influisce sui reati?
Tab. 4 Tasso di criminalita’ secondo l’ordine di nascita e la dimensione famigliare
3 figli o meno(Z=1) 4 o piu’ figli (Z=2)
Y Y
Z
X X
M. Triventi
1b) Relazione spuria: la variabile soppressore
Scenario 1: Scenario 2:
+ Y ̶
Y
Z ̶
Z +
+ +
X X
Una variabile soppressore Z è una variabile che rende più bassa o, nel caso estremo ,
nulla la relazione bivariata tra X e Y.
M. Triventi
Esempio di variabile soppressore
M. Triventi
Esempio di variabile soppressore
Anti-semite attitude (Y) by age (Z) and years in the union (X)
Age
<30 years 30-49 years >50 years
M. Triventi
Esempio di variabile soppressore
0
Anni affiliazione
sindacato Y atteggiamento antisemita
+
Z Eta’ Y atteggiamento antisemita
+ -
Anni affiliazione sindacato
M. Triventi
1c) Paradosso di Simpson
Scenario in cui la forma della covariazione fra X
e Y emersa dall’analisi bivariate risulta invertita
quando introduciamo una (o più) variabili con
funzione di “controllo”
M. Triventi 24
1) Paradosso di Simpson: tavola bivariata
Emerge una relazione positiva tra senso di appartenenza alla Chiesa cattolica
ed essere favorevole alla pena di morte.
Livello di istruzione!
PdM Istr
̶ PdM
+ ̶
̶
Catt Catt
M. Triventi 27
2) Z e’ una variabile interveniente
C=effetto totale
c’ = effetto diretto
a×b = effetto indiretto
M. Triventi
Un esempio di variabile interveniente
Intenzione di voto (Y) secondo il livello di istruzione (X). Fonte:
Rosenberg (1968) Tab. 3.3
M. Triventi
Un esempio di variabile interveniente
Political interest
Education Low Medium Great Tot
M. Triventi
Un esempio di variabile interveniente
Education and Intention to vote, by Political Interest (Z)
Political interest
Great Medium Low
M. Triventi
3) Z e’ un moderatore: relazione condizionata o
interazione
M. Triventi
La relazione tra i voti (Z) e iscrizione alle superiori (Y)
| Transition
Grades | No YES | Total
-----------+----------------------+----------
Bad | 222 90 | 312
| 71.15 28.85 | 100.00 Z Y (+)
-----------+----------------------+----------
Not good | 610 502 | 1,112
| 54.86 45.14 | 100.00
-----------+----------------------+----------
Good | 324 1,024 | 1,348
| 24.04 75.96 | 100.00
-----------+----------------------+----------
Very good | 44 384 | 428
| 10.28 89.72 | 100.00
-----------+----------------------+----------
Total | 1,200 2,000 | 3,200
| 37.50 62.50 | 100.00
M. Triventi
La relazione tra origine sociale (X) e i voti (Z)
M. Triventi
Relazione condizionata
Percentage that make the transition to upper secondary education
(Y) by social class of origin (x) and grades (Z)
Bad Not good Good Very good
Good
Whtcollar 48 75 93 97
Self 29 51 80 94
SelfA 26 35 64 68
SkillWor 25 41 71 93
UnskillWor 17 46 71 77
UnskillWorA 14 17 49 55
M. Triventi
Relazione condizionata: focus su categorie estreme
M. Triventi
Rappresentazione visuale di un
effetto di interazione
High
Upper class
Lower class
Low
Bad Good
Previous performance
Effetto bivariato
Variabili antecedenti
Variabili intervenienti
M. Triventi 38